Por: Kai Hou (Gordon) Yip y Quentin Changeat
¿Sabes de qué está hecha la atmósfera de la Tierra? Probablemente recuerdes que es oxígeno y tal vez nitrógeno. Y con un poco de ayuda de Google, puedes llegar fácilmente a una respuesta más precisa: 78% de nitrógeno, 21% de oxígeno y 1% de argón. Sin embargo, cuando se trata de la composición de exo-atmósferas, las atmósferas de planetas fuera de nuestro sistema solar, no se conoce la respuesta. Es una pena, ya que las atmósferas pueden indicar la naturaleza de los planetas y si pueden albergar vida.
Como los exoplanetas están tan lejos, ha resultado extremadamente difícil sondear sus atmósferas. La investigación sugiere que la inteligencia artificial (IA) puede ser nuestra mejor opción para explorarlos, pero solo si podemos demostrar que estos algoritmos piensan de manera científica y confiable, en lugar de engañar al sistema. Ahora, nuestro nuevo artículo, publicado en Astrophysical Journal, ha proporcionado una perspectiva tranquilizadora sobre su misteriosa lógica.
Los astrónomos suelen aprovechar el método de tránsito para investigar exoplanetas, que implica medir las caídas de luz de una estrella cuando un planeta pasa frente a ella. Si hay una atmósfera presente en el planeta, también puede absorber una pequeña cantidad de luz. Al observar este evento en diferentes longitudes de onda (colores de luz), las huellas dactilares de las moléculas se pueden ver en la luz estelar absorbida, formando patrones reconocibles en lo que llamamos espectro.
Una señal típica producida por la atmósfera de un planeta del tamaño de Júpiter solo reduce la luz estelar en ~ 0.01% si la estrella es similar al Sol. Los planetas del tamaño de la Tierra producen señales de 10 a 100 veces más bajas. Es un poco como ver el color de ojos de un gato desde un avión.
En el futuro, el Telescopio Espacial James Webb (JWST) y la Misión Espacial Ariel, ambas sondas que investigarán exoplanetas desde su órbita en el espacio, ayudarán proporcionando espectros de alta calidad para miles de exo-atmósferas. Pero aunque los científicos están entusiasmados con esto, las últimas investigaciones sugieren que puede ser complicado. Debido a la naturaleza compleja de las atmósferas, el análisis de un solo planeta en tránsito puede tardar días o incluso semanas en completarse.
Naturalmente, los investigadores han comenzado a buscar herramientas alternativas. Las IA son reconocidas por su capacidad para asimilar y aprender de una gran cantidad de datos y su excelente desempeño en diferentes tareas una vez entrenadas. Por lo tanto, los científicos han intentado entrenar a la IA para predecir la abundancia de varias especies químicas en la atmósfera.
La investigación actual ha establecido que las IA son adecuadas para esta tarea. Sin embargo, los científicos son meticulosos y escépticos, y para demostrar que este es realmente el caso, quieren comprender cómo piensan las IA.
Mirando dentro de la caja negra
En ciencia, no se puede adoptar una teoría o una herramienta si no se comprende. Después de todo, no querrás pasar por la emoción de descubrir la vida en un exoplaneta, sólo para darte cuenta de que es simplemente un “error” en la IA. La mala noticia es que las IA son terribles para explicar sus propios hallazgos. Incluso los expertos en inteligencia artificial tienen dificultades para identificar qué hace que la red proporcione una explicación determinada. Esta desventaja a menudo ha impedido la adopción de técnicas de inteligencia artificial en astronomía y otros campos científicos.
Desarrollamos un método que nos permite echar un vistazo al proceso de toma de decisiones de la IA. El enfoque es bastante intuitivo. Supongamos que una IA tiene que confirmar si una imagen contiene un gato. Presumiblemente, lo haría detectando ciertas características, como el pelaje o la forma de la cara. Para comprender a qué características hace referencia y en qué orden, podríamos difuminar partes de la imagen del gato y ver si aún detecta que es un gato.
Esto es exactamente lo que hicimos con una IA que explora exoplanetas al “perturbar” o cambiar regiones del espectro. Al observar cómo cambiaban las predicciones de la IA sobre la abundancia de moléculas de exoplanetas (por ejemplo, agua en la atmósfera) cuando se manipulaba cada región, comenzamos a construir una “imagen” de cómo pensaba la IA, como qué regiones del espectro utilizaba para decidir el nivel de agua en la atmósfera.
De manera tranquilizadora para nosotros, los astrónomos, descubrimos que una IA bien entrenada se basa en gran medida en fenómenos físicos, como huellas digitales espectroscópicas únicas, tal como lo haría un astrónomo. Esto puede no ser una sorpresa, después de todo, ¿de dónde más puede aprenderlo la IA?
De hecho, cuando se trata de aprender, la IA no es tan diferente de un estudiante de secundaria descarado: hará todo lo posible para evitar el camino difícil (como comprender conceptos matemáticos difíciles) y encontrar cualquier atajo (como memorizar los conceptos matemáticos fórmulas sin entender por qué) para obtener la respuesta correcta.
Si la IA hiciera predicciones basadas en la memorización de cada uno de los espectros con los que se había encontrado, eso sería profundamente indeseable. Queremos que la IA obtenga su respuesta de los datos y funcione bien con datos desconocidos, no solo con los datos de entrenamiento para los que existe una respuesta correcta.
Este hallazgo proporcionó el primer método para echar un vistazo furtivo a las llamadas “cajas negras de IA”, lo que nos permitió evaluar lo que han aprendido las IA. Con estas herramientas, los investigadores ahora no solo pueden usar IA para acelerar su análisis de exo-atmósferas, sino que también pueden verificar que su IA utiliza leyes de la naturaleza bien entendidas.
Dicho esto, es demasiado pronto para afirmar que comprendemos completamente las IA. El siguiente paso es determinar con precisión qué tan importante es cada concepto y cómo se procesa en las decisiones.
La perspectiva es emocionante para los expertos en inteligencia artificial, pero más aún para nosotros, los científicos. El increíble poder de aprendizaje de la IA se origina en su capacidad para aprender una “representación” o patrón a partir de los datos, una técnica similar a la forma en que los físicos han descubierto las leyes de la naturaleza para comprender mejor nuestro mundo. Por lo tanto, tener acceso a las mentes de la IA puede brindarnos la oportunidad de aprender leyes de la física nuevas y no descubiertas.
Este artículo es una traducción de otro publicado en The Conversation. Puedes leer el texto original haciendo clic aquí.