Un nuevo enfoque en la IA permitiría a las computadoras tener imaginación

Tecnología

Investigadores de la Universidad del Sur de California (USC) están tratando de enseñarle a una computadora no cómo amar, sino cómo imaginar. La gente generalmente no tiene ningún problema para imaginar cosas. Somos bastante buenos comenzando desde cero y somos incluso mejores usando nuestra experiencia para imaginar cosas completamente nuevas. Por ejemplo, todos los que lean esto probablemente podrían imaginarse la Gran Muralla China pero hecha de espaguetis y albóndigas, o un gato con sombrero de pirata.

Las computadoras, sin embargo, son notoriamente malas en esto. No es su culpa, los hemos creado para que sean rápidas y precisas, para que no pierdan el tiempo soñando despiertos; ese es nuestro trabajo. Pero dar a las computadoras la capacidad de imaginar, de visualizar un objeto con diferentes atributos o de crear conceptos desde cero, definitivamente podría ser útil. Aunque los expertos en aprendizaje automático se han ocupado de este problema hasta ahora, hemos avanzado muy poco. Sin embargo, una nueva IA desarrollada en la USC imita los mismos procesos que nuestro cerebro usa para alimentar nuestra imaginación, pudiendo crear objetos completamente nuevos con una amplia gama de atributos.

Computación creativa
“Nos inspiraron las capacidades de generalización visual humana para intentar simular la imaginación humana en máquinas”, dijo el autor principal Yunhao Ge, estudiante de doctorado en ciencias de la computación que trabaja bajo la supervisión de Laurent Itti, profesor de ciencias de la computación.

“Los seres humanos pueden separar su conocimiento aprendido por atributos – por ejemplo, forma, pose, posición, color – y luego recombinarlos para imaginar un nuevo objeto. Nuestro artículo intenta simular este proceso utilizando redes neuronales”.

En otras palabras, como humanos, es fácil imaginar un objeto con diferentes atributos. Pero, a pesar de los avances en las redes neuronales profundas que igualan o superan el desempeño humano en ciertas tareas, las computadoras todavía luchan con la habilidad humana de la “imaginación”.

Uno de los mayores obstáculos que hemos enfrentado al enseñar a las computadoras a imaginar es que, en términos generales, son bastante limitados en lo que reconocen. Digamos que queremos hacer una IA que pueda diseñar edificios. Entrenamos estos sistemas hoy en día proporcionándoles una gran cantidad de datos. En nuestro caso, serían un montón de fotografías de edificios. Al mirarlos, dice la teoría, la IA puede comprender qué hace que un edificio sea un edificio y la forma correcta de diseñar uno. En otras palabras, comprende sus atributos, que luego se pueden replicar o comparar. Con estos en la mano, debería poder extrapolar, crear ejemplos virtualmente infinitos de nuevos edificios.

El problema es que nuestras IA todavía están capacitadas para comprender las características en su mayor parte, no los atributos. Esto significa cosas como ciertos patrones de diseño de píxeles, palabras después de las cuales es más probable que se encuentre una determinada palabra. Una forma simple pero imperfecta de describir esto es que una IA debidamente entrenada hoy en día puede reconocer un edificio como un edificio, pero no tiene idea de qué es realmente un edificio, para qué se usa o cómo. Puede comprobar si una imagen se parece a la imagen de una pared, y eso es todo. Para nuestros propósitos prácticos de hoy, este tipo de formación es suficiente.

Aún así, para ir más allá de este punto, el equipo utilizó un proceso llamado desenredo. Este es el tipo de proceso que se utiliza para crear deepfakes, por ejemplo, “desenredando” o separando los movimientos faciales y la identidad de una persona. Usando este proceso, la apariencia de una persona puede ser reemplazada por la de otra, mientras se mantienen los movimientos y el habla de la primera.

El equipo tomó grupos de imágenes de muestra y las introdujo en la IA, en lugar de usar una imagen a la vez, como hacen los enfoques de entrenamiento tradicionales. Luego le encargaron al programa que identificara las similitudes entre ellos, un paso llamado “aprendizaje de representación desenredante controlable”. La información recopilada aquí fue recombinada en una “síntesis de imagen novedosa controlable”, que es lo que el programador habla para “imaginar cosas”.

Todavía es mucho más tosco de lo que podemos hacer usando nuestro cerebro, pero en cuanto a los mecanismos que los sustentan, los procesos no son muy diferentes en absoluto.

“Por ejemplo, toma la película Transformers como ejemplo”, dijo Ge. “Puede tomar la forma de un automóvil Megatron, el color y la pose de un automóvil Bumblebee amarillo y el fondo de Times Square de Nueva York. El resultado será un automóvil Megatron color abejorro conduciendo en Times Square, incluso si esta muestra no fue presenciada durante la sesión de capacitación”.

La IA generó un conjunto de datos de 1,56 millones de imágenes a partir de los datos utilizados para entrenarlo, agrega el equipo.

La imaginación artificial sería de gran ayuda, especialmente en la investigación, por ejemplo, en los esfuerzos por descubrir nuevas drogas. A menudo sacamos la idea de las películas de que una vez que una computadora se vuelve lo suficientemente inteligente, puede dominar el mundo y la raza humana sin esfuerzo. Definitivamente cosas emocionantes. Pero el quid de la cuestión sigue siendo que todo el poder de procesamiento del mundo no podrá idear una nueva medicina, por ejemplo, sin la capacidad de imaginar primero algo. El poder de procesamiento puede verificar (con el código correcto) cómo interactúan algunas moléculas. Pero para hacer eso, primero debes pensar en la interacción de esas moléculas, y eso se maneja con la imaginación.

“El aprendizaje profundo ya ha demostrado un rendimiento insuperable y una promesa en muchos dominios, pero con demasiada frecuencia esto ha sucedido a través de una mímica superficial y sin una comprensión más profunda de los atributos separados que hacen que cada objeto sea único”, dijo Itti.

“Este nuevo enfoque de desenredo, por primera vez, realmente desata un nuevo sentido de imaginación en A.I. sistemas, acercándolos a la comprensión humana del mundo”.

El documento Síntesis de cero intentos con aprendizaje supervisado por grupos se presentó en la Conferencia Internacional de Representaciones de Aprendizaje de 2021 y está disponible aquí.

Fuente: ZME Science.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *