Ayudando a las máquinas a percibir algunas leyes de la física

El modelo registra «sorpresa» cuando los objetos en una escena hacen algo inesperado, lo que podría usarse para construir una IA más inteligente.

Los humanos tienen una comprensión temprana de las leyes de la realidad física. Los bebés, por ejemplo, tienen expectativas sobre cómo los objetos deben moverse e interactuar entre sí, y se sorprenderán cuando hagan algo inesperado, como desaparecer en un truco de magia.

Ahora, los investigadores del MIT han diseñado un modelo que demuestra una comprensión de cierta «física intuitiva» básica sobre cómo deben comportarse los objetos. El modelo podría usarse para ayudar a construir una inteligencia artificial más inteligente y, a su vez, proporcionar información para ayudar a los científicos a comprender la cognición infantil.

El modelo, llamado ADEPT, observa los objetos que se mueven alrededor de una escena y hace predicciones sobre cómo deberían comportarse los objetos, en función de su física subyacente. Mientras rastrea los objetos, el modelo emite una señal en cada cuadro de video que se correlaciona con un nivel de «sorpresa»: cuanto mayor es la señal, mayor es la sorpresa. Si un objeto alguna vez no coincide drásticamente con las predicciones del modelo, por ejemplo, desapareciendo o teletransportándose a través de una escena, sus niveles de sorpresa aumentarán.

En respuesta a videos que mostraban objetos moviéndose de formas físicamente plausibles e inverosímiles, el modelo registró niveles de sorpresa que coincidían con los niveles informados por humanos que habían visto los mismos videos.  

«Para cuando los bebés tienen 3 meses, tienen cierta noción de que los objetos no aparecen y desaparecen, y no pueden moverse entre sí ni teletransportarse», dice el primer autor Kevin A. Smith, científico investigador en el Departamento de Ciencias Cerebrales y Cognitivas (BCS) y miembro del Centro de Cerebros, Mentes y Máquinas (CBMM). “Queríamos capturar y formalizar ese conocimiento para convertir la cognición infantil en agentes de inteligencia artificial. Ahora nos estamos acercando a los humanos en la forma en que los modelos pueden distinguir escenas básicas plausibles o inverosímiles”.

Junto a Smith en el artículo están los coautores Lingjie Mei, estudiante del Departamento de Ingeniería Eléctrica y Ciencias de la Computación, y el científico investigador de BCS Shunyu Yao; Jiajun Wu Doctorado ’19; la investigadora del CBMM Elizabeth Spelke; Joshua B. Tenenbaum, profesor de ciencia cognitiva computacional e investigador en CBMM, BCS y el Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL); y el investigador de CBMM Tomer D. Ullman PhD ’15.

muestran a los bebés pares de videos. Un video muestra un evento plausible, con objetos que se adhieren a sus nociones esperadas de cómo funciona el mundo. El otro video es igual en todos los sentidos, excepto que los objetos se comportan de una manera que viola las expectativas de alguna manera. Los investigadores a menudo usan estas pruebas para medir cuánto tiempo el bebé mira una escena después de que ha ocurrido una acción inverosímil. Cuanto más miran, según la hipótesis de los investigadores, más sorprendidos o interesados ​​pueden estar en lo que acaba de suceder.

Para sus experimentos, los investigadores crearon varios escenarios basados ​​en la investigación de desarrollo clásica para examinar el conocimiento del objeto central del modelo. Emplearon a 60 adultos para ver 64 videos de escenarios conocidos físicamente plausibles y físicamente inverosímiles. Los objetos, por ejemplo, se moverán detrás de una pared y, cuando la pared caiga, seguirán allí o se habrán ido. Los participantes calificaron su sorpresa en varios momentos en una escala creciente de 0 a 100. Luego, los investigadores mostraron los mismos videos a la modelo. Específicamente, los escenarios examinaron la capacidad del modelo para capturar nociones de permanencia (los objetos no aparecen o desaparecen sin ningún motivo), continuidad (los objetos se mueven a lo largo de trayectorias conectadas) y solidez (los objetos no pueden moverse entre sí).

ADEPT emparejó a los humanos particularmente bien en videos donde los objetos se movían detrás de las paredes y desaparecían cuando se quitaba la pared. Curiosamente, el modelo también igualó niveles de sorpresa en videos que a los humanos no les sorprendieron, pero que tal vez deberían haberlo hecho. Por ejemplo, en un video donde un objeto que se mueve a cierta velocidad desaparece detrás de una pared e inmediatamente sale por el otro lado, el objeto podría haber acelerado dramáticamente cuando pasó detrás de la pared o podría haberse teletransportado al otro lado. En general, tanto los humanos como ADEPT estaban menos seguros de si ese evento era sorprendente o no. Los investigadores también encontraron que las redes neuronales tradicionales que aprenden física a partir de las observaciones, pero que no representan objetos explícitamente, son mucho menos precisas para diferenciar escenas sorprendentes de las que no lo son.

A continuación, los investigadores planean profundizar en cómo los bebés observan y aprenden sobre el mundo, con el objetivo de incorporar nuevos hallazgos en su modelo. Los estudios, por ejemplo, muestran que los bebés hasta cierta edad en realidad no se sorprenden mucho cuando los objetos cambian por completo de alguna manera, como si un camión desaparece detrás de una pared, pero vuelve a emerger como un pato.

“Queremos ver qué más se necesita incorporar para comprender el mundo más como los bebés y formalizar lo que sabemos sobre psicología para construir mejores agentes de IA”, dice Smith.

Loading

Danos tu valoración..

mauricio Valdés

Bloguero de aficionado y redactor de mi revista, utilizo codigos sagrados, me apasiona el Internet y la informática, lector de psicología, espiritualidad, criptomonedas, salud, llevo una vida simple con grandes sueños...

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *