Mostrar a los robots cómo hacer sus tareas

Al observar a los humanos, los robots aprenden a realizar tareas complejas, como poner una mesa.

Entrenar robots interactivos puede ser un día un trabajo fácil para todos, incluso para aquellos sin experiencia en programación. Los especialistas en robótica están desarrollando robots automatizados que pueden aprender nuevas tareas únicamente observando a los humanos. En casa, algún día podrías mostrarle a un robot doméstico cómo hacer tareas rutinarias. En el lugar de trabajo, podría entrenar a los robots como nuevos empleados, mostrándoles cómo realizar muchas tareas.

Avanzando en esa visión, los investigadores del MIT han diseñado un sistema que permite que este tipo de robots aprendan tareas complicadas que de otro modo los bloquearían con demasiadas reglas confusas. Una de esas tareas es poner una mesa para cenar bajo ciertas condiciones.  

En esencia, el sistema de «Planificación con especificaciones inciertas» (PUnS) de los investigadores brinda a los robots la capacidad de planificación similar a la humana para sopesar simultáneamente muchos requisitos ambiguos y potencialmente contradictorios para alcanzar un objetivo final. Al hacerlo, el sistema siempre elige la acción más probable a realizar, basándose en una “creencia” acerca de algunas especificaciones probables para la tarea que se supone que debe realizar.

En su trabajo, los investigadores compilaron un conjunto de datos con información sobre cómo ocho objetos (una taza, un vaso, una cuchara, un tenedor, un cuchillo, un plato, un plato pequeño y un tazón) podrían colocarse sobre una mesa en varias configuraciones. Un brazo robótico observó por primera vez demostraciones humanas seleccionadas al azar de poner la mesa con los objetos. Luego, los investigadores encargaron al brazo que colocara automáticamente una mesa en una configuración específica, en experimentos del mundo real y en simulación, en función de lo que había visto.

Para tener éxito, el robot tuvo que sopesar muchos ordenes de ubicación posibles, incluso cuando los elementos se quitaron, apilaron u ocultaron deliberadamente. Normalmente, todo eso confundiría demasiado a los robots. Pero el robot de los investigadores no cometió errores en varios experimentos del mundo real, y solo unos pocos errores en decenas de miles de pruebas simuladas.  

«La visión es poner la programación en manos de expertos en el dominio, que pueden programar robots de manera intuitiva, en lugar de describir órdenes a un ingeniero para que las agregue a su código», dice el primer autor Ankit Shah, estudiante graduado en el Departamento de Aeronáutica. y Astronáutica (AeroAstro) y el Grupo de Robótica Interactiva, quien destaca que su trabajo es solo un paso para cumplir esa visión. “De esa manera, los robots ya no tendrán que realizar tareas preprogramadas. Los trabajadores de la fábrica pueden enseñar a un robot a realizar múltiples tareas de ensamblaje complejas. Los robots domésticos pueden aprender cómo apilar gabinetes, cargar el lavavajillas o poner la mesa de las personas en el hogar”.

Junto a Shah en el artículo están AeroAstro y el estudiante graduado del Grupo de Robótica Interactiva Shen Li y la líder del Grupo de Robótica Interactiva Julie Shah, profesora asociada en AeroAstro y el Laboratorio de Ciencias de la Computación e Inteligencia Artificial.

consecuencias de la falla no son tan graves, los diseñadores pueden optar por dar a los robots una mayor flexibilidad para probar diferentes enfoques.

Con los criterios establecidos, los investigadores desarrollaron un algoritmo para convertir la creencia del robot (la distribución de probabilidad que apunta a la fórmula deseada) en un problema de aprendizaje por refuerzo equivalente. Este modelo hará ping al robot con una recompensa o penalización por una acción que realice, según la especificación que decida seguir.

En las simulaciones que le pidieron al robot que colocara la mesa en diferentes configuraciones, solo cometió seis errores de 20,000 intentos. En demostraciones del mundo real, mostró un comportamiento similar a cómo un humano realizaría la tarea. Si un artículo no estaba visible inicialmente, por ejemplo, el robot terminaría de colocar el resto de la mesa sin el artículo. Luego, cuando se revelara el tenedor, lo colocaría en el lugar apropiado. “Ahí es donde la flexibilidad es muy importante”, dice Ankit Shah. “De lo contrario, se atascaría cuando espera colocar un tenedor y no terminar el resto de la configuración de la mesa”.

A continuación, los investigadores esperan modificar el sistema para ayudar a los robots a cambiar su comportamiento basándose en instrucciones verbales, correcciones o la evaluación del rendimiento del robot por parte del usuario. “Digamos que una persona le demuestra a un robot cómo poner una mesa en un solo lugar. La persona puede decir, ‘haz lo mismo en todos los demás lugares’ o, ‘coloca el cuchillo antes que el tenedor aquí’”, dice Ankit Shah. “Queremos desarrollar métodos para que el sistema se adapte naturalmente para manejar esos comandos verbales, sin necesidad de demostraciones adicionales”.  

Loading

Danos tu valoración..

mauricio Valdés

Bloguero de aficionado y redactor de mi revista, utilizo codigos sagrados, me apasiona el Internet y la informática, lector de psicología, espiritualidad, criptomonedas, salud, llevo una vida simple con grandes sueños...

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *