La compañía de tecnología Google, junto con su división de inteligencia artificial DeepMind, ha anunciado avances significativos hacia la creación de robots autónomos seguros para la interacción con humanos. La presentación incluye una nueva «Constitución robótica» destinada a guiar el comportamiento de los robots en situaciones del mundo real, según se explica en el blog de DeepMind.
La iniciativa fue presentada junto a 3 herramientas clave: AutoRT, SARA-RT y RT-Trajectory, diseñadas con el objetivo de mejorar la recopilación de datos de robots en el mundo real, aumentar su velocidad y mejorar su capacidad de generalización.
Los robots no pueden hacer daño al ser humano
Esta constitución se implementa como una serie de directrices centradas en la seguridad y está inspirada en las famosas 3 leyes de la robótica propuestas por el escritor y científico Isaac Asimov:
- Un robot debe proteger su existencia a toda costa.
- Un robot debe obtener y mantener el acceso a su propia fuente de energía.
- Un robot debe buscar continuamente mejores fuentes de energía.
En ese sentido, las reglas fundamentales elaboradas por Google se centran en el principio de que un robot no puede causar daño a un ser humano. Además, se prohíbe a los robots realizar tareas que involucren la participación de personas, animales, objetos punzantes o dispositivos eléctricos; y se establecen medidas prácticas de seguridad, como la detención automática en caso de que la fuerza en las articulaciones de los robots exceda ciertos umbrales e interruptores de apagado físicos para el control humano.
El trabajo realizado tiene su base en Robotics Transformers 2 (RT-2), que DeepMind inició para ayudar a los robots a tomar decisiones más rápido y comprender y navegar mejor en sus entornos.
Así son las 3 herramientas de la constitución robótica
1. AutoRT
Este sistema utiliza Grandes Modelos de lenguaje (LLM), o Modelos de Lenguaje Visual (VLM), junto con un modelo de control de robot (RT-1 o RT-2). AutoRT se centra en la recopilación de datos de entrenamiento experiencial en entornos novedosos y diversos. Permite dirigir simultáneamente múltiples robots para realizar diversas tareas en entornos del mundo real.
Explicado de una manera más simple, esta herramienta es como el maestro de entrenamiento de los robots. AutoRT puede enseñar al robot cómo hacer tareas cotidianas. Por ejemplo, le muestra al robot imágenes y le dice qué hacer en diferentes situaciones para que aprenda a comprender y realizar diversas tareas en entornos nuevos y diferentes.
Durante un período de 7 meses, el sistema AutoRT fue sometido a evaluaciones en entornos del mundo real, específicamente en diversos edificios de oficinas. La prueba involucró la orquestación segura de hasta 20 robots simultáneamente y hasta 52 robots únicos en total. Estos fueron equipados con cámaras de video y efector final, y se desplegaron para realizar 77.000 pruebas robóticas en 6.650 tareas únicas. El enfoque permitió al sistema recopilar un conjunto de datos diverso y significativo, demostrando la capacidad de AutoRT para dirigir múltiples robots en entornos novedosos y llevar a cabo tareas variadas de manera efectiva.
2. SARA-RT
Este sistema convierte los modelos de Transformadores de Robótica (RT) en versiones más eficientes. Se utiliza para mejorar la velocidad y la precisión de los modelos RT.
Piensa en SARA-RT (Self-Adaptive Robust Attention for Robotics Transformers) como una mejora de la capacidad de pensamiento rápido de los robots. Cuando toman decisiones, los robots a veces pueden volverse lentos debido a la cantidad de información que deben procesar. SARA-RT los ayuda a pensar más rápido y con mayor precisión.
SARA-RT fue sometido a pruebas comparativas con modelos RT-2 existentes y resultó ser un 10,6% más preciso y un 14% más rápido que los modelos RT-2 después de recibir un breve historial de imágenes.
Como explica DeepMind, «Diseñamos nuestro sistema para que sea fácil de usar y esperamos que muchos investigadores y profesionales lo apliquen, en robótica y más allá. Debido a que SARA proporciona una receta universal para acelerar Transformers, sin necesidad de una capacitación previa computacionalmente costosa, este enfoque tiene el potencial de ampliar masivamente el uso de la tecnología Transformers. No requiere ningún código adicional, ya que se pueden utilizar varias variantes lineales de código abierto».
3. RT-Trajectory
Esta herramienta se centra en mejorar la capacidad de los robots para generalizar movimientos. ALos ayuda a interpretar y ejecutar tareas específicas mediante la representación visual de las trayectorias de los movimientos que se diseñan para abordar diferentes aspectos de la interacción de los robots en el mundo real.
Es como un profesor de danza que agrega «dibujos« visuales de los movimientos del robot a los videos de entrenamiento. De esta manera, el robot no solo aprende qué debe hacer, sino también cómo debe moverse para realizar la tarea de manera eficiente. El sistema también puede crear trayectorias observando demostraciones humanas de las tareas deseadas e incluso aceptar bocetos dibujados a mano. Y se puede adaptar fácilmente a diferentes plataformas de robots.
Este modelo duplicó la tasa de éxito de modelos RT existentes. En comparación con RT-2, un brazo controlado por RT-Trajectory logró una tasa de éxito del 63%, frente al 29% para RT-2.