Home Tecnología El modelo de IA de robótica Gemini de Google llega al mundo...

El modelo de IA de robótica Gemini de Google llega al mundo físico

8
0

En cuentos de ciencia ficción, la inteligencia synthetic a menudo alimenta todo tipo de robots inteligentes, capaces y ocasionalmente homicidas. Una limitación reveladora de la mejor IA de hoy es que, por ahora, permanece atrapada directamente dentro de la ventana de chat.

Google Deepmind señaló un plan para cambiar que hoy, presumiblemente menos la parte homicida, anunciando una nueva versión de su modelo de IA Géminis que fusiona el lenguaje, la visión y la acción física para impulsar una gama de robots más capaces, adaptativos y potencialmente útiles.

En una serie de movies de demostración, la compañía mostró varios robots equipados con el nuevo modelo, llamado Gemini Robotics, manipulando elementos en respuesta a los comandos hablados: los brazos de robotic se pliegan el papel, la mano sobre las verduras, colocan suavemente un par de vasos en un caso y full otras tareas. Los robots confían en el nuevo modelo para conectar elementos que son visibles con posibles acciones para hacer lo que se les cube. El modelo está entrenado de una manera que permite que el comportamiento se generalice en {hardware} muy diferente.

Google Deepmind también anunció una versión de su modelo llamado Gemini Robotics-Er (para razonamiento encarnado), que tiene una comprensión visible y espacial. La concept es que otros investigadores de robots usen este modelo para entrenar sus propios modelos para controlar las acciones de los robots.

En una demostración de video, los investigadores de Google Deepmind usaron el modelo para controlar un robotic humanoide llamado Apolo, desde la inicio Apptronik. El robotic conversa con un humano y mueve letras alrededor de una mesa cuando se le indica.

“Hemos podido llevar la comprensión mundial, la comprensión de concepto basic, de Géminis 2.0 a la robótica”, dijo Kanishka Rao, investigadora de robótica en Google Deepmind que dirigió el trabajo, en una sesión informativa antes del anuncio de hoy.

Google Deepmind cube que el nuevo modelo puede controlar diferentes robots con éxito en cientos de escenarios específicos que no se incluyeron previamente en su entrenamiento. “Una vez que el modelo de robotic tiene una comprensión de concepto basic, se vuelve mucho más basic y útil”, dijo Rao.

Los avances que dieron lugar a poderosos chatbots, incluidos los chatgpt de OpenAi y Géminis de Google, en los últimos años han aumentado la esperanza de una revolución related en la robótica, pero quedan grandes obstáculos.

fuente