Japón ha creado un robot humanoide basado en GPT-4: el resultado es impresionante (vídeo)

Un equipo de la Universidad de Tokio ha presentado Alter3, un robot humanoide capaz de realizar movimientos utilizando el GPT-4 large language model (LLM).

Alter3 utiliza la última herramienta de Open AI para adoptar dinámicamente una gran variedad de poses, desde la pose selfie a la imitación de un fantasma, todo ello sin necesidad de entradas preprogramadas en la base de datos.

“La respuesta de Alter3 al contenido hablado mediante expresiones faciales y gestos es un avance significativo en la robótica humanoide que puede adaptarse fácilmente a otros androides con modificaciones mínimas”, afirman los investigadores.

En el ámbito de la integración de LLM con robots, la atención se centra en mejorar la comunicación básica y modelar reacciones realistas. Los investigadores también están profundizando en las capacidades del LLM para que los robots puedan entender y ejecutar instrucciones complejas, aumentando así su funcionalidad.

Tradicionalmente, el control de robots de bajo nivel está ligado al hardware y escapa a la competencia de las corporaciones LLM. Esto crea dificultades para la gestión directa de los robots basados en LLM. Para resolver este problema, el equipo japonés ha desarrollado un método para convertir las expresiones de los movimientos humanos en código comprensible para android. Esto significa que el robot puede generar de forma independiente secuencias de acciones en el tiempo sin necesidad de que los desarrolladores programen individualmente cada parte del cuerpo.

Durante la interacción, una persona puede dar a Alter3 órdenes como “Hazte un selfie con tu iPhone”. Posteriormente, el robot inicia una serie de consultas a GPT-4 para obtener instrucciones sobre los pasos necesarios. GPT-4 traducirá esto a código Python, que permite al robot “entender” y realizar los movimientos necesarios. Esta innovación permite a Alter3 mover la parte superior de su cuerpo, mientras que la inferior permanece inmóvil, sujeta al soporte.

Alter3 es la tercera iteración de la serie Alter de robots humanoides desde 2016, y cuenta con 43 actuadores responsables de las expresiones faciales y los movimientos de las extremidades, todos ellos alimentados por aire comprimido. Esta configuración ofrece una amplia gama de gestos expresivos. El robot no puede andar, pero puede imitar movimientos típicos de andar y correr.

Alter3 también demostró la capacidad de copiar poses humanas utilizando una cámara y el framework OpenPose. El robot adapta sus articulaciones a las posturas observadas y guarda las imitaciones logradas para utilizarlas en el futuro. La interacción con un humano dio lugar a una variedad de posturas, lo que apoya la idea de que los diferentes movimientos proceden de la imitación de un humano, al igual que los recién nacidos aprenden por imitación.

Antes de la llegada del LLM, los investigadores tenían que controlar cuidadosamente los 43 actuadores para reproducir una pose humana o imitar un comportamiento, como servir té o jugar al ajedrez. Esto requería numerosos ajustes manuales, pero la IA ayudó a liberar al equipo de esta rutina.

“Esperamos que Alter3 participe eficazmente en el diálogo mostrando gestos y expresiones faciales relevantes para el contexto. Ha demostrado la capacidad de reflejar emociones, como mostrar tristeza o felicidad en respuesta, compartiendo así emociones con nosotros”, afirman los investigadores.

Fuente root-nation
También podría gustarte
Comentarios
Loading...

Este sitio web utiliza cookies para mejorar su experiencia. Suponemos que está de acuerdo, pero puede darse de baja si lo desea. Acepte Seguir leyendo