Empresas desarrollan robots que pueden hacer adecuaciones
Al identificar patrones en grandes cantidades de datos, estos sistemas pueden aprender a reconocer palabras, sonidos e imágenes
Covariant ha creado tecnología de IA que da a los robots una comprensión mucho más amplia del mundo que los rodea.
Por Cade Metz/ The New York Times
EMERYVILLE, California — Empresas como OpenAI y Midjourney construyen chatbots, generadores de imágenes y otras herramientas de inteligencia artificial que operan en el mundo digital. Ahora, una startup fundada por tres ex investigadores de OpenAI está utilizando los mismos métodos de desarrollo de tecnología para construir tecnología de IA que puede sortear el mundo físico.
Covariant, con sede en Emeryville, California, está creando formas para que los robots recojan, muevan y clasifiquen artículos. Su objetivo es ayudar a los robots a comprender lo que sucede a su alrededor y decidir qué deben hacer a continuación. La tecnología también brinda a los robots una amplia comprensión del idioma inglés, permitiendo a las personas hablar con ellos como si estuvieran hablando con ChatGPT.
La tecnología, aún en desarrollo, no es perfecta. Pero es una señal de que los sistemas de IA detrás de los chatbots en línea y generadores de imágenes también impulsarán máquinas en bodegas, carreteras y hogares.
Covariant, respaldado por 222 millones de dólares en financiamiento, no construye robots. Crea el software que impulsa a los robots.
Los sistemas de IA detrás de los chatbots y generadores de imágenes se denominan redes neuronales. Al identificar patrones en grandes cantidades de datos, estos sistemas pueden aprender a reconocer palabras, sonidos e imágenes —o incluso generarlos por sí solos.
Varias compañías están construyendo sistemas que pueden aprender de diferentes tipos de datos al mismo tiempo. Por ejemplo, al analizar una colección de fotografías y las descripciones de esas fotografías, un sistema puede captar las relaciones entre las dos. Puede aprender que la palabra “plátano” describe a una fruta curva de color amarillo.
OpenAI empleó ese sistema para construir Sora, su nuevo generador de video. Al analizar miles de videos con descripciones, el sistema aprendió a generar videos cuando se les daba una descripción de una escena.
Covariant, fundada por Pieter Abbeel, profesor en la Universidad de California, en Berkeley, y tres ex alumnos, Peter Chen, Rocky Duan y Tianhao Zhang, utilizaron técnicas similares para construir un sistema que impulsa a robots. La empresa ayuda a operar robots clasificadores en bodegas en todo el mundo. Ha pasado años recopilando datos —de cámaras y sensores— que muestran cómo operan estos robots.
Al combinar esos datos con las enormes cantidades de texto utilizadas para entrenar los chatbots, la tecnología da al robot el poder de manejar situaciones inesperadas. El robot sabe cómo recoger un plátano, aunque jamás haya visto un plátano. Si le dices “recoge un plátano”, sabrá lo que significa. Si le dices “recoge una fruta amarilla”, también lo entenderá.
La tecnología, llamada modelo fundamental de robótica, o RFM, comete errores, al igual que los chatbots. A medida que las compañías entrenen este tipo de sistema con colecciones de datos cada vez más grandes, los investigadores creen que mejorará rápidamente. Normalmente, los ingenieros en el pasado programaban robots para realizar el mismo movimiento preciso una y otra vez, pero los robots no podían afrontar situaciones aleatorias.
Sin embargo, al aprender de cientos de miles de ejemplos de lo que sucede en el mundo físico, los robots pueden empezar a manejar lo inesperado.
“Lo que hay en los datos digitales se puede transferir al mundo real”, dijo Chen.
© 2024 The New York Times Company