Prevén el surgimiento de “agentes de IA”
Estos agentes pueden hacer más que chatear. Pueden utilizar aplicaciones de software, sitios web y otras herramientas en línea, incluyendo hojas de cálculo, calendarios en línea, sitios de viajes
Miembros del equipo de investigación de IA en Nvidia, (de izq.) Anima Anandkumar, Yuke Zhu y Jim Fan..
Por Cade Metz y Karen Weise/ The New York Times
El chatbot ChatGPT fue diseñado para generar texto digital, todo desde poesía hasta trabajos finales y programas computacionales. Pero cuando un equipo de investigadores de inteligencia artificial en Nvidia, la empresa de chips computacionales, accedió a su tecnología subyacente, se dieron cuenta de que podía hacer mucho más.
En cuestión de semanas, le enseñaron a jugar al popular videojuego Minecraft. Dentro del universo digital de Minecraft, aprendió a nadar, recolectar plantas, cazar cerdos, extraer oro y construir casas.
“Puede entrar en el mundo de Minecraft y explorar por sí solo, recolectar materiales y mejorar cada vez más en todo tipo de habilidades”, dijo Linxi Fan, conocido como Jim, un científico investigador senior en Nvidia.
Capacidades del agente IA
El proyecto fue una señal inicial de que los investigadores líder mundiales en IA están transformando los chatbots en un nuevo tipo de sistema autónomo llamado agente IA. Estos agentes pueden hacer más que chatear. Pueden utilizar aplicaciones de software, sitios web y otras herramientas en línea, incluyendo hojas de cálculo, calendarios en línea, sitios de viajes y más. Con el tiempo, dicen los investigadores, los agentes IA podrían volverse mucho más sofisticados y podrían reemplazar a los trabajadores de oficina, automatizando casi cualquier trabajo administrativo.
“Esta es una enorme oportunidad comercial, potencialmente de billones de dólares”, dijo Jeff Clune, profesor de ciencias computacionales en la Universidad de Columbia Británica que anteriormente trabajó en OpenAI, la startup de San Francisco que construyó ChatGPT. “Esto tiene enormes ventajas —y enormes consecuencias— para la sociedad”.
El agente de Nvidia juega un juego. Agentes similares pueden programar juntas, editar archivos, analizar datos y crear gráficas de barras. La idea es que estos sistemas automatizados con el tiempo actúen como asistentes personales capaces de realizar una amplia gama de tareas.
GPT-4, la tecnología que subyace a ChatGPT, es lo que los investigadores llaman un modelo de lenguaje grande, un sistema de IA que aprende analizando grandes cantidades de datos. En los últimos meses, el sistema ha sorprendido a cientos de millones de personas con la forma en que genera correos electrónicos, escribe discursos e improvisa sobre casi cualquier tema. Pero su habilidad más importante puede ser la programación.
Puede generar un programa que dibuja un unicornio o deja caer nieve digital en la pantalla de su laptop. También puede generar código que accede a otras aplicaciones de software y sitios web. Así es como los investigadores de Nvidia enseñaron a GPT-4 a jugar Minecraft.
Los bots actuales no son lo suficientemente hábiles para realizar más que tareas simples. Y permitirles vagar libremente por Internet sería un riesgo. Por eso las empresas están empezando en pequeño.
ChatGPT
Unos meses después de que OpenAI presentó ChatGPT, lanzó una forma para que el chatbot hiciera más. Después de instalar varios plugins —software que aumenta lo que el bot puede hacer— podrías pedirle que busque vuelos en sitios de viajes, tome un mapa de tu ciudad natal de Google Earth o transforme una hoja de cálculo que detalle tus gastos anuales en un gráfico. Con un plugin llamado intérprete de código, ChatGPT no sólo podía escribir código, sino también ejecutarlo. Esto permitió al bot editar hojas de cálculo y transformar imágenes fijas en videos. Otras empresas están explorando tecnologías similares.
“Estos son proyectos en los que imaginamos esencialmente IA trabajando con otras IA en nombre de uno”, dijo Ashley Llorens, vicepresidente en Microsoft.
En el verano del 2022, Clune formó parte de un equipo de investigadores de OpenAI que creó un agente que podía usar el software de manera muy similar a como lo haría una persona —clic del ratón tras clic del ratón, pulsación de tecla tras pulsación de tecla. El equipo alimentó al sistema con horas de videos de personas jugando Minecraft. Al analizar la forma en que las personas usaban su ratón y el teclado para sortear el universo digital de Minecraft, el sistema aprendió a jugar el juego.
Clune dijo que este tipo de agente con el tiempo permitirá que la inteligencia artificial utilice un abanico más amplio de aplicaciones y sitios web, dando a todos acceso a un asistente digital que potencialmente podría hacer casi cualquier cosa en Internet. Eso podría hacer la vida más fácil —pero también podría reemplazar empleos.
“Si la IA puede hacer cualquier cosa que podamos hacer, no sólo reemplaza las tareas aburridas”, afirmó. “Reemplaza todas las tareas”.
© 2023 The New York Times Company