Sociedad | Comprometidos | Internacionales

El 'agente web' navega por sitios web complejos utilizando comandos de lenguaje natural.

En un esfuerzo por hacer que Internet sea más accesible para las personas con discapacidades, investigadores de la Universidad Estatal de Ohio han comenzado a desarrollar un agente de inteligencia artificial que podría completar tareas complejas en cualquier sitio web utilizando comandos de lenguaje simples.

Desarrollan Agentes Web con IA para hacer Internet más accesible

Ohio State News

En las tres décadas desde su lanzamiento, la World Wide Web se ha convertido en un sistema altamente complejo y dinámico. Pero debido precisamente a que el funcionamiento de Internet es ahora una parte integral del bienestar de la sociedad, dicha complejidad también significa más dificultades para navegar.

Para algunas personas, especialmente aquellas con discapacidades, no les resulta fácil navegar por Internet",señala Yu Su, profesor asistente de ciencias informáticas e ingeniería en Ohio State.

"Dependemos cada vez más del mundo de la informática en nuestra vida diaria y en nuestro trabajo, pero cada vez hay más barreras para ese acceso, lo que, hasta cierto punto, amplía la disparidad".
El Dr. Yu Su y un equipo de trabajo presentaron un estudio en diciembre en la Trigésima Séptima Conferencia sobre Sistemas de Procesamiento de Información Neural (NeurIPS) , una conferencia emblemática para la investigación de la IA y el aprendizaje automático.
Al aprovechar el poder de los grandes modelos de lenguaje, el agente funciona de manera similar a cómo se comportan los humanos cuando navegan por la web, dijo Su. El equipo de Ohio State demostró que su modelo era capaz de comprender el diseño y la funcionalidad de diferentes sitios web utilizando únicamente su capacidad para procesar y predecir el lenguaje.

Los investigadores comenzaron el proceso creando Mind2Web, el primer conjunto de datos para agentes web generalistas. Aunque los esfuerzos anteriores para crear agentes web se centraron en sitios web simulados, Mind2Web adopta plenamente la naturaleza compleja y dinámica de los sitios web del mundo real y privilegia la capacidad de un agente de generalizar a sitios web completamente nuevos que nunca antes había visto.

El professor Su dijo que gran parte de su éxito se debe a la capacidad de su agente para manejar la curva de aprendizaje en constante evolución de Internet. El equipo realizó más de 2000 tareas abiertas de 137 sitios web diferentes del mundo real, que luego utilizaron para capacitar al agente.

Algunas de las tareas incluyeron reservar vuelos internacionales de ida y de ida y vuelta, seguir cuentas de celebridades en Twitter, buscar películas de comedia de 1992 a 2017 transmitidas en Netflix e incluso programar pruebas de conocimientos sobre automóviles en el DMV. Muchas de las tareas eran muy complejas; por ejemplo, reservar uno de los vuelos internacionales utilizados en el modelo requeriría 14 acciones. Esta versatilidad sencilla permite una cobertura diversa en varios sitios web y abre un nuevo panorama para que futuros modelos exploren y aprendan de manera autónoma, dijo Su.

"Sólo es posible hacer algo como esto gracias al reciente desarrollo de grandes modelos de lenguaje como ChatGPT", dijo Su. Desde que el chatbot se hizo público en noviembre de 2022, millones de usuarios lo han utilizado para generar contenido automáticamente, desde poesía y chistes hasta consejos de cocina y diagnósticos médicos.

Con más ajustes, señala el estudio, el modelo probablemente podría usarse en conjunto con modelos de lenguajes grandes de código abierto y cerrado, como Flan-T5 o GPT-4 . Sin embargo, su trabajo resalta un problema ético cada vez más relevante en la creación de inteligencia artificial flexible, dijo Su. Si bien ciertamente podría servir como un agente útil para los humanos que navegan por la web, el modelo también podría usarse para mejorar sistemas como ChatGPT y convertir todo Internet en una herramienta poderosa sin precedentes, dijo Su.
La investigación fue apoyada por la Fundación Nacional de Ciencias, el Laboratorio de Investigación del Ejército de EE. UU. y el Centro de Supercomputadoras de Ohio. Otros coautores fueron Xiang Deng, Yu Gu, Boyuan Zheng, Shijie Chen, Samuel Stevens, Boshi Wang y Huan Sun, todos

La imagen muestra una portada del libro The inteligent Web.

Portada de libro digital

del estado de Ohio.