OpenAI presentó el jueves un programa de inteligencia artificial llamado “Operador” que puede encargarse de tareas en línea como ordenar artículos o completar formularios.
Según OpenAI, el operador puede buscar páginas web e interactuar con ellas escribiendo, haciendo clic o desplazándose como lo haría una persona.
“Se le puede pedir al operador que maneje una amplia variedad de tareas repetitivas del navegador, como completar formularios, ordenar alimentos e incluso crear memes”, dijo OpenAI en una publicación en línea.
“La capacidad de utilizar las mismas interfaces y herramientas con las que interactúan los humanos a diario amplía la utilidad de la IA, ayudando a las personas a ahorrar tiempo en las tareas diarias y abriendo nuevas oportunidades de participación para las empresas”.
Un “agente” de IA, la última tendencia de Silicon Valley, es un ayudante digital que se supone debe detectar el entorno, tomar decisiones y emprender acciones para lograr objetivos específicos.
Google anunció en diciembre las capacidades de sus agentes con el lanzamiento de Gemini 2.0, su modelo de inteligencia artificial más avanzado hasta la fecha.
Anthropic, rival de la carrera de IA, añadió dos meses antes una función de “uso de computadora” a su modelo de IA Claude Frontier en una fase beta pública experimental.
“Los desarrolladores pueden indicarle a Claude que use las computadoras como lo hacen las personas: mirando una pantalla, moviendo un cursor, haciendo clic en botones y escribiendo texto”, dijo Anthropic en una publicación en ese momento, advirtiendo que era un trabajo en progreso.
OpenAI describió a Operador como uno de sus primeros agentes de IA capaz de realizar trabajos para personas de forma independiente, diseñado para completar las tareas que se le asignan.
El operador está disponible sólo para los usuarios estadounidenses que pagan por suscripciones Pro al servicio OpenAI “para garantizar una implementación segura e iterativa”, dijo OpenAI.
“Si encuentra desafíos o comete errores, el Operador puede aprovechar sus capacidades de razonamiento para autocorregirse”, dijo OpenAI.
“Cuando se atasca y necesita ayuda, simplemente le devuelve el control al usuario”.
Según OpenAI, el operador está capacitado para pedirle al usuario que se haga cargo de tareas que requieren inicio de sesión, detalles de pago o cuando resuelve desafíos de seguridad “CAPTCHA” destinados a distinguir entre personas y software en línea.
“Los usuarios pueden hacer que el operador ejecute múltiples tareas simultáneamente creando nuevas conversaciones, como pedir una taza esmaltada personalizada en Etsy mientras reservan un campamento en Hipcamp”, dijo OpenAI.
gc/bs