El agente Operador de OpenAI recibe un impulso con un nuevo modelo de IA

2025-05-24 08:51:03

OpenAI actualizó el modelo de IA que impulsa a Operator de la versión personalizada anterior de GPT-4o a un modelo basado en o3, uno de los más recientes en la serie o de modelos de "razonamiento" de OpenAI. El Operator o3 fue ajustado con datos de seguridad adicionales para el uso de computadoras e incluyó conjuntos de datos de seguridad diseñados para enseñar al modelo los límites de decisión.

OpenAI mejoró el Operador en ChatGPT con un nuevo modelo de Agente de Uso de Computadora (CUA) basado en una versión de OpenAI o3. Con el nuevo modelo, el Operador se volvió más persistente y más preciso al interactuar con el navegador, mejorando la tasa de éxito general de las tareas. También ofrece respuestas mejor estructuradas que son más claras y completas.

Según OpenAI, el nuevo modelo CUA mostró un rendimiento más fuerte en comparación con la industria, logrando SOTA en OSWorld y WebArena. También mostró un rendimiento relativo más fuerte en comparación con la versión anterior, tanto en benchmarks establecidos como en evaluaciones de preferencia humana.

OpenAI reemplaza el modelo basado en GPT‑4o por una versión basada en o3

OpenAI insinúa una gran actualización para ChatGPT Operator Agent pic.twitter.com/iGPQp9butD

— SabatAge (@sabatage) 22 de mayo de 2025

OpenAI reemplazó el modelo existente basado en GPT‑4o para Operator con una versión basada en OpenAI o3, aunque la versión de la API seguirá basada en 4o. La firma de IA también afirmó que el Operator o3 utiliza el mismo enfoque de seguridad multicapa utilizado para la versión 4o.

Sin embargo, en comparación con otros modelos de la familia o3, el o3 Operator fue ajustado con datos de seguridad adicionales para el uso de computadoras, incluidos conjuntos de datos de seguridad diseñados para enseñar al modelo los límites de decisión sobre confirmaciones y rechazos.

OpenAI publicó un informe técnico que muestra el rendimiento del operador o3 en evaluaciones de seguridad específicas. En comparación con el modelo de operador GPT-4o, el operador o3 era menos propenso a negarse a realizar actividades "ilícitas" y a buscar datos personales sensibles y menos susceptible a una forma de ataque de IA conocida como "inyección de comandos."

“o3 Operator utiliza el mismo enfoque de múltiples capas para la seguridad que usamos para la versión 4o de Operator… Aunque el o3 Operator hereda las capacidades de codificación de o3, no tiene acceso nativo a un entorno de codificación o Terminal.”

–OpenAI

La empresa de IA también reveló que el nuevo modelo basado en o3 pasó por evaluaciones de seguridad estándar, y Operator siguió estando disponible como una vista previa de investigación para los usuarios de ChatGPT Pro a nivel mundial. Sin embargo, este modelo mejorado solo estaba disponible en Operator en ChatGPT.

Knoop sospecha que ejecutar el modelo o3 de OpenAI podría ser más costoso de lo esperado

La semana pasada, la Fundación Arc Prize, que mantiene y administra ARC-AGI, actualizó sus costos de computación aproximada para o3. La organización originalmente estimó que la configuración de mejor rendimiento de o3 que probó, o3 high, costaba alrededor de $3K para resolver un solo problema de ARC-AGI. Sin embargo, la Fundación ahora cree que el costo podría ser 10 veces más alto de lo estimado anteriormente, posiblemente alrededor de $30K por tarea.

Además, aunque OpenAI aún no ha establecido un precio para o3 ni lo ha lanzado completamente, uno de los cofundadores de la Arc Prize Foundation, Mike Knoop, cree que el precio del modelo o1-pro es un proxy razonable y una comparación más cercana del verdadero costo de o3. Sin embargo, añadió que o3 seguiría etiquetándose como una vista previa en la tabla de clasificación para reflejar la incertidumbre hasta que se anunciara el precio oficial.

Según la Fundación Arc Prize, un precio alto para o3 high no sería descabellado, dada la cantidad de recursos informáticos que, según se informa, utiliza el modelo. o3 high utilizó 172 veces más computación que o3 low, la configuración de menor computación de o3, para abordar ARC-AGI.

Desde principios de marzo, han estado circulando rumores sobre los costosos planes que OpenAI estaba considerando introducir para clientes empresariales. La información reportó que la empresa podría cobrar hasta $20K por mes por "agentes" de IA especializados, como agentes de desarrolladores de software.

Sin embargo, mientras algunos argumentaron que incluso los modelos más caros de OpenAI costarían mucho menos de lo que un contratista o empleado humano típico cobraría, el investigador de IA Toby Ord señaló que los modelos pueden no ser tan eficientes. Por ejemplo, o3 high necesitó 1,024 intentos en cada tarea en ARC-AGI para lograr su mejor puntuación.

Diferencia clave Wire: la herramienta secreta que los proyectos de criptomonedas utilizan para obtener cobertura mediática garantizada

AGENT-13.27%

Ver originales

El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.

Recompensa
Me gusta
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
#PI#
284k publicaciones
#BTC#
257k publicaciones
#ETH#
167k publicaciones
4#GateioInto11#
82k publicaciones
5#ContentStar#
68k publicaciones
6#GT#
68k publicaciones
7#DOGE#
62k publicaciones
8#BOME#
62k publicaciones
9#MAGA#
53k publicaciones
10#SLERF#
51k publicaciones

Anclado