OpenAIのオペレーターエージェントは新しいAIモデルで強化されます

OpenAIは、Operatorを従来のカスタムバージョンのGPT-4oから、OpenAIの「推論」モデルの最新のoシリーズの1つであるo3に基づくモデルに更新しました。o3 Operatorは、コンピュータ利用のための追加の安全データで微調整され、モデルに意思決定の境界を教えるための安全データセットが含まれています。

OpenAIは、OpenAI o3のバージョンに基づいた新しいコンピュータ使用エージェント(CUA)モデルでChatGPTのオペレーターをアップグレードしました。この新しいモデルにより、オペレーターはブラウザとのインタラクションにおいてより持続的かつ正確になり、全体的なタスク成功率が向上しました。また、より明確で徹底的な構造化された応答を提供します。

OpenAIによると、新しいCUAモデルは業界に対して強いパフォーマンスを示し、OSWorldおよびWebArenaでSOTAを達成しました。また、確立されたベンチマークと人間の好み評価の両方において、前のバージョンに対しても相対的に強いパフォーマンスを示しました。

OpenAIはGPT‑4oベースのモデルをo3ベースのバージョンに置き換えます

OpenAIはChatGPTオペレーターエージェントの大きなアップグレードについて示唆しています pic.twitter.com/iGPQp9butD

— SabatAge (@sabatage) 2025 年 5 月 22 日

OpenAIは、オペレーター用の既存のGPT‑4oベースのモデルを、OpenAI o3に基づくバージョンに置き換えましたが、APIバージョンは4oに基づいたままとなります。このAI企業はまた、o3オペレーターが4oバージョンに使用されているのと同じ多層的な安全アプローチを使用していると主張しました。

しかし、o3ファミリーの他のモデルと比較して、o3オペレーターはコンピュータ使用のための追加の安全データで微調整されており、確認と拒否に関するモデルの意思決定境界を教えるために設計された安全データセットが含まれています。

OpenAIは、o3オペレーターの特定の安全評価における性能を示す技術報告書を発表しました。GPT-4oオペレーターモデルと比較して、o3オペレーターは「違法な」活動を実行することを拒否する可能性が低く、敏感な個人データを検索することや、「プロンプトインジェクション」として知られるAI攻撃の形式に対しても影響を受けにくいことがわかりました。

“o3オペレーターは、4oバージョンのオペレーターで使用したのと同じ多層的な安全アプローチを使用しています…o3オペレーターはo3のコーディング機能を継承していますが、コーディング環境やターミナルへのネイティブアクセスはありません。”

–オープンAI

AI企業は、新しいo3ベースのモデルが標準的な安全評価を通過したことも明らかにし、オペレーターは引き続き世界中のChatGPT Proユーザーに研究プレビューとして利用可能であると述べました。しかし、このアップグレードされたモデルは、ChatGPTのオペレーターでのみ利用可能でした。

クノップは、OpenAIのo3モデルを運用することが予想よりもコストがかかる可能性があると疑っている。

先週、ARC-AGIを維持・管理するArc Prize Foundationは、o3の近似計算コストを更新しました。組織は、テストしたo3の最も性能が良い構成であるo3 highが、単一のARC-AGI問題を解決するのに約$3Kかかると最初に見積もっていました。しかし、財団は現在、コストが以前の見積もりよりも10倍高くなる可能性があり、タスクごとに約$30Kになる可能性があると考えています。

また、OpenAIはまだo3の価格を設定しておらず、完全にリリースもしていないが、Arc Prize Foundationの共同創設者であるMike Knoopは、o1-proモデルの価格が合理的な代理指標であり、o3の真のコストにより近い比較であると考えている。しかし、彼は、公式な価格が発表されるまでの不確実性を反映するために、o3はリーダーボード上でプレビューとして表示され続けると付け加えた。

Arc Prize Foundationによると、モデルが報告されている計算リソースの量を考えると、o3 highの高価格は不可能ではないとのことです。o3 highは、ARC-AGIに取り組むために、o3の最低計算構成であるo3 lowの172倍の計算を使用しました。

3月初旬から、OpenAIが企業顧客向けに導入を検討している高額プランについての噂が飛び交っています。報道によると、同社はソフトウェア開発者エージェントのような専門的なAI「エージェント」に対して、月額最大20,000ドルを請求する可能性があるとのことです。

しかし、一部の人々はOpenAIの最も高価なモデルでも、典型的な人間の契約者やスタッフが要求する金額をはるかに下回ると主張しましたが、AI研究者のトビー・オードは、モデルがそれほど効率的ではない可能性があることを指摘しました。例えば、o3 highはARC-AGIで最高のスコアを達成するために、各タスクで1,024回の試行を必要としました。

KEY Difference Wire: 暗号プロジェクトが保証されたメディア報道を得るために使用する秘密のツール

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)