OpenAIのオペレーターエージェントは新しいAIモデルで強化されます

2025-05-24 08:51:03

OpenAIは、Operatorを従来のカスタムバージョンのGPT-4oから、OpenAIの「推論」モデルの最新のoシリーズの1つであるo3に基づくモデルに更新しました。o3 Operatorは、コンピュータ利用のための追加の安全データで微調整され、モデルに意思決定の境界を教えるための安全データセットが含まれています。

OpenAIは、OpenAI o3のバージョンに基づいた新しいコンピュータ使用エージェント(CUA)モデルでChatGPTのオペレーターをアップグレードしました。この新しいモデルにより、オペレーターはブラウザとのインタラクションにおいてより持続的かつ正確になり、全体的なタスク成功率が向上しました。また、より明確で徹底的な構造化された応答を提供します。

OpenAIによると、新しいCUAモデルは業界に対して強いパフォーマンスを示し、OSWorldおよびWebArenaでSOTAを達成しました。また、確立されたベンチマークと人間の好み評価の両方において、前のバージョンに対しても相対的に強いパフォーマンスを示しました。

OpenAIはGPT‑4oベースのモデルをo3ベースのバージョンに置き換えます

OpenAIはChatGPTオペレーターエージェントの大きなアップグレードについて示唆しています pic.twitter.com/iGPQp9butD

— SabatAge (@sabatage) 2025 年 5 月 22 日

OpenAIは、オペレーター用の既存のGPT‑4oベースのモデルを、OpenAI o3に基づくバージョンに置き換えましたが、APIバージョンは4oに基づいたままとなります。このAI企業はまた、o3オペレーターが4oバージョンに使用されているのと同じ多層的な安全アプローチを使用していると主張しました。

しかし、o3ファミリーの他のモデルと比較して、o3オペレーターはコンピュータ使用のための追加の安全データで微調整されており、確認と拒否に関するモデルの意思決定境界を教えるために設計された安全データセットが含まれています。

OpenAIは、o3オペレーターの特定の安全評価における性能を示す技術報告書を発表しました。GPT-4oオペレーターモデルと比較して、o3オペレーターは「違法な」活動を実行することを拒否する可能性が低く、敏感な個人データを検索することや、「プロンプトインジェクション」として知られるAI攻撃の形式に対しても影響を受けにくいことがわかりました。

“o3オペレーターは、4oバージョンのオペレーターで使用したのと同じ多層的な安全アプローチを使用しています…o3オペレーターはo3のコーディング機能を継承していますが、コーディング環境やターミナルへのネイティブアクセスはありません。”

–オープンAI

AI企業は、新しいo3ベースのモデルが標準的な安全評価を通過したことも明らかにし、オペレーターは引き続き世界中のChatGPT Proユーザーに研究プレビューとして利用可能であると述べました。しかし、このアップグレードされたモデルは、ChatGPTのオペレーターでのみ利用可能でした。

クノップは、OpenAIのo3モデルを運用することが予想よりもコストがかかる可能性があると疑っている。

先週、ARC-AGIを維持・管理するArc Prize Foundationは、o3の近似計算コストを更新しました。組織は、テストしたo3の最も性能が良い構成であるo3 highが、単一のARC-AGI問題を解決するのに約$3Kかかると最初に見積もっていました。しかし、財団は現在、コストが以前の見積もりよりも10倍高くなる可能性があり、タスクごとに約$30Kになる可能性があると考えています。

また、OpenAIはまだo3の価格を設定しておらず、完全にリリースもしていないが、Arc Prize Foundationの共同創設者であるMike Knoopは、o1-proモデルの価格が合理的な代理指標であり、o3の真のコストにより近い比較であると考えている。しかし、彼は、公式な価格が発表されるまでの不確実性を反映するために、o3はリーダーボード上でプレビューとして表示され続けると付け加えた。

Arc Prize Foundationによると、モデルが報告されている計算リソースの量を考えると、o3 highの高価格は不可能ではないとのことです。o3 highは、ARC-AGIに取り組むために、o3の最低計算構成であるo3 lowの172倍の計算を使用しました。

3月初旬から、OpenAIが企業顧客向けに導入を検討している高額プランについての噂が飛び交っています。報道によると、同社はソフトウェア開発者エージェントのような専門的なAI「エージェント」に対して、月額最大20,000ドルを請求する可能性があるとのことです。

しかし、一部の人々はOpenAIの最も高価なモデルでも、典型的な人間の契約者やスタッフが要求する金額をはるかに下回ると主張しましたが、AI研究者のトビー・オードは、モデルがそれほど効率的ではない可能性があることを指摘しました。例えば、o3 highはARC-AGIで最高のスコアを達成するために、各タスクで1,024回の試行を必要としました。

KEY Difference Wire: 暗号プロジェクトが保証されたメディア報道を得るために使用する秘密のツール

AGENT-2.48%

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
リポスト
共有

0/400

コメントなし

トピック
#July PPI Beats Expectations
42k 人気度
#ETH ETFs Top $30B
43k 人気度
#Gate Alpha Peak Trading Competition
148k 人気度
#Gate Releases August Reserves Report
19k 人気度
#BTC Hits New ATH
107k 人気度

ピン

サイトマップ