قامت OpenAI بتحديث نموذج الذكاء الاصطناعي الذي يدعم Operator من الإصدار المخصص السابق GPT-4o إلى نموذج يعتمد على o3، وهو واحد من أحدث نماذج OpenAI في سلسلة o من نماذج "التفكير". تم ضبط مشغل o3 باستخدام بيانات أمان إضافية لاستخدام الكمبيوتر وشملت مجموعات بيانات الأمان المصممة لتعليم النموذج حدود اتخاذ القرار.
قامت OpenAI بترقية المشغل في ChatGPT مع نموذج جديد لوكيل استخدام الكمبيوتر (CUA) استنادًا إلى إصدار OpenAI o3. مع النموذج الجديد، أصبح المشغل أكثر ديمومة ودقة عند التفاعل مع المتصفح، مما يحسن من معدل نجاح المهام بشكل عام. كما أنه يقدم استجابات أكثر تنظيمًا ووضوحًا وشمولية.
وفقًا لـ OpenAI، أظهر نموذج CUA الجديد أداءً أقوى مقارنة بالصناعة، محققًا SOTA على OSWorld و WebArena. كما أظهر أداءً نسبيًا أقوى مقارنة بالإصدار السابق، سواء في المعايير المعتمدة أو تقييمات تفضيل البشر.
تستبدل OpenAI نموذج GPT‑4o بنسخة تعتمد على o3
OpenAI تشير إلى ترقية كبيرة لوكيل ChatGPT pic.twitter.com/iGPQp9butD
— ساباتالعمر (@sabatage) 22 مايو 2025
استبدلت OpenAI النموذج القائم على GPT‑4o الموجود لنظام التشغيل بإصدار يعتمد على OpenAI o3، على الرغم من أن إصدار واجهة برمجة التطبيقات سيظل يعتمد على 4o. كما ادعت الشركة أن مشغل o3 يستخدم نفس نهج السلامة متعدد الطبقات المستخدم في إصدار 4o.
ومع ذلك، مقارنةً بالنماذج الأخرى في عائلة o3، تم ضبط مشغل o3 باستخدام بيانات أمان إضافية لاستخدام الكمبيوتر، بما في ذلك مجموعات بيانات الأمان المصممة لتعليم النموذج حدود القرار بشأن التأكيدات والرفض.
أصدرت OpenAI تقريرًا فنيًا يُظهر أداء مشغل o3 في تقييمات السلامة المحددة. مقارنةً بنموذج مشغل GPT-4o، كان مشغل o3 أقل احتمالًا لرفض تنفيذ الأنشطة "غير المشروعة" والبحث عن بيانات شخصية حساسة وأقل عرضة لنوع من الهجمات الذكية المعروفة باسم "حقن الطلب".
"يستخدم مشغل o3 نفس النهج متعدد الطبقات للسلامة الذي استخدمناه في النسخة 4o من المشغل... على الرغم من أن مشغل o3 يرث قدرات البرمجة الخاصة بـ o3، إلا أنه لا يتمتع بالوصول الأصلي إلى بيئة البرمجة أو الطرفية."
OpenAI
أفادت شركة الذكاء الاصطناعي أيضًا أن النموذج الجديد القائم على o3 قد خضع لتقييمات سلامة قياسية، وأن مشغل النظام لا يزال متاحًا كمعاينة بحثية لمستخدمي ChatGPT Pro عالميًا. ومع ذلك، كان هذا النموذج المحدث متاحًا فقط في مشغل النظام في ChatGPT.
يشتبه كنووب في أن تشغيل نموذج o3 الخاص بـ OpenAI قد يكون أكثر تكلفة مما هو متوقع
في الأسبوع الماضي ، قامت مؤسسة Arc Prize Foundation ، التي تحافظ على ARC-AGI وتديرها ، بتحديث تكاليف الحوسبة التقريبية ل o3. قدرت المنظمة في الأصل أن التكوين الأفضل أداء ل o3 الذي اختبرته ، o3 مرتفع ، يكلف حوالي 3 آلاف دولار لحل مشكلة ARC-AGI واحدة. ومع ذلك ، تعتقد المؤسسة الآن أن التكلفة يمكن أن تكون أعلى بمقدار 10 أضعاف مما كان مقدرا سابقا ، وربما حوالي 30 ألف دولار لكل مهمة.
أيضًا، بينما لم تقم OpenAI بعد بتسعير o3 أو إصداره بالكامل حتى الآن، يعتقد أحد مؤسسي مؤسسة Arc Prize، مايك كنوب، أن تسعير نموذج o1-pro هو معيار معقول ومقارنة أقرب للتكلفة الحقيقية لـ o3. ومع ذلك، أضاف أن o3 ستبقى مصنفة كمعاينة على لوحة المتصدرين لتعكس عدم اليقين حتى يتم الإعلان عن التسعير الرسمي.
وفقًا لمؤسسة جائزة Arc، فإن السعر المرتفع لـ o3 high ليس خارج السؤال، نظرًا لعدد موارد الحوسبة التي يستخدمها النموذج على ما يبدو. استخدم o3 high 172 مرة أكثر من الحوسبة مقارنة بـ o3 low، وهو أقل تكوين حوسبة لـ o3، لمعالجة ARC-AGI.
تتداول الشائعات منذ أوائل مارس حول الخطط المكلفة التي كانت OpenAI تفكر في تقديمها للعملاء من الشركات. وأفادت المعلومات بأن الشركة قد تتقاضى ما يصل إلى 20 ألف دولار شهريًا مقابل "عملاء" الذكاء الاصطناعي المتخصصين، مثل عملاء مطوري البرمجيات.
ومع ذلك، بينما جادل البعض بأن أغلى نماذج OpenAI ستكلف أقل بكثير مما يتقاضاه مقاول أو موظف بشري نموذجي، أشار الباحث في الذكاء الاصطناعي توبي أور إلى أن النماذج قد لا تكون فعالة بنفس القدر. على سبيل المثال، احتاج نموذج o3 high إلى 1,024 محاولة في كل مهمة في ARC-AGI لتحقيق أفضل نتيجة له.
الفرق الرئيسي في Wire: الأداة السرية التي تستخدمها مشاريع العملات المشفرة للحصول على تغطية إعلامية مضمونة
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
يستفيد وكيل أوبن إيه آي من تعزيز مع نموذج الذكاء الاصطناعي الجديد
قامت OpenAI بتحديث نموذج الذكاء الاصطناعي الذي يدعم Operator من الإصدار المخصص السابق GPT-4o إلى نموذج يعتمد على o3، وهو واحد من أحدث نماذج OpenAI في سلسلة o من نماذج "التفكير". تم ضبط مشغل o3 باستخدام بيانات أمان إضافية لاستخدام الكمبيوتر وشملت مجموعات بيانات الأمان المصممة لتعليم النموذج حدود اتخاذ القرار.
قامت OpenAI بترقية المشغل في ChatGPT مع نموذج جديد لوكيل استخدام الكمبيوتر (CUA) استنادًا إلى إصدار OpenAI o3. مع النموذج الجديد، أصبح المشغل أكثر ديمومة ودقة عند التفاعل مع المتصفح، مما يحسن من معدل نجاح المهام بشكل عام. كما أنه يقدم استجابات أكثر تنظيمًا ووضوحًا وشمولية.
وفقًا لـ OpenAI، أظهر نموذج CUA الجديد أداءً أقوى مقارنة بالصناعة، محققًا SOTA على OSWorld و WebArena. كما أظهر أداءً نسبيًا أقوى مقارنة بالإصدار السابق، سواء في المعايير المعتمدة أو تقييمات تفضيل البشر.
تستبدل OpenAI نموذج GPT‑4o بنسخة تعتمد على o3
OpenAI تشير إلى ترقية كبيرة لوكيل ChatGPT pic.twitter.com/iGPQp9butD
— ساباتالعمر (@sabatage) 22 مايو 2025
استبدلت OpenAI النموذج القائم على GPT‑4o الموجود لنظام التشغيل بإصدار يعتمد على OpenAI o3، على الرغم من أن إصدار واجهة برمجة التطبيقات سيظل يعتمد على 4o. كما ادعت الشركة أن مشغل o3 يستخدم نفس نهج السلامة متعدد الطبقات المستخدم في إصدار 4o.
ومع ذلك، مقارنةً بالنماذج الأخرى في عائلة o3، تم ضبط مشغل o3 باستخدام بيانات أمان إضافية لاستخدام الكمبيوتر، بما في ذلك مجموعات بيانات الأمان المصممة لتعليم النموذج حدود القرار بشأن التأكيدات والرفض.
أصدرت OpenAI تقريرًا فنيًا يُظهر أداء مشغل o3 في تقييمات السلامة المحددة. مقارنةً بنموذج مشغل GPT-4o، كان مشغل o3 أقل احتمالًا لرفض تنفيذ الأنشطة "غير المشروعة" والبحث عن بيانات شخصية حساسة وأقل عرضة لنوع من الهجمات الذكية المعروفة باسم "حقن الطلب".
"يستخدم مشغل o3 نفس النهج متعدد الطبقات للسلامة الذي استخدمناه في النسخة 4o من المشغل... على الرغم من أن مشغل o3 يرث قدرات البرمجة الخاصة بـ o3، إلا أنه لا يتمتع بالوصول الأصلي إلى بيئة البرمجة أو الطرفية."
أفادت شركة الذكاء الاصطناعي أيضًا أن النموذج الجديد القائم على o3 قد خضع لتقييمات سلامة قياسية، وأن مشغل النظام لا يزال متاحًا كمعاينة بحثية لمستخدمي ChatGPT Pro عالميًا. ومع ذلك، كان هذا النموذج المحدث متاحًا فقط في مشغل النظام في ChatGPT.
يشتبه كنووب في أن تشغيل نموذج o3 الخاص بـ OpenAI قد يكون أكثر تكلفة مما هو متوقع
في الأسبوع الماضي ، قامت مؤسسة Arc Prize Foundation ، التي تحافظ على ARC-AGI وتديرها ، بتحديث تكاليف الحوسبة التقريبية ل o3. قدرت المنظمة في الأصل أن التكوين الأفضل أداء ل o3 الذي اختبرته ، o3 مرتفع ، يكلف حوالي 3 آلاف دولار لحل مشكلة ARC-AGI واحدة. ومع ذلك ، تعتقد المؤسسة الآن أن التكلفة يمكن أن تكون أعلى بمقدار 10 أضعاف مما كان مقدرا سابقا ، وربما حوالي 30 ألف دولار لكل مهمة.
أيضًا، بينما لم تقم OpenAI بعد بتسعير o3 أو إصداره بالكامل حتى الآن، يعتقد أحد مؤسسي مؤسسة Arc Prize، مايك كنوب، أن تسعير نموذج o1-pro هو معيار معقول ومقارنة أقرب للتكلفة الحقيقية لـ o3. ومع ذلك، أضاف أن o3 ستبقى مصنفة كمعاينة على لوحة المتصدرين لتعكس عدم اليقين حتى يتم الإعلان عن التسعير الرسمي.
وفقًا لمؤسسة جائزة Arc، فإن السعر المرتفع لـ o3 high ليس خارج السؤال، نظرًا لعدد موارد الحوسبة التي يستخدمها النموذج على ما يبدو. استخدم o3 high 172 مرة أكثر من الحوسبة مقارنة بـ o3 low، وهو أقل تكوين حوسبة لـ o3، لمعالجة ARC-AGI.
تتداول الشائعات منذ أوائل مارس حول الخطط المكلفة التي كانت OpenAI تفكر في تقديمها للعملاء من الشركات. وأفادت المعلومات بأن الشركة قد تتقاضى ما يصل إلى 20 ألف دولار شهريًا مقابل "عملاء" الذكاء الاصطناعي المتخصصين، مثل عملاء مطوري البرمجيات.
ومع ذلك، بينما جادل البعض بأن أغلى نماذج OpenAI ستكلف أقل بكثير مما يتقاضاه مقاول أو موظف بشري نموذجي، أشار الباحث في الذكاء الاصطناعي توبي أور إلى أن النماذج قد لا تكون فعالة بنفس القدر. على سبيل المثال، احتاج نموذج o3 high إلى 1,024 محاولة في كل مهمة في ARC-AGI لتحقيق أفضل نتيجة له.
الفرق الرئيسي في Wire: الأداة السرية التي تستخدمها مشاريع العملات المشفرة للحصول على تغطية إعلامية مضمونة