OpenAI تطلق GPT-5.4

6 دقائق للقراءة

بعد يومين فقط من إطلاق نموذج المحادثة الفورية GPT-5.3 Instant, أعلنت شركة OpenAI عن نموذجها الأحدث في فئة نماذج التفكير والعمل الوكيلي (Agentic AI), وهو GPT-5.4.
يتوفر النموذج بإصدار Thinking وإصدار Pro.
تم بناء النموذج الجديد اعتمادًا على الأسس التي قدمتها نماذج GPT-5.2 Thinking في مجال التفكير المتقدم, وعلى قدرات البرمجة في GPT-5.3-Codex, ليجمع بين التفكير المتعمق, والبرمجة, واستخدام الأدوات, والعمل عبر واجهات الكمبيوتر.
يقدم GPT-5.4 تحسينات ملحوظة في عدة مجالات, من بينها الرؤية الحاسوبية وفهم الصور, واستخدام الكمبيوتر بشكل مباشر, بالإضافة إلى تقليل ظاهرة الهلوسة في النماذج اللغوية. وتشير بيانات الشركة إلى أن الادعاءات الفردية في إجابات النموذج أصبحت أقل احتمالًا أن تكون خاطئة بنسبة تصل إلى 33% مقارنة بـ GPT-5.2, كما أصبحت الإجابات الكاملة أقل احتواءً على أخطاء بنسبة تقارب 18%.
كما يدعم النموذج سياقًا يصل إلى مليون رمز (1M tokens) في بيئات التطوير مثل Codex وواجهة API, ما يسمح له بالتعامل مع مشاريع برمجية كبيرة أو مستندات ضخمة ضمن جلسة واحدة.
ومن أبرز الإضافات في GPT-5.4 قدراته الأصلية في استخدام الكمبيوتر. إذ يعد أول نموذج عام من الشركة يمتلك قدرات مدمجة للتفاعل مع واجهات الأنظمة والتطبيقات, حيث يمكنه فهم لقطات الشاشة والتفاعل مع عناصر الواجهة عبر الماوس ولوحة المفاتيح, ما يسمح للمطورين ببناء وكلاء ذكاء اصطناعي قادرين على تنفيذ مهام حقيقية داخل البرامج والمواقع بطريقة مشابهة لاستخدام البشر للحاسوب.
تُظهر اختبارات الأداء أن النموذج حقق نتائج متقدمة في معيار OSWorld-Verified الذي يقيس قدرة النماذج على التحكم في بيئة سطح المكتب, حيث وصل معدل النجاح إلى 75% مقارنة بـ 47.3% لنموذج GPT-5.2, متجاوزًا حتى الأداء البشري في بعض الحالات الذي بلغ 72.4%.
كما حقق النموذج نتائج قوية في استخدام المتصفح, حيث سجل 67.3% في معيار WebArena-Verified, وبلغت نسبة النجاح 92.8% في معيار Online-Mind2Web عند الاعتماد على الملاحظات المستخرجة من لقطات الشاشة فقط.
إلى جانب ذلك, حسّنت OpenAI قدرات النموذج في فهم الصور عالية الدقة. إذ يمكن للنموذج الآن معالجة صور تصل دقتها إلى 10.24 مليون بكسل أو حد أقصى يبلغ 6000 بكسل في أحد الأبعاد عند استخدام مستوى التفاصيل الكامل, ما يسمح بفهم أدق للصور المعقدة والوثائق عالية الجودة.
وفي مجال فهم المستندات والوثائق, حقق النموذج نتائج أفضل في معيار OmniDocBench, حيث انخفض متوسط الخطأ إلى 0.109 مقارنة بـ 0.140 في النموذج السابق, ما يعني قدرة أدق على استخراج النصوص والبيانات من المستندات.
كما يحقق GPT-5.4 تقدمًا واضحًا في مجال أعمال المعرفة (Knowledge Work) مثل إعداد العروض التقديمية, تحليل البيانات, إعداد الجداول, وكتابة التقارير. ففي اختبار GDPval الذي يقيس قدرة النماذج على تنفيذ مهام مهنية عبر 44 وظيفة مختلفة ضمن أهم الصناعات في الاقتصاد الأمريكي, حقق النموذج نتائج تنافس أداء الخبراء البشر في 83% من المقارنات, مقارنة بـ 70.9% فقط لنموذج GPT-5.2.
وفي الاختبارات الخاصة بمهام جداول البيانات المشابهة لما يقوم به محلل مالي مبتدئ في بنوك الاستثمار, سجل GPT-5.4 متوسط أداء بلغ 87.3% مقابل 68.4% للنموذج السابق. كما فضّل المقيمون البشر العروض التقديمية التي أنشأها GPT-5.4 بنسبة 68% مقارنة بتلك التي أنشأها GPT-5.2, بفضل جودة التصميم والتنوع البصري وتحسين استخدام الصور.
لدعم هذه القدرات, أطلقت الشركة أيضًا إضافة رسمية لبرنامج Excel تتيح استخدام قدرات ChatGPT مباشرة داخل الجداول, وهي متاحة حاليًا لعملاء خطط Enterprise.
في مجال البرمجة, يجمع GPT-5.4 بين قدرات التفكير المتقدم وأدوات التطوير, ويحقق أداءً يوازي أو يتجاوز نموذج GPT-5.3-Codex في معيار SWE-Bench Pro المخصص لاختبار حل المشكلات البرمجية الواقعية, مع زمن استجابة أقل عند مستويات التفكير المختلفة.
كما يقدم النموذج تجربة تطوير تفاعلية جديدة عبر Codex تسمى Playwright (Interactive), وهي مهارة تجريبية تسمح للنموذج ببناء التطبيقات واختبارها بصريًا أثناء تطويرها. يمكن للنموذج تشغيل التطبيق, تحليل واجهته, النقر على عناصره, واكتشاف الأخطاء وإصلاحها أثناء العمل, بما في ذلك تطبيقات الويب وتطبيقات Electron.
وقد أظهرت الاختبارات الداخلية أن GPT-5.4 يقدم نتائج أكثر جمالية ووظيفية في تطوير واجهات المستخدم الأمامية (Frontend) مقارنة بالنماذج السابقة.
كما يحسن النموذج استخدام الأدوات في واجهة API من خلال تقنيات جديدة لتحديد الأدوات المطلوبة بشكل أكثر كفاءة, مما يقلل من استهلاك الرموز (Tokens) ويمنع امتلاء سياق النموذج بمعلومات غير ضرورية قد تؤثر على جودة الاستجابة.
وفي ChatGPT يمكن للمستخدم متابعة طريقة عمل النموذج عبر قدرته على وضع خطة تنفيذ قبل البدء في حل المهمة, ما يسمح للمستخدم بمراجعة الخطة أو تعديلها أو توجيه النموذج أثناء التنفيذ.
كما تم تحسين قدرة النموذج على تحديد متى يحتاج إلى التفكير لفترة أطول لحل مشكلة معقدة, مع محاولة تقليل استهلاك سياق الذاكرة قدر الإمكان.
ومن ناحية الأمان, يلتزم النموذج بمعايير السلامة الخاصة بالشركة, حيث يتضمن آليات للكشف عن ثغرات الأمن السيبراني والتعامل معها بحذر, إضافة إلى قيود تمنع استخدامه في إنشاء أو تعديل برمجيات ضارة.
يتوفر أيضًا إصدار أقوى للمطورين باسم gpt-5.4-pro, موجه للحالات التي تتطلب قدرة أعلى في التفكير أو تحليل البيانات أو تطوير البرمجيات.
يتوفر gpt-5.4 في ChatGPT و Codex ومن خلال واجهة API.
وهو متاح داخل ChatGPT لمستخدمي خطط Plus و Pro, بينما يتوفر gpt-5.4-pro لمستخدمي خطط Pro و Enterprise.
تم اعتماد GPT-5.4 Thinking ليكون البديل المباشر لنموذج GPT-5.2 Thinking. وسيبقى النموذج القديم متاحًا لمدة 3 أشهر ضمن قائمة Legacy Models قبل إزالته نهائيًا في 5 يونيو 2026.
ويمكن للمطورين تجربة سياق مليون رمز عبر إعدادات خاصة في واجهة API.
وللتعبير عن القفزة الكبيرة في قدرات التفكير والتحسينات التي يقدمها النموذج, قررت OpenAI الانتقال مباشرة من الإصدار 5.2 إلى 5.4. كما أشارت الشركة إلى أن نماذج التفكير (Thinking) ونماذج المحادثة الفورية (Instant) قد تتلقى تحديثات منفصلة وبفترات مختلفة مستقبلًا.
ولذلك, تم إطلاق نموذج GPT-5.3 Instant بشكل منفصل.
المصدر

عن Qais Alrefai

تحقق أيضا

WhatsApp يتيح بوتات الذكاء الاصطناعي في أوروبا

< 1 دقيقة للقراءةبعد قيام Meta بحظر بوتات الذكاء الاصطناعي من الخدمات المنافسة في WhatsApp, ولتجنب تحقيق من… أكمل القراءة » WhatsApp يتيح بوتات الذكاء الاصطناعي في أوروبا

اكتب تعليقًا