مرحبا بمتابعي نافذة التقنية.
أعلنت Google عن عدة تحديثات لنماذج Gemini 2.5, فدعونا نلقي نظرة على هذه التحديثات.
تحديثات على Deep Think:
تم إضافة خاصية جديدة في 2.5 Pro تتيح دمج ميزات البحث والتحليل والتفكير في عدة فرضيات قبل تقديم الإجابة. يتم طرحها لمجموعة مختارة عبر Gemini API لاختبار الأمان قبل طرحها للجميع.
تحديثات في Gemini 2.5 Flash:
نموذج 2.5 Flash هو الأسرع والأقل تكلفة لدى الشركة, وأصبح أفضل مع تحسين قدراته في التفكير المنطقي, تعدد الوسائط, البرمجة, وفهم السياقات الطويلة.
كما يقلل استهلاك الرموز مقابل الحروف والكلمات بنسبة 20 إلى 30%.
يتوفر الإصدار المحدث للاختبار من خلال Google AI Studio و Gemini.
قدرات جديدة لنماذج Gemini 2.5:
الصوت الأصلي, حيث أصبحت النماذج قادرة على تحويل نصوص إلى أصوات طبيعية من النماذج نفسها, وفهم تعبيرات المستخدم, ستتمكن النماذج في Live API من فهم صوتك وتعبيراتك والتفاعل بنفس الطريقة, ستتعرف النماذج إذا ما كنت تتحدث معها أو كان شخص آخر يتحدث معك, ليتم تجاهل الرد.
إلى جانب ما سبق, تطرح الشركة ميزة تحويل النص إلى كلام في 2.5 Pro و2.5 Flash, والتي تشمل دعمًا فريدًا لعدة متحدثين, مما يتيح صوتين مختلفين في الوقت نفسه. يتميز هذا التحويل الصوتي بالقدرة على التعبير والهمسات والتبديل السلس بين أكثر من 24 لغة.
استخدام الكمبيوتر:
تقول الشركة إنها تعمل على دمج قدرات مشروع Mariner لاستخدام الحاسوب داخل Gemini API وVertex AI. وتختبر الميزات مع عدة شركات للطرح العام في الصيف.
تحديثات أخرى:
- تحسين الأمان في النماذج ضد أوامر البرمجة الضارة.
- ملخص التفكير Thought summaries لتحسين قدرة النموذج على التفكير تصبح متاحة في واجهة برمجة التطبيقات.
- Thinking budgets لتحديد عدد الرموز المستخدمة, لتقليل التكاليف.
- دعم بروتوكول Model Context Protocol (MCP) لتسهيل تواصل Gemini مع تطبيقات ونماذج أخرى مفتوحة المصدر تعمل بالذكاء الاصطناعي.
وهذا كل شيء.