أعلنت Google عن مجموعة تحديثات واسعة ضمن Gemini, في خطوة توصف بأنها توسّع كبير لدور الذكاء الاصطناعي من مجرد مساعد يجيب على الأسئلة إلى نظام متكامل ينفّذ المهام ويبدع المحتوى ويتفاعل مع التطبيقات اليومية بشكل مباشر.
بدأت الشركة بالإعلان عن Gemini Spark، وهو وكيل ذكاء اصطناعي شخصي يعمل بشكل مستمر على مدار الساعة. الفكرة هنا أن المستخدم لم يعد مضطرًا لتنفيذ كل شيء بنفسه داخل التطبيقات، إذ يمكن لـ Spark أن يتولى المهام بالنيابة عنه، مثل تنظيم الأعمال الرقمية أو متابعة المهام اليومية. هذه الميزة بدأت بالوصول لمجموعة مختبرين موثوقين، وستتوسع لاحقًا لمشتركي Google AI Ultra في الولايات المتحدة لمن هم فوق 18 عامًا، مع إمكانية الوصول إليها عبر تبويب جديد داخل تطبيق Gemini. وتصف Google هذه الخطوة بأنها انتقال من مساعد يجيب إلى مساعد “يعمل” فعليًا.
وفي جانب الإبداع، كشفت الشركة عن Gemini Omni، وهو نظام مخصص لإنشاء وتحرير الفيديو عبر المحادثة الطبيعية فقط. الفكرة تشبه تحويل الكتابة أو الكلام إلى أداة إنتاج فيديو كاملة، حيث يمكن دمج النصوص والصور ومقاطع الفيديو لصناعة محتوى عالي الجودة. ويمكن حتى إنشاء شخصية رقمية شبيهة بالمستخدم نفسه تتحرك وتتكلم داخل الفيديو. الخدمة بدأت بالانتشار عالميًا لمشتركي Google AI، مع اختلافات حسب المنطقة، وهي تهدف إلى إزالة الحاجة إلى أدوات تحرير معقدة، بحيث يصبح الإخراج الإبداعي متاحًا لأي شخص مهما كان مستواه التقني.
كما قدمت Google ميزة Daily Brief، وهي خلاصة يومية ذكية تعتمد على ما تسميه “الذكاء الشخصي”. تقوم هذه الميزة بتحليل البريد الإلكتروني وGoogle Calendar والمحادثات داخل Gemini لتقديم ملخص صباحي منظم. هذا الملخص يقسم اليوم إلى أولويات فورية وأهداف طويلة المدى، مع اقتراح خطوات عملية للبدء بالمهام دون تشتيت. الميزة بدأت بالوصول لمشتركي Google AI في الولايات المتحدة، وتركز على تقليل الفوضى الذهنية الصباحية وجعل بداية اليوم أكثر وضوحًا.
أما على مستوى النماذج، فقد أعلنت الشركة عن Gemini 3.5 Flash، وهو نموذج جديد يتميز بالسرعة العالية مع قدرات متقدمة في التعامل مع المهام المعقدة. يمكنه تحليل عدة مستندات بسرعة، أو المساعدة في مشاريع متعددة الخطوات مثل بناء النماذج الأولية والبرمجة الإبداعية. النموذج أصبح متاحًا عالميًا لجميع المستخدمين عبر اختياره من قائمة النماذج داخل التطبيق، وتصفه Google بأنه يجمع بين السرعة والجودة دون الحاجة إلى التنازل عن أحدهما.
وفي تطوير مهم لتجربة المحادثة، تم تحديث Gemini Live ليصبح جزءًا من الدردشة العادية، مما يسمح بالتبديل السلس بين التحدث والكتابة. كما أصبح بإمكان Gemini الاتصال بالتطبيقات المفضلة للمستخدم لتنفيذ مهام فعلية مثل مقارنة المنتجات أو تلخيص البريد الإلكتروني. وأضيفت قدرات عرض فورية مثل الخرائط والطقس، إضافة إلى إمكانية استخدام الكاميرا أو المحتوى المرئي للمستخدم لتوليد صور وأفكار جديدة مباشرة داخل المحادثة.
التجربة نفسها أصبحت أكثر ثراءً بصريًا وتفاعليًا، حيث يمكن لـ Gemini تقديم محتوى متعدد الطبقات مثل صور عالية الدقة يمكن استكشاف تفاصيلها بشكل تدريجي، أو إنشاء فيديوهات قصيرة مشروحة بصوت مدمج. هذه التحديثات أصبحت متاحة في نموذج Pro لبعض المواضيع وباللغة الإنجليزية عالميًا، ضمن توجه جديد تسميه Google “Neural Expressive Design”، والذي يهدف إلى تجاوز النصوص التقليدية نحو تجربة متعددة الوسائط أكثر حيوية.
كما أعلنت الشركة عن خطة اشتراك جديدة باسم Google AI Ultra بسعر 100 دولار شهريًا، وهي موجهة للمستخدمين المتقدمين الذين يريدون أقصى قدر من إمكانيات Gemini. تشمل الخطة وصولًا أعلى للنماذج المتقدمة، وميزات مثل توليد الفيديو عبر Gemini Omni، إضافة إلى 20 تيرابايت من التخزين السحابي واشتراك YouTube Premium، ما يجعلها باقة شاملة لمن يعتمد على خدمات Google بشكل مكثف.
وأخيرًا، توسعت قدرات Gemini في التكامل مع التطبيقات الخارجية، حيث أصبح يمكنه الاتصال مباشرة بخدمات مثل OpenTable وCanva وInstacart. هذا يعني أن المستخدم يمكنه طلب حجز مطعم، أو إنشاء تصميم، أو طلب مشتريات غذائية، وكل ذلك عبر محادثة واحدة دون الانتقال بين التطبيقات. وتخطط Google لتوسيع هذه الشراكات مستقبلًا لتشمل منصات مثل Zillow وAdobe وBox.
المصدر.
مدونة نافذة التقنية مدونة نافذة التقنية – موقع يقدّم شروحات تقنية حديثة حول Windows، Android، الذكاء الاصطناعي، وأدوات المطورين بطريقة سهلة وواضحة للمستخدم العربي.