الكثير استخدم Google Maps وميزة Street View لنُري صديقًا كيف كان يبدو منزل طفولتنا، أو لنضع أيقونة الرجل الصغير على شوارع باريس لمعرفة ما إذا كنا قد حجزنا فندقًا في حي جميل. تخيل الآن أن تتمكن من فعل ذلك، لكن بطريقة أكثر تفاعلية واندماجًا تسمح لك بمحاكاة الشارع وبيئته فعليًا، وحتى تغيير الطقس أو رؤية كيف سيبدو في سيناريو مثل “ما بعد يوم الغد”.
هذا أحد أهداف أحدث تكامل من Google. بدءًا من اليوم، تقوم Google DeepMind بربط Street View مع Project Genie، وهو نموذج العالم العام الخاص بالشركة الذي يمكنه إنشاء بيئات تفاعلية متنوعة. وقد تم إطلاق هذه الميزة خلال مؤتمر Google I/O 2026 للمطورين.
وقال الباحث في DeepMind جاك باركر-هولدر إن هذه التقنية قوية جدًا لكل من حالات استخدام الوكلاء والروبوتات، وكذلك لتجربة المستخدمين، وهذا كان دائمًا جوهر مشروع Genie.
وضرب مثالًا بروبوت جديد يتم نشره في لندن التي نادرًا ما ترى الشمس. يمكن لـ Genie محاكاة لحظات ظهور الشمس على المباني الفيكتورية حتى لا يُفاجأ الروبوت عند حدوث ذلك في الواقع.
كما قال: “يمكنك أيضًا أن تقول إنني سأذهب إلى نيويورك، لكن ليس في هذا الوقت من السنة، سيكون الجو ثلجيًا، أريد أن أرى كيف يبدو ذلك الحي في الثلج.”
تقوم Google بجمع بيانات Street View منذ 20 عامًا باستخدام سيارات مزودة بكاميرات وأشخاص يحملون “حقائب تتبع”. وقد جمعت الشركة أكثر من 280 مليار صورة عبر 110 دولة وسبع قارات.
وقال باركر-هولدر: “لدينا في Street View كمية ضخمة من صور العالم الحقيقي. ويمكنك تخيل مدى قوة دمج هذه البيانات مع القدرة على محاكاة العوالم.”
وقد أطلقت Google أحدث نموذج عالمي لديها Genie 3 في نسخة بحثية في أغسطس الماضي، وفتحته لمشتركي Google AI Ultra في الولايات المتحدة في يناير، مما يسمح بإنشاء عوالم ألعاب تفاعلية من أوامر نصية أو صور. والهدف من Genie هو استخدامه في التعليم والألعاب وتدريب الروبوتات.
ويُستخدم Genie 3 بالفعل في تشغيل أحد أنظمة المحاكاة التابعة لـ Waymo لتدريب سياراتها ذاتية القيادة على أحداث نادرة جدًا مثل الأعاصير أو حتى مواجهة الأفيال بشكل مفاجئ. وإضافة بيانات Street View قد تساعد Waymo على التوسع في مدن جديدة حول العالم.
وتملك Waymo أيضًا نظام محاكاة خاصًا بها استخدمته للتوسع إلى 11 مدينة في الولايات المتحدة واختبار نظام القيادة في مدن أخرى. لكن الفرق مع Genie، بحسب باركر-هولدر، هو أن أنظمة Waymo تعتمد على منظور السيارة فقط، بينما يتيح Street View محاكاة العالم الحقيقي من وجهات نظر مختلفة، مثل الإنسان أو الروبوت، وليس السيارة فقط.
وتبدأ Google بإتاحة Street View داخل Genie لبعض مستخدمي Ultra في الولايات المتحدة بدءًا من اليوم، مع توسع تدريجي لاحقًا. كما سيتم توفيره لمستخدمي Ultra عالميًا خلال الأسابيع المقبلة.
وقال دييغو ريفاس، مدير المنتجات في DeepMind، إن الهدف هو إتاحة هذه الميزة لأكبر عدد ممكن من المستخدمين، لكنه أكد أن المشروع لا يزال تجربة بحثية تحتاج إلى تحسينات كبيرة في الدقة.
في بعض النماذج التي عرضها فريق Google — بما في ذلك محاكاة تحت الماء لحي سكني سابق — كانت النتائج مثيرة للإعجاب ويمكن التعرف عليها، لكنها ما تزال أقرب إلى جودة ألعاب الفيديو منها إلى الواقعية الكاملة. كما أن النماذج لا تفهم الفيزياء بشكل كامل بعد، أي أنها لا تدرك السبب والنتيجة.
على سبيل المثال، في محاكاة لشخصة تركض في منطقة ثلجية داخل Joshua Tree، كانت تمر عبر النباتات والصخور دون تفاعل حقيقي.
وبالمقارنة، فإن مولد الصور Nano Banana أصبح قادرًا على إنشاء نصوص دقيقة داخل الرسوم، بينما يستطيع مولد الفيديو Veo فهم سلوك الفيزياء مثل تدفق الماء أو انتشار الدخان أو انسياب القماش.
الفيزياء ليست مبرمجة مباشرة داخل هذه النماذج، بل يتم تعلمها تدريجيًا من خلال الملاحظة، كما يتعلمها الكائن الحي.
وقال باركر-هولدر: “أعتقد أن هذا النوع من النماذج متأخر بحوالي 6 إلى 12 شهرًا مقارنة بنماذج الفيديو من حيث الدقة والجودة، وسنقوم بحل ذلك.”
وقال جوناثان هربرت، مدير Google Maps، الذي بدأ كمتدرب في فريق Street View قبل 12 عامًا، إن Genie لا يزال غير قادر على إعادة بناء شارع بشكل مطابق تمامًا، لكنه يرى أن الإنجاز الحقيقي هو “الاستمرارية المكانية”. فإذا دار المستخدم 360 درجة، يتذكر النموذج البيئة خلفه بشكل صحيح، ومن هناك يمكنه بناء بيئة جديدة فوقها.
وأضاف: “لطالما فكرنا في كيفية بناء أفضل نموذج للعالم باستخدام بيانات Street View، وكان استخدام بيانات Maps في أبحاث الذكاء الاصطناعي هدفًا قديمًا لدينا.”
الخبر منقول ومترجم من TechCrunch.
المصادر:
1.
2.
مدونة نافذة التقنية مدونة نافذة التقنية – موقع يقدّم شروحات تقنية حديثة حول Windows، Android، الذكاء الاصطناعي، وأدوات المطورين بطريقة سهلة وواضحة للمستخدم العربي.