حصلت على دعوة لتجربة متصفح Comet من Perplexity.
ويمكنني القول أن التجربة مختلفة عن أي شيء يمكن توقعه.
فدعونا نذهب في رحلة سريعة ونرى أمثلة عملية.
سنقسم نظرتنا إلى قسمين, الأول حول المتصفح نفسه كمتصفح ويب, والثاني حول ميزات الذكاء الاصطناعي المتوفرة.
المتصفح:
تنزيل المتصفح يتم من خلال موقعه بعد منحك الدعوة, ثم ستجد ملف .exe يمكنك فتحه لتثبيت المتصفح, قد تحتاج للتحرك بالمؤشر أو OCR والضغط على زر بدء التثبيت, ينطبق الأمر على زر التشغيل, او إذا أردت أغلق المثبت وقم بتشغيله بنفسك.
تابع التثبيت عن طريق المؤشر, أو NVDA+B.
لن نطيل أكثر هنا, فإذا كنت من مستخدمي Chrome, لن تشعر بأي فرق, حيث أن المتصفح هو نسخة من Chrome بنفس الترتيب والاختصارات والإضافات, وكل شيء.
مع بعض الخصائص البسيطة المفيدة, مثل زر واختصار Ctrl+Shift+C لنسخ رابط الصفحة الحالية.
أو زر في شريط الأدوات للبحث بالصوت.
الذكاء الاصطناعي:
وهنا يبدأ الاستكشاف.
أولًا, عليك تسجيل الدخول إلى حسابك في Perplexity, ثم في أي صفحة من أي موقع, اضغط Alt+A أو Alt ثم Shift+Tab واضغط على زر Assistant.
بدلًا من ذلك, تابع الحركة واضغط على زر Voice Mode لبدء محادثة صوتية, أو Summarize the current web page لتلخيص الصفحة الحالية.
والآن, المساعد يتم تشغيله باستخدام Alt+A حيث يظهر ويختفي بهذه الطريقة, ولن أشرح أمور تقنية أكثر من ذلك, سأركز على تجارب عملية قمت بها.
التجارب:
أولًا, بدأت بتجربة بسيطة حيث طلبت منه فتح موقع نافذة التقنية, قام بفتحه في تبويبة جديدة دون أي مشكلة, طلبت منه إغلاق التبويبة فقام بإغلاقها, وذلك عن طريق الكتابة.
قررت أخذ الفكرة أبعد من ذلك, فطلبت منه فتح موقع نافذة التقنية والذهاب إلى صفحة الاتصال بنا وكتابة نموذج لإرسال رسالة لنافذة التقنية, أخبرته عن اسمي وبريدي الإلكتروني, لكني طلبت منه أن يكتب كلمة واحدة في العنوان وكلمة واحدة في نص الرسالة, وهي كلمة تجربة, وأنا أعرف أن نموذج الاتصال لدينا لن يقبل بإرسال الرسالة لأن حقل الرسالة يتطلب كلمتين على الأقل.
في البداية نفذ ما أردته بالضبط, حيث ذهب إلى الموقع وبحث عن خيار الاتصال وفتح الصفحة, ثم بدأ في كتابة النموذج.
وبعد ذلك, حاول إرسال الرسالة, ففشل للسبب الذي ذكرته, توقف عن التجربة وذكر لي المشكلة, فطلبت منه أن يحاول حتى ينجح, قام بتشغيل نموذج للتفكير ثم كتب كلمات عشوائية في مربع الرسالة وقام بإرسالها.
هنا اعترضت Google من خلال reCAPTCHA الخدمة التي أضفناها لصفحة الاتصال لمنع الرسائل العشوائية, حيث اعتبرت الخدمة أن الرسالة كتبها بوت, ولذلك منعت الإرسال.
لكن المساعد لم يستسلم, ولا أعرف ما الذي فعله, لكنه استمر في المحاولة ثم أرسل الرسالة.
هنا قررت تجربة أمر مختلف, واتجهت إلى Gemini من خلال المتصفح, ثم طلبت من المساعد أن يجري محادثة مع Gemini وفقًا لردوده, وأن يقوم بتشغيل كل رسالة يرسلها Gemini من خلال زر الاستماع.
وبمجرد أن نجح في رسالتين أوقفته وأردت تجربة أخرى.
طلبت منه أن يبحث عن فيديو معين على YouTube وتحديدًا إعلان شركة زين لرمضان 2025, وطلبت منه أن يذهب إلى وقت محدد في الفيديو.
نفذ ذلك بسرعة وأعتقد إنه قام بتعديل الرابط لتضمين الوقت.
طلبت منه إعادة الفيديو إلى بدايته, وهنا أعتقد إنه استخدم شريط التمرير وعاد إلى بداية الفيديو.
رأيت أن التجارب من هذا النوع تكفي, علينا الذهاب إلى شيء عملي يمكن الاستفادة منه.
فتحت صفحة محرر المقالات في مدونة نافذة التقنية, وأعطيته نص الخبر والتعليمات حول التصنيفات والوسوم وغير ذلك, فقام بنشر هذا المقال دون أي تدخل مني:
توضيح, قام بالنشر, أي لصق النص وكتابة العنوان والتعامل مع خيارات المحرر, تنسيق المقال وتسمية الرابط, والمزيد. وليس كتابة الخبر.
طلبت منه نشر الخبر الثاني الذي كتبته حول NVDA اليوم, لكنه لم ينجح بشكل كامل بسبب تعقيد التنسيقات, وبالتحديد, كرر النص بشكل كبير لكنه قام بكل ما يجب, وكل ما كان يجب أن أفعله هو حذف تكرار الخبر, ثم قام بالنشر.
بعد ذلك, قمت بتجربة مختلفة.
فتحت موقع Playroom ثم فتحت إصدار الويب, ومن ثم لعبة 1000 miles أضفت بوت وطلبت من المساعد أن يلعب ضده.
وهذا ما حدث, حيث بدأ يلعب ويفكر ويخبرني إنه لا يستطيع لعب هذا الكرت لسبب محدد, ثم كان يتخذ الإجراء المناسب إلى حد كبير.
بعد ذلك اختبرته مع لعبة Dominos وكانت النتيجة أكثر دقة, حيث كان يتصرف كأنه لاعب حقيقي.
من المدهش أن ترى المساعد يتحرك في الصفحة ويضغط على الأزرار كأنه شيء تلقائي أو أحدهم يتحكم في جهازك.
ولكن لم أكمل التجربة هنا.
الآن أعرف أن الطلبات الأساسية مثل إرسال بريد أو كتابة منشور على Facebook سيقوم بها بكل بساطة.
توجهت إلى مقال في صحيفة The Guardian حول إحدى روايات أجاثا كريستي, وطلبت منه ترجمة التعليقات إلى العربية.
في البداية فشل في الانتقال إلى صفحة التعليقات, ووضع سبب محتمل إلى أن التعليقات يتم تحميلها باستخدام JS, وهذا صحيح.
لكنه أعاد التمرير في الصفحة ونجح في فتح التعليقات, وترجم مجموعة منها, وكانت الترجمة إلى العربية من أسوأ ما يكون, لكن هذا أمر آخر لا يتعلق بالمتصفح.
أجريت محادثة صوتية وطلبت عدة طلبات, فقام بتنفيذ بعضها لكن ليس جميعها, فالاستجابة النصية أكبر بكثير.
طلبت منه وصف الفيديو الذي طلبت منه تشغيله, فأخبرني إنه لا يمتلك القدرة على مشاهدة الصور حاليًا, لكنه فتح نصوص الفيديو من التحويل الذي ينفذه YouTube, ثم قرأ وصف الفيديو وقرأ التعليقات, ثم أعطاني ملخص عن فكرة الفيديو ومحتواه.
يوجد المزيد لتجربته في المستقبل بالطبع.
ما يجعل التجربة مميزة أن الكثير من التجارب قمت بها بالعربية, ولم يفشل أبدًا في تنفيذ ما أأريد.
من خلال مراقبة سلسلة التفكير Chain-of-Thought كان يترجم الطلب إلى الإنجليزية, ثم يعيد صياغته بطريقة تناسبه, ثم يبدأ في التنفيذ.
العيوب:
لا يمكن أن يأتي كل ما سبق دون عيوب, وأذكر بعضها.
- يستهلك المتصفح موارد الجهاز بشكل ليس قليل, أي إنه أعلى من Chrome صاحب السمعة السيئة في هذا المجال.
- رغم دعم تنفيذ الأوامر باللغة العربية البسيطة, إلا أن الاستجابة بطيئة للغاية, وتصبح أسرع في الإنجليزية, لكنها تبقى بطيئة.
- قد لا يفهمك دائمًا عند استخدام العربية.
- قد ينفذ تغييرات حتى تناسبه, على سبيل المثال, حاول تغيير المحرر في WordPress أثناء النشر.
قبل أن ننهي هذه النظرة, نود أن نشير إلى أن تجربة المتصفح حاليًا تعتمد على الدعوات, سواءًا عن طريق دعوة ترسلها لك الشركة بعد التسجيل في قائمة الانتظار, او دعوة يرسلها لك صديق.
أو أن تشترك في خطة الشركة المدفوعة, التي تتطلب 200$ شهريًا.