جديد Vision Assistant Pro

6 دقائق للقراءة

قمنا سابقًا بشرح إضافة Vision Assistant Pro لقارئ الشاشة NVDA.
ومع تغير طريقة عمل الاختصارات وإضافة المزيد من الخصائص مثل تحليل فيديوهات youTube, نعيد تكرار الشرح مع تضمين الخيارات الجديدة وشرح طريقة عمل الاختصارات الجديدة.
لكننا لن نشرح ما لم يتغير مثل الأوامر المخصصة.
إضافة Vision Assistant Pro لقارئ الشاشة NVDA هي إضافة تتيح خصائص كثيرة بالاعتماد على الذكاء الاصطناعي, وتحديدًا نماذج Gemini.
تشمل الخصائص قراءة الشاشة, الترجمة, الإملاء الصوتي, تحليل المستندات, تحليل فيديوهات YouTube ووصفها, تحويل الملفات الصوتية إلى نص, وصف الصور, تنفيذ OCR على ملفات .pdf, وحل رموز CAPTCHA وغير ذلك.

إعداد الإضافة:

بعد تثبيت الإضافة, انتقل إلى إعداداتها في إعدادات NVDA حيث ستجد:

  • Gemini API Key: لإدخال مفتاح Gemini من Google AI Studio طريقة الحصول على مفتاح في شرحنا السابق..
  • Show API Key لإظهار مفتاح API أو إخفائه.
  • AI Model: تحدد النموذج المستخدم في الاستجابة, يدعم أحدث إصدار مختلف النماذج المتوفرة, بما في ذلك نماذج Gemini 3.
  • Proxy URL: لاستخدام وكيل في الاتصال إذا كانت الخدمة محظورة في بلدك.
  • Check for updates on startup: للبحث عن تحديثات الإضافة عند تشغيل NVDA, يمكن تفعيله أو تعطيله.
  • Clean Markdown in Chat: لإزالة علامات Markdown من الدردشات, تعطيله يترك تنسيق Markdown.
  • Copy AI responses to clipboard: نسخ ردود الذكاء الاصطناعي تلقائيًا إلى الحافظة.
  • Direct Output (No Chat Window): يتم نطق ردود الذكاء الاصطناعي مباشرة دون عرض نافذة الدردشة.
  • Translation Languages, Source, Target: تحدد اللغات للترجمة من وإلى.
  • AI Response: لتحديد لغة ردود النموذج.
  • Smart Swap: لتبديل لغة الترجمة مع لغة المصدر في حال قدمت نص يطابق لغة الترجمة.
  • CAPTCHA Mode, Capture Method: تحدد طريقة تصوير الشاشة للعثور على رمز CAPTCHA لديك عنصر الكائن الحالي Navigator Object او Full Screen لتصوير الشاشة بالكامل.
  • Custom Prompts: لإنشاء مطالبات مخصصة مع مرونة كبيرة, تفاصيل في شرحنا السابق.

الوظائف والاختصارات:

نسرد هنا قائمة الاختصارات الافتراضية ووظائفها, بسبب تعدد الوظائف, تستخدم الإضافة نمط Command Layer أي إنك تضغط اختصار ثابت ليتم تنشيط وضع أوامر الإضافة مع صفير بحدة مرتفعة, ثم يمكنك ضغط الحرف المناسب للوظيفة المطلوبة لتنفيذها.
يمكنك الخروج من وضع أوامر الإضافة عن طريق نفس الاختصار أو ضغط أي مفتاح غير مدعوم, لتسمع صفير بحدة منخفضة.
إذا أردت اختصار مباشر لوظائف محددة, يمكنك تخصيص اختصارات الإضافة من Preferences > Input gestures > Vision Assistant.
إذن, اضغط NVDA+Shift+V ثم نفذ أي من الحروف التالية بحسب الوظيفة.

  • T: لترجمة النص, تتم ترجمة النص الذي يتم التركيز عليه حاليًا, إذا تم تحديد نص, يأخذ الأولوية.
  • Shift+T: ترجمة النص من الحافظة.
  • R: التعامل مع النصوص مثل التصحيح والتلخيص والشرح أو تنفيذ الأوامر المخصصة, يتم عرض قائمة بالخيارات المتوفرة. إذا تم تحديد نص يأخذ الأولوية, بخلاف ذلك, يتم التعامل مع موضع التركيز.
  • V: وصف الكائن الحالي, يتم أخذ صورة للكائن الذي يتم التركيز عليه ووصف محتواه, تفتح نافذة دردشة لمتابعة الأسئلة.
  • O: وصف الشاشة بالكامل, يتم فتح نافذة دردشة لمتابعة الأسئلة.
  • Shift+V: تحليل فيديوهات YouTube, Instagram, Twitter (X) من خلال رابط الفيديو, يتم فتح نافذة للصق رابط الفيديو.
  • D: تحليل المستند, تظهر نافذة اختيار ملف, يمكنك اختيار ملف للدردشة وطرح الأسئلة بخصوصه, يتم دعم PDF, TIFF, TXT, MD, PY, تظهر نافذة للدردشة حول الملف.
  • F: اختيار صورة JPG, PNG أو ملف PDF لعمل مسح ضوئي OCR, تظهر نافذة اختيار الملف, يتم فتح نافذة دردشة حول الملف.
  • A: لعمل تحويل صوت إلى نص Audio Transcription, تظهر نافذة لاختيار الملف, يتم دعم MP3, WAV, OGG, يتم فتح نافذة دردشة حول الملف الصوتي.
  • C: حل رموز CAPTCHA, عن طريق التركيز على الصورة التي تحتوي على الأرقام ثم ضغط الاختصار, يتم محاولة حل الرمز وكتابته, يتم النسخ إلى الحافظة.
  • S: عمل إملاء صوتي Dictation, اضغط مرة واحدة لتسمع صفير بدرجة صوت مرتفعة, ابدأ التحدث, كرر الاختصار لتسمع صوت بدرجة صوت منخفضة, يتم تحويل الكلام إلى نص وتصحيحه ومحاولة كتابته في مربع التحرير الحالي, كما يتم النسخ إلى الحافظة.
  • L: الإعلان عن حالة الإضافة الحالية, مثل عدم النشاط Idle أو Uploading أثناء رفع ملف, وغير ذلك.
  • U: البحث اليدوي عن تحديثات الإضافة.
  • H: عرض قائمة باختصارات الإضافة الافتراضية..

ملاحظة, لم نختبر جميع خصائص الإضافة.

نافذة الدردشة:

تؤدي العديد من الأوامر إلى فتح نافذة دردشة لطرح أسئلة باستمرار مع النموذج.
تحتوي النافذة على التالي:

  • AI Response: مربع للقراءة فقط يعرض رسائلك وردود الذكاء الاصطناعي.
  • Ask: مربع كتابة لطرح سؤالك.
  • Send: لإرسال رسالتك, او اضغط Enter على مربع الكتابة.
  • View Formatted: لعرض النص بشكل منسق إذا احتوى على رموز تدعم التنسيق.
  • Save Content: لحفظ الرد بتنسيق HTML.
  • Save Chat: لحفظ الرسائل بتنسيق نص, يمكنك نسخها بدلًا من ذلك, يتم عرض نافذة الحفظ لتحديد المسار, يتم الحفظ بامتداد .txt.
  • Close: لإغلاق النافذة.

عند تنفيذ طلب يستدعي ظهور هذه النافذة, لا تقم بتكرار الطلب مرة أخرى بسرعة, انتظر لضمان ظهور النافذة, تكرار الطلب يفقدك رموز من قيود الاستخدام اليومي بلا مقابل.
إغلاق النافذة دون نسخ المحادثة أو حفظها سيجعلك تفقدها.
قم بالحفظ أو النسخ في حال قمت بتحويل صوت إلى نص على سبيل المثال.
تجد ردود النموذج باسم AI وردودك باسم You.
شرح الإضافة السابق من نافذة التقنية
تنزيل الإضافة من [متجر إضافات NVDA الرسمي.
مستودع الإضافة

عن Qais Alrefai

تحقق أيضا

كيفية تنزيل Windows 11 باستخدام Media Creation Tool.

3 دقائق للقراءةتتيح أداة إنشاء الوسائط Media Creation Tool من Microsoft تنزيل نسخة Windows 11 وحرقها مباشرة… أكمل القراءة » كيفية تنزيل Windows 11 باستخدام Media Creation Tool.

اكتب تعليقًا