مرحبا بمتابعي نافذة التقنية.
دعونا كالعادة نشكر صديقنا المبدع الأستاذ رياض أسوم الذي دائما يشاركنا التجارب والمصادر المتعلقة بأمور مميزة في الذكاء الاصطناعي.
غطت نافذة التقنية جديد Google في مؤتمر Google I/O2025 الذي أتى مع عدد كبير من الأخبار.
غطينا أيضًا تحديث Gemini كخدمة ونماذج.
من تحديثات النماذج يأتي وضع إخراج الصوت الأصلي Native audio output الذي يمكن النماذج من إنشاء أصوات بتعبيرات طبيعية, حيث يمكنك إما إنشاء نص بصوت واحد أو ب2 أصوات.
يمكنك تخصيص تعبيرات الأصوات وتحديد أسلوب, مثل أن يهمس, يضحك, يكون حزين, ينفذ 2 تعبيرات, يتحدث ببهجة, وغير ذلك الكثير من ما لا يمكن حصره, فيمكنك جعله يقرأ على نمط معين مثل تقليد أي نمط تفضله.
لا تتوفر الميزة حاليا من خلال Gemini لكنها متاحة في Google AI Studio حيث يمكنكم تجربة إنشاء النصوص والقصص وغير ذلك.
يتاح لك إنشاء اختبار, تنزيل النتيجة, أو الحصول على مثال برمجي لطريقة تنفيذ نفس الطلب من خلال الAPI.
الاستخدام
للبدء, انتقل إلى هذه الصفحة.
ثم في Speaker 1 اكتب النص الذي سيبدأ به الصوت.
ثم من Script builder اكتب في Style instructions تعليماتك لأسلوب الحديث, اكتب بشكل طبيعي ما تريده.
بعد ذلك انتقل إلى Mode وحدد Single-speaker audio لإنشاء صوت بمتحدث واحد, أو Multi-speaker audio لإنشاء صوت ب2 متحدثين.
من Voice settings يمكنك اختيار أصوات المتحدثين, من بين 30 صوت متاح حاليًا.
إذا فعلت وضع 2 متحدثين, فستجد مربع كتابة باسم المتحدث الأول, لكتابة نص للمتحدث الأول, لجعل المتحدث الثاني ينطق شيء إضافي اضغط على add_circleAdd dialog ثم يظهر مربع للمتحدث الثاني, اكتب ما تريده, اضغط على الزر مرة أخرى واكتب ما تريده من الأول, وتابع على هذا النظام.
أما وضع متحدث واحد, فتجاهل كل ما سبق وستجد صندوق خيارات لتحديد الصوت, مربع كتابة لكتابة ما تريده وطريقة نطقه في نفس المربع, ثم زر Run للتنفيذ.
وفي جميع الحالات, ستجد خيارات جاهزة لتنفيذ اقتراحات من إنشاء النموذج.
تدعم الأصوات اللغة العربية.
وهذا كل شيء.