OpenAi تطلق gpt-realtime.

بعد إطلاق إصدار معاينة في ديسمبر الماضي, أطلقت OpenAI نموذج gpt-realtime بشكل رسمي للمطورين من خلال واجهة برمجة التطبيقات API.
ويعتبر هذا النموذج من فئة speech-to-speech أي نفس النموذج ينشئ الكلام ويحوله لصوت, كما يتعرف على الكلام ويحوله لنص للرد عليه, ما يمنح النموذج قدرات متقدمة في فهم المحادثات, وسرعة أكبر في الاستجابة.
وتوجه الشركة هذا النموذج للمطورين لإنشاء تطبيقات محادثة في الوقت الفعلي, او وكلاء ذكاء اصطناعي يمكنهم تنفيذ المهام والتفاعل مع المستخدمين في نفس الوقت.
على سبيل المثال, يمكن برمجة النموذج ليعمل كبديل عن موظف خدمة العملاء, حيث يمكنه بشكل برمجي تنفيذ ما يطلبه المتحدث, ثم الرد على المتحدث بالنتيجة, يدعم أيضًا استقبال الصور وتحليلها, إلى جانب التعليمات المخصصة لكل محادثة.
ويمكن للنموذج تنفيذ تعليمات مثل تهجئة الكلمات, او الضحك, أو تغيير اللهجة أثناء التحدث, وكل ذلك في وقت قليل, ما يمنحك محادثة مشابهة للمحادثة مع البشر.
تم تحسين الأصوات الحالية في النموذج الجديد, إلى جانب 2 من الأصوات الجديدة.
وهم Marin و Cedar.
إلى جانب ذلك, تتوفر في Realtime API خصائص جديدة, تشمل Session Initiation Protocol (SIP) بروتوكول للمكالمات الهاتفية, و Reusable prompts لحفظ طلبات معينة يمكن تمريرها بكثرة للنموذج لإعادة استخدامها بمرونة.
ويتوفر النموذج الجديد لجميع المطورين بأسعار أقل بنسبة 20% بالمقارنة مع gpt-4o-realtime-preview.
المصدر

عن Qais Alrefai

تحقق أيضا

مايكروسوفت تفصل 4 موظفين بسبب الاحتجاجات.

على خلفية الاحتجاجات الأخيرة واقتحام مبنى يضم مكاتب رؤساء أقسام مختلفة في مايكروسوفت, قامت الشركة …

اكتب تعليقًا