أطلقت الشركة “OBEN AI” ثلاثة نماذج صوتية جديدة للمطورين ، “GPT-4O-TRARANSCING” ، “GPT-4O-Mini-traranscribe” و “GPT-4O-Mini-TTS” ، بهدف تحويل الكلام إلى نص ونص على كلمات باستخدام الذكاء الاصطناعي.
تتيح هذه النماذج للمطورين تطوير تطبيقاتهم للحصول على قدرات صوتية متقدمة.
أكد جيف هاريس من Openai أن هذه النماذج تسمح للمطورين والمستخدمين ليس فقط في المحتوى المنطوق ، ولكن أيضًا كيفية نطقها ، مع إمكانية التعبير عن مشاعر مختلفة.
وأشار إلى أن دقة النماذج مهمة للغاية للحصول على تجربة صوتية موثوقة.
أوضحت الشركة أن تكلفة استخدام المطورين لنماذج صوتية جديدة تتراوح بين 0.6 سنت و 1.5 سنت في الدقيقة.