أعلنت شركة ميسترال الفرنسية الناشئة عن إطلاق Voxtral، أول نموذج صوتي مفتوح المصدر مصمم لتقديم "ذكاء كلامي عملي" للاستخدامات التجارية.
يمثل Voxtral خيارًا جديدًا للمطورين، حيث يجمع بين كفاءة النماذج المغلقة المصدر وتكلفة النماذج المفتوحة، من دون التنازل عن الجودة، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".
وتقول "ميسترال" إن النموذج الجديد يتيح للشركات نسخ وفهم الصوت بكفاءة، وبتكلفة تقل عن نصف سعر النماذج المنافسة مثل "ويسبر" من "OpenAI".
الذكاء الاصطناعي ذكاء اصطناعي"أنثروبيك" تستقطب القطاع المالي بأدوات ذكاء اصطناعي جديدة
يستطيع Voxtral التعامل مع ما يصل إلى 30 دقيقة من الصوت، بينما يتيح هيكله المعتمد على نموذج "ميسترال سمول 3.1" إمكانية فهم 40 دقيقة، ما يسمح بتحليل المحتوى، تلخيصه، أو حتى تحويل الأوامر الصوتية إلى مهام مباشرة مثل تشغيل واجهات برمجة التطبيقات.
متعدد اللغات ومناسب للجميع
يدعم Voxtral مجموعة واسعة من اللغات، تشمل الإنجليزية، الفرنسية، الإسبانية، الألمانية، البرتغالية، الهولندية، الإيطالية، والهندية، ما يجعله خيارًا مرنًا للشركات متعددة الجنسيات أو التطبيقات العالمية.
تقدم "ميسترال" النموذج الرئيسي Voxtral Small، بقدرة تبلغ 24 مليار معلمة، ليكون منافسًا مباشرًا لـ ElevenLabs Scribe وGemini 2.5 Flash وGPT-4o Mini.
كما توفر نسخة أخف Voxtral Mini، تضم 3 مليارات معلمة، مخصصة للتشغيل المحلي وعلى أطراف الشبكة، إضافة إلى إصدار Voxtral Mini Transcribe المصمم لعمليات النسخ فقط