Mistral lansează Voxtral, primul său model audio AI cu sursă deschisă.

Moderator
3 Min Citire

Sursa foto: Google Images

0:00

Lansarea Voxtral de către Mistral

Startup-ul francez Mistral a lansat Voxtral, primul său model audio AI cu sursă deschisă, având ca scop provocarea sistemelor corporate închise prin oferirea de alternative cu sursă deschisă.

Caracteristici și Funcționalități

Voxtral este prezentat ca primul model deschis capabil să implementeze „inteligență vocală cu adevărat utilizabilă în producție.” Aceasta oferă dezvoltatorilor o alternativă accesibilă, promițând un preț de „mai puțin de jumătate” din soluțiile comparabile.

Voxtral poate transcrie până la 30 de minute de audio, având un backbone LLM, Mistral Small 3.1, care îi permite să înțeleagă până la 40 de minute. Utilizatorii pot adresa întrebări despre conținutul audio, pot genera rezumate sau pot transforma comenzi vocale în acțiuni în timp real, cum ar fi apelarea API-urilor sau rularea funcțiilor. De asemenea, modelul este multilingv, având capacitatea de a transcrie și înțelege limbi precum engleză, spaniolă, franceză, portugheză, hindi, germană, olandeză și italiană.

Variantele Voxtral

Mistral oferă două variante ale modelului său de „înțelegere a vorbirii.” Prima, Voxtral Small, are 24 de miliarde de parametri pentru desfășurări la scară industrială și este competitivă cu soluții precum ElevenLabs Scribe, GPT-4o-mini și Gemini 2.5 Flash. A doua variantă, Voxtral Mini, dispune de 3 miliarde de parametri pentru desfășurări locale și pe edge. Există, de asemenea, o versiune API ultra-ieftină, Voxtral Mini Transcribe, optimizată pentru cazuri de utilizare exclusiv de transcriere, care promite să depășească OpenAI Whisper la un preț de mai puțin de jumătate.

Accesibilitate și Costuri

Utilizatorii pot încerca Voxtral gratuit prin descărcarea API-ului de pe Hugging Face sau testând modelele în chatbot-ul Le Chat al Mistral. Integrarea API-ului în aplicații începe de la 0,001 USD pe minut.

Contextul Lansării

Lansarea are loc la o lună după ce Mistral a anunțat Magistral, prima sa familie de modele de raționare care abordează probleme pas cu pas pentru o fiabilitate îmbunătățită. Mistral este recunoscut ca una dintre cele mai importante firme AI din Europa, având o reputație solidă în promovarea modelelor AI cu sursă deschisă. Recent, compania a fost raportată că se află în discuții pentru a strânge până la 1 miliard USD din capital de la investitori precum fondul MGX din Abu Dhabi.

Concluzie

Lansarea Voxtral de către Mistral marchează un pas semnificativ în direcția democratizării accesului la tehnologia audio AI, oferind o alternativă deschisă și accesibilă în fața sistemelor închise dominante.

Distribuie acest articol
Lasa un comentariu

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *