Lansarea modelelor de raționare AI de către OpenAI
OpenAI a anunțat marți lansarea a două modele de raționare AI cu greutate deschisă, având capacități similare cu seria sa O. Ambele modele sunt disponibile gratuit pentru descărcare de pe platforma de dezvoltatori Hugging Face. Compania le descrie ca fiind “de vârf” atunci când sunt măsurate pe baza mai multor benchmark-uri pentru compararea modelelor deschise.
Detalii despre modele
Modelele sunt disponibile în două dimensiuni: modelul mai mare și mai capabil gpt-oss-120b, care poate rula pe un singur GPU Nvidia, și modelul mai ușor gpt-oss-20b, care poate rula pe un laptop de consum cu 16 GB de memorie. Aceasta reprezintă prima lansare a OpenAI a unui model de limbaj “deschis” de la GPT-2, lansat cu peste cinci ani în urmă.
Capacitățile și aplicațiile modelelor
Modelele deschise sunt capabile să trimită interogări complexe către modele AI în cloud. Aceasta înseamnă că, dacă modelul deschis al OpenAI nu poate realiza o anumită sarcină, cum ar fi procesarea unei imagini, dezvoltatorii pot conecta modelul deschis la unul dintre modelele sale închise, mai capabile. Deși OpenAI a oferit modele AI open-source în primele sale zile, compania a favorizat în general o abordare de dezvoltare închisă, ceea ce a contribuit la construirea unei afaceri mari prin vânzarea accesului la modelele sale AI prin API pentru întreprinderi și dezvoltatori.
Contextul și motivația lansării
CEO-ul Sam Altman a declarat în ianuarie că OpenAI a fost “pe partea greșită a istoriei” în ceea ce privește open sourcing-ul tehnologiilor sale. Compania se confruntă cu o presiune tot mai mare din partea laboratoarelor AI din China, care au dezvoltat modele deschise capabile și populare. De asemenea, Administrația Trump a încurajat dezvoltatorii AI din SUA să deschidă mai multe tehnologii pentru a promova adoptarea globală a AI-ului aliniat la valorile americane. Cu lansarea gpt-oss, OpenAI speră să câștige simpatia dezvoltatorilor și a Administrației Trump, amândouă observând ascensiunea laboratoarelor AI din China.
Performanța modelelor
OpenAI susține că modelele sale deschise au performanțe superioare altor modele deschise, cu rezultate variate pe diferite teste. De exemplu, pe Codeforces, gpt-oss-120b și gpt-oss-20b au obținut scoruri de 2622 și 2516, respectiv. Pe Humanity’s Last Exam, modelele au obținut scoruri de 19% și 17,3%, ceea ce le plasează sub modelele O, dar peste modelele deschise de la DeepSeek și Qwen. Totuși, modelele OpenAI au avut o rată de halucinații mai mare decât cele mai recente modele de raționare AI ale companiei.
Informații despre antrenamentul modelelor
OpenAI a antrenat modelele deschise folosind procese similare cu cele ale modelelor sale proprietare. Fiecare model deschis utilizează o tehnică numită mixture-of-experts (MoE) pentru a activa un număr mai mic de parametrii pentru fiecare întrebare, ceea ce le face mai eficiente. Modelul gpt-oss-120b are 117 miliarde de parametrii, dar activează doar 5,1 miliarde de parametrii per token. De asemenea, modelele au fost antrenate folosind învățarea prin întărire de înaltă capacitate, ceea ce le permite să fie eficiente în generarea de răspunsuri complexe.
Licențierea și preocupările de siguranță
OpenAI lansează gpt-oss-120b și gpt-oss-20b sub licența Apache 2.0, care este considerată una dintre cele mai permisive. Aceasta permite întreprinderilor să monetizeze modelele fără a plăti sau a obține permisiunea companiei. Cu toate acestea, OpenAI nu va publica datele de antrenament utilizate pentru crearea acestor modele, o decizie care vine în contextul mai multor procese legale în curs împotriva furnizorilor de modele AI.
Concluzie
Prin lansarea acestor modele deschise, OpenAI își propune să se reintegreze în peisajul AI deschis, oferind dezvoltatorilor instrumente puternice și accesibile, în timp ce răspunde provocărilor globale și concurenței din domeniul inteligenței artificiale.