În căutarea OpenAI: Cum să faci ca inteligența artificială să-ți îndeplinească orice dorință

0:00

OpenAI: Inteligența artificială care îndeplinește dorințele utilizatorilor

După ce Hunter Lightman s-a alăturat OpenAI ca cercetător în 2022, a asistat la lansarea ChatGPT, un produs care a crescut rapid. Între timp, Lightman a lucrat în echipa MathGen, dedicată învățării modelelor OpenAI să rezolve probleme de matematică din competiții de liceu.

Progrese în raționamentul matematic

Echipa MathGen este considerată esențială pentru efortul OpenAI de a crea modele de raționament AI. Lightman a menționat că scopul echipei era să îmbunătățească abilitățile de raționament matematic ale modelelor, care pe atunci nu erau foarte eficiente. Deși modelele OpenAI nu sunt perfecte, progresele în raționamentul matematic au fost semnificative, culminând cu obținerea unei medalii de aur la Olimpiada Internațională de Matematică (IMO) de către unul dintre modelele OpenAI.

Dezvoltarea agenților AI

OpenAI a lansat modelul de raționament o1 în toamna anului 2024, iar cercetătorii din spatele acestui model au devenit extrem de căutați în Silicon Valley. Sam Altman, CEO-ul OpenAI, a exprimat viziunea ca utilizatorii să poată cere computerului să îndeplinească sarcini complexe, ceea ce ar putea avea un impact major asupra modului în care interacționăm cu tehnologia.

Tehnici de învățare prin întărire

Progresele OpenAI în raționamentul AI se leagă de tehnica de învățare prin întărire (RL). Aceasta oferă feedback modelelor AI referitor la corectitudinea alegerilor lor în medii simulate. De exemplu, AlphaGo, un sistem AI dezvoltat de Google DeepMind, a câștigat o competiție internațională în 2016 folosind RL.

OpenAI a utilizat RL pentru a dezvolta agenți AI care pot utiliza un computer, iar în 2023 a făcut o descoperire semnificativă prin combinarea modelelor de limbaj mare (LLM), RL și tehnica de calcul în timpul testării. Această combinație a dus la îmbunătățiri semnificative în performanța modelelor AI pe problemele matematice.

Scalarea raționamentului

OpenAI a stabilit două direcții noi pentru îmbunătățirea modelelor AI: utilizarea unei puteri computaționale mai mari în post-antrenament și acordarea de mai mult timp și resurse procesării întrebărilor. Echipa „Agenți” a fost formată pentru a avansa în această nouă paradigmă, având drept obiectiv final dezvoltarea modelului de raționament o1.

Definirea raționamentului AI

Scopul cercetării AI este de a recrea inteligența umană prin computere. De la lansarea modelului o1, utilizatorii au început să observe caracteristici mai umane în interacțiunea cu ChatGPT, inclusiv „gândirea” și „raționamentul”. Lightman susține că, dacă modelele pot realiza sarcini complexe, putem considera că acestea aplică un tip de raționament, chiar dacă mecanismele exacte rămân neclare.

Următoarea frontieră: Agenți AI pentru sarcini subiective

Agenții AI actuali funcționează cel mai bine în domenii bine definite, cum ar fi programarea. Cu toate acestea, agenții generali, precum ChatGPT, întâmpină dificultăți în sarcini mai complexe și subiective, cum ar fi cumpărăturile online. Lightman a subliniat că este o problemă de date, iar OpenAI explorează noi tehnici de învățare care să le permită modelelor să abordeze sarcini mai puțin verificabile.

OpenAI lucrează la îmbunătățirea performanței agenților săi, iar progresele rapide sugerează că modelele vor deveni mai capabile în domenii de raționament și matematică. Compania își propune să lanseze GPT-5, sperând să ofere cel mai bun model AI pentru dezvoltatori și consumatori.

Concluzie

OpenAI se află într-o competiție acerbă cu alți lideri din domeniul AI, iar succesul său în dezvoltarea agenților AI capabili să îndeplinească dorințele utilizatorilor va depinde de abilitatea de a inova rapid și de a îmbunătăți tehnologiile existente.