Google lansează Gemini 2.5 Deep Think
Google DeepMind a anunțat lansarea Gemini 2.5 Deep Think, cel mai avansat model de raționare AI al companiei, capabil să răspundă la întrebări prin explorarea și analiza simultană a mai multor idei, alegând apoi cea mai bună soluție. Abonații la planul Ultra al Google, care costă 250 de dolari pe lună, vor avea acces la Gemini 2.5 Deep Think în aplicația Gemini începând de vineri.
Detalii despre Gemini 2.5 Deep Think
Modelul a fost prezentat pentru prima dată în mai 2025, la evenimentul Google I/O. Gemini 2.5 Deep Think este primul model multi-agent disponibil publicului, care utilizează agenți AI multipli pentru a aborda o întrebare în paralel, ceea ce necesită resurse computaționale semnificativ mai mari decât un singur agent, dar duce la răspunsuri mai bune.
Google a folosit o variantă a Gemini 2.5 Deep Think pentru a obține o medalie de aur la Olimpiada Internațională de Matematică (IMO) din acest an. De asemenea, compania intenționează să ofere modelul utilizat la IMO unui grup select de matematicieni și academicieni, menționând că acest model AI „are nevoie de ore pentru a raționa”, în contrast cu majoritatea modelelor AI destinate consumatorilor, care oferă răspunsuri în câteva secunde sau minute.
Performanțe și comparații
Gemini 2.5 Deep Think a obținut performanțe de vârf în testul Humanity’s Last Exam (HLE), un test provocator care măsoară capacitatea AI de a răspunde la mii de întrebări colectate de la oameni din domeniul matematicii, științelor umane și științelor exacte, cu un scor de 34,8%. Comparativ, Grok 4 de la xAI a obținut 25,4%, iar o3 de la OpenAI a avut 20,3%. De asemenea, Gemini 2.5 Deep Think a depășit modelele AI de la OpenAI, xAI și Anthropic în testul LiveCodeBench6, obținând un scor de 87,6% față de 79% pentru Grok 4 și 72% pentru o3.
Funcționalități și aplicații
Modelul Gemini 2.5 Deep Think colaborează automat cu instrumente precum execuția codului și Google Search, având capacitatea de a produce răspunsuri mult mai lungi decât modelele tradiționale AI. În teste, modelul a generat sarcini de dezvoltare web mai detaliate și estetic plăcute comparativ cu alte modele AI, având potențialul de a ajuta cercetătorii și de a accelera calea către descoperiri.
Concluzie
Gemini 2.5 Deep Think reprezintă un salt semnificativ în tehnologia AI, cu implicații majore pentru cercetare și aplicabilitatea în diverse domenii, demonstrând puterea sistemelor multi-agent în rezolvarea problemelor complexe.