Veo 3 de la Google: Începutul unor modele de lume jucabile?
Demis Hassabis, CEO-ul organizației de cercetare în AI a Google, DeepMind, a sugerat recent că Veo 3, cel mai recent model de generare video al Google, ar putea fi utilizat pentru jocuri video. Răspunzând la un mesaj pe X care cerea Google să permită utilizarea videoclipurilor Veo 3 pentru jocuri video, Hassabis a comentat: „Acum, nu ar fi ceva interesant.”
Logan Kilpatrick, liderul produsului pentru Google AI Studio și Gemini API, a răspuns, adăugând un emoji care sugerează tăcerea. Ambele postări ale executivilor Google sunt doar sugestii jucăușe, iar un purtător de cuvânt al companiei a declarat că nu au informații suplimentare de împărtășit în acest moment. Totuși, construirea de modele de lume jucabile nu este complet exclusă din planurile gigantului tehnologic.
Modelele de lume sunt diferite de modelele de generare video. Primele simulează dinamica unui mediu real, permițând agenților să prezică cum se va modifica lumea în funcție de acțiunile lor. Modelele de generare video, pe de altă parte, sintetizează secvențe video realiste.
Google are planuri de a transforma modelul său multimodal de bază, Gemini 2.5 Pro, într-un model de lume care simulează aspecte ale creierului uman. În decembrie, DeepMind a prezentat Genie 2, un model capabil să genereze o varietate „înfinită” de lumi jucabile. Luna următoare, a fost raportat că Google formează o nouă echipă pentru a lucra la modele AI care pot simula lumea reală.
Alții, precum pionierul AI Fei-Fei Li, lucrează, de asemenea, la construirea de modele de lume. Li a ieșit din anonimat anul trecut cu World Labs, o startup care a dezvoltat un sistem AI capabil să genereze scene 3D asemănătoare jocurilor video dintr-o singură imagine.
Veo 3, care este încă în preview public, poate crea video și audio pentru clipuri — inclusiv discursuri și coloane sonore. Deși Veo 3 produce mișcări realiste prin simularea fizicii din lumea reală, nu este încă un model de lume. În schimb, ar putea fi utilizat pentru povestiri cinematice în jocuri, cum ar fi scenele de tranziție, trailer-ele și prototiparea narativă.
Modelul este, de asemenea, un model generativ „pasiv”, iar acesta (sau o generație viitoare Veo) ar trebui să treacă la un simulator mai activ, interactiv și predictiv.
Totuși, adevărata provocare în producția de jocuri video nu este doar vizualurile impresionante; este vorba despre simularea în timp real, consistentă și controlabilă. De aceea, ar putea avea sens ca Google să adopte o abordare hibridă care să combine Veo și Genie în viitor, în cazul în care va urmări dezvoltarea jocurilor video sau a lumilor jucabile.
Google s-ar putea confrunta cu o competiție din partea Microsoft, Scenario, Runway, Pika și, în cele din urmă, modelul de generare video Sora de la OpenAI. Având în vedere planurile Google în domeniul modelelor de lume și reputația sa de a-și folosi resursele financiare și puterea de distribuție pentru a depăși rivalii, concurenții din acest domeniu ar fi bine să rămână cu ochii pe evoluțiile din acest spațiu.