Revoluție în lumea digitală: Genie 2 creează lumi interactive care seamănă cu jocuri video
DeepMind, organizația de cercetare AI a Google, a prezentat recent Genie 2, un model avansat capabil să genereze o diversitate „nelimitată” de lumi 3D interactive. Această tehnologie promite să transforme modul în care percepem crearea de medii virtuale, apropiindu-se de calitatea unor jocuri video AAA.
Ce este Genie 2 și cum funcționează
Genie 2 reprezintă o versiune evoluată a modelului Genie lansat mai devreme în acest an. Acesta poate genera scene interactive într-un timp real, pornind de la o simplă descriere text și o imagine. Spre exemplu, fraza „Un robot umanoid drăguț într-o pădure” poate fi transformată într-un mediu tridimensional explorabil.
Spre deosebire de alte modele similare, cum ar fi cele dezvoltate de World Labs sau startup-ul israelian Decart, Genie 2 poate simula interacțiuni complexe, animații fluide, iluminare realistă, fizică detaliată și comportamente credibile ale NPC-urilor (personaje non-jucătoare).
Unul dintre cele mai impresionante aspecte ale Genie 2 este abilitatea sa de a „învăța” din sesiuni video, ceea ce permite modelului să creeze medii cu o calitate apropiată de cea a jocurilor video de top. Cu toate acestea, DeepMind nu a dezvăluit detalii despre sursele exacte ale datelor utilizate pentru instruire, ridicând întrebări despre posibilele implicații legale legate de proprietatea intelectuală.
Capacitatea de a crea lumi diverse și interactive
Genie 2 poate genera lumi 3D consistente și variate, permițând utilizatorilor să interacționeze prin tastatură sau mouse. Modelul poate recunoaște și adapta comenzile: spre exemplu, tărĂtoarele nu se vor mișca atunci când utilizatorul apasă săgețile direcționale – doar personajele vor reacționa corect.
Cu toate acestea, mediile generate sunt limitate temporal – fiecare simulare durează între 10 și 20 de secunde, ajungând în unele cazuri la un minut. Acest lucru face ca Genie 2 să fie mai degrabă un instrument de cercetare și creație, decât o platformă pentru jocuri propriu-zise.
Un alt punct forte este memoria sa spațială: Genie 2 poate reconstitui porțiuni ale mediului care ies din câmpul vizual al utilizatorului, eliminând problemele de consistență frecvent întâlnite în alte modele similare.
Aplicații și implicații viitoare
DeepMind poziționează Genie 2 ca pe un instrument puternic pentru prototiparea experiențelor interactive și pentru evaluarea agenților AI. Spre exemplu, desenatorii pot transforma schițele și arta conceptuală în medii complet interactive. De asemenea, cercetătorii pot genera scenarii diverse pentru a testa comportamentul agenților AI în situații noi.
Cu toate acestea, reacțiile din partea industriei de jocuri video sunt mixte. Pe de o parte, astfel de tehnologii pot accelera procesul de creație, dar pe de altă parte, ele pot duce la reducerea locurilor de muncă în sector, așa cum au sugerat anchetele recente legate de utilizarea AI în companii precum Activision Blizzard.
DeepMind continuă să investească masiv în dezvoltarea acestor tehnologii. Recent, compania l-a angajat pe Tim Brooks, fost lider al proiectului OpenAI Sora, și l-a cooptat pe Tim Rocktäschel, cunoscut pentru experimentele sale cu jocuri open-ended precum NetHack.
Concluzie
Genie 2 marchează un pas important în evoluția modelelor AI capabile să genereze lumi virtuale complexe și interactive. Deși tehnologia este încă limitată, potențialul său de a influența industria creativă și cercetarea în inteligență artificială este uriaș. Rămâne de văzut cum vor evolua aceste instrumente și ce impact vor avea asupra industriilor care împreună măiestria umană cu puterea tehnologică.