Inteligența artificială te-ar putea ajuta să te joci mai cu spor, în viitor. DeepMind a tras lozul câștigător, ce știe să facă AI-ul

de: Iulia Kelt
15 03. 2024

Google DeepMind a dezvăluit noi cercetări care scot în evidență un agent de inteligență artificială capabil să efectueze sarcini în jocuri 3D nemaivăzute până acum.

Modelele AI ar putea să ne întreacă, dar și să ne ajute

Echipa experimentează de mult timp modelele AI care pot câștiga în jocuri precum Go și șah, chiar și să învețe jocuri fără a fi informate cu privire la regulile lor.

Conform DeepMind, un agent de inteligență artificială a demonstrat că este capabil să înțeleagă o gamă largă de lumi de joc și să efectueze sarcini în interiorul acestora pe baza instrucțiunilor în limbaj natural.

Cercetătorii s-au asociat cu studiouri și editori precum Hello Games (No Man’s Sky), Tuxedo Labs (Teardown) și Coffee Stain (Valheim și Goat Simulator 3) pentru a instrui Scalable Instructable Multiworld Agent (SIMA) pe nouă jocuri.

Echipa a folosit, de asemenea, patru medii de cercetare, inclusiv unul construit în Unity în care agenții sunt instruiți să formeze sculpturi folosind blocuri de construcție.

SIMA deschide lumi interactive noi

„Fiecare joc din portofoliul lui SIMA deschide o lume interactivă nouă, incluzând o gamă de abilități de învățare, de la navigare simplă și utilizare a meniului, până la extragerea resurselor, pilotarea unei nave spațiale”, au scris cercetătorii într-o postare pe blog.

Cercetătorii au înregistrat oameni jucând jocurile și au notat intrările tastaturii și mouse-ului utilizate pentru a efectua acțiuni. Au folosit aceste informații pentru a instrui SIMA, mai apoi.

Cercetătorii spun că SIMA nu necesită codul sursă al unui joc sau acces la API, ci funcționează pe versiunile comerciale ale unui joc. Are nevoie și doar de două intrări: ceea ce este afișat pe ecran și instrucțiunile de la utilizator.

Deoarece folosește aceeași metodă de intrare tastatură și mouse ca un om, DeepMind susține că SIMA poate opera în aproape orice mediu virtual.

Agentul este evaluat în funcție de sute de abilități de bază care pot fi efectuate în aproximativ 10 secunde sau mai puțin în mai multe categorii, inclusiv navigare, interacțiune cu obiecte și sarcini bazate pe meniu, cum ar fi deschiderea unei hărți sau confecționarea unui obiect.

În cele din urmă, DeepMind speră să le poată ordona agenților să efectueze sarcini mai complexe și multi-etapă bazate pe prompturi în limbaj natural, cum ar fi „găsește resurse și construiește o tabără”.