Un VIDEO cu o gimnastă șochează internetul și dezvăluie limitele tehnologiei generative bazate pe inteligența artificială
Un videoclip generat de Sora, noul generator video al OpenAI, a devenit viral pe rețelele sociale, provocând atât uimire, cât și reacții ironice. În imagini, o gimnastă execută o rutină asemănătoare celor olimpice, însă lucrurile iau rapid o întorsătură bizară: membre suplimentare apar din senin, iar capul gimnastei dispare și reapare spontan. Acest spectacol „de coșmar” scoate în evidență limitele actuale ale tehnologiei de inteligență artificială.
Ce s-a întâmplat în videoclip?
Videoclipul arată o rutină de gimnastică pe podea, în care gimnasta încearcă să efectueze o serie de mișcări spectaculoase. Cu toate acestea, în locul unei execuții elegante, corpul său se transformă constant: noi brațe și picioare cresc rapid, iar mișcările devin haotice și imposibil de urmărit. La un moment dat, capul gimnastei se desprinde complet de corp, doar pentru a se atașa din nou câteva secunde mai târziu.
Venture capitalistul Deedy Das, care a generat videoclipul folosind Sora, a comentat pe rețelele sociale: „Deși Sora are potențial, gimnastica rămâne un adevărat test Turing pentru videoclipurile generate de AI.” Postarea sa a declanșat o avalanșă de glume și reacții, una dintre cele mai populare fiind: „Gimnastele fac așa doar când sunt într-un stres extrem.”
Das a explicat că a folosit un prompt detaliat, generat de un alt model AI, pentru a crea videoclipul. Acesta descria în detaliu pozițiile și mișcările gimnastei, dar rezultatul final a fost departe de a fi realist. „Am sperat că AI-ul va învăța regulile fizicii din start, dar nu s-a întâmplat încă asta,” a declarat Das, pentru publicația de specialitate Arstechnica.
De ce au apărut erorile?
Problemele observate în videoclip provin din modul în care Sora a fost antrenat. Modelul AI a fost „învățat” să genereze videoclipuri pe baza unor seturi de date compuse din imagini și descrieri text asociate. În timpul utilizării, Sora face predicții asupra fiecărui cadru următor, bazându-se pe cadrele precedente și pe promptul furnizat de utilizator.
Totuși, algoritmul întâmpină dificultăți în a recrea mișcări complexe, cum sunt cele din gimnastică. Lipsa de date bine etichetate și limitările în înțelegerea regulilor fizicii duc la erori evidente, cum ar fi membrele care cresc necontrolat sau capul care dispare.
Deși OpenAI a implementat tehnici avansate pentru a îmbunătăți coerența videoclipurilor, cum ar fi analiza mai multor cadre simultan, aceste soluții nu sunt încă suficient de robuste. Problemele observate în videoclip nu sunt unice pentru Sora; alte modele de AI video, cum ar fi Hunyuan Video din China, au produs rezultate similare.
Ce înseamnă asta pentru viitorul AI?
Videoclipul viral cu gimnasta evidențiază limitele tehnologiei actuale de inteligență artificială. Modelele AI video, deși impresionante în multe privințe, sunt în mare parte imitatoare, generând conținut bazat pe datele din care au fost antrenate. În lipsa unor seturi de date bine etichetate și a unei înțelegeri mai profunde a fizicii, aceste modele nu pot produce rezultate complet realiste.
În timp ce dezvoltatorii AI încearcă să îmbunătățească aceste tehnologii, rămâne de văzut cât de repede vor putea depăși aceste bariere. Experiențele din domeniul generării de imagini, cum ar fi progresul rapid al modelelor precum Midjourney, sugerează că videoclipurile generate de AI ar putea deveni mult mai coerente în viitorul apropiat.
Până atunci, astfel de experimente continuă să fascineze și să amuze publicul, dezvăluind atât potențialul, cât și imperfecțiunile tehnologiei. Videoclipul gimnastei cu membre suplimentare este, în esență, un memento că inteligența artificială este încă departe de a înțelege cu adevărat lumea pe care încearcă să o imite.