Roboții Nvidia au învățat să monteze plăci video și să taie coliere de plastic cu ajutorul agenților AI
Nvidia duce ideea de „AI care se îmbunătățește singur” într-o zonă mult mai concretă decât generarea de text sau scrierea de cod. Cercetătorii companiei au testat un sistem prin care agenți AI de coding pot antrena roboți reali să execute sarcini fizice delicate, de la tăierea unor coliere de plastic până la introducerea unei plăci video într-un slot de pe o placă de bază.
Experimentul vine din laboratorul Nvidia GEAR, în colaborare cu cercetători de la Carnegie Mellon University și University of California, Berkeley. Sistemul se numește ENPIRE și funcționează ca un cadru software care le permite agenților AI să folosească instrumente, să analizeze rezultate, să modifice cod, să verifice greșeli și să îmbunătățească treptat comportamentul roboților. Practic, în loc ca oamenii să regleze manual fiecare pas al procesului de antrenare, agenții AI primesc obiective, resurse și acces la roboți, apoi încearcă singuri să găsească metode mai bune.
Cum ajunge AI-ul să antreneze roboți reali
Cea mai interesantă parte a experimentului este că agenții AI nu au lucrat doar într-o simulare. Ei au fost puși să îmbunătățească roboți fizici, care executau sarcini în laborator. Printre testele folosite se numără Push-T, o provocare standard în robotică, în care un robot trebuie să mute un obiect în formă de T într-o poziție țintă, dar și sarcini mai apropiate de lumea reală, precum organizarea unor pini într-o cutie, legarea și tăierea colierelor de plastic sau manevrarea unei plăci grafice.
Într-unul dintre cele mai spectaculoase exemple, un braț robotic a fost antrenat să introducă un GPU într-un slot îngust de pe o placă de bază, apoi să îl scoată pentru ca testul să poată fi reluat. Este o sarcină dificilă inclusiv pentru roboți avansați, pentru că implică precizie, aliniere fină, control al forței și capacitatea de a corecta greșelile mici înainte ca piesele să fie deteriorate.
ENPIRE le permite agenților AI să treacă prin cicluri repetate de testare și îmbunătățire. Ei pot analiza loguri, pot modifica algoritmi, pot ajusta politicile de control ale roboților și pot decide ce schimbări merită păstrate. Cu alte cuvinte, sistemul transformă antrenarea roboților într-un proces de cercetare automatizată, în care AI-ul testează ipoteze și învață din eșecuri.
Rezultate impresionante, dar nu fără limite
Potrivit cercetătorilor, agenții AI au reușit să atingă rate de succes de până la 99% pentru mai multe sarcini de manipulare. În unele cazuri, echipele de agenți au ajuns mai repede la rezultate foarte bune decât metodele în care oamenii rămâneau implicați direct în procesul de antrenare. Un exemplu important a fost sarcina de inserare și organizare a pinilor, unde agenții au obținut aproape 100% succes într-un timp mai scurt decât o metodă avansată cu om în buclă.
Testele au arătat și că echipele mai mari de agenți AI pot accelera progresul. O echipă de opt agenți a ajuns la 99% succes în sarcina Push-T în aproximativ două ore de cercetare, în timp ce o echipă de patru agenți a avut nevoie de trei ore, iar un singur agent de aproape cinci ore. Asta sugerează că mai mulți agenți pot explora în paralel strategii diferite și pot găsi mai repede soluții eficiente.
Totuși, experimentul a scos la iveală și limite clare. Roboții nu au fost folosiți permanent. Uneori, brațele robotice stăteau degeaba în timp ce agenții AI citeau loguri, scriau cod, așteptau răspunsuri de la modele lingvistice sau încercau să depaneze probleme. Echipele mai mari de agenți au consumat și mai multe resurse, inclusiv tokeni, iar o parte din timp s-a pierdut cu rezumarea ideilor între agenți, nu cu folosirea efectivă a roboților.
De ce contează acest experiment pentru viitorul roboților
Pentru Nvidia, miza este uriașă. Compania nu vrea să fie doar furnizorul de cipuri pentru AI generativ, ci și unul dintre actorii centrali ai așa-numitei „physical AI”, adică inteligența artificială aplicată roboților, mașinilor autonome, fabricilor și sistemelor care interacționează direct cu lumea reală.
Dacă astfel de sisteme devin mai eficiente, laboratoarele de robotică ar putea antrena mai rapid roboți pentru sarcini industriale. În loc ca inginerii să petreacă zile sau săptămâni ajustând manual comportamente, agenții AI ar putea rula experimente peste noapte, iar oamenii ar citi dimineața rapoartele cu ce a funcționat și ce nu.
Asta nu înseamnă că roboții vor înlocui imediat oamenii în fabrici sau că AI-ul poate învăța orice sarcină fizică fără supraveghere. Lumea reală este mai complicată decât un benchmark, iar manipularea obiectelor rămâne una dintre cele mai grele probleme din robotică. Dar faptul că agenți AI pot antrena roboți reali să execute sarcini fine, precum montarea unui GPU, arată cât de repede se mută AI-ul din ecran în lumea fizică.
Experimentul Nvidia nu este doar o demonstrație spectaculoasă de laborator. Este un indiciu despre direcția în care merg roboții următorilor ani: mai autonomi, mai ușor de antrenat și tot mai dependenți de agenți AI care pot scrie cod, testa ipoteze și îmbunătăți singuri comportamente.