Oamenii își filmează treburile prin casă pentru a antrena roboții umanoizi
Visul unui android capabil să spele vasele, să strângă masa, să ude plantele sau să facă ordine prin casă pare tot mai aproape de realitate. Numai că, înainte să ajungă în sufrageria ta, un astfel de robot are nevoie de ceva esențial: să învețe cum se fac toate aceste lucruri în lumea reală. Iar pentru asta, companiile de tehnologie au început să caute o resursă neașteptată, dar extrem de valoroasă: oameni obișnuiți care se filmează în timp ce își fac treburile casnice.
Noua goană după date pentru inteligența artificială nu se mai rezumă doar la texte, imagini sau clipuri găsite pe internet. În cazul roboților umanoizi, dezvoltatorii au nevoie de înregistrări din perspectivă umană, adică imagini filmate la persoana întâi, care arată exact cum se mișcă un om atunci când gătește, curăță, spală sau îngrijește un animal de companie. Pentru multe startup-uri, acesta a devenit deja un nou model de afacere, conform CNN.
O industrie nouă, construită din gesturi banale
Mai multe companii au început să recruteze colaboratori din zeci de țări pentru a produce așa-numitul „human data”, material video folosit la antrenarea roboților. Tot ce trebuie să facă acești lucrători este să poarte o cameră fixată pe cap sau un smartphone și să filmeze activități de zi cu zi, de la gătit și aspirat până la grădinărit ori joaca cu animalele.
Cererea este uriașă. Unele firme adună deja sute de mii de ore de conținut în fiecare lună, dar spun că tot nu este suficient. Pentru ca un robot să devină cu adevărat util în casă, în magazin, în spital sau în depozit, el trebuie să „vadă” o varietate imensă de medii, obiecte și mișcări. O bucătărie din Statele Unite nu seamănă cu una din India, iar o mătură folosită într-o țară poate fi complet diferită de cea din alta. Tocmai de aceea, diversitatea datelor devine la fel de importantă ca volumul lor.
Acest tip de material este valoros și pentru că poate fi etichetat ulterior. Companiile analizează clipurile pentru a învăța robotul să distingă obiectele, distanțele, direcțiile de mișcare și modul în care interacționează mâinile cu lumea fizică. În teorie, dacă un om poate arăta clar cum apucă un pahar, împăturește un tricou sau desface un capac, robotul poate fi antrenat să repete acea secvență.
De ce nu ajung simulările și roboții controlați de la distanță
Până acum, roboții au fost antrenați în principal în două moduri: fie prin control direct de la distanță, fie în simulări digitale. Prima variantă este costisitoare, pentru că implică mult hardware și echipamente specializate. A doua este mai ieftină, dar nu reproduce mereu fidel interacțiunea cu obiectele reale, mai ales când este vorba despre suprafețe, greutate, alunecare sau fragilitate.
Aici intervine filmarea activităților umane. Pentru dezvoltatori, este o soluție de mijloc: mult mai accesibilă decât antrenarea exclusivă pe roboți reali și, în multe situații, mai utilă decât un mediu virtual. Unele rezultate arată deja că integrarea a zeci de mii de ore de videoclipuri filmate la persoana întâi poate crește semnificativ rata de succes a unor sarcini precum sortarea obiectelor, rularea tricourilor sau deschiderea recipientelor.
Totuși, progresul nu este suficient pentru ca roboții să fie trimiși mâine în fiecare locuință. În fabrici, unde mediul este controlat și repetitiv, aceștia pot avea o rată de reușită de aproape 100%. Într-o casă, însă, lucrurile devin imprevizibile: mobilierul se schimbă, oamenii se mișcă, obiectele sunt lăsate în locuri diferite, iar interacțiunile pot varia enorm de la o secundă la alta.
Ultimul prag: siguranța și intuiția umană
Marea problemă rămâne lipsa unei intuiții apropiate de cea umană. O persoană înțelege instinctiv câtă forță să aplice, când un obiect este alunecos, când ceva este fragil sau când o situație poate deveni periculoasă. Pentru un robot, aceste lucruri nu sunt deloc evidente, chiar dacă a fost antrenat pe mii de ore de video.
De aici apar și cele mai serioase semne de întrebare legate de siguranță. Un robot care face curat într-o cameră de joacă trebuie să poată distinge fără greș între o păpușă și un copil real. O eroare într-un astfel de context nu înseamnă doar un eșec tehnic, ci un risc major și, potențial, consecințe juridice uriașe pentru compania care l-a creat.
De aceea, drumul până la majordomul android promis de industria tech este încă lung. Dar faptul că munca de antrenare începe acum cu imagini banale din locuințe obișnuite spune multe despre direcția în care merge tehnologia. Viitorul automatizării nu se mai construiește doar în laboratoare sterile, ci și în bucătării, sufragerii și curți filmate de oameni care, fără să vrea, devin profesorii roboților de mâine.