AI-ul antrenat pe computer cuantic a trecut un test pe care modelul obișnuit l-a ratat: descoperirea care poate schimba viitorul inteligenței artificiale

AI-ul antrenat pe computer cuantic a trecut un test pe care modelul obișnuit l-a ratat: descoperirea care poate schimba viitorul inteligenței artificiale
Foto: Playtech

Inteligența artificială ar putea primi un impuls important dintr-o zonă care, până acum, părea mai degrabă experimentală decât practică: computerele cuantice. O echipă de cercetători de la Multiverse Computing a testat o metodă prin care un model AI existent poate deveni mai precis atunci când este îmbunătățit cu ajutorul unui computer cuantic IBM, fără să fie nevoie de o creștere uriașă a dimensiunii modelului.

Experimentul este important pentru că arată o posibilă alternativă la strategia clasică din AI: modele tot mai mari, cu tot mai mulți parametri, antrenate pe infrastructuri din ce în ce mai costisitoare. În loc să mărească masiv modelul, cercetătorii au adăugat un număr foarte mic de parametri și au folosit circuite cuantice pentru a obține o îmbunătățire măsurabilă a performanței.

Ce au făcut cercetătorii și de ce contează

În centrul experimentului s-a aflat Llama 3.1 8B, un model lingvistic cu 8 miliarde de parametri dezvoltat de Meta. Cercetătorii nu au reconstruit modelul de la zero și nu i-au modificat baza principală. Dimpotrivă, parametrii originali au fost „înghețați”, adică lăsați neschimbați, iar peste ei au fost adăugate componente noi, antrenate separat.

Aceste componente se numesc Cayley-parameterized unitary adapters, prescurtat CUA. Pe scurt, sunt blocuri matematice care pot fi antrenate pe un computer clasic și apoi executate cu ajutorul unui procesor cuantic. Cercetătorii le-au rulat pe IBM Quantum System Two, un sistem cuantic superconductiv cu 156 de qubiți.

Rezultatul a fost modest ca dimensiune, dar important ca semnificație. Modelul hibrid, adică versiunea care combină AI-ul clasic cu aceste componente cuantice, a redus perplexitatea modelului Llama 3.1 8B cu 1,4%, adăugând doar 6.000 de parametri. Raportat la un model cu 8 miliarde de parametri, creșterea este infimă.

Perplexitatea este una dintre măsurile folosite pentru a evalua cât de bine poate un model AI să prezică următorul cuvânt dintr-o secvență. Cu cât perplexitatea este mai mică, cu atât modelul are, în principiu, o capacitate mai bună de a genera răspunsuri coerente și predictibile. De aceea, chiar și o reducere mică devine interesantă dacă este obținută fără o extindere masivă a modelului.

Întrebările la care AI-ul cuantic a răspuns mai bine

Partea cea mai spectaculoasă a testului nu ține doar de procentul de îmbunătățire, ci de exemplele concrete în care modelul hibrid a dat răspunsuri corecte acolo unde modelul de bază a greșit. Într-o întrebare de astronomie, modelul Llama obișnuit a ales greșit un răspuns care sugera că doar Saturn are inele dintre planetele joviene.

Versiunea îmbunătățită cu componente cuantice a răspuns corect, identificând faptul că toate planetele joviene au inele. Într-un alt exemplu, legat de biologie și genetică populațională, modelul de bază a dat un răspuns greșit despre efectele fluxului genetic, în timp ce varianta hibridă a identificat corect creșterea omogenității genetice.

Aceste exemple nu înseamnă că AI-ul cuantic a devenit brusc superior modelelor clasice sau că problema halucinațiilor a fost rezolvată. Înseamnă, însă, că introducerea unor componente cuantice poate modifica performanța unui model real, deja existent, într-un mod măsurabil. Pentru cercetători, acesta este punctul esențial: nu mărimea progresului, ci faptul că progresul apare.

Borja Aizpurua, cercetător la Multiverse Computing și autor principal al studiului, a descris tehnica drept un prim pas, nu o soluție finală. Calculatoarele cuantice pot aduce avantaje, dar vin și cu probleme serioase, mai ales din cauza zgomotului. În lumea cuantică, zgomotul poate apărea din interacțiuni între qubiți, câmpuri magnetice, radiații sau alte interferențe, iar aceste perturbări pot afecta rezultatele.

De ce nu înseamnă încă o revoluție, dar poate fi începutul uneia

Cea mai mare provocare rămâne corectarea erorilor. Computerele cuantice actuale sunt promițătoare, dar sensibile. Cu cât circuitul cuantic este mai mare, cu atât crește riscul ca zgomotul să strice calculul. De aceea, cercetătorii au folosit adaptoare mici, mai ușor de controlat și mai potrivite pentru hardware-ul cuantic disponibil astăzi.

Pe termen lung, scopul este mult mai ambițios: construirea unor modele AI care să folosească mai profund avantajele calculului cuantic, nu doar mici componente atașate unui model clasic. Dacă această direcție va funcționa, AI-ul ar putea deveni mai eficient fără să depindă exclusiv de modele tot mai uriașe și infrastructuri tot mai scumpe.

Pentru industria AI, vestea vine într-un moment critic. Modelele mari devin din ce în ce mai costisitoare de antrenat și rulat, iar companiile caută metode prin care să obțină performanțe mai bune cu resurse mai puține. Calculul cuantic nu este încă o soluție comercială matură pentru acest lucru, dar experimentul arată că poate avea un rol real în viitor.

Deocamdată, descoperirea trebuie privită ca un proof of concept: o demonstrație că direcția merită investigată. Totuși, faptul că un model AI folosit la scară reală a putut fi îmbunătățit prin hardware cuantic este o bornă importantă. Nu suntem încă în era AI-ului cuantic de zi cu zi, dar cercetarea arată că următoarea mare schimbare în inteligența artificială s-ar putea să nu vină doar din modele mai mari, ci dintr-un mod complet diferit de a calcula.