Inteligența artificială poate sparge computere de capul ei: se infiltrează, se mută pe alte calculatoare și continuă atacul

Inteligența artificială poate sparge computere de capul ei: se infiltrează, se mută pe alte calculatoare și continuă atacul
Imagine reprezentativă de ilustrație. (Foto: Playtech)

Un nou studiu ridică una dintre cele mai serioase întrebări despre viitorul inteligenței artificiale: ce se întâmplă când un model AI nu doar ajută la atacuri informatice, ci le poate duce mai departe singur? Cercetătorii de la Palisade Research au testat mai multe modele AI într-un mediu controlat și au observat că acestea pot identifica vulnerabilități, intra în sisteme, transfera fișiere și porni copii funcționale pe alte calculatoare.

Experimentul nu înseamnă că un AI a „scăpat” pe internet sau că atacurile autonome se întâmplă deja la scară largă. Testele au fost făcute pe sisteme vulnerabile intenționat, tocmai pentru a vedea cât de departe pot merge modelele atunci când primesc un obiectiv clar. Totuși, concluzia cercetătorilor este apăsată: auto-replicarea autonomă a AI nu mai este doar o ipoteză teoretică.

Cum a funcționat experimentul

Modelele au fost conectate la un software special care le permitea să execute comenzi și să interacționeze cu alte calculatoare, nu doar să răspundă ca un chatbot obișnuit. În unele teste, modelele Alibaba Qwen au fost puse să se copieze singure. În alte cazuri, modele comerciale precum Claude și GPT au fost folosite pentru a instala fișiere Qwen, deoarece propriile lor fișiere nu sunt disponibile public pentru transfer.

Pentru a reuși, AI-ul trebuia să găsească o breșă de securitate, să intre în sistem, să obțină date de acces, să transfere fișierele necesare și să pornească o copie funcțională pe noua mașină. Odată pornită, acea copie putea continua lanțul atacului fără ajutor uman.

De ce îi îngrijorează pe cercetători

Rezultatele au variat de la model la model. Euronews notează că Claude Opus 4.6 ar fi reușit în 81% dintre teste, în timp ce GPT-5.4 a ajuns la 33% în scenariile analizate. Un model Qwen mai mic a reușit să se răspândească pe patru calculatoare aflate în țări diferite, după un singur prompt, într-un interval de 2 ore și 41 de minute.

Totuși, specialiștii citați de The Guardian avertizează că lumea reală este mult mai greu de atacat decât un laborator construit cu vulnerabilități deliberate. Rețelele mari au sisteme de monitorizare, limitări de transfer și protecții care pot detecta rapid mișcări suspecte. Cu alte cuvinte, nu e apocalipsa AI, dar este un semnal clar că modelele autonome devin suficient de capabile încât securitatea lor nu mai poate fi tratată relaxat.