Modelele AI „periculoase” nu mai pot fi oprite: criza Anthropic arată ce urmează pentru securitatea cibernetică
Decizia guvernului american de a bloca accesul la două dintre cele mai avansate modele Anthropic, Claude Fable 5 și Mythos 5, a reaprins o dezbatere esențială despre viitorul inteligenței artificiale. Nu mai vorbim doar despre chatboți care scriu texte, rezumă documente sau generează cod simplu. Următoarea generație de modele AI poate ajuta specialiștii să găsească vulnerabilități software, să testeze sisteme și să întărească apărarea digitală. Aceleași capabilități pot fi însă folosite și de atacatori.
Aici apare problema reală: chiar dacă un model este blocat temporar, direcția tehnologică nu poate fi oprită. Anthropic se află acum în centrul atenției, dar experții avertizează că modele similare vor apărea curând și la alte companii, dacă nu există deja în forme private sau experimentale, potrivit Reuters. Criza Fable 5 și Mythos 5 nu este, de fapt, doar despre Anthropic. Este despre momentul în care AI-ul devine suficient de competent încât să schimbe regulile jocului în securitatea cibernetică.
De ce a intervenit guvernul american
La finalul săptămânii trecute, Anthropic a retras offline modelele Claude Fable 5 și Mythos 5, după ce administrația americană a emis o directivă de control al exporturilor care interzicea accesul „oricărui cetățean străin” la aceste servicii. Motivul invocat ține de securitatea națională, în contextul în care Mythos 5 este prezentat ca un model cu abilități avansate în identificarea vulnerabilităților software.
Anthropic avertizase deja că astfel de modele au o natură duală. În mâinile unui cercetător în securitate cibernetică, ele pot ajuta la descoperirea și repararea problemelor înainte ca acestea să fie exploatate. În mâinile unui actor rău intenționat, aceeași capacitate poate accelera descoperirea unor puncte slabe și dezvoltarea unor atacuri.
Compania lansase inițial o versiune Mythos Preview pentru un consorțiu restrâns, în cadrul unui grup de lucru numit Project Glasswing. Ulterior, Mythos 5 a fost oferit privat aceluiași grup, iar Claude Fable 5 a fost lansat public cu restricții explicite pentru întrebări din zone sensibile, precum biologia și securitatea cibernetică.
Guvernul american a intervenit însă pe fondul temerii că mecanismele de protecție din Fable 5 ar putea fi ocolite, oferind acces indirect la capabilități comparabile cu cele ale Mythos 5. Pentru autorități, riscul nu a fost doar existența modelului, ci posibilitatea ca acesta să ajungă în mâinile unor actori străini sau ostili.
Blocarea unui model nu blochează evoluția AI
Experții în securitate spun că această abordare poate întârzia problema, dar nu o poate rezolva. Dacă un singur laborator a ajuns la un model cu astfel de capabilități, este rezonabil să presupui că și alte companii vor ajunge acolo în curând. În unele cazuri, este posibil ca ele să fi ajuns deja, dar să nu fi anunțat public.
Tarah Wheeler, specialistă în securitate cibernetică, a avertizat că este o greșeală să presupui că doar Anthropic poate dezvolta modele similare. Alte companii urmăresc aceeași direcție și pot alege să păstreze în rezervă produse comparabile, tocmai pentru a vedea cum reacționează autoritățile în cazul Anthropic.
OpenAI a testat, la rândul său, modele și strategii axate pe securitate cibernetică, iar industria se mișcă rapid spre agenți AI capabili să analizeze cod, să caute probleme și să propună soluții. Chiar și modelele mai mici sau open-source pot deveni mult mai puternice atunci când sunt combinate cu instrumente, fluxuri de lucru și prompturi specializate.
Aceasta este marea schimbare: pericolul nu stă într-un singur model, ci în direcția generală a tehnologiei. AI-ul devine mai bun la raționament tehnic, la analiză de cod și la automatizarea unor sarcini care până acum necesitau echipe specializate. În securitate cibernetică, asta poate însemna apărare mai rapidă, dar și atacuri mai ieftine și mai accesibile.
Ce ar trebui să facă guvernele, dincolo de interdicții
Blocarea punctuală a unor modele poate părea o soluție rapidă, dar specialiștii cer un cadru mai clar, mai transparent și mai predictibil. Întrebarea importantă nu este dacă o tehnologie are risc. Aproape orice tehnologie puternică are risc. Întrebarea este dacă o restricție anume reduce cu adevărat acel risc sau doar încetinește oamenii care încearcă să folosească tehnologia defensiv.
În cazul modelelor AI avansate, o politică eficientă ar trebui să includă audituri independente, teste de siguranță, criterii clare pentru acces, reguli pentru utilizarea în cercetare și colaborare între guverne, companii și comunitatea de securitate. Dacă deciziile sunt luate brusc, fără explicații clare, companiile nu știu ce pot lansa, cercetătorii nu știu ce pot testa, iar aliații internaționali nu știu dacă se pot baza pe tehnologia americană.
Există și o problemă geopolitică. Dacă Statele Unite restricționează prea agresiv accesul la modelele lor, alte țări vor accelera propriile programe de AI. Europa, India, China și alte puteri tehnologice nu vor accepta pe termen lung să depindă complet de infrastructură americană care poate fi oprită printr-o decizie politică.
Criza Anthropic este, astfel, un semnal de alarmă. Modelele AI capabile să ajute la hacking, apărare cibernetică și cercetare sensibilă nu sunt o excepție trecătoare. Ele sunt următorul pas al industriei. Interdicțiile pot cumpăra timp, dar nu pot opri apariția acestor capabilități.
Adevărata provocare este să construiești reguli înainte ca tehnologia să devină omniprezentă. Pentru că modelele „periculoase” vin oricum. Întrebarea nu mai este dacă vor exista, ci cine le va controla, cum vor fi verificate și dacă vor fi folosite mai mult pentru apărare decât pentru atac.