Anthropic deschide o nouă frontieră în securitate: AI-ul care caută vulnerabilități înaintea hackerilor

Anthropic deschide o nouă frontieră în securitate: AI-ul care caută vulnerabilități înaintea hackerilor
Foto: Getty Images

Anthropic a făcut un pas care ar putea schimba serios modul în care marile companii își apără infrastructura digitală. Compania a lansat Project Glasswing, o inițiativă prin care oferă acces limitat la Claude Mythos Preview, un model AI considerat extrem de capabil în identificarea vulnerabilităților software, către zeci de organizații mari din tehnologie și infrastructură critică. Printre partenerii anunțați se află Amazon Web Services, Apple, Google, JPMorganChase, Microsoft și NVIDIA.

Mutarea este cu atât mai interesantă cu cât vine la doar câteva săptămâni după ce tot Anthropic avertiza că acest model ar putea introduce „riscuri fără precedent” în zona de securitate cibernetică. Cu alte cuvinte, compania spune acum că aceeași tehnologie care ar putea deveni periculoasă dacă ajunge pe mâini greșite poate fi folosită preventiv pentru a întări apărarea unor sisteme esențiale.

Un model AI foarte puternic, ținut departe de public

Project Glasswing nu înseamnă o lansare publică. Anthropic a precizat că Mythos Preview nu va fi disponibil larg, tocmai din cauza riscurilor asociate. În schimb, modelul este testat într-un cadru restrâns, cu aproximativ 40 de organizații care lucrează cu software critic sau infrastructură importantă. Scopul declarat este unul defensiv: modelul trebuie să găsească breșe înainte ca atacatorii să o facă.

Compania susține că primele rezultate au fost deja spectaculoase. Potrivit Anthropic, Claude Mythos Preview a identificat mii de vulnerabilități severe, inclusiv probleme în toate marile sisteme de operare și browsere web. În exemplele prezentate public, modelul ar fi găsit un bug vechi de 27 de ani în OpenBSD și un lanț de vulnerabilități în Linux care ar fi putut permite compromiterea completă a unui sistem.

Anthropic afirmă și că modelul depășește clar versiuni anterioare precum Claude Opus 4.6 în testele de securitate, inclusiv în benchmark-uri care măsoară capacitatea unui agent AI de a detecta și reproduce vulnerabilități reale. Asta sugerează că nu mai vorbim doar despre un chatbot foarte bun la cod, ci despre un instrument care începe să semene cu un adevărat analist automatizat de securitate.

Pariul Anthropic vine cu promisiuni mari, dar și cu întrebări incomode

Dincolo de entuziasm, lansarea are și o doză evidentă de paradox. Exact compania care a scăpat anterior informații nepublicate despre Mythos într-o bază de date accesibilă public vine acum să spună că are un model suficient de puternic încât să protejeze infrastructuri esențiale. Anthropic a recunoscut în raportul său de risc că, în dezvoltarea acestui model, au existat erori în procesele de training, monitorizare, evaluare și securitate, chiar dacă firma spune că riscul general rămâne redus.

Aici apare și miza reală a proiectului. Pe de o parte, AI-ul ar putea deveni un aliat crucial pentru apărarea cibernetică, într-un context în care sistemele software devin tot mai complexe și mai greu de verificat manual. Pe de altă parte, aceeași tehnologie poate fi folosită și ofensiv, pentru a accelera descoperirea și exploatarea breșelor. Anthropic pare să încerce să se poziționeze de partea „bună” a acestei curse, oferind modelul doar într-un cerc controlat și pregătind industria pentru ce urmează.

În esență, Project Glasswing arată unde se îndreaptă rapid industria AI: spre modele care nu doar conversează sau generează texte, ci intervin direct în zone sensibile precum securitatea infrastructurii digitale globale. Dacă promisiunile Anthropic se confirmă, astfel de sisteme ar putea deveni indispensabile în apărarea cibernetică. Dar exact această eficiență este și motivul pentru care companiile se tem să le lase complet libere.