Anthropic pregătește lansarea Claude Mythos, modelul AI considerat prea periculos pentru internetul actual

Anthropic pregătește lansarea Claude Mythos, modelul AI considerat prea periculos pentru internetul actual
Claude Mythos ar putea ajunge direct în Claude Code / Foto: Profimedia

Anthropic pare să se apropie de lansarea publică a lui Anthropic Mythos, unul dintre cele mai controversate modele AI dezvoltate până acum pentru securitate informatică și analiză de cod. Compania anunțase încă din aprilie existența proiectului, însă atunci a descris modelul ca fiind suficient de puternic încât să reprezinte un risc real pentru infrastructura digitală globală.

Modelul, aflat momentan în preview restricționat, a fost prezentat ca un sistem capabil să depășească semnificativ performanțele actualului vârf de gamă al companiei, Claude Opus 4.7, mai ales în ceea ce privește raționamentul pe cod și autonomia în executarea sarcinilor complexe, scrie Bleeping Computer.

Diferența majoră este că Mythos nu se limitează la a scrie cod mai bine, ci poate identifica și construi atacuri cibernetice funcționale la un nivel apropiat de cel al specialiștilor umani.

Claude Mythos ar putea ajunge direct în Claude Code

Noi indicii descoperite în platformele Claude Code și Claude Security sugerează că Anthropic pregătește deja infrastructura necesară pentru o lansare mai largă. Mai mulți utilizatori au observat pentru scurt timp apariția unei opțiuni numite „claude-mythos-1-preview” în interfața publică a Claude Code, înainte ca aceasta să fie retrasă.

Apariția accidentală a acestui toggle a alimentat speculațiile privind o lansare apropiată, deși compania nu a confirmat oficial când va deveni disponibil modelul și nici dacă accesul va fi limitat la anumite abonamente premium.

Anthropic a explicat anterior că motivul principal pentru care Mythos nu a fost lansat public ține de riscurile enorme asociate unui astfel de sistem. Compania susține că modelul poate exploata vulnerabilități software la scară mare și că o publicare fără măsuri serioase de protecție ar putea ajuta inclusiv actori rău intenționați.

Printre exemplele menționate s-au numărat aplicații populare care conțin vulnerabilități nepatchuite, inclusiv browserul Mozilla Firefox. Anthropic avertiza atunci că un AI suficient de avansat ar putea accelera dramatic identificarea și folosirea breșelor de securitate înainte ca dezvoltatorii să le poată repara.

Proiectul Glasswing și cele 10.000 de vulnerabilități descoperite

În paralel cu pregătirea lansării, Anthropic dezvoltă și proiectul Glasswing, o inițiativă prin care colaborează cu organizații și companii pentru identificarea vulnerabilităților critice din software-ul utilizat la scară globală.

Conform informațiilor prezentate de companie, varianta preview a modelului Claude Mythos a reușit să descopere aproximativ 10.000 de vulnerabilități catalogate drept severe sau critice în doar prima lună de testare. Datele explică de ce Anthropic tratează lansarea cu extrem de multă prudență.

Compania a prezentat inclusiv un dashboard intern care afișează vulnerabilitățile open-source detectate de Mythos Preview, iar până acum aproximativ 50 de parteneri organizaționali ar fi participat la acest program.

Anthropic susține că, pe termen scurt, astfel de modele AI pot avantaja atacatorii dacă sunt lansate fără suficiente limitări și filtre. Pe termen lung însă, compania crede că aceeași tehnologie va permite echipelor defensive să găsească și să repare erorile înainte ca software-ul vulnerabil să ajungă în producție.

În acest moment, Anthropic oferă deja mai multe modele comerciale din familia Claude, printre care Claude Opus 4.6, Claude Opus 4.5, Claude Sonnet 4.6 și Claude Haiku 5.5. Totuși, Mythos pare să fie primul model pe care compania îl tratează explicit drept un potențial risc de securitate la nivel global.