Claude Code te „citește” când înjuri, iar adevărata problemă e alta: AI-ul începe să-și șteargă urmele
O scurgere de informații accidentală de cod de la Anthropic a aprins rapid discuțiile din lumea tehnologiei, după ce dezvoltatorii au descoperit că asistentul de programare Claude Code pare să urmărească momentele în care utilizatorii își pierd răbdarea. Mai exact, în cod au apărut mecanisme care identifică injurii, insulte și expresii de frustrare precum „this sucks” sau „so frustrating”, marcând faptul că utilizatorul a avut o reacție negativă. Informația a atras imediat atenția, nu doar pentru că este neobișnuită, ci pentru că arată cât de atent pot fi monitorizate interacțiunile aparent banale dintre om și un instrument AI.
Scurgerea de informații a avut loc pe 31 martie 2026 și a expus aproximativ 512.000 de linii din codul sursă al Claude Code, după ce un fișier de debugging a fost inclus accidental într-un pachet software public. Anthropic a transmis ulterior că nu au fost compromise date ale clienților și nici credențiale sensibile, dar incidentul a oferit publicului o privire rară în culisele unui produs AI folosit de programatori. Ce a ieșit la iveală nu este însă doar o problemă de securitate operațională, ci și una de transparență.
Ce a arătat, de fapt, leak-ul de cod de la Anthropic
Partea cu detectarea frustrării este poate cea mai spectaculoasă, dar nu este neapărat cea mai importantă. Potrivit analizelor apărute după leak, sistemul nu folosește vreun model AI sofisticat pentru a înțelege emoțiile utilizatorului, ci o metodă mult mai banală: regex, adică potrivire de tipare text. Cu alte cuvinte, instrumentul caută anumite cuvinte și expresii asociate nervilor sau nemulțumirii și le tratează ca semnale de produs. Unii dezvoltatori au remarcat ironia: o companie de AI care folosește o tehnică veche și simplă pentru a măsura starea utilizatorului.
Mai sensibilă este însă descoperirea altor secțiuni de cod care ar fi avut rolul de a elimina referințe explicite la Anthropic sau la numele „Claude Code” atunci când instrumentul genera cod pentru depozite publice. Criticii au interpretat această funcție ca pe un mod prin care contribuția AI-ului devine mai puțin vizibilă, iar rezultatul final poate părea mai ușor o creație exclusiv umană. Dezvoltatorul independent Alex Kim a descris una dintre aceste funcții drept o „ușă într-un singur sens”, adică un mecanism care poate fi activat, dar nu și dezactivat ușor de către utilizator.
Problema reală nu este că AI-ul vede nervii, ci că își ascunde rolul
De aici începe discuția cu adevărat importantă. Faptul că o companie colectează semnale despre frustrarea utilizatorilor poate fi justificat drept măsurare a sănătății produsului. Multe platforme digitale urmăresc unde apar blocaje, ce funcții enervează și cât de des cresc reacțiile negative după actualizări. Însă odată colectată, o astfel de informație poate fi folosită în multe alte moduri, iar utilizatorul nu are aproape niciodată o imagine clară despre traseul acestor date. Tocmai aici intervin întrebările de guvernanță și control.
Specialiști citați în dezbaterea provocată de leak spun că adevărata miză este ce face compania cu aceste semnale după ce le obține. Istoria internetului a arătat deja că mici indicii comportamentale pot deveni rapid criterii de profilare, optimizare și influențare a experienței utilizatorului. În cazul instrumentelor AI, riscul este chiar mai mare, pentru că oamenii le oferă acestor sisteme volume uriașe de informații, tocmai fiindcă vor răspunsuri utile, intime și adaptate. Când un astfel de instrument nu doar că te asistă, ci și îți măsoară frustrarea și își estompează propriile urme în ceea ce produce, linia dintre ajutor și control devine mult mai greu de văzut.
Leak-ul de la Anthropic nu dovedește doar că marile companii AI pot greși. Arată și ceva mai incomod: în spatele unor unelte prezentate drept inteligente și folositoare se pot ascunde sisteme care observă mai mult decât crezi și lasă mai puține semne decât ar trebui. Iar pentru industrie, aceasta ar putea deveni problema mai mare decât simplul fapt că un chatbot știe când ai înjurat.