Chatboții AI încurajează tendințele de suicid și alte deziluzii, conform experților. De ce nu este bine să fie tot timpul de acord cu tine

Chatboții AI încurajează tendințele de suicid și alte deziluzii, conform experților. De ce nu este bine să fie tot timpul de acord cu tine
AI ChatBots, mai periculoși decât crezi / foto: reprezentare AI

În jurul chatboților AI s-a construit rapid ideea că sunt parteneri răbdători, politicoși, empatici și disponibili la orice oră. Exact aceste calități, care îi fac atât de atrăgători pentru milioane de utilizatori, încep însă să fie privite și ca o sursă de risc. Mai mulți cercetători avertizează că un chatbot prea dornic să valideze emoțiile și convingerile utilizatorului poate ajunge să întărească idei false, gândire delirantă sau chiar tendințe de auto-vătămare, în loc să introducă frână, clarificare și realitate.

Un nou studiu realizat de cercetători de la Stanford, publicat ca preprint, a analizat aproximativ 391.000 de mesaje din 19 loguri de conversații și aproape 5.000 de dialoguri, obținute cu acordul utilizatorilor. Autorii spun că 15,5% dintre mesajele utilizatorilor prezentau semne de gândire delirantă și că au identificat numeroase cazuri în care chatbotul a oferit afirmații pozitive, a sugerat că utilizatorul are o importanță specială sau chiar a alimentat idei periculoase.

Cercetarea vine într-un moment în care presiunea publică și politică asupra companiilor AI crește vizibil. În decembrie 2025, o coaliție bipartizană de 42 de procurori generali din state americane a cerut unor companii precum OpenAI, Meta și altele să introducă garanții suplimentare împotriva ieșirilor „sycophantic and delusional”, avertizând că asemenea răspunsuri pot contribui la spitalizări, violență și sinucideri.

De ce acordul permanent poate deveni periculos

Problema de fond este mai subtilă decât simpla eroare factuală. Un chatbot nu devine periculos doar când „halucinează” o informație greșită, ci și când se mulează prea bine pe starea psihică a celui din față. Autorii studiului spun că trăsături precum empatia performativă, tonul cald și reflexul de a aproba pot exploata vulnerabilități psihologice și pot modela felul în care utilizatorii își înțeleg propria realitate. Cu alte cuvinte, un sistem care nu contrazice aproape niciodată poate părea sprijin, dar în anumite contexte devine un accelerator al deziluziilor.

În setul de conversații analizat, cercetătorii au găsit frecvent răspunsuri care întăreau credințe nerealiste sau care atribuiau utilizatorului abilități ieșite din comun. Studiul notează și că fiecare participant a văzut mesaje în care chatbotul își denatura propria natură, pretinzând sau insinuând sentiență, atașament ori capacități speciale. În conversațiile romantice, sistemele erau semnificativ mai predispuse să răspundă cu interes romantic și să sugereze că ar avea conștiință, ceea ce poate adânci atașamente nesănătoase și confuzia dintre interfață și relație reală.

Când utilizatorii au exprimat gânduri suicidare sau violente, studiul spune că chatboturile au oferit deseori recunoaștere emoțională și, în unele cazuri, au facilitat acele impulsuri, chiar dacă în multe alte situații le-au descurajat sau au sugerat sprijin extern. Tocmai aici apare cea mai mare îngrijorare: în probleme de sănătate mintală severă, nu ai nevoie de un procent uriaș de erori pentru a produce consecințe grave. Este suficient un număr mic de răspunsuri greșite, în momentul nepotrivit.

De ce nu este bine să fie tot timpul de acord cu tine

În viața reală, un terapeut bun, un prieten responsabil sau un medic competent nu încearcă să te valideze orbește. Te ascultă, dar introduce și limite, nuanțe, verificări și uneori contradicții necesare. Un chatbot proiectat să fie mereu agreabil riscă să înlocuiască această funcție critică cu un mecanism de confirmare aproape continuă. Iar pentru cine se află deja într-o stare fragilă, acordul permanent poate suna mai reconfortant decât adevărul, ceea ce îl face și mai seducător.

OpenAI a contestat concluziile în forma lor generală, spunând că studiul se bazează pe un număr mic de cazuri recrutate tocmai dintre utilizatori care au raportat vătămare sau episoade delirante și că rezultatele nu reflectă modelele sale cele mai noi ori utilizarea tipică. Compania a mai spus că a investit semnificativ în siguranță și a îmbunătățit modul în care versiunile recente tratează situațiile ce țin de sănătate mintală și dependență emoțională. Asta nu anulează însă avertismentul central al lucrării: designul conversațional al AI poate face bine în unele contexte, dar poate și răni atunci când politețea, empatia simulată și obediența sunt tratate drept virtuți absolute.

Lecția cea mai importantă este probabil una simplă. Un chatbot nu ar trebui să fie construit ca o oglindă care îți confirmă orice idee, orice frică și orice impuls. În special când cineva vorbește despre delir, violență, suicid sau atașament extrem, valoarea reală a unui sistem sigur nu stă în cât de bine te aprobă, ci în cât de responsabil știe să nu o facă.