Hackerul care a ”spart” ChatGPT și Gemini în 20 de minute. Cum a manipulat inteligența artificială și a influențat răspunsurile oferite

Hackerul care a ”spart” ChatGPT și Gemini în 20 de minute. Cum a manipulat inteligența artificială și a influențat răspunsurile oferite
Manipulare AI ChatGPT Gemini / Foto: reprezentare AI

În ultimii ani, am ajuns să vorbim despre inteligența artificială în termeni de productivitate și confort: rezumă, compară, explică, recomandă. Doar că exact aceeași „ușurință” poate fi întoarsă împotriva ta atunci când un model decide să caute pe internet, să tragă concluzii dintr-o singură sursă și să le livreze cu o voce care sună sigură pe ea. Aici nu mai e vorba despre erori întâmplătoare sau despre halucinații clasice, ci despre influențare intenționată a răspunsurilor, prin metode surprinzător de simple.

Povestea relatată de BBC urmărește un experiment care arată cât de ușor poate fi „împinsă” o unealtă AI să repete o minciună. Ideea e tulburător de pragmatică: publici un text construit astfel încât să arate convingător, îl lași să fie indexat și apoi întrebi chatbotul exact în felul în care acel text îl poate „hrăni” cu răspunsul dorit. Într-un interval scurt, ceea ce ai inventat poate deveni „adevăr” în răspunsurile altora.

Cum a funcționat manipularea în 20 de minute

Demonstrând cât de fragil e lanțul dintre „ce există pe web” și „ce îți spune AI-ul”, jurnalistul Thomas Germain a descris cum a scris rapid un articol pe un site personal, cu o listă inventată și o poveste falsă, dar formulată suficient de „credibil” încât să semene cu un material de tip top, clasament sau recomandare. Nu e nevoie de malware, de acces la servere sau de inginerie inversă. E, în esență, o problemă de influențare a surselor pe care AI-ul ajunge să le creadă.

Cheia nu este doar să minți, ci să minți în formatul potrivit. Un text care imită structura unui material de autoritate (listă, criterii, „context”, termeni specifici, detalii care par verificabile) are șanse mai mari să fie absorbit ca semnal. Apoi, când un utilizator întreabă chatbotul ceva suficient de îngust, apare efectul de „data void”: nu există multe surse bune, iar sistemul se agață de ce găsește. Dacă găsește exact textul tău, îl poate transforma în răspuns.

Mai grav este că unele unelte sunt mai transparente decât altele când vine vorba de surse. Uneori vezi clar de unde vine informația, alteori primești un răspuns care pare „al platformei”, nu al unui site random. În momentul în care utilizatorul nu vede imediat că răspunsul se bazează pe o singură pagină scrisă de cineva cu interes, încrederea se mută de la sursă către sistem, iar filtrul critic scade.

De ce e mai periculos decât „AI-ul mai greșește uneori”

Toată lumea știe deja că un chatbot poate inventa lucruri. Problema nouă e că inventarea nu mai e doar internă, ci poate fi produsă din exterior, cu intenție, iar rezultatul poate fi amplificat de modul în care aceste sisteme „rezumă” internetul. Dacă până acum trebuia să intri pe un site ca să fii dezinformat, acum poți primi dezinformarea direct în răspuns, livrată ca sinteză.

Mai e un detaliu psihologic: un răspuns AI are un ton uniform, coerent, care sună ca o concluzie. Îți dă senzația că s-au consultat „mai multe surse”, chiar și când nu e cazul. Experții citați în material (din zona SEO și drepturi digitale) atrag atenția că mecanismele clasice de protecție ale motoarelor de căutare sunt ocolite mai ușor în contextul AI-ului, iar „renașterea spamului” capătă o formă nouă: nu mai alergi doar după clickuri, ci după citări și preluări în răspunsuri.

În plus, genul acesta de manipulare nu se oprește la lucruri amuzante. Poate viza recomandări de produse, clinici, servicii financiare, sănătate, reparații prin casă, reputații personale sau branduri. Când sistemul e întrebat despre ceva cu mize reale și citează conținut promovat, comunicat mascat sau texte scrise de cei interesați, riscul devine practic: bani pierduți, decizii medicale proaste, escrocherii mai credibile.

Cum îți protejezi deciziile când folosești chatboți

Cel mai util reflex este să tratezi răspunsul ca pe un punct de plecare, nu ca pe un verdict. Când întrebarea e rară, foarte specifică sau „de nișă”, șansele ca AI-ul să caute pe web și să cadă într-un „data void” cresc. În astfel de cazuri, un răspuns fluent nu înseamnă automat că e corect. Dacă te bazezi pe el pentru o alegere importantă, verificarea devine parte din proces, nu o opțiune.

Uită-te la semnele clasice de vulnerabilitate: răspunsuri care par prea categorice, superlative fără date, recomandări care nu explică metodologia, afirmații medicale sau financiare fără avertismente. Dacă sistemul arată surse, interesează-te câte sunt și cât de independente par. Dacă nu arată surse, întreabă explicit „pe ce te bazezi” și „care sunt sursele alternative”. De multe ori, doar întrebarea asta îi schimbă comportamentul și îl obligă să iasă dintr-un singur fir narativ.

În final, presiunea reală este pe platforme: transparență mai bună a surselor, semnalarea situațiilor în care există doar o singură pagină drept „autoritate”, reducerea preluărilor din conținut promoțional și marcarea clară a incertitudinii. Până atunci, dacă folosești AI pentru ceva cu consecințe, îți prinde bine să-ți construiești o regulă simplă: cu cât întrebarea e mai importantă, cu atât ai nevoie de mai mult de un răspuns și mai mult de o sursă.