De ce AI-ul are nevoie de un „simț intern” pentru a nu deveni periculos. Ce spun specialiștii
Inteligența artificială a ajuns să scrie, să vorbească, să analizeze imagini și să răspundă din ce în ce mai convingător la întrebări complicate. Dar, în spatele acestei impresii de inteligență aproape umană, cercetătorii spun că există o lipsă fundamentală care ar putea conta enorm pentru siguranță: AI-ul nu are un fel de „viață interioară” funcțională. Nu simte oboseală, nu resimte incertitudinea ca pe o limită internă și nu are un echivalent al setei, al disconfortului sau al nevoii de conservare. Iar fără aceste mecanisme, modelele actuale pot părea mai sigure și mai competente decât sunt în realitate.
Aceasta este ideea centrală a unui nou studiu publicat în revista Neuron de cercetători de la UCLA și colaboratori, care propun un nou mod de a privi dezvoltarea viitoare a sistemelor AI și a roboților. Autorii fac o distincție importantă între „întruparea externă”, adică interacțiunea cu lumea fizică, și „întruparea internă”, adică monitorizarea continuă a propriilor stări interne, așa cum se întâmplă în organismele vii. Ei susțin că tocmai această a doua componentă lipsește aproape complet din arhitecturile actuale ale modelelor multimodale.
Problema nevăzută: AI știe să descrie lumea, dar nu o trăiește
Un om care întinde mâna după solniță nu execută doar o comandă mecanică. Creierul folosește poziția corpului, senzația de atingere, echilibrul, contextul social și propriile stări interne pentru a regla mișcarea. La oameni, aceste semnale funcționează și ca un sistem natural de siguranță: dacă ești epuizat, nesigur sau într-o situație riscantă, organismul „înregistrează” asta și îți influențează deciziile. Cercetătorii spun că modelele AI actuale nu au nimic comparabil.
Asta înseamnă că un sistem poate suna foarte sigur pe el chiar și atunci când, de fapt, doar ghicește pe baza tiparelor din date. Studiul argumentează că absența unor „costuri interne” face ca AI-ul să nu aibă un motiv intrinsec să evite erorile făcute cu prea multă încredere, să reziste la manipulare sau să se comporte consecvent în timp. Cu alte cuvinte, problema nu este doar că modelele greșesc, ci că nu au un mecanism profund prin care să-și simtă propriile limite.
Pentru a ilustra acest gol, autorii amintesc un test perceptiv simplu: imaginile de tip „point-light display”, adică doar câteva puncte care sugerează mișcarea unui corp uman. Chiar și bebelușii recunosc în mod natural figura umană, pentru că percepția lor este ancorată într-o experiență corporală proprie. Mai multe modele AI testate nu au identificat corect figura, iar unele au descris punctele ca pe o constelație de stele. Când imaginea a fost rotită ușor, performanța s-a prăbușit și mai mult.
Ce vor cercetătorii să schimbe la viitorii roboți
Autorii nu spun că AI-ul trebuie să aibă emoții umane în sens biologic. Ei propun, mai degrabă, analogi funcționali: semnale interne persistente care să urmărească nivelul de încărcare, gradul de incertitudine, încrederea în propriul răspuns sau stabilitatea sistemului. Aceste variabile ar putea influența comportamentul modelului în timp și ar acționa ca un set de frâne interne, nu doar ca un strat extern de reguli.
Această idee este numită de cercetători „dual-embodiment framework”, un model în care AI-ul ar trebui să învețe simultan din contactul cu lumea și din monitorizarea propriilor stări sintetice. În paralel, echipa cere și noi teste de evaluare. În loc să măsori doar dacă un sistem poate identifica obiecte sau trece un examen, ar trebui să verifici și dacă se poate autoregla, dacă își menține stabilitatea când este perturbat și dacă își ajustează comportamentul atunci când propriile semnale interne indică risc sau incertitudine.
Pe scurt, mesajul studiului este direct: inteligența artificială poate imita foarte bine limbajul și chiar unele comportamente umane, dar fără un echivalent al „simțului intern” rămâne vulnerabilă la erori greu de anticipat. Iar dacă industria vrea roboți și sisteme AI care să fie cu adevărat sigure, aliniate și demne de încredere, nu va fi suficient să le facă mai rapide sau mai fluente. Va trebui să le ofere și ceva ce seamănă, măcar funcțional, cu propriile limite.