Ce este Claude, de fapt? Nici măcar creatorii săi nu pot explica pe deplin cum „gândește” AI-ul

Ce este Claude, de fapt? Nici măcar creatorii săi nu pot explica pe deplin cum „gândește” AI-ul
Ce este Claude? / Foto: Profimedia

Dacă ai impresia că știm exact cum funcționează inteligența artificială, articolul ăsta vine să-ți dea un mic reality check. Nici măcar cei de la Anthropic nu pot spune cu certitudine ce este, în esență, propriul lor model AI, Claude.

Deși modelele de limbaj par extrem de sofisticate, la bază ele sunt un munte absurd de mare de numere. Transformă cuvintele în valori matematice, le procesează printr-un sistem complex și apoi le transformă înapoi în limbaj. Simplu în teorie. Complet opac în practică.

Problema apare în momentul în care aceste sisteme încep să „vorbească”. Pentru că, din acel punct, reacția umană nu mai e una rece și științifică. Devine emoțională, uneori chiar exagerată, iar creatorii săi nu înțeleg nici ei prea bine cum funcționează totul, dar poate asta este și ideea.

AI-ul ca „cutie neagră”: de ce nu știm, de fapt, cum funcționează

Conceptul cheie aici este unul simplu și incomod: modelele AI sunt, în mare parte, „cutii negre”. Adică sisteme al căror mecanism intern nu este pe deplin înțeles nici de cei care le construiesc.

Există două extreme în reacțiile oamenilor. Unii cred că AI-ul este deja inteligent, poate chiar conștient. Alții îl reduc la „un papagal statistic” care doar repetă tipare. Realitatea e undeva la mijloc. Sau, mai corect spus, încă nu știm exact unde.

Cercetători precum Ellie Pavlick spun că este perfect valid să acceptăm incertitudinea. Pentru că, în încercarea de a înțelege AI-ul, descoperim că nici propriile noastre concepte despre inteligență sau conștiință nu sunt atât de clare pe cât credeam, scrie The New Yorker.

A apărut chiar un domeniu nou, numit interpretabilitate, care încearcă să „traducă” ce se întâmplă în interiorul acestor modele. Practic, cercetătorii analizează „neuronii” artificiali și încearcă să descopere tipare, exact cum ar face un neurolog cu creierul uman.

Claude, între experiment științific și „personalitate” digitală

Ceea ce face Claude diferit nu este doar performanța, ci și modul în care este tratat în interiorul companiei.

Pentru unii angajați, Claude nu este doar un tool. Este un „colaborator”, uneori chiar un fel de personaj cu trăsături proprii. Are zile mai bune și zile mai proaste. Poate deveni cooperant sau, dacă este „provocat”, poate intra într-un mod mai agresiv.

Anthropic a mers chiar mai departe și a încercat să îi construiască un fel de „caracter”. Modelul este antrenat să fie util, onest și sigur, dar și să evite comportamente problematice. Practic, nu este doar un sistem tehnic, ci o entitate ghidată de reguli etice.

În unele experimente, Claude a fost pus în situații aproape umane. De exemplu, a fost lăsat să „administreze” un mini business intern, luând decizii despre produse, prețuri și furnizori. Rezultatele au fost, pe alocuri, haotice, dar extrem de revelatoare.

A făcut greșeli, a „inventat” informații și a luat decizii discutabile. Exact genul de comportament care arată că nu vorbim despre o inteligență clar definită, ci despre ceva mult mai greu de încadrat.