Roboții conversaționali și „demența virtuală”: Ce relevă testele cognitive despre inteligența artificială
Un studiu publicat recent în prestigioasa revistă BMJ scoate la iveală o problemă neașteptată a celor mai avansați roboți conversaționali din lume: aceștia prezintă semne de „demență” similară cu cea întâlnită la pacienții vârstnici. Cercetătorii au utilizat testul MoCA (Montreal Cognitive Assessment), folosit în mod obișnuit pentru depistarea deteriorării cognitive la oameni, pentru a evalua performanța chatbot-urilor, iar rezultatele au fost surprinzătoare.
Departe de a fi infailibile, programele de inteligență artificială (IA) au demonstrat limitări semnificative, mai ales în sarcinile care necesită abilități vizuale și executive. Aceste descoperiri ar putea avea implicații profunde asupra viitorului utilizării IA în medicină și alte domenii sensibile.
Performanțe sub așteptări: Ce arată rezultatele testului
În cadrul studiului, cercetătorii au testat mai mulți roboți conversaționali de top, inclusiv ChatGPT și Gemini, dezvoltate de companii precum OpenAI și Google. Rezultatele au variat considerabil, dar niciunul dintre chatbot-uri nu a reușit să obțină un scor perfect de 30 de puncte, ceea ce ar indica o funcționare cognitivă completă.
ChatGPT, în cea mai recentă versiune a sa (4.0), a obținut cel mai bun rezultat, cu 26 de puncte din 30. Acest scor îl plasează aproape de intervalul normal pentru oameni, dar evidențiază totuși anumite deficiențe. Pe de altă parte, Gemini, chatbot-ul dezvoltat de Google, a obținut un scor de doar 16 puncte, asociat cu deteriorarea cognitivă severă la pacienții umani.
Rezultatele testului MoCA au subliniat punctele slabe comune ale roboților conversaționali. Toate programele au eșuat în sarcinile vizuale și executive, cum ar fi desenarea unui ceas sau conectarea unor puncte într-o ordine specifică. Aceste tipuri de sarcini implică procese cognitive complexe, care, se pare, rămân o provocare majoră pentru inteligența artificială.
Un alt aspect interesant observat de cercetători este că versiunile mai vechi ale chatbot-urilor au obținut scoruri mai mici, similar cu modul în care pacienții mai în vârstă tind să aibă performanțe mai slabe la testele cognitive. Această constatare ridică întrebări despre „îmbătrânirea virtuală” și posibila deteriorare a performanței IA pe măsură ce tehnologiile devin învechite.
Limitele inteligenței artificiale în domeniul medical
Deși chatbot-urile au performat bine în sarcinile care implică limbaj și atenție, eșecurile lor în interpretarea scenelor vizuale complexe și lipsa empatiei pun în evidență limitele fundamentale ale acestei tehnologii. Aceste constatări sunt deosebit de relevante în contextul predicțiilor entuziaste conform cărora roboții ar putea înlocui medicii în viitor.
Studiul subliniază că, în ciuda progreselor impresionante, inteligența artificială nu este pregătită să preia roluri critice în domeniul medical, unde interpretarea contextuală, înțelegerea vizuală și empatia sunt esențiale. De fapt, cercetătorii sugerează că neurologii ar putea ajunge să trateze „pacienți virtuali” – programe de IA care manifestă ele însele semne de tulburări cognitive.
În plus, limitările observate în aceste teste cognitive pun sub semnul întrebării viabilitatea IA în alte domenii sensibile, cum ar fi psihologia, consilierea sau diagnosticul medical avansat. De exemplu, eșecul în sarcini simple, precum desenarea unui ceas, sugerează că IA nu poate înțelege pe deplin informațiile vizuale sau nu poate răspunde la probleme care necesită creativitate și raționament spațial.
Aceste concluzii atrag atenția asupra faptului că, deși chatbot-urile pot fi instrumente utile în anumite contexte, ele nu sunt un substitut pentru expertiza umană. Progresele în domeniul inteligenței artificiale trebuie să fie însoțite de o înțelegere realistă a limitărilor sale și de o reglementare adecvată pentru a preveni utilizarea greșită sau supraevaluarea acestei tehnologii.
Studiul publicat în BMJ oferă o perspectivă importantă asupra performanței cognitive a roboților conversaționali și asupra limitărilor acestora. Deși tehnologia a avansat considerabil, rămân multe obstacole de depășit înainte ca IA să poată concura cu abilitățile și intuiția umană.
Eșecurile evidente în sarcini vizuale și interpretative evidențiază faptul că, pentru moment, roboții conversaționali sunt mai degrabă niște asistenți decât niște înlocuitori ai oamenilor în domenii precum medicina.