Chatboții care se joacă de-a doctorii dau greș când contează cel mai mult. Ce spun experții

Chatboții care se joacă de-a doctorii dau greș când contează cel mai mult. Ce spun experții
Foto: Getty Images

Inteligența artificială este tot mai des prezentată drept următorul mare aliat al medicinei, capabil să analizeze simptome, să compare cazuri și să ofere răspunsuri rapide. Doar că, atunci când informațiile sunt puține și cazul este încă neclar, exact acel moment în care un medic bun începe să gândească în scenarii și ipoteze, marile modele AI par să aibă o problemă serioasă.

Un studiu publicat în JAMA Network Open și realizat de cercetători de la Mass General Brigham arată că modelele lingvistice mari testate au ratat în peste 80% din cazuri etapa de diagnostic diferențial atunci când datele despre pacient erau incomplete. Cu alte cuvinte, chatbotul poate părea convingător, dar tocmai la începutul investigației, când trebuie luate în calcul mai multe posibile cauze, performanța sa scade abrupt.

Problema nu este răspunsul final, ci drumul până la el

Cercetarea a evaluat 21 de modele comerciale, folosind 29 de viniete clinice standardizate. Cercetătorii au testat modul în care aceste sisteme răspund pe parcursul întregului flux clinic, de la primele simptome și până la diagnosticul final, pe măsură ce primeau informații suplimentare precum examenul fizic sau rezultatele de laborator. Concluzia a fost clară: în fazele timpurii, când datele sunt puține și incerte, toate modelele au avut rate de eșec de peste 80% la formularea unui diagnostic diferențial corect.

Asta nu înseamnă că AI este inutilă în medicină. De fapt, același studiu arată că performanța se îmbunătățește semnificativ atunci când cazul este complet descris. La diagnosticul final, cu informații clinice mai bogate, ratele de eșec au scăzut sub 40%, iar cele mai bune modele au depășit 90% acuratețe. Problema este însă una esențială: viața reală nu începe cu toate datele pe masă. Pacientul vine, de cele mai multe ori, cu simptome vagi, incomplete sau confuze, iar tocmai acolo intervine judecata clinică autentică.

Autorul principal, Arya Rao, a explicat că modelele sunt bune la „numirea” unui diagnostic final atunci când setul de date este complet, dar se descurcă mult mai slab în faza deschisă, incertă, a cazului. Este o limitare majoră pentru oricine vede în chatbot un substitut de medic de familie sau de specialist. În practică, sistemul poate sări prea repede la o singură concluzie și să rateze tocmai lista de alternative care face diferența între o evaluare prudentă și una riscantă.

De ce concluziile studiului sunt importante pentru utilizatorii obișnuiți

Mesajul studiului este incomod, dar necesar: chatbotul poate suna sigur pe el chiar și atunci când nu are motive solide să fie. Aici apare pericolul real. Utilizatorul care introduce simptome incomplete într-o aplicație AI poate primi un răspuns formulat clar, fluent și convingător, deși raționamentul din spate rămâne fragil. Iar în sănătate, stilul sigur pe sine poate fi uneori mai periculos decât o ezitare sinceră.

Companiile din domeniu au încercat deja să limiteze acest risc. Anthropic și Google au transmis că modelele lor sunt proiectate să trimită utilizatorii către profesioniști atunci când apar întrebări medicale, iar OpenAI precizează în politicile sale că serviciile sale nu ar trebui folosite pentru consiliere medicală licențiată fără implicarea adecvată a unui specialist. Totuși, distanța dintre politicile oficiale și felul în care oamenii folosesc efectiv aceste instrumente rămâne mare.

Pe termen lung, inteligența artificială ar putea avea un rol important în medicină, mai ales în zone cu acces limitat la doctori sau ca instrument de sprijin pentru profesioniști. Specialiști citați în reacțiile la studiu spun însă că evaluarea clinică reală înseamnă mai mult decât combinarea unor simptome: contează și examenul direct al pacientului, contextul, nuanțele și chiar impresiile subtile pe care un model nu le poate reproduce ușor. De aceea, concluzia momentului este una simplă: AI poate ajuta, dar nu este pregătită să joace singură rolul medicului, mai ales în primele minute ale unui caz.