AI-ul care pune diagnostice mai bine decât medicii? Studiul Harvard care aprinde o dezbatere uriașă în spitale
Un nou studiu realizat de cercetători de la Harvard Medical School și Beth Israel Deaconess Medical Center reaprinde discuția despre rolul inteligenței artificiale în medicină. Rezultatele arată că un model AI dezvoltat de OpenAI a oferit, în anumite scenarii, diagnostice mai precise decât doi medici umani, pe baza informațiilor disponibile în camera de gardă.
Descoperirea este spectaculoasă, dar vine cu nuanțe importante. Studiul nu spune că AI-ul este pregătit să înlocuiască medicii în urgențe și nici că deciziile de viață și de moarte ar trebui lăsate pe mâna unui algoritm. Mai degrabă, cercetarea arată că modelele lingvistice mari pot deveni instrumente puternice de sprijin, mai ales în momentele în care informațiile sunt puține, timpul este scurt, iar diagnosticul corect contează enorm.
Modelul o1 a depășit medicii în primele evaluări
Într-unul dintre experimente, cercetătorii au analizat 76 de pacienți care au ajuns la camera de gardă a spitalului Beth Israel. Diagnosticele formulate de doi medici specialiști în medicină internă au fost comparate cu cele generate de modelele OpenAI o1 și 4o.
Evaluarea a fost făcută de alți doi medici, care nu știau dacă diagnosticele proveneau de la oameni sau de la AI. Această metodă a fost folosită pentru a reduce riscul de prejudecată și pentru a vedea cât de bine se descurcă modelele atunci când primesc exact aceleași informații ca medicii.
Modelul o1 a avut rezultate egale sau mai bune decât medicii în mai multe puncte ale procesului de diagnostic. Diferența a fost mai vizibilă la primul moment de evaluare, adică la triajul inițial din camera de gardă, când există cele mai puține informații despre pacient și cea mai mare presiune pentru o decizie rapidă.
În această etapă, o1 a oferit un diagnostic exact sau foarte apropiat în 67% dintre cazuri. Prin comparație, unul dintre medicii evaluați a ajuns la un diagnostic exact sau apropiat în 55% dintre cazuri, iar celălalt în 50%. Pentru cercetători, rezultatul sugerează că AI-ul poate identifica rapid tipare utile, chiar și atunci când datele sunt incomplete.
Studiul nu înseamnă că AI-ul poate conduce o cameră de gardă
Chiar dacă cifrele par impresionante, concluzia nu trebuie exagerată. Cercetătorii au subliniat că modelele au fost testate pe informații textuale, extrase din dosarele medicale electronice. Datele nu au fost prelucrate special înainte de a fi introduse în sistem, ceea ce face rezultatul mai relevant, dar limitele rămân importante.
În medicina de urgență, diagnosticul nu este doar un exercițiu intelectual. Un medic nu trebuie doar să ghicească boala finală a pacientului, ci să decidă rapid dacă acesta are o afecțiune care îi poate pune viața în pericol. Această diferență este esențială, mai ales în camera de gardă, unde prioritatea este stabilizarea pacientului și identificarea riscurilor imediate.
Un alt detaliu important este că diagnosticele umane au fost formulate de medici specializați în medicină internă, nu de medici de urgență. Criticii studiului spun că, pentru o comparație mai relevantă, AI-ul ar trebui pus față în față cu specialiști care lucrează efectiv în urgențe, nu cu medici dintr-o altă zonă de practică.
Această observație nu anulează rezultatele, dar le pune în context. Un model AI poate excela într-o anumită sarcină, fără ca asta să însemne automat că poate prelua întregul rol al unui medic într-un mediu clinic real, unde comunicarea, examinarea fizică, intuiția și responsabilitatea legală contează enorm.
Medicina are nevoie de teste reale, nu de entuziasm grăbit
Autorii studiului cer teste prospective în medii clinice reale, tocmai pentru a vedea cum s-ar comporta aceste sisteme atunci când sunt integrate în îngrijirea pacienților. Până atunci, AI-ul rămâne un instrument promițător, dar nu un înlocuitor pentru decizia medicală umană.
Una dintre marile probleme este lipsa unui cadru clar de responsabilitate. Dacă un sistem AI sugerează un diagnostic greșit, cine răspunde: medicul, spitalul, dezvoltatorul modelului sau toți la un loc? Fără reguli clare, folosirea acestor tehnologii în situații critice rămâne dificilă.
Pacienții au nevoie de precizie, dar au nevoie și de oameni care să le explice opțiunile, riscurile și tratamentele. În momentele de criză, încrederea, empatia și responsabilitatea nu pot fi reduse la un scor de acuratețe.
Studiul Harvard arată că AI-ul medical avansează rapid și poate deveni un aliat valoros pentru medici. Dar arată și cât de atent trebuie construită această tranziție. În spitalele viitorului, inteligența artificială ar putea ajuta la diagnosticare, însă deciziile grele vor avea nevoie, în continuare, de judecată umană.