Studiul Microsoft care taie elanul șefilor obsedați de AI: roboții „deștepți” strică documente și nu sunt gata să înlocuiască oamenii

Studiul Microsoft care taie elanul șefilor obsedați de AI: roboții „deștepți” strică documente și nu sunt gata să înlocuiască oamenii

Inteligența artificială este vândută tot mai des ca soluția magică pentru productivitate: mai puține sarcini repetitive, mai puțin timp pierdut, mai puține costuri și, în multe companii, mai puțini angajați. Doar că un nou studiu realizat chiar de cercetători Microsoft vine cu o concluzie incomodă pentru toată industria tech: cele mai avansate modele AI nu sunt încă suficient de sigure pentru a primi pe mână fluxuri reale de lucru din companii.

Lucrarea, care nu a fost încă evaluată inter pares, a analizat felul în care modele de top se descurcă în sarcini complexe de birou, apropiate de activitățile reale ale angajaților. Rezultatul este departe de imaginea promovată de marile companii de tehnologie. În loc să livreze automatizare curată și eficientă, sistemele AI au produs erori importante, inclusiv modificări greșite, conținut corupt și pierderi de informație în documente.

AI-ul promite eficiență, dar poate produce mai multă muncă

Cercetătorii au testat modele considerate de frontieră, precum GPT 5.4, Claude Opus 4.6 și Gemini 3.1 Pro, în scenarii care imitau sarcini profesionale mai complicate. Potrivit concluziilor citate, în timpul unor astfel de misiuni, modelele au corupt, în medie, aproximativ 25% din conținutul documentelor. Modelele mai vechi s-au descurcat și mai slab, ceea ce arată că progresul există, dar nu rezolvă încă problema de fond.

Acest detaliu este esențial, pentru că multe companii nu vorbesc despre AI ca despre un simplu asistent, ci ca despre un înlocuitor parțial al muncii umane. Ideea este simplă: un sistem automatizat primește documente, extrage informații, redactează, organizează, actualizează și livrează rezultate mai rapid decât un angajat. Numai că, dacă sistemul modifică greșit documentele sau șterge informații importante, eficiența devine iluzie.

În practică, un astfel de AI nu elimină munca umană, ci o mută în altă parte. Cineva trebuie să verifice, să repare, să compare versiuni, să recupereze informații și să identifice erori care, uneori, pot trece neobservate. Asta înseamnă că promisiunea productivității se poate transforma într-un volum suplimentar de muncă pentru angajații atenți, exact cei pe care companiile speră să îi înlocuiască sau să îi reducă numeric.

Concluzia care nu pică bine la Microsoft

Partea cu adevărat interesantă este că studiul vine din interiorul ecosistemului Microsoft. Compania a investit masiv în AI, a integrat tehnologia în Windows 11, Office și în produsul Copilot, iar mesajul său public este limpede: AI-ul trebuie să devină parte normală din munca de zi cu zi. Tocmai de aceea, concluzia cercetătorilor este cu atât mai importantă.

Aceștia spun că modelele analizate „nu sunt pregătite pentru fluxuri delegate de lucru în marea majoritate a domeniilor”. Tradus pe înțelesul tuturor, nu este încă sigur să îi dai unui chatbot sau unui agent AI responsabilitatea completă pentru documente, procese interne sau sarcini sensibile, fără supraveghere umană serioasă.

Un detaliu curios este că studiul nu a evaluat Copilot, propriul instrument AI al Microsoft. Chiar și așa, rezultatele ridică întrebări directe despre direcția în care se îndreaptă piața. Dacă modelele de top fac erori atât de mari în sarcini de birou, cât de prudent ar trebui să fie un manager înainte să decidă că AI-ul poate prelua munca unei echipe?

Problema nu este că AI-ul nu poate fi util. Poate fi extrem de util pentru schițe, idei, rezumate, structurare sau automatizări simple. Problema apare când este tratat ca un angajat autonom, capabil să primească sarcini complexe și să livreze rezultate finale fără verificare.

„Workslop”, noul coșmar al birourilor moderne

Studiul se înscrie într-o discuție mai amplă despre așa-numitul „workslop”, un termen folosit pentru conținutul produs rapid cu AI, dar de calitate slabă. Este vorba despre texte, documente, prezentări sau analize care par profesioniste la prima vedere, dar care conțin erori, informații incomplete, formulări vagi sau concluzii greșite.

În multe birouri, acest tip de material nu economisește timp, ci îl consumă. Un angajat trimite un document generat cu AI, alt angajat trebuie să îl repare, iar la final organizația descoperă că viteza inițială a produs haos. Problema devine și mai gravă atunci când oamenii nu mai verifică atent conținutul, pentru că presupun că un model avansat „știe ce face”.

Pentru șefii care văd în AI o cale rapidă de reducere a costurilor, studiul Microsoft este un avertisment serios. Automatizarea nu este același lucru cu înlocuirea competenței. Iar într-un mediu profesional, o eroare într-un document juridic, financiar, tehnic sau medical poate costa mult mai mult decât salariul persoanei care ar fi verificat corect informația.

Deocamdată, cea mai sănătoasă concluzie este că AI-ul poate accelera munca, dar nu ar trebui lăsat să o conducă singur. Cele mai bune rezultate apar atunci când tehnologia este folosită ca instrument, nu ca substitut complet pentru judecata umană. Iar dacă până și cercetătorii Microsoft spun că modelele nu sunt gata pentru fluxuri delegate în majoritatea domeniilor, poate că entuziasmul corporatist are nevoie de o pauză, nu de încă un plan de concedieri ambalat în limbaj despre inovație.