O firmă „angajată” doar cu inteligențe artificiale s-a prăbușit spectaculos: de ce nu îți vei pierde jobul prea curând
:format(webp)/https://playtech.ro/wp-content/uploads/2025/04/„Microsoft-anunta-ca-vom-deveni-sefii-robotilor-inteligenti.jpg)
De câțiva ani, discuțiile despre cum inteligența artificială va înlocui forța de muncă umană au devenit din ce în ce mai alarmante. Însă un experiment recent realizat de cercetători de la Carnegie Mellon University aduce o doză sănătoasă de realism: AI-ul este încă departe de a prelua controlul asupra locurilor noastre de muncă.
În cadrul unei simulări numite TheAgentCompany, întreaga echipă a unei presupuse companii de software a fost alcătuită doar din agenți AI proveniți de la giganți precum Google, OpenAI, Anthropic și Meta. Ce a urmat? Un haos generalizat și o performanță dezamăgitoare, ce arată clar că, deocamdată, inteligența artificială nu este pregătită să înlocuiască oamenii în activități complexe.
Cum a fost organizată compania și ce sarcini au primit agenții AI
Cercetătorii au dorit să vadă cum s-ar descurca modelele de inteligență artificială în condiții similare cu cele dintr-o companie reală de software. Agenții AI au fost „angajați” pe posturi precum analiști financiari, ingineri software și manageri de proiect, având alături și structuri simulate de resurse umane și conducere tehnică.
Sarcinile au fost variate și au inclus navigarea prin directoare de fișiere, tururi virtuale ale unor sedii de birouri noi și redactarea de evaluări de performanță pentru colegii ingineri. La prima vedere, nimic imposibil, mai ales pentru niște modele care promit eficiență și autonomie.
Rezultatele, însă, au fost departe de a fi impresionante. Cel mai bun „angajat” AI, Claude 3.5 Sonnet de la Anthropic, a reușit să finalizeze doar 24% dintre sarcini. Chiar și această performanță modestă a venit cu un cost ridicat, fiecare task necesitând în medie aproape 30 de pași și peste 6 dolari per execuție.
Ce au descoperit cercetătorii despre limitările actuale ale inteligenței artificiale
Experimentul a scos la iveală mai multe probleme fundamentale ale agenților AI. În primul rând, aceștia suferă de o lipsă majoră de bun simț operațional și de abilități sociale. De asemenea, au dificultăți serioase în a naviga mediul online într-un mod logic și eficient.
Una dintre cele mai haioase situații relatate de echipă a fost atunci când un agent AI, neștiind cum să găsească persoana potrivită pentru o întrebare pe chatul intern, a decis să redenumească un alt utilizator cu numele celui căutat. Această formă de „autoînșelare” a dus, evident, la erori și confuzie.
Google Gemini 2.0 Flash, de exemplu, a finalizat doar 11,4% dintre sarcini, având nevoie de peste 40 de pași pentru fiecare reușită. Cel mai slab dintre toți a fost Nova Pro v1 de la Amazon, care a finalizat un lamentabil 1,7% dintre sarcini.
În esență, ceea ce numim astăzi inteligență artificială nu este altceva decât o formă sofisticată de completare automată, asemănătoare funcției de sugestie de text de pe telefon, fără capacitatea reală de a învăța din experiență sau de a rezolva probleme complexe în mod autonom.
Ce înseamnă aceste rezultate pentru viitorul locurilor de muncă
În ciuda hype-ului constant generat de marile companii de tehnologie, realitatea arată că AI-ul nu este, cel puțin pentru moment, o amenințare reală pentru majoritatea locurilor de muncă umane. Deși poate gestiona taskuri repetitive sau foarte bine definite, atunci când vine vorba de adaptabilitate, creativitate și raționament de bun simț, inteligența artificială actuală cade testul lamentabil.
Această constatare ar trebui să îți aducă o oarecare liniște: mașinile nu sunt încă pregătite să-ți ia locul. Deocamdată, AI-ul are nevoie de supraveghere umană atentă și nu poate funcționa autonom în medii complexe.
Sigur, viitorul va aduce îmbunătățiri, însă aceste rezultate arată clar că drumul spre o adevărată autonomie a inteligenței artificiale este mult mai lung și plin de provocări decât și-ar dori industria tech să recunoaștem.