ChatGPT și Gemini „nu trec clasa”. Testul care îți arată că inteligența artificială mai are de învățat până să devină, cu adevărat, „inteligentă”

de: Iulia Kelt
26 03. 2025
test agi gemini chatgpt
Inteligența artificială / Foto: Creative Synergies Group

O nouă provocare în domeniul inteligenței artificiale a reușit să pună la încercare cele mai avansate modele AI de la OpenAI, Google și DeepSeek, demonstrând că suntem departe de a atinge Inteligența Artificială Generală (AGI).

Conform unui test recent, modelele de top ale industriei au avut scoruri extrem de mici, demonstrând limitele actualei tehnologii AI, scrie Mashable.

Testul ARC-AGI-2, o provocare cât se poate de reală pentru modele de AI actuale „la modă”

Testul ARC-AGI-2, realizat de Arc Prize Foundation, măsoară progresul în direcția AGI prin provocarea modelelor AI de a rezolva puzzle-uri vizuale. Ele necesită recunoașterea de tipare, indicii contextuale și raționament, competențe care sunt relativ ușor de abordat de oameni, dar extrem de dificile pentru inteligența artificială.

Scorurile obținute de modelele de top sunt uimitor de scăzute, subliniind cât de mult mai este de lucrat pentru a dezvolta o inteligență artificială cu adevărat funcțională.

Modelul cel mai avansat de la OpenAI, o3-low, a obținut doar 4%, în timp ce Gemini 2.0 Flash de la Google și DeepSeek R1 au înregistrat scoruri și mai mici, de 1,3%. Pe de altă parte, modelul Claude 3.7 de la Anthropic, cu o limită de 8K de tokenuri, a obținut doar 0,9%.

Scorurile scăzute scot, practic, în evidență decalajul masiv între inteligențele specializate și adevărata inteligență generală, care implică capacitatea de a învăța și de a se adapta în moduri flexibile și de a face față unor situații noi și neașteptate.

AGI, deocamdată un vis frumos

Teoria realizării AGI a fost dezbătută intens în ultimii ani. Deși unii experți, precum Dario Amodei de la Anthropic, consideră că AGI ar putea fi realizabil în doar câțiva ani, alții, cum ar fi Gary Marcus și Yann LeCun, susțin că tehnologia actuală nu este încă suficient de avansată.

În ciuda entuziasmului din jurul acestui concept, este evident că mai este nevoie de multă muncă pentru a dezvolta un sistem de inteligență artificială care să poată rezolva puzzle-uri vizuale și să îndeplinească sarcini la nivelul gândirii umane.

Un alt aspect important pe care ARC-AGI îl scoate în evidență este diferența dintre inteligența specializată și inteligența generală.

Modelele AI de astăzi excelează în domenii specifice, precum recunoașterea imaginilor sau jocurile complexe, dar nu pot generaliza cunoștințele într-un mod care să le permită să rezolve probleme noi. Testul ARC-AGI-2 pune accentul tocmai pe acest tip de raționament generalizat, care este mai ușor pentru oameni, dar rămâne o provocare uriașă pentru AI.