OpenAI lansează primele modele lingvistice deschise după cinci ani, dar specialiștii avertizează asupra limitărilor și riscurilor

TEHNOLOGIE, ȘTIINȚĂ & DIGITAL

Imagine reprezentativă de ilustrație.

OpenAI, compania cunoscută la nivel mondial pentru ChatGPT, a lansat primele sale modele lingvistice deschise după mai bine de cinci ani în care a publicat doar modele închise și controlate strict. Decizia marchează un moment important pentru comunitatea de inteligență artificială, dar ridică și numeroase semne de întrebare cu privire la performanță, transparență și siguranță.

Modele accesibile, dar cu performanțe limitate

Cele două noi modele poartă numele gpt-oss-120b și gpt-oss-20b. Primul, cel mai puternic, poate rula pe un singur sistem dotat cu o placă video Nvidia de ultimă generație, ceea ce îl face accesibil laboratoarelor de cercetare și companiilor cu resurse tehnice moderate. Cel de-al doilea model, mult mai ușor, poate funcționa chiar și pe un laptop obișnuit cu 16GB de memorie RAM, ceea ce îl aduce la îndemâna unui număr mult mai mare de utilizatori.

Conform testelor sintetice prezentate de OpenAI, ambele modele se situează sub nivelul de performanță al produselor premium ale companiei, cum sunt versiunile avansate de GPT-4, dar depășesc majoritatea modelelor deschise existente pe piață. Acest lucru le face atractive pentru dezvoltatorii care vor să testeze aplicații AI fără costuri ridicate.

O „deschidere” cu semne de întrebare

Deși OpenAI le numește modele deschise, mulți experți contestă acest termen. Spre deosebire de alte proiecte open-source, compania nu a făcut publice sursele datelor pe care au fost antrenate modelele, ceea ce limitează verificabilitatea și transparența procesului de dezvoltare. În plus, atunci când modelele se confruntă cu sarcini pe care nu le pot rezolva, ele se conectează prin cloud la versiunile mai performante și închise ale companiei. Această interconectare ridică întrebări despre cât de „deschise” sunt de fapt aceste noi instrumente.

Un alt aspect criticat este rata ridicată a halucinațiilor — adică generarea de răspunsuri eronate sau inventate. Testele arată că gpt-oss-120b are o rată de halucinații de 49%, iar gpt-oss-20b chiar mai mult, de 53%. Practic, utilizatorii nu se pot baza pe cel puțin jumătate dintre răspunsurile oferite, ceea ce limitează drastic aplicabilitatea acestor modele în situații care cer acuratețe.

Disponibilitate și impact asupra comunității AI

Noile modele pot fi deja descărcate de pe platforma Hugging Face, unde cercetătorii și dezvoltatorii le pot integra în proiectele lor. Specialiștii spun că, în ciuda problemelor semnalate, lansarea marchează un pas important pentru democratizarea accesului la AI, mai ales că modelele pot rula pe echipamente mai accesibile decât cele necesare pentru versiunile GPT de top.

Totuși, rămâne de văzut dacă deschiderea parțială promovată de OpenAI va fi suficientă pentru a câștiga încrederea comunității. Mulți cercetători insistă că adevărata transparență implică publicarea seturilor de date și reducerea dependenței de infrastructura controlată centralizat de companie.