06 aug. 2025 | 09:15

OpenAI lansează conceptul gpt-oss: două modele de inteligență artificială „deschise”, dar cu greutate în cursa AI globală

TEHNOLOGIE
Share
OpenAI lansează conceptul gpt-oss: două modele de inteligență artificială „deschise”, dar cu greutate în cursa AI globală
OpenAI lansează gpt-oss / Foto: OpenAI

OpenAI revine în scena modelelor AI cu sursă deschisă, lansând gpt-oss-120b și gpt-oss-20b, disponibile gratuit și menite să contracareze avansul laboratoarelor chineze.

OpenAI a anunțat lansarea a două modele de inteligență artificială cu greutate redusă și acces liber: gpt-oss-120b și gpt-oss-20b, scrie TechCrunch.

Două noi modele OpenAI disponibile gratuit pe Hugging Face

Acestea sunt disponibile pentru descărcare gratuită prin platforma Hugging Face și sunt prezentate ca fiind printre cele mai performante modele AI open-weight în testele de referință actuale.

Modelul gpt-oss-120b, deși mai mare și mai puternic, poate rula pe o singură placă video Nvidia, în timp ce versiunea mai compactă, gpt-oss-20b, este compatibilă cu laptopuri obișnuite care au minimum 16GB RAM.

Această lansare este semnificativă: este primul model „deschis” al OpenAI de la GPT-2 încoace, adică după o pauză de peste cinci ani.

Mai mult decât atât, modelele pot trimite solicitări către sisteme AI mai avansate din cloud, ceea ce le oferă flexibilitate sporită. Dacă un task depășește capacitățile modelului local, acesta poate apela la un model mai avansat, dar închis, al OpenAI.

CEO-ul Sam Altman a recunoscut public, în ianuarie, că organizația sa a greșit prin ezitarea de a adopta o strategie deschisă.

Noile modele gpt-oss vin într-un context de presiune crescută din partea dezvoltatorilor din China, cum ar fi DeepSeek și Alibaba (Qwen), care au atras comunități vaste în jurul modelelor lor AI cu sursă deschisă.

În plus, administrația Trump a îndemnat recent companiile americane din domeniul AI să deschidă mai mult codul sursă, pentru a promova o dezvoltare globală a tehnologiei în acord cu valorile democratice.

Performanță promițătoare, dar și limite destul de clare

Modelele gpt-oss au fost supuse mai multor teste comparative. La evaluarea Codeforces, gpt-oss-120b a obținut un scor de 2622, iar gpt-oss-20b a atins 2516, performanțe care depășesc modelul R1 al DeepSeek, dar sunt sub nivelul seriei o3 și o4-mini de la OpenAI.

În testul „Humanity’s Last Exam”, ce constă în întrebări dificile din multiple domenii, scorurile au fost de 19% pentru modelul mare și 17,3% pentru cel mic.

Totuși, un punct slab important este rata mare de „halucinații”, răspunsuri eronate oferite cu siguranță aparentă. În testul intern PersonQA, modelele gpt-oss au oferit răspunsuri halucinante în peste 49% din cazuri, un nivel semnificativ mai mare decât al modelelor comerciale ale OpenAI.

Modelele au fost antrenate folosind tehnici moderne precum mixture-of-experts (MoE), care permit activarea selectivă a parametrilor, și învățarea prin întărire pe clustere Nvidia. Cu toate acestea, ele rămân exclusiv textuale, fără capacități de procesare a imaginilor sau sunetului.

Gpt-oss-120b și gpt-oss-20b sunt lansate sub licență Apache 2.0, una dintre cele mai permisive licențe software. Astfel, firmele pot integra și chiar monetiza aceste modele fără aprobări suplimentare din partea OpenAI.

Totuși, compania nu va publica datele de antrenament, invocând preocupări legale, un pas prudent în contextul mai multor procese legate de folosirea de conținut protejat prin drepturi de autor.