OpenAI anunță lansarea GPT-4o: „Vorbește, râde, cântă și vede ca un om”

TEHNOLOGIE, ȘTIINȚĂ & DIGITAL

OpenAI anunță lansarea GPT-4o, un nou model de inteligență artificială (IA) care, conform companiei, reprezintă un pas mai aproape de „interacțiunea mult mai naturală între om și calculator”.

Acest nou model poate vorbi, râde, cânta și vedea ca un om, conform declarațiilor companiei. În plus, OpenAI va lansa o aplicație desktop pentru ChatGPT.

GPT-4o „vorbește, râde, cântă și vede ca un om”

GPT-4o acceptă orice combinație de text, audio și imagini ca intrare și poate genera un rezultat în toate cele trei formate. De asemenea, este capabil să recunoască emoțiile, să fie întrerupt în timpul discursului și să răspundă aproape la fel de rapid ca un om în timpul conversațiilor.

Vezi și:

Google DeepMind deschide în Marea Britanie un nou laborator AI pentru descoperirea de materiale avansate

Inteligența artificială accelerează automatizarea: trei industrii intră în zona de risc, avertizează un director OpenAI

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN

Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx

— OpenAI (@OpenAI) May 13, 2024

„Lucrul special despre GPT-4o este că aduce inteligența de nivel GPT-4 tuturor, inclusiv utilizatorilor noștri care au nivelul gratuit”, a declarat Mira Murati, CTO OpenAI, în cadrul unei prezentări transmise în direct.

„Aceasta este prima dată când facem un pas mare înainte când vine vorba de ușurința de utilizare”.

În timpul prezentării, OpenAI a demonstrat abilitățile GPT-4o traducând în timp real între engleză și italiană, ajutând un cercetător să rezolve o ecuație liniară pe hârtie în timp real și oferind îndrumare privind respirația profundă unui alt executiv OpenAI, pur și simplu ascultând respirațiile acestuia.

AI-ul la un alt nivel

Litera „o” din GPT-4o înseamnă „omni”, o referință la capacitățile multimodale ale modelului. OpenAI a declarat că GPT-4o a fost antrenat pe text, viziune și audio, ceea ce înseamnă că toate intrările și ieșirile sunt procesate de aceeași rețea neurală. Acest lucru este diferit față de modelele anterioare ale companiei, GPT-3.5 și GPT-4, care permiteau utilizatorilor să pună întrebări pur și simplu vorbind, dar apoi transcriau discursul în text. Aceasta elimina tonul și emoția și încetinea interacțiunile.

OpenAI va face noul model disponibil pentru toată lumea, inclusiv utilizatorii care nu plătesc pentru ChatGPT, în următoarele săptămâni și va lansa, de asemenea, o versiune desktop a ChatGPT, inițial pentru Mac, la care utilizatorii care plătesc vor avea acces începând de azi.

Anunțul OpenAI vine cu o zi înainte de Google I/O, conferința anuală pentru dezvoltatori a companiei. Curând după ce OpenAI a dezvăluit GPT-4o, Google a făcut aluzie la o versiune a Gemini, propriul său chatbot de inteligență artificială, cu capacități similare.

Urmăriţi-ne şi pe: