ChatGPT a învățat să vorbească și pare mai plauzibil decât Siri sau Google Assistant
ChatGPT va primi câteva actualizări semnificative care vor permite chatbot-ului să se ocupe de comenzile vocale și de interogări bazate pe imagini.
Utilizatorii vor putea să aibă o conversație vocală cu ChatGPT pe Android și iOS și să introducă imagini în aceasta pe toate platformele.
În prezent, funcțiile sunt disponibile numai pentru utilizatorii ChatGPT Plus și Enterprise
Aceste funcții vor fi disponibile pentru utilizatorii ChatGPT Plus și Enterprise, într-o primă instanță, urmând ca ulterior să se extindă pentru toată lumea.
OpenAI a creat cele cinci voci cu ajutorul unor actori profesioniști. În sens invers, sistemul de recunoaștere a vorbirii Whisper al companiei transformă cuvintele rostite ale unui utilizator în text.
Funcțiile bazate pe imagini sunt și ele destul de interesante, de altfel. OpenAI spune că, de exemplu, poți să-i arăți chatbot-ului o fotografie a grătarului tău și să întrebi de ce nu pornește, acesta încercând să găsească o soluție.
OpenAI folosește GPT-3.5 și GPT-4 pentru a alimenta funcțiile de recunoaștere a imaginii. Pentru a utiliza funcțiile bazate pe imagini ale ChatGPT, atinge butonul fotografie. De aici poți alege o imagine deja existentă sau să încarci tu una.
Compania a menționat că a limitat, de asemenea, modul în care ChatGPT poate analiza și face declarații directe despre persoanele care apar în imagini, „deoarece ChatGPT nu este întotdeauna precis și aceste sisteme ar trebui să respecte confidențialitatea persoanelor”.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
ChatGPT este mai eficient în înțelegerea textului în limba engleză decât în alte limbi, dar viitorul va schimba sigur acest lucru.
Între timp, Spotify a făcut echipă cu OpenAI pentru a folosi tehnologia bazată pe voce într-un scop interesant destul de interesant, și anume de a face voice-over peste vocile podcasturilor, pentru traducere în alte limbi, iar acesta va fi, evident, doar începutul.