Cea mai mare problemă a apelurilor video poate fi rezolvată cu această soluție

de: Paula Artin

06 10. 2020

În prezent, suntem, cel mai probabil, obișnuiți și sătui de videoconferințele nesfărșite, care se mai și întrerup, au probleme de imagine sau de sunet și se dovedesc a fi, în cele din urmă, mai puțin productive decât lipsa lor.

Nvidia a anunțat o nouă platformă de videoconferință pentru dezvoltatori numită Nvidia Maxine, cu ajutorul căreia susține că poate rezolva unele dintre cele mai frecvente probleme ale apelurilor video.

Maxine va procesa apelurile în cloud folosind GPU-urile Nvidia și va crește calitatea apelurilor în mai multe moduri cu ajutorul inteligenței artificiale.

Maxine folosește AI și poate realinia fețele și privirile apelanților astfel încât să se uite mereu direct la camera lor. De asemenea, reduce cerințele de lățime de bandă pentru video “până la o zecime din cerințele standardului de compresie video streaming H.264” prin transmiterea doar a “punctelor cheie ale feței” și îmbunătățește rezoluția videoclipurilor.

Alte caracteristici disponibile în Maxine includ re-iluminarea feței, traducerea și transcrierea în timp real și chiar și avatare animate.

Nvidia Maxine este disponibilă pentru implementare în cadrul altor platforme de videoconferințe

Nu toate aceste caracteristici sunt noi, desigur. Compresia video și transcrierea în timp real sunt destul de comune, iar Microsoft și Apple au introdus alinierea privirii în Surface Pro X și FaceTime pentru a se asigura că utilizatorii păstrează contactul vizual în timpul apelurilor video.

Dar Nvidia speră ca influența sa în cloud computing și munca sa de cercetare și dezvoltare AI va ajuta compania să se ridice peste nivelul concurenților săi.

Totuși, adevăratul test va fi să vedem dacă unele companii de videoconferință deja adoptate adoptă de fapt tehnologia Nvidia.

Maxine nu este o platformă pentru consumatori, ci un set de instrumente pentru firme terțe pentru a-și îmbunătăți propriul software. Până în prezent, însă, Nvidia a anunțat un singur parteneriat – cu firma de comunicații Avaya, care va utiliza caracteristici selectate ale lui Maxine.

Videoconferințe mai calitative și mai ieftine

Într-o conferință telefonică cu reporterii, directorul general pentru media și divertisment al Nvidia, Richard Kerris, a descris lansarea Maxine drept “un anunț cu adevărat interesant și foarte oportun” și a subliniat compresia video alimentată de AI ca fiind o caracteristică deosebit de utilă.

“Cu toții am experimentat momente în care lățimea de bandă a fost o limitare a conferințelor pe care le facem zilnic în aceste zile”, a spus Kerris.

“Dacă aplicăm AI la această problemă, putem reconstrui scenele de diferență de la ambele capete și putem transmite doar ceea ce trebuie transmis, reducând astfel lățimea de bandă în mod semnificativ”.

Nvidia spune că funcția sa de compresie folosește o metodă AI cunoscută sub numele de rețele contradictorii generative sau GAN-uri pentru a reconstrui parțial fețele apelanților în cloud.

Aceasta este aceeași tehnică folosită în multe deepfakes.

“În loc să transmită întregul ecran de pixeli, software-ul AI analizează punctele faciale cheie ale fiecărei persoane pe un apel și apoi reanimează în mod inteligent fața din videoclipul de pe cealaltă parte”, a spus compania într-o postare pe blog.

“Acest lucru face posibilă transmiterea în flux a videoclipurilor cu mult mai puține date care circulă înainte și înapoi pe internet”.

Desigur, pentru a putea experimenta cu adevărat capacitatea acestei tehnologii, va trebui să așteptăm ca platformele să implementeze tehnologia Nvidia.

Însă, până atunci, ne putem da seama cu siguranță că viitorul este al videoconferințelor, motiv pentru care, companiile de tehnologie încearcă să adapteze nevoile utilizatorilor din ce în ce mai numeroși.

Articole recomandate