Cercetătorii au creat cel mai precis software pentru citirea de pe buze
În 2001: Odiseea Spațială, Stanley Kubrick și-a imaginat un computer care poate citi de pe buzele oamenilor. 15 ani mai târziu, cercetătorii din lumea reală au găsit o modalitate prin care să transforme această fantezie în realitate.
Software-ul LipNet a fost dezvoltat de cercetătorii de la Universitatea Oxford. Nu este primul de acest tip, dar e, fără îndoială, cel mai precis. A atins o acuratețe de 93,4%, prin comparație cu procentul maxim de 52% atins de un om experimentat în domeniu, potrivit Gizmodo.
Cititul de pe buze implică decodarea textului în fucție de mișcările gurii vorbitorului. Abordările tradiționale se împart, de obicei, în două etape: învățarea funcțiilor vizuale și prezicerea lor. Metodele moderne, totuși, sunt „antrenabile” end-to-end, dar se descurcă doar la clasificarea cuvintelor, nu a propozițiilor ceva mai complexe.
Explicația științifică e prea complicată, dar ideea e că oamenii de știință au realizat că ființele umane se descurcă mai bine la cititul de pe buze și descifrarea cuvintelor în momentul în care cuvintele sunt mai lungi. LipNet are o acuratețe atât de mare pentru că nu analizează înregistrarea cuvânt cu cuvânt, ci ia în calcul întreaga propoziție. Folosește tehnici de Deep Learning pentru a descifra, ulterior, fiecare cuvânt în parte.
Ceea ce face această performanță atât de promițătoare e faptul că, dacă aplicația ar fi disponibilă pe smartphone, ar putea fi o unealtă extraordinară pentru cei cu deficiențe de auz. Chiar dacă aceștia sunt deprinși cu cititul de pe buze, ar putea înțelege mai bine ce spune interlocutorul. De asemenea, cei care nu pot citi de pe buze nu ar mai avea probleme în interacțiunea cu o persoană care nu știe limbajul semnelor.