Computerele au devenit mai bune la citit pe buze decât oamenii

Computerele au devenit mai bune la citit pe buze decât oamenii
17:19 22.11.2016

Există oameni care sunt foarte buni la citit pe buze, dar asta nu înseamnă din păcate că respectiva performanță nu a fost depășită detașat de un computer cu un algoritm performant de inteligență artificială.

Dacă ați petrecut vreodată timp încercând să citiți pe buze de la o distanță rezonabilă, probabil că ați observat că procesul nu este deloc facil, iar performanța voastră variază semnificativ de la om la om. Nu de alta, dar există persoane care pronunță cuvintele cu gura mai deschisă, iar respectivii s-ar putea să fie mai ușor de înțeles. Chiar și atunci însă, în cazul cuvintelor care împărtășesc aceleeași mișcări ale buzelor, confuzia este inevitabilă.

Se pare însă că nu același principiu se aplică computerelor care tocmai au devenit mai bune la citit pe buze decât orice altă persoană. Proiectul a fost realizat de un grup de cercetători de la Oxford și a implicat colaborarea între mai multe departamente pentru finisarea produsului final. Secretul s-ar putea să nu fi fost însă neapărat puterea de procesare din spate, cât algoritmul folosit pentru educarea inteligenței artificiale.

Pentru eficientizarea sistemului de citit pe buze, Departamentul de Știință Computațională de la Oxford a creat o inteligență artificială intitulată LipNet. Informațiile ce au fost alimentate către LipNet prin intermediului unui GRID au constat în clipuri bine luminate, cu durata de trei secunde, în care oamenii care se uitau drept spre cameră vorbeau.

La final, întregul volum de informații a fost încărcat într-o rețea neurală cu o performanță spectaculoasă la citit pe buze. Precizia a fost de 93,4% în majoritatea scenariilor, în timp ce voluntarii umani nu au reușit să obțină decât un scor de 52,3 procente în aceleași situații.

Alternativa computațională la LipNet a fost creată de un alt departament din cadrul Oxford – Deparmentul de Inginerie și Știință. Acesta din urmă a folosit Google DeepMind și s-a bazat pe analiza a 100.000 de clipuri de la BBC. La final însă, precizia a fost de 46,8%, față de 12,4% reușită de experți în citit pe buze.

Sursa: Ubergizmo