13 apr. 2018 | 17:29

Tehnologia Google care te va face să crezi că te spionează mereu

VIDEO ACTUALITATE

Tu știi deja să distingi vocea unui prieten în aglomerație, dar în curând, și dispozitivele inteligente vor fi capabile de asta.

Boxele inteligente știu deja când vorbești cu ele și ce le spui, de cele mai multe ori. însă au încă un neajuns. Acestea nu sunt foarte capabile să deosebească între două persoane care vorbesc, dar Google lucrează deja la o rezolvare.

Cercetătorii companiei au publicat o cercetare, ”Looking to Listen at the Cocktail Party”, în care explică modul în care un sistem de învățare profundă este capabil să identifice vocile diferite ale mai multor persoane. Pentru a reuși asta, sistemul se uită la fața unui vorbitor în timp ce acesta rostește cuvintele.

”Oamenii sunt extrem de capabili să-și concentreze atenția la o anumită persoană într-un mediu zgomotos, reușind să dea pe mut vocile din afara conversației”, spun Inbar Mosseri și Oran Lang, ingineri software la Google Research. Deși abilitatea este nativă pentru oameni, sistemele de separare automată a vorbirii, care separă un semnal audio în funcție de surse individuale de orbire, reprezintă încă o problemă pentru calculatoare.

Mosseri și Lang au reușit, însă, să creeze un asemenea sistem care să separe cu brio vocile cuiva anume dintr-o mulțime. Primul pas a fost să antreneze sistemul, astfel încât acesta să identifice voci individuale și fețele asociate în timp ce acestea rostesc cuvinte într-un mediu fără interferențe.

Sistemul a ”urmărit” 2.000 de ore de videoclipuri, iar odată ce acest pas a fost realizat, aceștia au început să adauge alte zgomote pe fundal. Astfel, inteligența artificială a devenit capabilă să diferențieze între sursele audio distincte.

În final, cercetătorii au învățat sistemul să ”despice acest amestec sintetic în stream-uri audio distincte pentru fiecare vorbitor”. După cum se vede în video, inteligența artificială e capabilă să identifice vocea fiecărui comediant, chiar dacă aceștia vorbesc în același timp.

Rămâne de văzut cum și când va fi implementat un asemenea sistem în cadrul produselor Google.