Algoritmul care îți face portretul după voce e desprins din Black Mirror

Algoritmul care îți face portretul după voce e desprins din Black Mirror
08:26 10.06.2019

De cele mai multe ori, un portret robot poate fi realizat pe baza unei descrieri detaliate a unei persoane, dar un algoritm de inteligență artificială îți ia toate informațiile din voce.

Cu toții știm că vocea noastră este unică. Aceasta poate fi folosită ca un instrument de autentificare biometrică și am văzut deja asemenea implementări în filme precum Mission Impossible sau James Bond. Aceeași voce trădează însă și particularități fiziologice ale vorbitorului. Când vorbești cu cineva la telefon, îți dai seama că are 50-60 de ani, că este femeie, dacă este sau nu fumătoare și alte câteva elemente. Un accent îți poate indica zona geografică, iar pornind de la acea informații poți obține particularități fiziologice.

Un algoritm de inteligență artificială duce desprinderea de detalii fiziologice din voce la nivel de artă. AI-ul poate crea portrete complexe ale oamenilor pornind doar de la voce. Grupul de cercetători din spatele acestui proiect a explicat o mare parte din tehnologia utilizată într-o lucrare intitulată Speech2Face: Învățând fața din spatele vocii. Documentul poate fi descărcat de la această adresă în format PDF.

Proiectul a reprezentat munca de lungă durată a unor oameni de știință de la MIT – Institutul Tehnologic din Michigan. Primele teste publice au scos la iveală niște rezultate atât de precise încât s-ar putea să te sperie, mai ales dacă ai în vedere că se pleacă doar de la voce.

Pentru a-și învăța AI-ul să facă distincția între oameni, cercetătorii din spatele proiectului ”l-au antrenat” cu aproximativ 100.000 de clipuri video de pe YouTube cu diverși vorbitori care susțineau discursuri. În acel context, fețele umane au fost asociate cu modul în care sună persoanele, iar particularitățile de voce au putut fi asociate cu detalii vizuale ale feței.

În mod previzibil, nu pot fi generate portrete cu un nivel de acuratețe de 100%, dar precizia este ridicată. Pe termen lung, acest mecanism te-ar putea ajuta să afli cine te sună, chiar dacă nu se recomandă, dar există și aplicații în sectorul militar sau în spionaj pe care nu le vom afla niciodată.

loading...