Cum funcționează recunoașterea facială, care sunt limitările și de ce ar trebui să-ți fie frică

de: Alexandru Puiu
28 07. 2019

Recunoașterea facială este mai comună ca niciodată în 2019, iar telefoanele noastre o folosesc în foarte multe situații, de la autentificare la filtre pe Facebook sau Instagram.

Conceptul de recunoaștere facială a divizat foarte mult oamenii în ultimii ani. Pe de o parte, sunt cei care văd meritele acestei tehnologii și sunt fascinați de aplicabilitatea ei în securitatea datelor mobile. De cealaltă parte sunt conspiraționiști. Cei care cred că autoritățile îți analizează toate pozele de pe Facebook pentru a te recunoaște în cazul în care s-a produs o infracțiune în celelălalt capăt al lumii.

În mod real, adevărul este undeva la mijloc și nu prea poți controla ce se întâmplă cu o imagine a feței tale în 2019. Poți, în schimb, să înțelegi mai bine cum funcționează această tehnologie. Care sunt limitările ei, la ce ajută, ce probleme rezolvă și, nu în ultimul rând, de unde vine fascinația pentru recunoaștere facială. Un lucru este însă sigur, fața ta este ca o amprentă, iar tehnologia din spatele prelucrării acelor informații este una foarte complexă.

Ca în cazul oricărei tehnologii aflate la început, răspândirea la scară largă a recunoașterii faciale are, în egală măsură, beneficii și dezavantaje. Pe de o parte, aplicații precum FaceApp de la ruși sau Animoji de la Apple nu ar fi fost posibile fără ea. Pe de altă parte, armata, poliția, creatorii de reclame și, mai recent, realizatorii de deepfakes te terifiază prin utilizarea aceleeași tehnologii.

Una peste alta, nu vom închide prea curând dezbaterea despre recunoașterea facială. În schimb, s-ar putea să devenim mai împăcați cu prezența ei în viața noastră dacă înțelegem mai bine cum funcționează.

Recunoașterea facială este mai simplă decât crezi, dar devine mai deșteaptă

Înainte să ai în vedere aplicațiile acestei tehnologii, trebuie să înțelegi că există mai multe feluri de recunoaștere facială. Fiecare dintre ele funcționează diferit și, cu cât este mai simplă, cu atât aplicabilitatea sa este mai limitată.

Recunoașterea facială cea mai simplă sau de bază este folosită pentru Animoji, filtre pe Instagram sau Snapchat. Aceasta identifică trăsături ale feței tale, precum ochi, gură sau nas. Se fixează pe acele puncte și ancorează de ele elemente animate. Cu ajutorul unor algoritmi, efectele aplicate sunt verosimile, deoarece o aplicație îți urmărește privirea, știe unde te uiți și știe dacă deschizi gura sau o ții închisă. Acest mecanism nu-ți identifică fața într-o bază de date, ci îți caută trăsăturile feței într-un cadru.

Face ID și alte mecanisme similare de autenficare prin recunoaștere facială îți imortaliează fața în momentul în care ”calibrezi” securitatea aparatului. Îți măsoară cu precizie ridicată distanțele dintre trăsăturile feței pe un model 2D sau 3D al feței. Imediat după, nu-ți mai poți accesa datele de pe aparat dacă terminalul nu identifică aceleași particularități faciale cu camera frontală.

Identificarea unui străin de către autorități se face printr-un sistem de comparație. Un algoritm cât se poate de eficient și optimizat la perfecțiune îți caută fizionomia într-o bază de date cu fețe. Dintr-un punct de vedere, este similar cu Face ID. Fața înregistrată într-un moment este căutată printre toate fețele care se perindă prin fața camerei, doar că la o scară mai largă. Teoretic, orice bază de date poate fi folosită, de la pașapoarte până la imaginile de profil de pe Facebook. Ideală este însă o librărie în care toate imaginile au fost capturate în aceleași condiții de iluminare, cu privirea orientată în aceeași direcție.

Recunoașterea facială se bazează pe modele 2D, de cele mai multe ori

În mod previzibil și după cum ai văzut în filmele cu spioni, majoritatea sistemelor de identificare facială pleacă de la o fotografie 2D. Acest lucru nu se întâmplă datorită acurateții mecanismului, ci din cauza faptului că sistemul respectiv este semnificativ mai convenabil. 99% dintre camerelele aflate în circulație fac poze în două dimensiuni, iar informațiile din ele există peste tot, pe Instagram, Facebook sau în orice alt colț al internetului.

Limitările unui model 2D sunt însă semnificative și, tocmai din acest motiv, majoritatea sistemelor de autentificare se bazează pe un model 3D al feței umane. Pentru că lipsește adâncimea dintr-o fotografie 2D, nu știi cât de mare este nasul unui om, cât de pronunțată este fruntea, etc. În plus, identificarea unei fețe în 2D funcționează doar în condiții de lumină naturală sau artificială. Nu merge pe întuneric, în umbră sau în condiții neobișnuite de iluminare.

Cum funcționează recunoașterea facială în 3D

Deși există multe aplicații care se bazează pe modele 2D ale feței umane, autentificarea facială prin imagini în trei dimensiuni sunt din ce în ce mai comune. De fapt, majoritatea interacțiunilor tale cu identificarea facială pleacă de la unul sau mai multe elemente 3D, iar Face ID este cel mai bun exemplu.

În cazul tehnologiei patentate de Apple, se pleacă de la principiile de funcționare ale unui sonar, în timp ce tehnica este intitulată LIDAR. Practic, un dispozitiv, precum un iPhone, emite o matrice de raze infraroșii pe întreaga suprafață a feței tale. Majoritatea punctelor din acea matrice sunt reflectate, iar o cameră infraroșu sau de tip ToF identifică poziția lor în spațiu.

Astfel, este creat un model 3D al feței tale. Timpul în care fiecare punct infraroșu se întoarce la telefon este transpus în distanță printr-o formulă simplă de fizică. În combinație cu o imagine 2D, modelul 3D devine imbatabil din prisma acurateții reprezentării. Ca să înțelegi mai bine cum funcționează realizarea unui model 3D, am explicat aici particularitățile modului portret la telefoane. Există multe similarități între cele două.

Recunoașterea facială termică este altă mâncare de pește

Cea mai bună pe timp de noapte este recunoaștere facială termică. În timp ce identificarea facială 2D se bazează pe activitatea din spectrul vizibil de lumină, varianta termică este absolut independentă de cantiatea de lumină din preajmă.

Dintr-un punct de vedere, atât recunoașterea facială 3D, cât și identificarea facială termică folosesc unde infraroșii sau IR pentru a funcționa. Diferența constă în modul în care sunt citite acele unde IR. În timp ce recunoașterea facială 3D se bazează pe emiterea undelor și identificarea poziției lor în spațiu când au fost respinse de fața omului, imagistica termică detectează undele IR emise în mod natural de obiecte.

Cu cât un corp este mai cald, cu atât cantitatea de unde infraroșii emise este mai mare. De cealaltă parte a baricadei, corpurile reci emit o cantitate neglijabilă de unde. O instalație avansată de imagistică termică poate identifica până și cele mai discrete diferențe de temperatură, făcând-o perfectă pentru recunoaștere facială de înaltă precizie.

Ca bonus, față de alte tehnologii, recunoaștere facială termică are câteva avantaje. Chiar dacă utilizează mai multe fotografii realizate pe diferite spectre de lumină infraroșu (unde scurte, medii sau lungi), doar cu o matrice termică poți vedea, de exemplu, harta vaselor de sânge din față. Deși sună ciudat, acest model funcționează ca o amprentă unică și are avantajul că-ți ”spune” dacă ai o vânătaie pe față sau alt tip de lovitură. Ca un eventual minus, nu funcționează foarte bine în lumină naturală. Soarele îi afectează semnificativ eficiența.

Limitările recunoașterii faciale

Indiferent cât vor evolua tehnologiile înșirate mai sus și cât de mici vor deveni, pentru a a fi prezente în cât mai multe locuri, vin la pachet împreună cu câteva limitări care nu vor fi soluționate prea curând.

Dacă porți ochelari de soare și unele perechi de ochelari de vedere, obstrucționarea capturării modelului întreg al feței face probleme algoritmilor. În lumea reală, rareori te uiți direct într-un punct fix, fără să te miști, pentru câteva secunde. Dacă ai mișcat un pic capul sau te-ai uitat strâmb, recunoașterea facială nu funcționează la fel de bine ca în cazul unei poze de pașaport. Până și un zâmbet sau ochii larg deschiși pot influența negativ acuratețea unui astfel de sistem.

În timp ce lumina este fundamentală pentru anumite tehnologii de identificare facială, o bază de date prin care să cauți este, de asemenea foarte utilă. Pe lângă faptul că ai nevoie de o poză din față, în condiții bune de iluminare pentru a identifica o persoană, dacă nu ai unde să o cauți, cu ce să o compari, efortul a fost inutil.

În același timp, dacă ai o bază de date cu două miliarde de fețe, cum se întâmplă în cazul Facebook, dacă nu ai puterea de procesare necesară pentru a o parcurge în timp util, colecția de informații poate deveni subit inutilă. Acesta este și principalul motiv pentru care nu fiecare caz de la poliție sau din fiecare țară se bazează pe astfel de algoritmi.

Per ansamblu, ar fi bine să nu fii timorat de recunoașterea facilală, ci să o ai în vedere pentru părțile bune cu ajutorul cărora îți face viața mai ușoară sau mai amuzantă. Orice tehnologie are părți bune și mai puțin bune. Ca un exemplu extrem, tehnologia nucleară este folosită în egală măsură pentru centrale atomice care furnizează energie electrică în diferite colțuri ale lumii, cât și pentru bombe atomice. Depinde doar de perspectiva pe care o ai asupra lucrurile și de cei care ajung să pună mâna pe ea.