Inteligența artificială a Facebook poate face orbii să vadă imagini

Inteligența artificială a Facebook poate face orbii să vadă imagini

Matt King este orb, așa că nu poate vedea o poză publicată pe Facebook. Este însoțită de o descriere destul de detaliată, dar nu e de prea mare ajutor, căci e în germană. Iar software-ul său transcript îl citește cu voce tare, dar degeaba, pentru că Matt nu știe germană.

Dar apoi, folosește un instrument de inteligență artificială dezvoltat de Facebook, și după ce analizează poza, aceasta e descrisă în amănunt. Scena are loc afară, spune inteligența artificială. Include iarbă, copaci, nori și e și un râu prin preajmă. King nu își poate imagina fotografia așa cum și-ar dori, căci în ea se află un prieten care se plimbă cu bicicleta în natură. Dar măcar are o idee decentă despre ea. „Mi-ar fi plăcut să îmi spună că în poză e Christoph cu bicicleta. Dar, oricum, din perspectiva unui utilizator orb, să treci de la zero satisfacție obținută dintr-o poză la o imagine de ansamblu e un pas imens”, a spus King.

King este parte a echipei Facebook Accessibility. Asta înseamnă că lucrează pentru ca cea mai populară rețea socială să se adapteze oamenilor cu dizabilități, inclusiv celor orbi. Deși instrumentul de inteligență artificială e momentan doar un prototip, Facebook plănuiește să îl împărtășească la scară largă oamenilor din toate colțurile lumii. Dacă te gândești că aproape 50.000 de oameni sunt activi prin aplicația Apple Voiceover, un sistem popular care trasformă textele în cuvinte, vei înțelege că miza e mare.

Echipa de accesibilitate

Precum majoritatea rețelelor sociale, Facebook e un mediu extrem de vizual. Dar cu ajutorul unui instrument precum Apple Voiceover, cineva precum King, care și-a pierdut vederea în liceu, se poate conecta cu prieteni și colegi pe Facebook la fel ca noi, toți ceilalți.

După cum spuneam, o interfață precum cea folosită de King face posibilă navigarea acestuia prin News Feed în condiții normale, la o viteză decentă. Chiar și fără sistemul experimental de inteligență artificială, poate înțelege ce se află într-o poză. Unele au descrieri decente, iar altele specifică inclusiv cine le-a făcut și când. Totuși, sistemul de inteligență artificială creat de Shaomei Wu și mai mulți ingineri ai Facebook va împinge lucrurile considerabil mai departe. Orbii ar putea avea context folosind doar fotografia în sine.

Sistemul de descifrare a pozelor dezvoltat de Facebook se bazează pe ceea ce numim deep learning, o tehnică pe care compania o folosește de mult pentru a identifica fețe și obiecte în pozele publicate pe rețeaua socială. Folosind rețele neurale vaste, mașinării interconectate care mimează structura creierului uman, compania își poate învăța serviciile să identifice poze analizând numere imense de imagini similare. Pentru a-ți identifica fața, de exemplu, va solicita toate pozele cu tine stocate în rețea. Așa pare Facebook să te recunoască într-o poză de grup și să ofere sugestii de tag, chiar și în momentul de față.

Google folosește o tehnică similară pentru aplicația Google Photos, iar aceeași tehnologie de bază poate îndeplini o gamă largă de funcții, de la recunoaștere vocală la traducerea lingvistică. Deși tehnologia e departe de perfecțiune, era de așteptat ca Facebook să vrea să o folosească pentru a veni în ajutorul orbilor. „Pentru recunoașterea fețelor și a obiectelor, suntem aproape de performanța umană”, a spus Yoshua Bengio, profesor la Universitatea din Montreal. „Mai sunt probleme cu imaginile complexe, luminile, înțelegerea imaginii de ansamblu”.

Acest pas e parte dintr-un efort amplu de a face Facebook accesibil și celor defavorizați. Accesibility Team, pe care Wieland a fondat-o după ani de muncă la User Experience Lab, vrea să facă lucruri mărețe. Dezvoltatorii speră să facă în așa fel încât cei care nu își pot folosi mâinile să aibă la dispoziție instrumente controlate vocal, și fiecare persoană cu dizabilități să aibă instrumente care să îi asigure o experiență plăcută cu Facebook. Totuși, eforturile Facebook nu se opresc aici, ci au în vizor și țările în curs de dezvoltare, unde conexiunile la internet sunt lente.

De asemenea, echipa lui Wieland speră să împingă și alte companii în direcții similare. Recent, a fondat Teaching Accessibility Initiative, un consorțiu al companiilor tech, printre care Yahoo! și Microsoft, cu scopul de a împărtăși practicile în domeniul dezvoltării inteligenței artificiale.

 

 

Citește și: