Companiile tech te ascultă, iar problema e mult mai gravă decât credeai

Companiile tech te ascultă, iar problema e mult mai gravă decât credeai
Teodora Tudosie
Teodora Tudosie
12:56 12.12.2019

Toată lumea e conștientă de faptul că marile companii tech își spionează utilizatorii. Explicația este una simplă. În esență, acest lucru le ajută să-și îmbunătățească produsele, iar asta le aduce apoi mai mulți bani. Totuși, problema este mult mai serioasă, în special când vine vorba de ascultarea conversațiilor personale cu ajutorul unui asistent virtual.

Aproape toate dispozitivele din ziua de astăzi au microfoane: de la telefoane și laptopuri, până la televizoare, mașini sau chiar frigidere. De asemenea, și boxele portabile sunt extrem de populare în lume. Cercetătorii estimează că până în 2023 vor exista cam 7,4 miliarde de dispozitive care pot fi controlate cu ajutorul vorbirii.

În prezent, cam toți giganții tech au metode prin care își pot asculta utilizatorii. Unele dintre cele mai populare modalități prin care pot face acest lucru sunt asistenții virtuali. Fie că vorbim despre Alexa, Siri, Google Assistant sau Cortana, toate acestea ajung în casa utilizatorilor, unde ascultă și execută comenzi. Totuși, situația e mai complicată de atât.

Amazon ascultă utilizatori pe ascuns

În 2014, o agenție din Boston recruta angajați pentru un job simplu: transcrierea unor fișiere audio pentru Amazon. Printre aceștia se număra și Ruthy Hope Slatis, de la care jurnaliștii Bloomberg au reușit să adune mai multe informații.

Angajaților li s-a spus că ceea ce făceau ei era esențial pentru dezvoltarea unui produs secret de speech-recognition, recunoașterea vorbirii. Tot în acea perioadă, Amazon anunța boza portabilă Echo, care avea în componența sa un asistent virtual, Alexa.

Atunci, Slatis și-a dat seama că, de fapt, la asta lucra. În esență, Amazon înregistra fiecare comandă vocală în cloud și se baza pe cei care transcriau fișiere pentru a antrena sistemul. Astfel, compania își înregistra utilizatorii și dădea mai departe fișierele audio unor angajați, care transcriau conversațiile cuvânt cu cuvânt. Totul pentru a antrena inteligența artificială. Slatis menționează că, inițial, credea că fișierele audio proveneau de la alți angajați Amazon, plătiți pentru a fi înregistrați. Totuși, cele mai multe conversații erau foarte intime și dezvăluiau atât de multe informații personale, încât nu încăpea îndoială că respectivii utilizatori nu știau că sunt ascultați de Alexa.

Antrenarea computerelor să reușească să identifice și să răspundă la comenzi vocale necesită potrivirea fișierelor audio cu text transcris. Iar acesta este un proces foarte lent și scump.

De-a lungul timpului, Amazon a construit adevărate „ferme” de transcriere a fișierelor audio colectate de la utilizatori. Există astfel de birouri chiar și în București.

Apple spionează cu ajutorul propriului asistent virtual, Siri

Să luăm și cazul Apple. În 2011, iPhone 4S venea cu Siri, asistentul virtual. Tehnologia nu îi aparținea, ci o cumpărase anul anterior de la startup-ul cu același nume. În primii ani, Apple s-a bazat pe specialiști din exterior pentru a îmbunătăți abilitățile său asistentului virtual.

Totuși, în 2014, a început să controleze și acest aspect din afacerea sa. Erau îngrijorați că nivelul de înțelegere și viteza lui Siri erau în urma capacităților pe care le aveau Alexa și Google Assistant. Astfel, Apple a început să angajeze și ea oameni care să transcrie ce auzea Siri. Mulți dintre aceștia erau contractanți din Europa, printre care și GlobeTech, o companie din Irlanda. Angajații de aici spun că stăteau toată ziua în liniște, în fața unor MacBook-uri, cu căștile pe urechi, transcriind câte 1.300 de fișiere audio pe zi. Fiecare putea conține fie doar o propoziție, fie conversații întregi. Funcționa cam așa: angajații dădeau play unei înregistrări vocale. Apoi, computerul completa automat o casetă de text cu cuvintele pe care credea că „le-a auzit” Siri. Ulterior, angajatul trebuia să aprobe sau să corecteze traducerea.

Totuși, și în acest caz conversațiile erau mult prea personale. Mulți angajați și-au întrebat managerii dacă pot sări peste fișierele prea private. Li s-a spus că niciun clip nu este prea privat. Trebuia să transcrie tot ce venea.

Până în 2015, utilizatorii de produse Apple puteau alege dacă voiau să activeze sau nu asistentul virtual. De atunci, opțiunea a dispărut, așa că Siri asculta în permanență. Dacă săpai adânc în termenii și condiții, scria că îi dai permisiunea Apple să înregistreze date vocale pentru a îmbunătăți asistentul virtual. Totuși, nu scria nicăieri că acestea vor fi ascultate și de alți oameni.

Mai mulți foști directori Apple spun că înregistrările nu erau asociate cu ID-urile de utilizator și au presupus că utilizatorii au înțeles că Apple le prelucrează clipurile audio. Spun că nu văd nicio problemă în faptul că și alți oameni le pot asculta. Până la urmă, ar fi în interesul utilizatorilor să îmbunătățească sistemul, sunt de părere aceștia.

Apple a spus că mai puțin de 0,2% dintre solicitările auzite dde Siri sunt supuse unei analize umane. Totuși, Siri este pe toate dispozitivele Apple. În 2019, asistentul virtual procesează 15 miliarde de comenzi vocale pe lună. Astfel, 0,2% din această cifră ar însemna că Apple analizează undeva la 30 de milioane de comenzi vocale pe lună.

Google și Google Assistant

Amazon și Apple nu sunt singurele companii care își ascultă utilizatorii. Google a adoptat și ea practici similare. Are și ea propriul asistent virtual, Google Assistant, care nu vine doar pe telefoane și tablete, ci și pe dispozitive precum termostate smart sau televizoare Sony. Și această compania a angajat oameni care să transcrie fișiere audio, menite tot să îmbunătățească calitatea sistemului. Compania a promis că înregistrările vocale revizuite nu sunt corelate cu nicio informație personală. Totuși, în vara lui 2019, un contractant care se ocupa cu așa ceva a dai departe presei peste 1.000 de înregistrări cu utilizatorii. Astfel, au reușit să-și dea seama cine erau unii dintre oamenii din înregistrări pe baza lucrurilor pe care le-au spus.

Aproximativ 10% dintre clip-uri au fost înregistrate fără acordul acestor utilizatori, din cauza asistentului, care de multe ori detectează în mod eronat fraza de activare „OK, Google”.

Facebook n-are nevoie neapărat de un asistent virtual ca să asculte utilizatori

De pe această listă nu putea lipsi Facebook, unde scandalurile legate de securitatea datelor sunt aproape la ordinea zilei.

Zvonul potrivit cărora compania își îmbunătățește targetarea reclamelor ascultând în secret utilizatorii, prin intermediul microfoanelor din telefoanele lor sau alte dispozitive există de mult. În audierea din fața congresului, Zuckerberg a negat acest lucru, și a numit totul o teorie a conspirației.

Totuși, Facebook s-a bazat de-a lungul timpului pe angajați care să transcrie fișiere audio pentru a antrena inteligența artificială. De asemenea, a procedat la fel și pentru aplicația sa de chat, Messenger. Aceasta permite utilizatorilor să facă schimb de clipuri audio în loc să trimită mesaje text. Compania i-a îndemnat pe utilizatori să aleagă opțiunea prin care puteau să-și transcrie automat ceste mesaje vocale, cu ajutorul inteligenței artificiale, a. Totuși, nu le-a spus că aceste fișiere au mers și la contractantul TaskUs Inc. pentru revizuire manuală.

Partea amuzantă e că TaskUs avea un nume de cod pentru contractul încheiat cu Facebook. În numea Prism, același nume de cod folosit pentru un program de spionaj al Agenției de Securitate Națională, dezvăluit în 2013 de către avertizorul de integritate Edward Snowden.

Facebook are și ea un dispozitiv similar cu cel de la Amazon. În noiembrie 2018, compania lansa Portal, o combinație între o boxă smart și un dispozitiv de pe care poți efectua apeluri video. Evident, are incluse un microfon și o cameră. Totuși, acest lucru nu face o diferență prea mare, dacă iei în considerare faptul că Facebook se află pe telefoanele tuturor.

Problema e una complicată

În prezent, companiile tech nu mai procedează la fel în totalitate. Google a luat pauză de la transcrierile fișierelor audio provenite de la asistentul său virtual. De asemenea, Apple a început să le permită utilizatorilor să șteargă istoricul Siri și să fie la alegerea lor dacă vor să împărtășească sau nu înregistrările audio. Facebook doar a adăugat câteva disclaimere mai clare în termenii și condițiile sale. Amazon a mai adăguat și ea disclaimere, dar a și permis utilizatorilor să nu fie de acord ca înregistrările convorbirilor lor să fie revizuite manual de angajații săi.

Totuși, acestea nu sunt neapărat suficiente. De asemenea, încrederea utilizatorilor în aceste companii uriașe a scăzut. Deși acestea le garantează că nu îi spionează, scepticismul este încă acolo, și pe bună dreptate.

DĂ PLAY ȘI FII MAI INFORMAT DECÂT PRIETENII TĂI
Sursa: Bloomberg