Atunci când calculatorul poate demonstra că este om: testele de autentificare și viitorul
Să demonstrezi că nu ești un robot devine din ce în ce mai greu.
La un moment dat anul trecut, cererile constante ale Google de a dovedi că sunt om au început să se simtă din ce în ce mai agresive. Din ce în ce mai mult, butonul simplu, puțin prea drăguț, care spunea „Nu sunt un robot” a fost urmat de solicitări pentru a demonstra acest lucru – prin selectarea tuturor semafoarelor, trecerilor de pietoni și vitrinelor magazinelor într-o grilă de imagini.
Curând, semafoarele au fost îngropate în frunzișul îndepărtat, trecerile de pietoni deformate și pe jumătate după un colț, semnalizarea vitrinei magazinului neclară și în coreeană. Există ceva unic de descurajator în a fi rugat să identifici un hidrant de incendiu și să te lupți cu el.
Ascensiunea mașinilor
Aceste teste se numesc CAPTCHA și reprezintă un acronim pentru testul Completely Automated Public Turing . La începutul anilor 2000, imaginile simple ale textului erau suficiente pentru a împiedica majoritatea spamboților. Dar un deceniu mai târziu, după ce Google cumpărase programul de la cercetătorii de la Carnegie Mellon și îl folosea pentru a digitiza Google Books, textele au trebuit să fie din ce în ce mai deformate și ascunse pentru a rămâne înaintea îmbunătățirii programelor de recunoaștere optică a caracterelor – programe care, într-un mod indirect, toți acei oameni care rezolvau CAPTCHA-uri ajutau la îmbunătățire.
Deoarece CAPTCHA este un instrument atât de elegant pentru antrenarea AI, orice test ar putea fi doar temporar, lucru pe care inventatorii săi au recunoscut de la început. În 2014, Google a pus în față unul dintre algoritmii săi de învățare automată împotriva oamenilor pentru a rezolva cele mai distorsionate CAPTCHA-uri de text: computerul a obținut testul corect în 99,8 la sută din timp, în timp ce oamenii au obținut doar 33 la sută.
Google s-a mutat apoi la NoCaptcha ReCaptcha, care observă datele și comportamentul utilizatorilor pentru a permite unor oameni să treacă printr-un clic pe butonul „Nu sunt un robot” și le prezintă altora etichetarea imaginilor pe care o vedem astăzi. Dar aparatele ajung din nou din urmă. Toate acele copertine care pot fi sau nu vitrine de magazine? Ele sunt jocul final în cursa înarmărilor umanității împotriva mașinilor.
Jason Polakis, profesor de informatică la Universitatea Illinois din Chicago, își asumă meritul personal pentru creșterea recentă a dificultății CAPTCHA. În 2016, a publicat o lucrare în care a folosit instrumente de recunoaștere a imaginilor disponibile, inclusiv căutarea inversă a imaginilor de la Google, pentru a rezolva CAPTCHA-urile de imagine Google cu o acuratețe de 70%. Alți cercetători au depășit provocările CAPTCHA audio ale Google folosind propriile programe de recunoaștere audio ale Google.
Învățarea automată este acum la fel de bună ca și oamenii la sarcinile de bază de recunoaștere a textului, a imaginii și a vocii, spune Polakis. De fapt, algoritmii sunt probabil mai buni: „Suntem într-un punct în care îngreunarea software-ului ajunge să îngreuneze multă lume. Avem nevoie de o alternativă, dar nu există încă un plan concret.”
Evoluția testelor
Literatura despre CAPTCHA este plină de porniri false și încercări ciudate de a găsi altceva decât recunoașterea textului sau a imaginilor la care oamenii sunt buni în mod universal și cu care mașinile se luptă. Cercetătorii au încercat să le solicite utilizatorilor să clasifice imaginile oamenilor după expresia facială, gen și etnie. Îți dai seama cât de a mers, nu?
Au existat propuneri pentru CAPTCHA-uri trivia și CAPTCHA-uri bazate pe versuri de copii comune în zona în care se presupune că a crescut un utilizator. Astfel de CAPTCHA-uri culturale sunt destinate nu doar roboților, ci și oamenilor care lucrează în fermele CAPTCHA de peste mări care rezolvă puzzle-uri pentru fracțiuni de cent.
Oamenii au încercat să împiedice recunoașterea imaginilor, cerând utilizatorilor să identifice, să zicem, porcii, dar făcându-le desene animate și dându-le ochelari de soare. Cercetătorii au încercat să le ceară utilizatorilor să identifice obiecte în pete asemănătoare cu Magic Eye. Într-o variantă intrigantă, cercetătorii au propus în 2010 utilizarea CAPTCHA-urilor pentru a indexa petroglifele antice, computerele nefiind foarte bune la descifrarea schițelor gestuale ale renilor mâzgăliți pe pereții peșterii.
Recent s-au făcut eforturi pentru a dezvolta CAPTCHA-uri asemănătoare jocurilor, teste care solicită utilizatorilor să rotească obiectele în anumite unghiuri sau să mute piesele puzzle-ului în poziție, cu instrucțiuni date nu în text, ci în simboluri sau implicite de contextul tablei de joc. Speranța este ca oamenii să înțeleagă logica puzzle-ului, dar computerele, fără instrucțiuni clare, ar fi nedumerite. Alți cercetători au încercat să exploateze faptul că oamenii au corpuri, folosind camerele dispozitivelor sau realitatea augmentată pentru dovada interactivă a umanității.
Problema cu multe dintre aceste teste nu este neapărat că roboții sunt prea inteligenți – ci că oamenii nu știu să le rezolve. Și nu, nu înseamnă că oamenii sunt proști, este faptul că oamenii sunt extrem de diversi ca limbă, cultură și experiență. Odată ce scapi de toate acele lucruri pentru a face un test pe care orice om îl poate trece, fără pregătire prealabilă sau multă gândire, rămâi cu sarcini brute, cum ar fi procesarea imaginilor, exact capitolul la care un AI personalizat excelează.
Ce înseamnă să fii om?
„Testele sunt limitate de capacitățile umane”, spune Polakis. „Ai nevoie de un tip de provocare care să funcționeze cu cineva din Grecia, cineva din Chicago, cineva din Africa de Sud, Iran și Australia în același timp. Și trebuie să fie independent de complexitățile și diferențele culturale. Ai nevoie de ceva ușor pentru un om obișnuit, care nu ar trebui să fie legat de un anumit subgrup de oameni și ar trebui să fie greu pentru computere în același timp. Ești foarte limitat în ceea ce poți face de fapt. Și trebuie să fie ceva ce un om poate face rapid și nu este prea enervant.”
Poate că umanitatea noastră nu se măsoară după modul în care ne desfășurăm o sarcină, ci în modul în care ne mișcăm prin lume – sau, în acest caz, prin internet. Jocurile de CAPTCHA, orice fel de test CAPTCHA pe care îl concepi va fi în cele din urmă rupt, spune Shuman Ghosemajumder, care a lucrat anterior la Google pentru combaterea fraudei clicurilor înainte de a deveni directorul de tehnologie al companiei de detectare a bot-ului Shape Security.
Mai degrabă decât testele, el preferă ceva numit „autentificare continuă”, observând în esență comportamentul unui utilizator și căutând semne de automatizare. „O ființă umană reală nu are un control foarte bun asupra propriilor funcții motorii și, prin urmare, nu poate mișca mouse-ul în același mod de mai multe ori în mai multe interacțiuni, chiar dacă încearcă din greu”, spune Ghosemajumder.
În timp ce un bot va interacționa cu o pagină fără a mișca un mouse sau prin mișcarea unui mouse foarte precis, acțiunile umane au o „entropie”, care este greu de falsificat, spune Ghosemajumder.
Viitorul
Echipa CAPTCHA gândește în direcții similare. Cea mai recentă versiune, reCaptcha v3, anunțată la sfârșitul anului trecut, folosește „analiza de risc adaptativă” pentru a nota traficul în funcție de cât de suspect pare. Proprietarii de site-uri web pot alege apoi să le prezinte utilizatorilor sommați o provocare, cum ar fi o solicitare de parolă sau o autentificare cu doi factori.
Google nu spune ce factori contribuie la acest scor, în afară de faptul că Google observă cum arată o grămadă de „trafic bun” pe un site, conform lui Cy Khormaee, un manager de produs al echipei CAPTCHA, și folosește informația colectată pentru a detecta „traficul suspect”. Cercetătorii în securitate spun că este probabil un amestec de cookie-uri, atribute ale browserului, modele de trafic și alți factori.
În cartea sa „The Most Human Human”, Brian Christian intră într-o competiție de test turing și constată că este de fapt destul de dificil să-ți demonstrezi umanitatea în conversație. Pe de altă parte, creatorilor de boți le-a fost ușor să treacă testul, nu fiind cel mai elocvent sau inteligent conversator, ci evitând întrebările cu glume non-sequitur, greșeli de scriere sau în cazul botului care a câștigat un concurs Turing în 2014, pretinzând că este un băiat ucrainean de 13 ani, cu o cunoaștere slabă a limbii engleze. La urma urmei, a greși este uman, nu?
„Cred că oamenii își dau seama că există o aplicație pentru simularea utilizatorului uman obișnuit… sau a oamenilor proști”, spune Ghosemajumder.