Moment istoric pentru computere: cum pot recunoaște obiecte fără să le fi văzut vreodată
AI își asumă în mod continuu noi provocări, de la detectarea deepfakes până la impulsionarea experimentelor de biologie sintetică. Însă pentru a face aceste lucruri, sunt necesare seturi imense de date pentru a instrui sistemele de inteligență artificială.
Un astfel de proces este costisitor, consumă mult timp și oferă informații cu care AI nu poate face decât un singur lucru bine.
De exemplu, pentru a antrena un AI pentru a face diferența între o imagine a unui câine și una a unei pisici, sistemul este hrănit cu mii de imagini etichetate cu câini și pisici. Un copil, pe de altă parte, poate vedea un câine sau o pisică doar o dată sau de două ori și își poate aminti să-i diferențieze. Cum putem face ca AI să învețe mai mult după procedeul pe care îl folosesc copiii?
Un nou mod de a instrui sistemele AI
O echipă de la Universitatea din Waterloo din Ontario a încercat un răspuns.
Metodologia echipei Waterloo se bazează pe schimbarea specificității datelor utilizate pentru a instrui sistemele de inteligență artificială. Instruirea unui sistem AI pentru a identifica o nouă clasă de obiecte folosind doar un exemplu este ceea ce ei numesc învățare “one-shot”. Dar fac un pas mai departe, concentrându-se pe învățarea “less than one-shot” sau învățarea LO-shot, pe scurt.
Învățarea LO-shot constă într-un sistem care învață să clasifice diferite categorii pe baza unui număr de exemple mai mic decât numărul de categorii.
Ce înseamnă asta? Să spunem că vrei să înveți un AI să identifice câini, pisici și canguri. Cum s-ar putea face acest lucru fără câteva exemple clare ale fiecărui animal?
Cheia, spune echipa Waterloo, este în ceea ce ei numesc etichete soft. Spre deosebire de etichetele rigide, care etichetează un punct de date ca aparținând unei clase specifice, etichetele soft elimină relația sau gradul de asemănare dintre acel punct de date și mai multe clase.
În cazul unui AI antrenat doar pe câini și pisici, o a treia clasă de obiecte, să zicem, canguri, ar putea fi descrisă ca 60% ca un câine și 40% ca o pisică – ipotetic, desigur.
“Etichetele soft pot fi folosite pentru a reprezenta seturi de învățare folosind mai puține prototipuri decât există clase, obținând creșteri mari ale eficienței eșantionului față de prototipurile obișnuite, hard label”, spun autorii lucrării.
Asta înseamnă că un sistem AI va reuși să recunoască un cangur, fără să fi văzut vreodată unul, doar spunându-i că un cangur este o fracțiune pisică și o fracțiune câine – ambele imagini cunoscute de AI.
Cum funcționează sistemul?
Autorii lucrării folosesc un algoritm simplu de învățare automată numit k-nearest neighbors (kNN) pentru a explora această idee mai în profunzime.
Algoritmul funcționează sub presupunerea că lucrurile similare sunt cel mai probabil existente unul lângă celălalt.
Pentru a antrena un algoritm kNN să facă diferența între categorii, alegeți caracteristici specifice pentru a reprezenta fiecare categorie, cum ar fi dimensiunea sau greutatea, î cazul animalelor.
Cu o caracteristică pe axa x și cealaltă pe axa y, algoritmul creează un grafic în care punctele de date care sunt similare între ele sunt grupate una lângă alta. O linie în centru împarte categoriile și este destul de simplu ca algoritmul să discearnă pe ce parte a liniei ar trebui să cadă noile puncte de date.
Echipa Waterloo a păstrat lucrurile simple și a folosit parcele de culoare pe un grafic 2D. Folosind culorile și locațiile lor pe grafice, echipa a creat seturi de date sintetice și etichete soft însoțitoare.
Când echipa a pus algoritmul să traseze liniile de graniță ale diferitelor culori pe baza acestor etichete soft, a putut împărți graficul în mai multe culori decât numărul de puncte de date pe care le-a fost dat în etichetele soft.
Deși rezultatele sunt încurajatoare, echipa recunoaște că sunt doar primul pas și că există încă mult mai multe explorări ale acestui concept.
O idee la care lucrează deja echipa este ca alți algoritmi să genereze etichete soft pentru algoritmul care va fi antrenat folosind LO-shot; proiectarea manuală a etichetelor soft nu va fi întotdeauna la fel de ușoară ca împărțirea unor diagrame în diferite culori.
Potențialul LO-shot pentru reducerea cantității de date de antrenament necesare pentru a produce sisteme AI funcționale este promițător. Pe lângă reducerea costurilor și a timpului necesar pentru formarea de noi modele, metoda ar putea face AI mai accesibilă industriilor, companiilor sau persoanelor care nu au acces la seturi de date mari – un pas important pentru democratizarea AI.