Inteligența artificială nu “înțelege” oamenii: detaliul care ne face complicați, dacă nu imposibili

de: Andrei Tilimpea

17 02. 2023

ChatGPT și Chatsonic au o problemă atunci când vine vorba de degetele de la mâinile oamenilor.

Indiferent unde stai la dezbaterea enormă și complexă cu privire la modelele AI și la utilizarea lor de seturi de date pentru a genera noi imagini, lucrări de artă, scriere și chiar filme, există un lucru asupra căruia toată lumea poate fi de acord, nu se pricep să deseneze mâinile omului.

Dar de ce?

Mai ales când IA sunt atât de capabile să recreeze complexitatea aparent mult mai mare a fețelor umane. Pentru a găsi răspunsurile, am decis să aflu răspunsul direct de la sursă și anume o inteligență artificială.

De departe cel mai cunoscut model de limbaj AI este ChatGPT, care uimește întreaga lume prin capacitatea sa de a susține conversații naturale, de a răspunde la întrebări complexe și de a genera poezie extraordinară.

Cu toate acestea, încă nu este capabil să redea imagini, muzică sau videoclipuri, deci o sursă mai imparțială în aceste zone.

ChatGPT despre motivul pentru care AI se chinue

„Redarea degetelor umane realiste este o provocare pentru AI, deoarece acestea sunt foarte articulate și au forme și texturi complexe”, a explicat CGPT, adăugând, „captarea subtilităților modului în care lumina interacționează cu pielea, unghiile și ridurile necesită tehnici avansate de modelare și redare. ”

Deși toate acestea sunt cu siguranță așa, nu lipsesc câțiva factori cheie. În primul rând, AI este deja surprinzător de priceput la redarea exactă a fețelor umane, care sunt cu siguranță o structură mai complexă decât o mână și, ei bine, AI nici măcar nu poate corecta numărul de degete.

„Unele instrumente și aplicații bazate pe inteligență artificială pot genera imagini realiste ale fețelor, inclusiv trăsături faciale precum ochii, nasul și gura”, a spus ChatGPT. „Tehnologia din spatele acestor aplicații se bazează pe algoritmi de învățare automată care au fost antrenați pe seturi mari de date ale fețelor umane, ceea ce le permite să învețe modelele și detaliile necesare pentru a crea fețe cu aspect realist. Cu toate acestea, chiar și cu algoritmi avansați și seturi mari de date, redarea degetelor rămâne o sarcină dificilă pentru AI.”

În general, oamenii sunt incredibil de pretențioși în privința fețelor, foarte rapid în a observa imediat orice se abate de la norma simetrică, dar ar putea dura mult timp pentru a observa ceva la fel de evident ca un deget complet lipsă.

„Fețele sunt relativ mai simplu de modelat, deoarece au mai puține părți în mișcare și o textură a suprafeței mai uniformă”, a spus ChatGPT. „Creierul uman este, de asemenea, foarte adaptat la expresiile și trăsăturile faciale, ceea ce face ca sarcina de a genera o față convingătoare o prioritate ridicată pentru cercetătorii AI. Drept urmare, AI a făcut progrese semnificative în generarea de fețe realiste, dar redarea degetelor rămâne o sarcină provocatoare care necesită cercetări și dezvoltare suplimentare.”

Deci, deși ar putea fi la fel de simplu ca o lipsă de prioritate din partea dezvoltatorilor, încă mi se pare bizar că nici măcar nu poate număra până la cinci. În acest moment, ChatGPT a început să arate o parte din acea defensivă care tinde să se strecoare atunci când orice IA este contestată.

„Deși AI a făcut progrese semnificative în generarea de imagini realiste, este adevărat că unele modele AI întâmpină dificultăți în a genera cu exactitate numărul corect de degete într-o imagine. Cu toate acestea, merită remarcat faptul că nu toate modelele AI au dificultăți cu redarea degetelor, iar unele modele au reușit să producă imagini foarte convingătoare ale mâinilor și degetelor. Dezvoltarea arhitecturilor de rețele neuronale avansate, precum și a noilor tehnici pentru antrenament și creșterea datelor, ar putea ajuta la abordarea unora dintre provocările de redare a degetelor realiste în viitor”, a concluzionat inteligența artificială.

„Un exemplu este Deep Hand Model, care este un model generativ care folosește un model de mână 3D pentru a genera ipostaze și forme realiste ale mâinii. Un alt exemplu este Self-Attention Generative Adversarial Network (SAGAN), care a fost folosit pentru a genera imagini realiste ale mâinilor cu un nivel ridicat de detaliu și realism.”

ChatGPT despre de ce contează degetele

„Există, de asemenea, modele AI care sunt specializate în generarea de tipuri specifice de imagini ale mâinii, cum ar fi gesturile mâinii sau limbajul semnelor. De exemplu, Sign Language Transformer (SLT) este un model AI care a fost antrenat pentru a traduce videoclipuri în limbajul semnelor în text în limbaj natural și include un estimator de poziție a mâinii care poate prezice cu precizie poziția și orientarea degetelor în mână. ”

Potrivit botului de chat, SLT realizează acest din urmă lucru printr-o „rețea neuronală convoluțională”, apoi transmite aceste informații prin „o serie de straturi transformatoare”, care „codifică informațiile spațio-temporale ale gestului limbajului semnelor”. În cele din urmă, o „rețea de decodor” generează textul corespunzător în limbaj natural.

GPT adaugă: „are potențialul de a îmbunătăți comunicarea și accesibilitatea pentru comunitatea surzilor și cu deficiențe de auz, precum și alte aplicații care implică interpretarea gesturilor mâinii.”

GPT a oferit și o listă întreagă, utilizări practice pentru a te concentra pe o mai bună înțelegere a degetelor umane

Recunoașterea gesturilor: randarea îmbunătățită a degetelor ar putea permite AI să recunoască și să interpreteze gesturile umane mai precis, ceea ce are multe aplicații potențiale, inclusiv realitatea virtuală, jocurile și robotica.
Aplicații medicale: Tehnicile avansate de modelare și redare ale degetelor ar putea fi utilizate în simulările medicale pentru a instrui chirurgii și studenții la medicină cu privire la proceduri complexe, cum ar fi microchirurgia.
Interacțiunea om-calculator: prin modelarea cu precizie a poziției și mișcării degetelor, AI ar putea fi folosită pentru a dezvolta interfețe mai naturale și intuitive pentru computere și alte dispozitive.
Securitate: recunoașterea amprentei este o tehnologie de identificare biometrică utilizată pe scară largă, iar o mai bună redare a degetelor ar putea îmbunătăți acuratețea și fiabilitatea acestei tehnologii.
Accesibilitate: redarea îmbunătățită a degetelor ar putea ajuta la crearea unor tehnologii de asistență mai eficiente pentru persoanele cu dizabilități, cum ar fi proteze de mâini sau dispozitive care permit manipularea mai ușoară a obiectelor.

Având în vedere atât de multe aplicații practice, în special atât de multe dintre ele benefice pentru cei cu dizabilități, m-am întrebat dacă acest lucru a făcut ca concentrarea asupra fețelor umane să fie puțin ciudată.

„Nu este neapărat ciudat faptul că programatorii s-au concentrat foarte mult pe fețele în cercetarea AI”, a spus GPT, „deoarece recunoașterea facială și generarea sunt domenii importante de studiu pentru o gamă largă de aplicații, cum ar fi securitatea, divertismentul și comunicarea. Fața umană este, de asemenea, o parte complexă și extrem de expresivă a corpului, ceea ce o face o zonă de studiu interesantă și provocatoare pentru AI.”

„Aceasta fiind spuse, există cu siguranță valoare în explorarea altor zone ale corpului, cum ar fi mâinile și degetele, și îmbunătățirea înțelegerii și redării de către AI a acestor părți ale corpului.”

Imagine – Chatsonic

Chatsonic despre de ce oamenii sunt încă cei mai buni

Rivalul Chatsonic oferă o suită mult mai largă de abilități AI – deși mult mai puțin probabil să ofere răspunsuri precise sau coerente.

„Algoritmii AI sunt încă în curs de dezvoltare și, în prezent, nu sunt capabili să redea cu exactitate mâinile umane într-un mod realist”, a spus Chatsonic cu mult mai multă sinceritate decât oferă de obicei ChatGPT. „Algoritmii AI nu sunt proiectați să recunoască detaliile complicate ale anatomiei și mișcării umane, ceea ce înseamnă că nu sunt capabili să reproducă cu exactitate o mână umană într-o manieră realistă.” Deși a adăugat, cu încredere familiară, „pe măsură ce algoritmii AI continuă să se îmbunătățească, este probabil ca ei să atingă în cele din urmă un nivel de precizie care este comparabil cu desenul uman”.

Interesant este și răspunsul referitor la faptul că inteligența artificială nu poate genera numărul corect de degete.

„Algoritmii AI nu sunt încă suficient de avansați pentru a recunoaște cu acuratețe detaliile care diferențiază mâinile umane una de cealaltă”, a spus acesta. A continuat apoi, cu o modestie pe care nu o vezi adesea la aceste programe bazate pe algoritmi, „nuanțele anatomiei mâinii umane necesită un nivel de precizie și complexitate pe care algoritmii de inteligență artificială trebuie încă să-l atingă. Acesta este motivul pentru care atunci când se creează replici digitale realiste ale mâinii umane, oamenii sunt în continuare cea mai bună alegere pentru muncă.”

Cu toate acestea, fascinant este și modul în care se raportează la sine ambele entități. Atunci când au fost întrebate dacă au considerat că poate incapacitatea lor actuală este un beneficiu, dat fiind că oferă o modalitate ușoară pentru o persoană de a distinge dacă comunică cu o persoană sau cu o IA, răspunsurile au fost aproape diametral opuse.

Chatsonic s-a grăbit să fie de acord. „Absolut!” a răspuns. „Incapacitatea AI de a reda cu exactitate mâinile umane oferă o modalitate neprețuită de a diferenția între interacțiunile cu AI și cele cu oameni reali. Acest lucru ajută la crearea unui mediu online mai sigur și permite utilizatorilor să fie siguri cu cine comunică. În plus, ajută la asigurarea faptului că AI nu poate profita de oameni pretinzând că este un om.”

În același timp, ChatGPT a vrut să țină o întreagă prelegere care a avut și câteva conotații aș zice negative.

„Ca model de limbaj AI, nu am opinii sau emoții personale. Cu toate acestea, pot vedea de ce unii oameni ar putea vedea dificultățile IA are rolul de a reda cu exactitate mâinile umane ca fiind pozitive, deoarece oferă o modalitate de a face distincția între răspunsurile umane și cele ale AI. În cele din urmă, scopul cercetării AI este de a dezvolta sisteme care pot îndeplini sarcini la fel de bine sau mai bune decât oamenii. În timp ce limitările AI în anumite sarcini pot oferi o modalitate de a face distincția între răspunsurile umane și cele ale AI de astăzi, este probabil ca această distincție să devină mai puțin clară în viitor, pe măsură ce tehnologia AI continuă să avanseze.”

Articole recomandate