ChatGPT este lăsat să învețe din propriile greșeli, exact ca un copil: cât de uman ar putea deveni, în timp

de: Iulia Kelt

05 04. 2023

Este posibil ca o echipă de cercetători să fi găsit o modalitate ideală de a îmbunătăți chatbot-urile modelului LLM, inclusiv acuratețea ChatGPT-4 cu aproximativ 21 la sută.

Într-o nouă lucrare preliminară, care încă nu a fost revizuită, echipa explică modul în care a reușit acest lucru: permițând agenților inteligenței artificiale să reflecte asupra propriilor greșeli.

Modelul folosit de oamenii de știință a fost un succes

Echipa a folosit un proces numit Reflexie, care „dotează un agent cu memorie dinamică și capacități de auto-reflexie pentru a-și îmbunătăți urmărirea raționamentului și abilitățile de alegere a acțiunii specifice sarcinii”, potrivit lucrării lor.

„Inteligenta umană se remarcă prin capacitatea sa de a învăța din greșeli”, a explicat echipa pe Substack.

„De multe ori nu rezolvăm problemele din prima încercare, dar atunci când facem greșeli, generăm idei noi pentru a ne rafina abordarea prin auto-reflecție, prin analizarea pașilor greșiți”, s-a menționat, de asemenea.

Ei au încercat să reproducă acest lucru într-o anumită măsură, permițând agenților AI să-și analizeze propriile acțiuni și greșeli.

În cadrul cercetării, agenții AI au fost provocați să rezolve diverse probleme, de la codificare la o încercare în AlfWorld, un mediu bazat pe text care este folosit pentru a instrui și testa AI.

În AlfWorld, AI-ului i s-a cerut să finalizeze o serie de sarcini, dar singura modalitate de a face acest lucru a fost să învețe despre mediu și să fie recompensat cu observații, exact cum ai face cu un copil.

Acesta a obținut o precizie de 63%. Când agentului i s-a oferit capacitatea de a reflecta asupra acțiunilor și greșelilor sale, a reușit să obțină o precizie de 97%, rezolvând 130 din cele 134 de sarcini.

În concluzie, inteligența artificială pare de neoprit și devine, pe zi ce trece, din ce în ce mai umană, în timp ce oamenii contribuie destul de mult la această tendință. Tot ce ne rămâne de făcut este să sperăm că, peste ani, AI va fi cu noi și nu împotriva noastră.

Articole recomandate