Ce este inteligența artificială, dar mai ales, ce nu este: viitorul în era informației pentru toată lumea
În august 1955, un grup de oameni de știință a făcut o cerere de finanțare de 13.500 USD pentru a găzdui un atelier de vară la Dartmouth College, New Hampshire.
Domeniul pe care și-au propus să îl exploreze a fost inteligența artificială (AI).
Deși cererea de finanțare a fost umilă, conjectura cercetătorilor nu a fost: „Fiecare aspect al învățării sau orice altă trăsătură a inteligenței poate fi, în principiu, descrisă atât de precis încât să poată fi făcută o mașină care să o simuleze”.
De la aceste începuturi umile, filmele și mass-media au romantizat AI sau au prezentat-o ca un răufăcător. Cu toate acestea, pentru majoritatea oamenilor, AI a rămas un punct de discuție și nu o parte a unei experiențe trăite conștient.
AI a ajuns în viețile noastre
La sfârșitul lunii trecute, AI, sub forma ChatGPT, s-a eliberat de speculațiile științifico-fantastice și de laboratoarele de cercetare și pe desktop-urile și telefoanele publicului larg.
Este ceea ce este cunoscut sub numele de „IA generativă” – dintr-o dată, un mesaj inteligent formulat poate produce un eseu sau poate pune împreună o rețetă și o listă de cumpărături sau poate crea o poezie în stilul lui Elvis Presley.
În timp ce ChatGPT a fost cel mai dramatic participant într-un an de succes generativ de AI, sisteme similare au arătat un potențial și mai larg de a crea conținut nou, cu solicitări text-to-image folosite pentru a crea imagini vibrante care au câștigat chiar și concursuri de artă.
Este posibil ca inteligența artificială să nu aibă încă o conștiință vie sau o teorie a minții populară în filmele și romanele SF, dar se apropie cel puțin de a perturba ceea ce credem că pot face sistemele de inteligență artificială.
Cercetătorii care lucrează îndeaproape cu aceste sisteme au strâns sub perspectiva unei conștiințe, ca în cazul modelului de limbă mare (LLM) Google LaMDA. Un LLM este un model care a fost antrenat să proceseze și să genereze limbaj natural.
Inteligența artificială generativă a generat și îngrijorări cu privire la plagiat, exploatarea conținutului original folosit pentru a crea modele, etica manipulării informațiilor și abuzul de încredere și chiar „sfârșitul programării”.
În centrul tuturor acestor lucruri se află întrebarea care a crescut în urgență de la atelierul de vară de la Dartmouth: diferă AI de inteligența umană?
Ce înseamnă de fapt „AI”?
Pentru a fi calificat ca AI, un sistem trebuie să prezinte un anumit nivel de învățare și adaptare. Din acest motiv, sistemele de luare a deciziilor, automatizarea și statisticile nu sunt AI.
AI este definită în linii mari în două categorii: inteligența artificială îngustă (ANI) și inteligența generală artificială (AGI). Până în prezent, AGI nu există.
Provocarea cheie pentru crearea unei IA generale este de a modela în mod adecvat lumea cu toate cunoștințele, într-o manieră consecventă și utilă. Este cel puțin o întreprindere masivă.
Cea mai mare parte a ceea ce cunoaștem astăzi ca inteligență artificială are inteligență restrânsă – în cazul în care un anumit sistem abordează o anumită problemă. Spre deosebire de inteligența umană, o astfel de inteligență AI îngustă este eficientă doar în domeniul în care a fost instruită: detectarea fraudelor, recunoașterea facială sau recomandările sociale, de exemplu.
AGI, cu toate acestea, ar funcționa ca oamenii. Deocamdată, cel mai notabil exemplu de încercare de a realiza acest lucru este utilizarea rețelelor neuronale și a „învățării profunde” antrenate pe cantități mari de date.
Rețelele neuronale sunt inspirate de modul în care funcționează creierul uman. Spre deosebire de majoritatea modelelor de învățare automată care execută calcule pe datele de antrenament, rețelele neuronale funcționează prin alimentarea fiecărui punct de date unul câte unul printr-o rețea interconectată, ajustând de fiecare dată parametrii.
Pe măsură ce tot mai multe date sunt alimentate prin rețea, parametrii se stabilizează; rezultatul final este rețeaua neuronală „antrenată”, care poate produce apoi rezultatul dorit pe date noi – de exemplu, recunoașterea dacă o imagine conține o pisică sau un câine.
Saltul semnificativ înainte în AI de astăzi este condus de îmbunătățirile tehnologice ale modului în care putem antrena rețele neuronale mari, reajustând un număr mare de parametri în fiecare rulare datorită capacităților infrastructurilor mari de cloud computing. De exemplu, GPT-3 (sistemul AI care alimentează ChatGPT) este o rețea neuronală mare cu 175 de miliarde de parametri.
De ce are nevoie AI pentru a funcționa?
AI are nevoie de trei lucruri pentru a avea succes.
În primul rând, are nevoie de date de înaltă calitate, imparțiale și multe. Cercetătorii care construiesc rețele neuronale folosesc seturile mari de date care au apărut pe măsură ce societatea s-a digitalizat.
Co-Pilot, pentru creșterea programatorilor umani, își extrage datele din miliarde de linii de cod partajate pe GitHub. ChatGPT și alte modele lingvistice mari folosesc miliardele de site-uri web și documente text stocate online.
Instrumentele text-to-image, cum ar fi Stable Diffusion, DALLE-2 și Midjourney, folosesc perechi imagine-text din seturi de date precum LAION-5B. Modelele de inteligență artificială vor continua să evolueze în sofisticare și impact pe măsură ce ne digitalizăm mai mult viețile și le oferim surse alternative de date, cum ar fi date simulate sau date din setările jocului precum Minecraft.
AI are nevoie, de asemenea, de infrastructură de calcul pentru un antrenament eficient. Pe măsură ce computerele devin mai puternice, modelele care necesită acum eforturi intense și calculatoare la scară largă pot fi gestionate local în viitorul apropiat. Stabil Diffusion, de exemplu, poate fi deja rulat pe computere locale, mai degrabă decât pe medii cloud.
A treia nevoie pentru AI este modele și algoritmi îmbunătățiți. Sistemele bazate pe date continuă să facă progrese rapide în domenii considerate cândva a fi teritoriul cunoașterii umane.
Cu toate acestea, pe măsură ce lumea din jurul nostru se schimbă în mod constant, sistemele AI trebuie reinstruite în mod constant folosind date noi. Fără acest pas crucial, sistemele AI vor produce răspunsuri care sunt incorecte din punct de vedere faptic sau nu iau în considerare informații noi care au apărut de când au fost instruiți.
Rețelele neuronale nu sunt singura abordare a AI. O altă tabără proeminentă în cercetarea inteligenței artificiale este AI simbolică – în loc să digere seturi uriașe de date, se bazează pe reguli și cunoștințe similare cu procesul uman de formare a reprezentărilor simbolice interne ale anumitor fenomene.
Dar raportul de putere a înclinat puternic către abordări bazate pe date în ultimul deceniu, „părinții fondatori” ai învățării profunde moderne primind recent Premiul Turing, echivalentul Premiului Nobel pentru informatică.
Datele, calculele și algoritmii formează fundamentul viitorului AI. Toți indicatorii arată că se vor face progrese rapide în toate cele trei categorii în viitorul apropiat.