Wikipedia nu moare încă, dar ChatGPT o zdruncină serios, arată un studiu
Studiul realizat la King’s College London arată că Wikipedia rămâne puternică, în ciuda valului de instrumente de inteligență artificială care i-au fost prezise drept „gropari”. Oamenii continuă să folosească enciclopedia online, iar traficul și numărul de vizitatori sunt în creștere. Cercetătorii avertizează însă că modul în care AI colectează masiv datele („scraping”) și schimbă felul în care ne informăm aduce provocări serioase pentru viitorul platformei.
Analiza a fost publicată în revista Association for Computing Machinery (ACM) Collective Intelligence și a comparat 12 ediții lingvistice ale Wikipedia, dintre care șase în țări cu acces la ChatGPT și șase fără acces, în perioada ianuarie 2021 – ianuarie 2024. Concluzia principală: nu s-a înregistrat un declin al activității, ci dimpotrivă, o tendință de creștere. În același timp, studiul subliniază că impactul AI nu poate fi ignorat, mai ales când vine vorba de sustenabilitatea infrastructurii și de recunoașterea muncii voluntarilor.
Ce arată concret studiul
Cercetătorii au observat că, pe parcursul celor 36 de luni analizate, nu s-a produs o scădere a activității pe Wikipedia. Atât numărul de vizualizări de pagini, cât și numărul de vizitatori au crescut în toate edițiile lingvistice urmărite. Creșterea a fost totuși mai mică în limbile în care utilizatorii aveau acces la ChatGPT, dar diferența nu a însemnat o „hemoragie” de public către instrumentele de AI.
La fel de important, nu există dovezi că apariția ChatGPT a redus numărul de editori sau volumul de modificări. Comunitatea de contributori – motorul care ține enciclopedia în viață – pare să-și păstreze ritmul. Autorii notează totuși limitări: unii utilizatori pot ocoli restricțiile de acces folosind VPN-uri, iar popularitatea ChatGPT variază de la o țară la alta, aspecte greu de cuantificat perfect într-un studiu comparativ.
De ce AI poate fi o problemă pe termen lung pentru Wikipedia
În plan tehnic, provocarea imediată este scrapingul agresiv: boții companiilor de AI extrag masiv informații din Wikipedia pentru a antrena modele pe date de calitate, ceea ce poate împinge traficul automatizat la niveluri care pun presiune pe serverele Fundației Wikimedia. În termeni simpli, dacă prea multe „aspiratoare” de date trag simultan, infrastructura are de suferit, iar resursele, plătite în bună măsură din donații, se pot subția.
În plan editorial și economic, problema este creditarea: mult conținut generat de AI se sprijină pe Wikipedia fără menționarea sursei, fără trimitere și fără a „întoarce” traficul. Asta afectează ecosistemul: mai puțini cititori ajung pe paginile originale, mai puține corecturi și contribuții sunt făcute, iar mai puține donații intră în sistem. Elena Simperl, profesoară de informatică la King’s și co-directoare a Institute for Artificial Intelligence, subliniază că e nevoie de reguli mai clare în relația dintre platformele AI și Wikipedia, pentru a proteja munca comunității.
Un posibil „contract social” și noul proiect Wikidata
Neal Reeves, primul autor al studiului, propune ideea unui „nou contract social” între companiile de AI și Wikipedia: accesul la cunoașterea verificată de editori poate continua, dar cu respectarea controlului asupra conținutului și cu mecanisme care să susțină în mod echitabil enciclopedia. Asta ar însemna atât limitarea scrapingului „la liber”, cât și recunoașterea explicită a sursei, poate chiar prin forme de licențiere și contribuții concrete înapoi către infrastructură.
În aceeași zi cu publicarea analizei, Wikimedia Deutschland a anunțat Wikidata Embedding Project, o inițiativă tehnică menită să faciliteze accesul la cunoașterea structurată validată de editori. Ideea este ca dezvoltatorii de AI să folosească reprezentări „încorporate” ale datelor, curate și urmăribile, în locul paginilor răzuite la grămadă. Beneficiul potențial este dublu: mai puțină încărcare pe servere și mai multă transparență în lanțul informațional, adică șanse mai mari ca munca voluntarilor să fie respectată și reflectată în rezultate.
Rămâne de văzut cum vor răspunde marile companii de AI. Studiul demontează narativul „Wikipedia moare”, dar trage un semnal de alarmă: dacă nu există reguli și responsabilitate partajată, enciclopedia riscă să devină doar o „fermă” de date pentru modele, fără recunoaștere și fără resurse pentru a-și menține calitatea. În fond, succesul Wikipedia a fost mereu un pact între utilizatori, contributori și platformă – iar apariția AI cere actualizarea acestui pact, nu închiderea lui.