Wikipedia bate palma cu giganții din inteligență artificială, după ce Microsoft, Amazon și Meta i-au luat toate informațiile

TEHNOLOGIE
Wikipedia bate palma cu giganții din inteligență artificială, după ce Microsoft, Amazon și Meta i-au luat toate informațiile
Wikipedia, deal cu Microsoft, Amazon și Meta / foto: reprezentare AI

Wikipedia a fost mult timp exemplul clasic de „bun public” al internetului: conținut scris de voluntari, acces gratuit, licențe care permit reutilizarea și un model financiar bazat pe donații. Doar că, în ultimii ani, rolul ei s-a schimbat radical. Nu mai este doar o enciclopedie consultată de oameni, ci și o sursă de date „aspirată” non-stop de modele AI, crawlere și sisteme automatizate.

În acest context, Wikimedia Foundation și Wikipedia au început să formalizeze relația cu marii jucători AI. Mesajul este simplu: dacă folosești masiv Wikipedia ca să-ți alimentezi produsele comerciale, nu mai e suficient să te bazezi pe faptul că site-ul e deschis și că alții plătesc nota de întreținere.

De ce Wikipedia cere „fair share” și cum intră în joc Wikipedia Enterprise

Presiunea vine din infrastructură. Potrivit declarațiilor din zona Wikimedia, sistemele automatizate precum modelele lingvistice mari au ajuns printre cei mai mari consumatori ai conținutului Wikipedia, punând o încărcare constantă pe servere. Iar asta se simte în costuri: bandwidth, caching, protecție anti-abuz, mentenanță și dezvoltare.

Jimmy Wales, fondatorul Wikipedia, a rezumat problema într-o formulare directă: companiile AI „au lovit” puternic serverele și sunt încurajate să folosească produsele enterprise, care pot livra un „feed” dedicat, în loc să „spargă” site-ul prin acces automatizat agresiv. În același timp, Wikimedia subliniază că donațiile oamenilor sunt pentru acces liber al cititorilor, nu pentru a subvenționa dezvoltarea comercială a unor companii uriașe.

Aici apare Wikipedia Enterprise, un produs comercial gândit tocmai pentru reutilizare la scară mare, cu livrare mai predictibilă, mai curată și mai ușor de integrat tehnic pentru companii. În logica Wikimedia, e o tranziție de la „ia ce vrei, cum vrei” la „ia ce vrei, dar pe o cale corectă, care nu destabilizează proiectul”.

Ce câștigă Amazon, Microsoft și Meta și ce înseamnă asta pentru internetul deschis

Din perspectiva companiilor AI, acordurile de tip enterprise rezolvă câteva probleme dintr-un foc: stabilitate (nu depinzi de schimbări de structură ale paginilor), eficiență (mai puține cereri haotice), date mai bine structurate și, foarte important, o relație contractuală clară. În plus, Wikipedia rămâne un set de cunoștințe „curate” prin comparație cu multe colțuri ale webului: este uman-curată, moderată, cu istorice și surse, ceea ce o face valoroasă pentru antrenare, evaluare și chiar pentru răspunsuri generate de produse AI.

Din perspectiva Wikipedia, partea sensibilă este precedentul. Dacă cei mai mari jucători plătesc pentru acces la un flux enterprise, începe să se contureze o linie între webul deschis și webul „industrial”, unde accesul masiv devine o resursă negociată. Euronews notează că Wikipedia avea deja un aranjament cu Google anunțat în 2022 și acorduri cu jucători precum Anthropic, Perplexity sau Mistral AI, plus alte colaborări. În același timp, ideea de „price undertaking” pe date nu e automată: fiecare companie trebuie evaluată, iar modelul poate evolua în funcție de abuzuri și costuri.

Ce ar trebui să reții ca utilizator și de ce subiectul contează mai mult decât pare

Dacă folosești zilnic internetul, miza e mai mare decât o simplă știre despre un parteneriat. Wikipedia este infrastructură culturală: atunci când e „măcinată” de automatizări, efectele se văd în disponibilitate, costuri și în capacitatea proiectului de a rămâne deschis. Dacă modelul enterprise funcționează, poate deveni o soluție pragmatică: companiile primesc ce au nevoie, iar proiectele deschise nu sunt forțate să aleagă între a se prăbuși tehnic și a închide accesul.

Pentru tine, partea practică e să nu confunzi faptul că un răspuns AI „sună” enciclopedic cu ideea că este verificat. Când ai o informație importantă, verifică sursa originală și istoricul, nu doar rezumatul generat. Iar dacă vrei să susții un web util, ia în calcul că proiectele deschise au nevoie de finanțare predictibilă, mai ales când devin combustibil pentru produse comerciale la scară globală.