Cât de mare este, de fapt, arhiva internetului

Cât de mare este, de fapt, arhiva internetului
15:40 08.10.2018

Arhiva internetului e o mână nesperată de ajutor dacă vrei să-ți amintești de site-uri dispărute de ani buni, iar dimensiunile sale sunt considerabile.

Poate că nu conține chiar absolut totul, dar arhiva internetului e locul unde vei găsi cele mai multe fragmente de pe internetul de azi și de ieri. Ba chiar și din afara internetului, în funcție de ceea ce-ți dorești să cauți.

Mark Graham, director al Wayback Machine, parte din Internet Archive, a discutat recent despre serviciu și despre cifrele din spatele acestuia. Acesta glumește și spune că unitatea de măsură a noutăților fizice adăugate în arhivă este ”containerul” – cam atâtea cărți, viniluri și alte obiecte fizice primesc o dată la două săptămâni, într-un depozit din San Francisco.

Compania este al doilea cel mai mare scanner de cărți din lume, după Google. Momentan, sunt ceva mai mult de patru milioane de cărți scanate, iar pe lista de dorințe se află vreo 1,5 milioane de titluri. Cărțile publicate înainte de 1923 pot fi descărcate gratuit de pe Internet Archive, iar multe dintre cele mai noi pot fi împrumutate digital.

Arhiva de știri conține cam 200 de milioane de ore de conținut și îți oferă unelte care îți permit să cauți prin burtiere. În ceea ce privește alte bunuri, colecția nu duce lipsă nici de acestea; există peste 300.000 de jocuri și programe, dar și milioane de înregistrări – recent, Biblioteca din Boston a donat 200.000 de viniluri.

Conform lui Graham, arhiva devine mai bogată cu 4 PB de informație în fiecare an, adică 4 milioane de GB. În total, arhiva are 22 de petabytes, doar că alături de backup ajunge la 44 PB. ”Mașinăriile se pot strica, iar noi avem o reputație”, spune Graham pentru a justifica backup-ul.

În total, cam 7.000 de procese simultane se desfășoară pe internet pentru a aduna cam 1,5 miliarde de lucruri în fiecare săptămână. Unele site-uri pot fi scanate de mai multe ori pe zi, în timp ce altele sunt vizitate mai rar.

Tot ceea ce te-ar interesa cu și despre arhivă găsești chiar pe site-ul oficial, aici.