Moment penibil din cauza Excel: țara care a „pierdut” peste 16.000 de rezultate ale testelor COVID-19
O limită de un milion de rânduri pentru software-ul de calcul tabelar Excel Microsoft ar fi putut cauza o pierdere majoră de date la Public Health England, de circa 16.000 de rezultate ale testelor pentru depistarea Covid-19.
Eroarea de date, care a dus la 15.841 de teste pozitive, a fost lăsată în afara cifrelor oficiale zilnice, ceea ce înseamnă că peste 50.000 de persoane potențial infecțioase ar fi putut fi ratate de tracer de contact și nu li s-a spus să se autoizoleze.
Cum a avut loc incidentul?
PHE este responsabil pentru strângerea rezultatelor testelor din laboratoarele publice și private și publicarea actualizărilor zilnice privind numărul de cazuri și testele efectuate.
Dar dezvoltarea rapidă a programului de testare a însemnat că o mare parte a muncii este încă efectuată manual, laboratoarele individuale trimițând foi de calcul care conțin rezultate către PHE.
Deși sistemul s-a îmbunătățit încă din primele zile ale pandemiei, când unele lucrări au fost efectuate cu apeluri telefonice, pixuri și hârtie, este încă departe de a fi automatizat.
În acest caz nefericit, un laborator și-a trimis raportul zilnic de testare la PHE sub forma unui fișier CSV – cel mai simplu format de bază de date posibil, cuprinzând o listă de valori separate prin virgule.
Raportul respectiv a fost apoi încărcat în Microsoft Excel, iar noile teste din partea de jos au fost adăugate în baza de date principală.
Dar, deși fișierele CSV pot avea orice dimensiune, fișierele Microsoft Excel pot avea doar 1.048.576 de rânduri lungi – sau, în versiunile mai vechi pe care PHE le-ar fi putut folosi încă, doar 65.536.
Când este deschis un fișier CSV mai lung, rândurile de jos sunt întrerupte și nu mai sunt afișate. Asta înseamnă că, odată ce laboratorul a efectuat mai mult de un milion de teste, a fost doar o chestiune de timp până când rapoartele sale nu au putut fi citite de PHE.
Excel este omniprezent, deci problema riscă să fie răspândită
Software-ul pentru foi de calcul Microsoft este unul dintre cele mai populare instrumente de afaceri din lume, dar este implicat în mod regulat în erori care pot fi costisitoare sau chiar periculoase, datorită ușurinței cu care poate fi utilizat.
În 2013, o eroare Excel la JPMorgan a mascat pierderea de aproape 6 miliarde de dolari, după ce o celulă a împărțit în mod eronat suma a două rate ale dobânzii, mai degrabă decât media.
Știrea l-a determinat pe James Kwak, profesor de drept la Universitatea din Connecticut, să avertizeze că Excel este “incredibil de fragil”.
“Nu există nicio modalitate de a urmări de unde provin datele, nu există nicio pistă de audit, astfel încât să poți scrie prea multe numere și să nu știi.
Cea mai mare problemă este că oricine poate crea foi de calcul Excel, și oricine o poate face prost. Deoarece este atât de ușor de utilizat, crearea de foi de calcul chiar și importante nu este limitată la persoanele care înțeleg programarea și o fac într-un mod metodic, bine documentat”, a scris Kwak.
Erorile din software-ul Excel au schimbat chiar fundamentele geneticii umane. Numele a 27 de gene au fost schimbate în ultimul an de către Comitetul pentru Nomenclatura Genelor Umane, după ce programul Microsoft le-a formatat greșit în mod repetat.
Genele SEPT1 și MARCH1, de exemplu, au fost schimbate în SEPTIN1 și MARCHF1 după ce au fost transformate în repetate rânduri în denumirile lunilor anului.
Denumirile care puteau fi confundate cu alte cuvinte au fost modificate și ele, astfel încât instrumentele gramaticale să nu le mai corecteze automat: WARS este acum WARS1, de exemplu.