Tânărul care a înțeles criza COVID mai bine decât specialiști din instituții de renume
În competiția despre cine ar putea face cea mai exactă prognoză a coronavirusului, s-au întrecut instituții globale cu un tip care locuia cu părinții săi în Santa Clara. Iată cum a înțeles criza de COVID tânărul.
În primăvara lui 2020 atenția a fost îndreptată către două sisteme de prognoză: unul construit de Imperial College London, celălalt de Institute for Health Metrics and Evaluation sau IHME , cu sediul în Seattle. Aceste studii urmăreau situația pandemiei.
Dar modelele au dat predicții extrem de divergente. Imperial a avertizat că SUA ar putea vedea până la două milioane de decese din COVID-19 până în vară, în timp ce prognozele IHME erau mult mai conservatoare, anticipând aproximativ 60.000 de decese până în august. Niciuna dintre aceste statistici nu s-a dovedit a fi foarte apropiată de adevăr. SUA au ajuns la aproximativ 160.000 de morți până la începutul lunii august.
Discrepanța uriașă dintre cifrele prognozate din primăvară a atras atenția unui om de știință de date în vârstă de 26 de ani pe nume Youyang Gu, relatează Bloomberg. Tânărul avea o diplomă de master în inginerie electrică și informatică de la Institutul de Tehnologie din Massachusetts și o altă diplomă în matematică, dar nu avea o pregătire formală într-un domeniu legat de pandemie, cum ar fi medicina sau epidemiologia. Totuși, el a crezut că experiența sa referitoare la modelele de date se poate dovedi utilă în timpul pandemiei.
Cum a înțeles băiatul cel mai bine criza COVID
Astfel, la mijlocul lunii aprilie, în timp ce locuia cu părinții săi în Santa Clara, California, Gu a petrecut o săptămână construindu-și propriile prognoze în legătură cu COVID-19 și un site web pentru a afișa concluziile la care a ajuns. În scurt timp, modelul său a început să producă rezultate mai precise decât cele date de instituții cu sute de milioane de dolari în finanțare și decenii de experiență.
„Modelul său a fost singurul care părea corect”, spune Jeremy Howard, un expert în date și cercetător la Universitatea din San Francisco. „Celelalte modele s-au dovedit a fi eronate de nenumărate ori și totuși nu a existat nicio schimbare în acest sens din partea persoanelor care publicau prognozele sau a jurnaliștilor care raportau despre ele. Viețile popoarelor depindeau de aceste lucruri, iar Youyang era singura persoană care se uita efectiv la date și le făcea corect”.
Modelul de prognoză pe care Gu l-a construit a fost, într-un fel, simplu. Mai întâi, se gândise să examineze relația dintre testele COVID, spitalizările și alți factori, dar a constatat că astfel de date erau raportate inconsecvent de către state și guvernul federal. Cele mai fiabile cifre păreau să fie numărul zilnic de decese.
„Alte modele au folosit mai multe surse de date, dar am decis să mă bazez pe decese din trecut pentru a prezice decese viitoare”, spune Gu.
Cum a ajutat modelul de analiză a lui Gu
Modelul lui Gu a venit din utilizarea algoritmilor de învățare automată pentru a-și perfecționa cifrele. Gu a petrecut câțiva ani lucrând în industria financiară scriind algoritmi pentru sisteme de tranzacționare de înaltă frecvență, în care previziunile sale trebuiau să fie corecte dacă dorea să-și păstreze slujba.
Când a venit vorba de COVID, Gu a continuat să compare predicțiile sale cu eventualele totaluri de decese raportate și și-a reglat în mod constant software-ul de învățare automată, astfel încât să conducă la date din ce în ce mai precise. Chiar dacă munca necesită aceleași ore ca un loc de muncă exigent cu normă întreagă, Gu și-a oferit voluntar timp și a trăit din economiile sale. El dorea ca datele sale să fie văzute ca fiind libere de orice conflict de interese sau prejudecăți politice.
Datele lui despre situația COVID s-au adeverit
Deși cu siguranță nu este perfect, modelul lui Gu a funcționat bine de la bun început. La sfârșitul lunii aprilie, el a prezis că SUA vor înregistra 80.000 de morți până pe 9 mai. Numărul efectiv de morți a fost de 79.926. O prognoză similară de la sfârșitul lunii aprilie a IHME a prezis că SUA nu va depăși 80.000 de decese pe tot parcursul anului 2020.
Gu a prezis, de asemenea, 90.000 de decese pe 18 mai și 100.000 de decese pe 27 mai. În cazul în care IHME se aștepta ca virusul să dispară ca urmare a distanțării sociale și a altor politici, Gu a prezis că va exista un al doilea val mare de infecții și decese, deoarece multe state s-au redeschis din lockdown-uri.
Spre sfârșitul lunii aprilie, biologul Universității din Washington, Carl Bergstrom, a scris pe Twitter despre modelul lui Gu și, nu după mult timp, Centrele SUA pentru Controlul și Prevenirea Bolilor au inclus numerele lui Gu pe site-ul său de prognoză COVID. Pe măsură ce pandemia a progresat, Gu, un imigrant chinez care a crescut în Illinois și California, s-a trezit participând la întâlniri regulate cu CDC și cu echipe de modelatori profesioniști și epidemiologi, deoarece toată lumea a încercat să-și îmbunătățească previziunile.