fbpx La ricerca su COVID-19 ha bisogno di dati | Scienza in rete

La ricerca su COVID-19 ha bisogno di dati condivisi

Elaborazione di Scienza in rete di un ritratto di Roberto Speranza, Ministro della Salute.

Tempo di lettura: 8 mins

Lunedì è stato pubblicato uno studio che mostra il livello di efficacia dei vaccini Pfizer/BioNTech e Oxford/AstraZeneca dopo la prima dose partendo dai dati della campagna vaccinale in Scozia. I risultati dello studio, che non è ancora stato sottoposto a peer review, sono confortanti: già dopo la prima dose l’efficacia di questi vaccini nell’evitare forme gravi di COVID-19 che necessitino di ospedalizzazione, è molto alta. Dopo quattro settimane dalla prima dose l’efficacia nell’evitare il ricovero a causa della COVID-19 è stata stimata al 76-91% per Pfizer/BioNTech e 73-99% per Oxford/AstraZeneca (qui il preprint).

L’annuncio è stato accolto con entusiasmo dalle istituzioni e dai ricercatori britannici. Questi risultati sembrano infatti confermare che la decisione di somministrare il vaccino Oxford/AstraZeneca a tutte le classi di età, senza fermarsi ai 65 anni come sta avvenendo in diversi paesi europei, sia state vincente.

Ma come sono stati ottenuti questi risultati? I ricercatori hanno messo insieme diversi database sanitari che coprono la quasi totalità della popolazione scozzese (5,4 milioni di persone): dati prodotti dai medici di base (940 studi medici), dati dello Electronic Communication of Surveillance in Scotland (ECOSS) che raccoglie i risultati degli esami diagnostici a cui sono stati sottoposti i cittadini, compresi quelli dei test RT-PCR per diagnosticare l’infezione da SARS-CoV-2, dati sui ricoveri in ospedale (database SMR e RAPID) e dati di mortalità (dal database National Records of Scotland). I dati hanno riguardato le persone vaccinate tra l’8 dicembre 2020 e il 15 febbraio 2021.

«I dati usati nello studio scozzese esistono in ciascuna regione italiana, ma dubito fortemente che da noi sarebbe stato possibile condurre in così poco tempo un’analisi del genere, anche a causa della peggiore organizzazione dei sistemi informativi», afferma Stefania Salmaso, epidemiologa che ha diretto fino al 2015 il Centro Nazionale di Epidemiologia, Sorveglianza e Promozione della Salute dell’Istituto Superiore di Sanità. L’operazione che ha permesso lo studio scozzese si chiama in gergo record linkage, e consiste nel collegamento tra le informazioni individuali contenute in diversi database.

Sta cercando di realizzare un record linkage anche Paolo Vineis, professore di epidemiologia ambientale alla School of Public Health dell’Imperial College a Londra, e vice presidente del Consiglio Superiore di Sanità. Vineis si è rivolto alla Regione Piemonte per poter collegare i dati dell’epidemia con quelli raccolti dallo studio di coorte EPIC: «Le prime richieste alla Regione risalgono alla fine di luglio del 2020 e a oggi non abbiamo ancora ottenuto il linkage delle due basi di dati», spiega Vineis. EPIC è uno studio di coorte che va avanti dal 1992 e coinvolge 23 centri in 10 paesi europei. Obiettivo di EPIC è studiare le origini biologiche e genetiche di diversi tipi di tumore. Tra il 1992 e il 2015 EPIC ha arruolato quasi 521 000 persone, di cui quasi 48 000 in Italia, ha osservato in questa popolazione l’insorgenza di oltre 67 000 tumori, raccogliendo dati sull’alimentazione, gli stili di vita ma anche campioni biologici dei partecipanti. «Le indagini che potremmo condurre se avessimo accesso al linkage ci permetterebbero di capire quali sono i fattori che aumentano il rischio di sviluppare forme gravi di COVID-19», spiega Vineis e aggiunge «si tratta di informazioni che permetterebbero di gestire la pandemia in maniera migliore, non speculazioni accademiche. Nel Regno Unito uno studio del genere è stato già condotto collegando i dati su COVID-19 con quelli della UK Biobank».

Vineis si riferisce a questo studio pubblicato la scorsa settimana sulla rivista European Journal of Epidemiology che ha permesso di individuare quali caratteristiche e quali patologie preesitenti contribuiscono a un rischio aumentato di morte per COVID-19. La forza di questo tipo di analisi è che si basa sull’osservazione dello stato di salute e di malattia delle persone lungo un periodo di tempo precedente all’ospedalizzazione e include anche dati che riguardano la condizione socioeconomica, lo stile di vita e il grado di esposizione all’inquinamento atmosferico. Questo permette una comprensione più approfondita dei motivi che portano a sviluppare forme gravi della malattia COVID-19 che conducono alla morte, rispetto a quanto non sia possibile fare dai dati raccolti durante l’anamnesi al momento del ricovero.

«In Italia c'è una estrema frammentazione dei sistemi informativi sanitari. Per impedire il linkage tra fonti di dati spesso viene addotto il motivo del trattamento di dati sensibili, ma pare un pretesto visto che in tutti gli altri paesi questi linkage vengono regolarmente effettuati rispettando il GDPR», ha infine commentato Vineis, che è membro del Comitato Etico del Centro Internazionale per le Ricerche sul Cancro dell'OMS.

Il record linkage non è l’unica strada che sembra difficile da percorrere in tempo di pandemia in Italia. L’Associazione Italiana di Epidemiologia (AIE) chiede da Novembre 2020 all’Istituto Superiore di Sanità di avere accesso ai dati aggregati sull’epidemia (tamponi, casi, ospedalizzati, terapia intensiva, decessi) per fasce di età e per regione, ma senza successo. Quei dati permetterebbero diversi tipi di analisi, tra cui una valutazione sull’efficacia delle restrizioni imposte nelle diverse regioni da quando è stato introdotto il sistema con tre fasce di rischio (colori). «Alla fine si è costituito un gruppo volontario di 12 Regioni che hanno messo a disposizione di AIE i dati da fine settembre per fasce di età», spiega Salmaso. Il gruppo di lavoro produce ogni settimana un’analisi dell’andamento della seconda ondata per gruppi di età, pubblicata qui su Scienza in rete. Nelle ultime due settimane, ad esempio, si osserva in diverse regioni un aumento dell’incidenza nelle classi di età più giovani dai 3 ai 24 anni, forse collegato alla diffusione delle nuove varianti del virus, in particolare alla B.1.1.7, la cosiddetta “variante inglese”. «Queste analisi, molto semplici, servono a seguire l'andamento della pandemia tra le persone di età diverse su cui le restrizioni adottate dal governo hanno impatti diversi», commenta ancora Salmaso e aggiunge «rispetto alla sorveglianza nazionale, ciascuna delle regioni partecipanti può commentare i propri dati e osservare i dettagli dell'incidenza per età nelle altre e questo è di sicuro un valore aggiunto».

I dati per età sono disponibili invece per tutti i cittadini del Regno Unito. Public Health England, l’agenzia che si occupa di salute pubblica, li pubblica qui per ciascuna local authority (5000-6000 abitanti). Si può quindi scegliere la regione di Londra e guardare qual è stata l’incidenza per età durante la terribile ondata di fine dicembre inizio gennaio e scoprire che il 4 gennaio variava da circa 370 casi ogni 100 000 bambini tra 0 e 4 anni fino a picchi di oltre 1500 casi ogni 100 000 giovani tra i 20 e i 24 anni. I dati relativi alle medie mobili settimanali dall’11 febbraio al 20 febbraio organizzati in 19 fasce di età (di ampiezza 5 anni) posso essere scaricati in tre diversi formati.

La comunità degli epidemiologi non è l’unica che ha cercato di avere accesso ai dati per poter collaborare e fare ricerca sull’epidemia. Anche altre componenti del mondo scientifico italiano hanno fatto pressione sulle istituzioni. Il primo successo è arrivato con l’accordo siglato a novembre con l’Accademia Nazionale dei Lincei, presieduta dal fisico Giorgio Parisi e vincitore della medaglia Dirac e della medaglia Boltzmann. Ma a che punto siamo con l’attuazione? «L'accordo è in fase di applicazione ed è stato nominato un gruppo che se ne occuperà», ha risposto Parisi.

Un altro gruppo che ha fatto pressione perché venissero condivisi i dati è l’associazione Lettera 150 costituita da circa 300 professori universitari italiani e coordinata dal giurista Giuseppe Valditara. All’inizio di gennaio Lettera 150 ha presentato un’istanza di accesso ai dati, diritto garantito dal Freedom of Information Act, relativamente ai 21 indicatori con cui viene stabilito il colore delle Regioni ed è in attesa di ricevere una risposta. L’associazione chiede di conoscere i dati relativi alla capacità di monitoraggio dell’epidemia, di accertamento diagnostico e di tracciamento dei contatti e quelli relativi alla trasmissione del contagio in forma disaggregata. «Il contributo che potremmo dare se coinvolti riguarderebbe diversi aspetti. Non solo la formulazione di modelli in grado di tracciare i possibili scenari futuri dell’epidemia, ma anche l’individuazione dei luoghi a più alto rischio di contagio o di altri dati interessanti che ancora non raccogliamo» commenta Pierluigi Contucci, fisico matematico, professore all’Università di Bologna e membro dell’associazione Lettera 150.

Dal Ministero della Salute non è arrivata risposta e dunque l’associazione ha fatto ricorso al Tar del Lazio. Lunedì, poi, Lettera 150 ha lanciato un appello diretto al nuovo presidente del consiglio, Mario Draghi, perché «passi dalle parole ai fatti» sul tema della trasparenza delle istituzioni che ha indicato come valore fondamentale nel suo primo discorso alla Camera dei Deputati la scorsa settimana.

Sempre a Draghi si sono rivolti anche gli animatori della campagna #datibenecomune, promossa dall’associazione Ondata e poi sottoscritta da decine e decine di associazioni, tra cui anche Scienza in rete. Altre istanze di accesso agli atti sono state inoltrate da parte di alcuni data journalist italiani. Alcune di queste sono andate a buon fine, come quelle sui dati dei contagi tra studenti e lavoratori della scuola da Wired Italia al Ministero dell’Istruzione e che ha portato a questa analisi. Altre, come quelle relative ai dati su età e comune di residenza dei contagiati o alle informazioni raccolte con il tracciamento dei contatti inoltrate all’Istituto Superiore di Sanità, sono invece cadute inascoltate.

Infine c’è il bando pubblicato all’inizio di maggio del 2020 dal Ministero dell’Università e della Ricerca per assegnare 21 milioni di euro del Fondo Integrativo Speciale per la Ricerca a progetti sulla COVID-19. I risultati erano attesi per luglio, tuttavia a oggi, quasi otto mesi dopo, non c’è alcuna notizia sull’esito del processo di valutazione e neanche un euro di quei 21 milioni è stato speso.

Finora l'Istituto Superiore di Sanità si è avvalso esclusivamente della collaborazione della Fondazione Bruno Kessler di Trento, che, tra le altre cose, è responsabile della stima dell'indice di riproduzione netto dell'epidemia a livello regionale che viene incluso nei rapporti settimanali del monitoraggio della fase 2 pubblicato dal Ministero della Salute (qui l'ultimo) e ha progettato e analizzato i risultati delle indagini rapide sulle varianti condotte nelle ultime settimane, producendo questa relazione tecnica.

«La ricerca scientifica è un’impresa collettiva. Scommettere su poche persone, per quanto ben selezionate, è estremamente rischioso e poco lungimirante», commenta Contucci e aggiunge «a mio avviso c’è urgente bisogno di un grande investimento nella costruzione di un sistema digitale nazionale di raccolta dati che funzioni in modo tempestivo. Per immettere dati di qualità servono persone dedicate al compito, non è pensabile che il personale sanitario, pressato dall’emergenza, assolva anche a questo compito»

Per ricevere questo contenuto in anteprima ogni settimana insieme a sei consigli di lettura iscriviti alla newsletter di Scienza in rete curata da Chiara Sabelli (ecco il link per l'iscrizione). Trovi qui il testo completo di questa settimana. Buona lettura, e buon fine settimana!


Scienza in rete è un giornale senza pubblicità e aperto a tutti per garantire l’indipendenza dell’informazione e il diritto universale alla cittadinanza scientifica. Contribuisci a dar voce alla ricerca sostenendo Scienza in rete. In questo modo, potrai entrare a far parte della nostra comunità e condividere il nostro percorso. Clicca sul pulsante e scegli liberamente quanto donare! Anche una piccola somma è importante. Se vuoi fare una donazione ricorrente, ci consenti di programmare meglio il nostro lavoro e resti comunque libero di interromperla quando credi.


prossimo articolo

Why have neural networks won the Nobel Prizes in Physics and Chemistry?

This year, Artificial Intelligence played a leading role in the Nobel Prizes for Physics and Chemistry. More specifically, it would be better to say machine learning and neural networks, thanks to whose development we now have systems ranging from image recognition to generative AI like Chat-GPT. In this article, Chiara Sabelli tells the story of the research that led physicist and biologist John J. Hopfield and computer scientist and neuroscientist Geoffrey Hinton to lay the foundations of current machine learning.

Image modified from the article "Biohybrid and Bioinspired Magnetic Microswimmers" https://onlinelibrary.wiley.com/doi/epdf/10.1002/smll.201704374

The 2024 Nobel Prize in Physics was awarded to John J. Hopfield, an American physicist and biologist from Princeton University, and to Geoffrey Hinton, a British computer scientist and neuroscientist from the University of Toronto, for utilizing tools from statistical physics in the development of methods underlying today's powerful machine learning technologies.