L'andamento della mortalità generale nel 2020 e 2021 è tra gli indicatori più sintetici dell'impatto della pandemia in un paese. In particolare, l'osservato speciale è l'eccesso di mortalità, ovvero la differenza tra il numero di decessi registrati e quello che ci si sarebbe aspettati sulla base degli anni precedenti. Tuttavia, non è semplice elaborare una stima accurata delle morti attese se la pandemia non ci fosse stata. Gli uffici nazionali di statistica, come ISTAT o il Federal Statistical Office for Germany, usano le medie grezze dei decessi osservati nei cinque anni precedenti, ma probabilmente si tratta di una sottostima, perché non considera l'invecchiamento della popolazione. In Italia nel 2020, questa stima indicherebbe un eccesso di circa 100 000 decessi, mentre un modello elaborato da un gruppo di biostatistici di Imperial College London mostra che considerando l'invecchiamento della popolazione l'eccesso sarebbe di circa 60 000 decessi. Il modello permette anche di confrontare l'impatto dell'epidemia su diversi territori, sia italiani che europei, perché comprende le stime per cinque paesi (Italia, Spagna, Inghilterra, Svizzera e Grecia) fino a livello provinciale. (Immagine di Scienza in rete.)
Mentre cresce il numero di vittime causate dalla guerra russa contro l'Ucraina, arrivano nuovi dati sulle vittime della pandemia, a ricordarci l'assurdità del periodo che stiamo vivendo con due crisi che si accavallano accompagnate dai loro bollettini quotidiani di morte e distruzione. Mercoledì scorso ISTAT e ISS hanno infatti pubblicato il settimo rapporto sull’impatto di Covid-19 sulla mortalità totale della popolazione italiana, che ha stimato un eccesso del 16% nel 2020 e del 10% nel 2021 rispetto ai decessi attesi sulla base dei cinque anni precedenti alla pandemia.
L’eccesso di mortalità è considerato uno degli indicatori più sintetici dell'impatto della pandemia su un paese. Quantifica non solo le vittime dirette dell’infezione, ma anche tutti coloro che sono morti per le conseguenze indirette dell’infezione, per esempio l’abbassamento del livello di assistenza sanitaria causato dal sovraccarico dei sistemi di cura, in particolare degli ospedali.
Stimare l’eccesso di mortalità, la differenza tra le morti registrate e quelle attese sulla base dei dati storici, è un compito tutt’altro che semplice. La domanda a cui si deve dare risposta è: «quante morti ci saremmo aspettati se non ci fosse stata la pandemia?». I dati sul passato costituiscono infatti solo una base di partenza per rispondere a questa domanda. Le stime dell’ISTAT che abbiamo citato all’inizio si riferiscono all’approccio più semplice al problema: prendere le morti osservate tra il 2015 e il 2019, calcolarne una media e confrontarle con quelle osservate nel 2020 e nel 2021.
Il limite più serio di questo approccio è che non considera l’invecchiamento della popolazione. «La popolazione italiana, come quella tedesca, è in rapido invecchiamento, e questo comporta un naturale aumento della mortalità totale di anno in anno», commenta Giacomo De Nicola, statistico alla Ludwig Maximillians Universität di Monaco in Germania, e primo autore di uno studio pubblicato all’inizio di gennaio sulla rivista AStA Wirtschafts und Sozialstatistisches Archiv in cui ha stimato l’eccesso di mortalità in Germania nel 2020 tenendo conto dell’invecchiamento della popolazione. «In Italia», prosegue De Nicola, «gli over 65 al 1° gennaio 2015 rappresentavano il 21,7% della popolazione, mentre il dato sale al 23,2% al 1° gennaio 2020. Per questo, utilizzando una media grezza per gli anni 2015-2019 porta a una sottostima della mortalità attesa per il 2020, anche in uno scenario senza Covid, dato che la popolazione di riferimento (media 2015-2019) è più giovane di quella del 2020».
Secondo le stime di De Nicola e collaboratori, l’eccesso di mortalità in Germania sarebbe pari circa all’1% (986 mila morti registrati contro i 980 mila attesi). Senza considerare l’invecchiamento della popolazione l’eccesso sarebbe pari quasi al 5% (le morti attese sarebbero circa 940 mila).
Una stima più realistica delle morti attese e, quindi, dell’eccesso di mortalità può essere utile non solo ad avere un’idea degli impatti diretti e indiretti del contagio, ma anche a valutare quanto le morti ufficialmente attribuite all’infezione dai diversi governi siano realistiche. Tuttavia, come spiega De Nicola, anche questo confronto non è semplicissimo.
«Per il 2020, le morti ufficialmente attribuite a COVID-19 in Germania sono in numero maggiore della mortalità generale in eccesso che abbiamo stimata nella nostra ricerca. Ma questo fatto non indica di per sé una sovrastima dei morti causati da Covid-19. È possibile semplicemente che le morti Covid siano state bilanciate da altri fattori, come ad esempio un'ondata di influenza più lieve del normale, e una mitigazione della mortalità generale complessiva per effetto delle misure di distanziamento (meno attività, meno incidenti, ridotta diffusione di altri virus, ecc.)».
E in Italia? In un lavoro pubblicato a fine gennaio sulla rivista Nature Communications e coordinato dal biostatistico Garyfallos Konstantinoudis dell’Imperial College London, ha elaborato un modello Bayesiano per stimare le morti attese in cinque paesi europei fino a livello provinciale, considerando anche l’invecchiamento della popolazione. Tra gli altri fattori inclusi nel modello c’è l’impatto della temperatura sulla mortalità: sappiamo che negli anni con ondate di calore molto intense si registra un aumento della mortalità totale.
Tra i cinque paesi c’è anche l’Italia e il modello stima un eccesso di mortalità per il 2020 dell’8% circa (756 mila morti osservate contro circa 700 mila attese). Una stima significativamente più bassa del 13% che ISTAT segnala nel suo rapporto e che si ottiene come media grezza dei cinque anni precedenti alla pandemia (le morti attese in questo caso sarebbero 660 mila circa). «Il fattore che influisce di più sulla differenza tra queste due stime è senz’altro l’invecchiamento della popolazione», commenta Konstantinoudis, «nel nostro modello consideriamo l’invecchiamento della popolazione settimana dopo settimana nel 2020 sulla base del trend osservato negli anni precedenti».
Il confronto tra la stima dell’eccesso di mortalità prodotta dal modello di Konstantinoudis e collaboratori con le morti attribuite a Covid-19 dal sistema di sorveglianza integrato (la linea rossa nel grafico sotto) segnalerebbe una sovrastima di queste ultime. Tuttavia, occorre osservare che la stima del modello ha un’incertezza. L’intervallo di credibilità al 95% dell’eccesso di mortalità nel 2020 va da 30 mila a 100 mila decessi circa. La stima ottenuta come media grezza coincide approssimativamente con l’estremo superiore di questo intervallo, circa 100 mila decessi, e indicherebbe invece che le 80 mila morti associate nel 2020 all'epidemia sarebbero una sottostima di quelle reali.
«Certamente l’invecchiamento della popolazione è una dinamica importante da considerare», commenta Eugenio Paci dell’Associazione Italiane di Epidemiologia, «ma l’incertezza della stima spinge a considerare la differenza rispetto alla media grezza con cautela. Le due stime sono statisticamente compatibili».
È dello stesso parere Rodolfo Saracci, ex-Presidente della International Epidemiological Association, ma aggiunge «quando si vuole valutare il rischio occupazionale, la popolazione che si studia è molto diversa da quella generale, che viene usata come riferimento. In quel caso per stimare la mortalità attesa nella popolazione a rischio per confrontarla con quella osservata si usano i tassi di mortalità per fasce di età. Questo stesso metodo, chiamato di "standardizzazione indiretta", potrebbe essere usato per tenere conto dell’evoluzione anno dopo anno della composizione per età della popolazione».
Anche l'Economist ha elaborato un suo modello, basato su un algoritmo di machine learning, per stimare l’eccesso di mortalità nei diversi paesi del mondo. Per l’Italia il modello dell’Economist stima un eccesso di mortalità molto superiore rispetto alla ricerca pubblicata su Nature Communications e anche alla media grezza: circa 115 000 morti in più nel 2020 rispetto alle attese. Questo indicherebbe che le circa 80 mila morti ufficialmente attribuite a Covid-19 in Italia sarebbero una notevole sottostima di quelle reali. Almeno ammettendo che l'unica spiegazione dell'eccesso sia riconducibile alla diffusione del contagio, cosa che non è affatto scontata.
La caratteristica distintiva dell’approccio dell’Economist è che permette di stimare l’eccesso di mortalità anche per quei paesi in cui i dati di mortalità vengono raccolti e pubblicati con molto ritardo o non vengono raccolti affatto. Per farlo il gruppo dell’Economist ha compilato una lista di più di cento indicatori nazionali che mostrano una qualche correlazione con l’eccesso di mortalità nei circa 80 paesi in cui questo è misurabile e ha usato questi fattori per allenare un algoritmo di machine learning. Questo permette di capire come gli indicatori interagiscono tra loro per determinare l’eccesso osservato. L'algoritmo ha poi stimato l’eccesso nei paesi senza dati di mortalità partendo dai valori degli indicatori nazionali. L’eccesso di mortalità stimato a livello globale al 2 marzo scorso è di quasi 20 milioni di decessi, ma con un intervallo di confidenza al 95% che si estende da 14 a 24 milioni circa. Tuttavia, diversi ricercatori si sono dichiarati scettici rispetto all’approccio, soprattutto riguardo ai paesi a basso e medio reddito. Per il Kenya, ad esempio, Economist stima 97 mila morti in eccesso contro i meno di seimila ufficialmente attribuiti a Covid-19 nel paese subsahariano. Gordon Shotwell, informatico canadese, intervistato da Nature ha detto: «Non si impara nulla allenando un modello su paesi per lo più ricchi con un'alta aspettativa di vita e applicandolo a paesi poveri con una bassa aspettativa di vita».
L’Organizzazione Mondiale della Sanità ha istituito il Technical Advisory Group on COVID-19 Mortality Assessment che ha prodotto una prima stima dell’eccesso di mortalità a livello globale nel 2020, pari a 3 milioni di decessi. A confronto, la stima dell’Economist, per il solo 2020, è di circa 5,8 milioni di decessi in eccesso. Il Technical Advisory Group dovrebbe pubblicare a breve un rapporto aggiornato.
Uno dei pregi maggiori del modello di Konstantinoudis e collaboratori è che considera la dimensione geografica e permette di fare dei confronti, almeno a livello nazionale, che altrimenti sarebbero molto difficili. Qui sotto mostriamo le morti settimanali attese secondo il modello e quelle osservate nelle 20 Regioni italiane ogni 100 000 residenti.
L'impatto dell'epidemia nel 2020 è stato molto diverso sul territorio italiano. L'eccesso di mortalità in percentuale rispetto alle morti attese sarebbe pari al 27% in Lombardia, 19% in Valle d'Aosta, 18% in Trentino Alto Adige, 17% in Piemonte, 13% in Liguria, 12% in Emilia Romagna, 10% in Veneto, 7% in Friuli Venezia Giulia. Nelle regioni del centro, le Marche registrano l'eccesso percentuale maggiore, pari al 7% circa, seguite da Toscana (4%), Umbria (1%) e Lazio (meno dell'1%). A sud e nelle isole la Puglia registra l'eccesso maggiore con il 6% circa, seguita da Sardegna (5%), Molise (3%), Sicilia (2%), Campania (1%) e Calabria (meno dell'1%). Per ora l'analisi si ferma al 2020, ma i ricercatori contano di estenderla presto a tutto il 2021.
Nota metodologica
Le visualizzazioni contenute in questo articolo sono state ottenute tramite R armonizzando e confrontando una serie di sorgenti di dati diverse. In particolare, le stime del modello di Konstantinoudis et al., Nature Communications 13, 482 (2022) sono stime settimanali (secondo lo standard ISO 8601) mentre i dati ISTAT di mortalità sono giornalieri. Abbiamo poi deciso di visualizzare morti cumulate e questo ha richiesto di ricalcolare gli intervalli di credibilità sulle stime settimanali di Konstantinoudis et al. partendo dai campioni estratti dalle distribuzioni a posteriori messe a disposizione dai ricercatori. Il supporto del primo autore del lavoro, Garyfallos Konstantinoudis, è stato fondamentale in questo processo.
Le fonti dei dati utilizzati sono le seguenti:
-
dati sulla mortalità generale: pubblicati il 3 febbraio 2022 da ISTAT si riferiscono ai decessi giornalieri registrati dal 2011 al 2021 (escluso il mese di dicembre 2021, non rilevante per la nostra analisi che si limita al 2020) in tutti i comuni italiani e per 21 diverse fasce di età (dettagliate qui) e distinti per sesso
-
dati sulla popolazione residente al primo gennaio dal 2002 al 2021 da ISTAT per fascia di età: qui quelli dal 2002 al 2019, e qui quelli relativi a 2020 e 2021
-
risultati e stime del modello descritto in Konstantinoudis et al., Nature Communications 13, 482 (2022), DOI: 10.1038/s41467-022-28157-3: qui su GitHub, qui dal sito di Imperial College London (in particolare i due file Italy.RData e poisson_samples-all). Un riferimento utile è anche questo pre-print che illustra il codice R per riprodurre i risultati del modello e l’applicazione interattiva che permette di esplorare i risultati del modello per tutte le province e i paesi considerati, per sesso e per una delle cinque fasce di età (minore di 40 anni, da 40 a 59, da 60 a 69, da 70 a 79 e superiore a 80 anni)
-
stime di eccesso di mortalità cumulato dell’Economist qui su GitHub (file export_country.csv)