L’analisi delle sequenze temporali della frazione dei contagiati osservati rispetto alla popolazione della provincia rivela che 106 delle 107 province presentano una diminuzione del tasso di crescita. Manca all’appello solo la provincia di Asti (vedi figura 1).
Figure 1. Sequenza del numero dei contagiati osservati nella provincia di Asti. Il miglior fit con un modello logistico generalizzato è sovrapposto ai dati.
Questo è in linea col fatto che la regione che si trova più arretrata rispetto alle altre nell’evoluzione dell’epidemia è il Piemonte, come mostrato in figura 2.
Figure 2. Sequenza del numero giornaliero di contagiati osservati nel Piemonte. Il miglior fit con un modello logistico generalizzato (derivata) è sovrapposto ai dati.
Dalla parte opposta abbiamo l’Umbria che è la regione più avanti nell’evoluzione dell’epidemia (vedi figura 3), pur avendo iniziato dopo nel tempo, per esempio rispetto alla Lombardia (vedi figura 4).
Figure 3. Sequenza del numero giornaliero di contagiati osservati in Umbria. Il miglior fit con un modello logistico generalizzato (derivata) è sovrapposto ai dati.
Figure 4. Sequenza del numero giornaliero di contagiati osservati nella Lombardia. Il miglior fit con un modello logistico generalizzato (derivata) è sovrapposto ai dati.
I risultati di tutte le regioni possono essere scaricati qui. Nelle figure precedenti, alle curve del numero di nuovi contagiati osservati giornalmente, sono stati sovrapposti i fit con il modello logistico generalizzato. Per ciascuna regione, abbiamo calcolato il valore massimo del modello ed il suo valore finale. Sulla base di queste due grandezze, abbiamo effettuato il clustering gerarchico (vedi nota metodologica), che permette di raggruppare le 21 regioni in gruppi in modo che la variabilità delle due grandezze considerate all’interno dei gruppi sia (localmente) minimizzata.
In figura 5 viene rappresentato il dendrogramma ottenuto tramite questa analisi. Si ha chiara evidenza della presenza di quattro gruppi, composti rispettivamente da:
Le regioni del primo gruppo sono caratterizzate da grandi valori di entrambi le grandezze considerate.
Figure 5. Dendrogramma ottenuto tramite il clustering gerarchico a partire dai dati per ciascuna regione del valore massimo e di quello finale del modello logistico generalizzato usato nel fit alle curve del numero giornaliero dei contagiati osservati.
Questi valori scendono passando dapprima al secondo gruppo e quindi al terzo. Le grandezze sono intuitivamente legate alla diffusione massima ed attuale dell’epidemia. Nel primo gruppo ci sono quindi le regioni che hanno subito una gran diffusione dell’epidemia che si trova ancora in una fase di rilevante attività. Nel secondo gruppo si è avuta una grande attività, ma ci si trova in una fase più avanzata dell’epidemia rispetto alle regioni del primo gruppo. Nel terzo gruppo si trovano le regioni che hanno avuto una diffusione ancora più bassa e che si trovano attualmente in una fase molto avanzata dell’epidemia. Infine, nell'ultimo gruppo c'e' la Valle D'Aosta che ha avuto una grande diffusione dell'epidemia, ma che si trova ora in una fase avanzata.
Giovanni Sebastiani
Istituto per le Applicazioni del Calcolo "Mauro Picone", Consiglio Nazionale delle Ricerche