fbpx I dati non nascondono e non dicono, ma indicano | Scienza in rete

I dati non nascondono e non dicono, ma indicano

Primary tabs

Curva dei contagi Covid 19 in vari paesi, Our World in Data.

Tempo di lettura: 7 mins

Prefazione al volume di Armando Massarenti e Antonietta Mira, La pandemia dei dati. Ecco il vaccino. Mondadori Università, Milano 2020.

Specialmente in quest’ultimo anno siamo stati bombardati da dati che ci arrivano da tutte le parti, dati che vengono tirati per la giacchetta dai commentatori che arrivano a conclusioni del tutto diverse gli uni dagli altri, lasciandoci nella completa incertezza.

Si ha l’impressione che aumentando il flusso di dati non aumenti la conoscenza, ma solo la confusione. Sembra quasi un paradosso, ma non lo è: è la prova che è solo un’illusione pensare che i dati siano trasparenti, che la loro conoscenza ci permetta di ricostruire direttamente la realtà, senza mediazioni. Non è così: qualcuno diceva, parafrasando Eraclito, che i dati sono come il Dio il cui seggio risiede a Delfi: non nascondono e non dicono, ma indicano. I dati hanno bisogno di essere interpretati utilizzando un quadro concettuale opportuno che si basa su due pilastri: la matematica e la probabilità, due grandi sconosciute, almeno nel nostro Paese.

Leggendo i giornali, mi sono convinto che la scuola italiana non insegna le moltiplicazioni e le divisioni. Come è ben noto, nelle scuole elementari, medie e superiori vengono fatte moltiplicazioni e divisioni in tutte le salse, con due, tre, quattro cifre, con e senza virgola. Tecnicamente gli studenti sanno farle; sfortunatamente nelle classi non s’insegna la cosa più importante: quando e perché fare queste operazioni.

Consideriamo per esempio un tema scottante: i morti per incidenti stradali. Il numero annuo ammonta a circa 3000 vittime: una cifra che da un lato è spaventosa, ma che in fondo non suscita particolari emozioni; 3000 cadaveri sdraiati in fila negli obitori sono una scena che trascende la nostra immaginazione; infatti, se leggessimo che in un anno ci sono stati 6000 morti per incidenti stradali la reazione sarebbe stata più o meno la stessa: 30 anni fa erano 8000, adesso sono 3000, ma non se n’è accorto nessuno. Il numero totale di morti non fa certo notizia. Al contrario, troviamo spesso articoli col titolo in grassetto del tipo «tragico ponte: 30 morti in quattro giorni». Una trentina di morti concentrati in quattro giorni sono evidentemente una cifra che colpisce di più l’immaginazione, in quanto più rapportabile a una realtà familiare: «30 morti, ma sono circa il numero di alunni della mia classe di liceo».

Cosa c’entra la matematica con tutto ciò? Una semplice divisione ci direbbe che i 3000 morti annui corrispondono a circa 8 morti al giorno e quindi a una trentina di morti ogni quattro giorni. Il ponte in realtà non era stato particolarmente tragico o lieto: 30 morti erano il normale tributo di sangue che ogni quattro giorni paghiamo all’automobile e al mito della velocità. Da quando ho l’età della ragione, ho sempre letto articoli su tragici weekend in cui il numero di morti stava vicino alla media, ma non ho mai visto la lettera di un lettore che protestasse: segno evidente dell’incomprensione generale e del disinteresse che circondano il significato reale di quei 3000 morti l’anno.

Un errore che si trova spesso sulla stampa è la confusione tra milioni e miliardi. Molto spesso milioni o miliardi sono parole interscambiabili quando sono usate in un contesto non familiare (al contrario, siamo ben sensibili alla differenza fra vincere un milione o un miliardo al Totocalcio). Se leggiamo che la Russia ha importato 10 milioni oppure 10 miliardi di quintali di grano e non ci ricordiamo quale è la produzione di grano della Russia, non abbiamo pietre di paragone: le due quantità (10 milioni o 10 miliardi di quintali di grano) sono entrambe concepite come «tanto» grano: i grandi numeri hanno qui solamente un significato retorico. Se invece riportassimo il totale al consumo individuale, scopriremmo che le due cifre corrispondono rispettivamente a 7 chili e a 7 tonnellate a testa e che quindi solo la prima è verosimile e l’altra deve essere evidentemente errata. Sfortunatamente questo calcolo non viene quasi mai effettuato né dal giornalista né dal lettore.
Bisognerebbe decidere in maniera autonoma di fare una divisione, ma le divisioni le abbiamo fatte solo su comando, mai di nostra spontanea volontà, sappiamo farle ma non sappiamo decidere di farle.

La radice di questi mali sta nell’insegnare la matematica mediante problemi da risolvere avulsi dalla realtà e che hanno come unica finalità l’applicazione acritica di metodi di calcolo. Qualcuno ci fa una domanda e noi dobbiamo trovare la risposta. Di conseguenza, se, usciti dalla scuola, nessuno ci pone dei problemi quantitativi già formulati, la matematica rimane del tutto inutilizzata.

L’impostazione corretta sarebbe considerare la matematica (come tutte le altre scienze) come uno strumento che serve all’individuo per aumentare la propria comprensione del mondo. Matematica e scienza dovrebbero essere al servizio della nostra curiosità: senza questi strumenti, le domande che ci poniamo restano senza risposta e, alla lunga, finiamo per non porci più nessuna domanda: smettiamo di essere curiosi, d’interrogarci e quando ci troviamo davanti a dei dati nuovi aspettiamo che qualcuno ci dia la chiave interpretativa.

Quando poi entrano in gioco le probabilità è difficilissimo mantenere un comportamento razionale, specialmente se si tratta di probabilità piccole. Anche i numeri piccoli vengono spesso interpretati come se avessero puramente un significato retorico e quindi i comportamenti sono arbitrari.

Facciamo un esempio: cosa dobbiamo fare quando un evento avverso ha una probabilità bassa? Se veniamo a conoscenza che un dato comportamento implica una probabilità su un milione di morire, la reazioni si divaricano. C’è chi dice subito «Io non voglio rischiare comunque di morire e quindi questa cosa non la faccio», un altro invece può dire: «che mi importa, la probabilità che io muoia è piccolissima». La risposta più ragionevole sarebbe: «Vediamo se posso fare qualcosa per abbassare questa probabilità». Ma la risposta può dipendere anche dal contesto. Per essere concreti supponiamo che andare in macchina da Roma a Canazei implichi un rischio di uno su un milione di morire a causa un incidente stradale (non so quale sia il valore esatto, ma non deve essere tanto lontano da questo). La reazione giusta non è quella di non andare a Canazei perché è troppo pericoloso, né quella di andarci a 170 km/ora perché tanto la probabilità di morire è piccola, ma semplicemente andarci guidando con attenzione e prudenza. Non siamo abituati a ragionare sulle probabilità basse. È difficile capire che anche le probabilità basse di un evento negativo devono essere regolamentate non per il rischio personale, ma perché rilevanti a livello sociale.

Inoltre, non siamo abituati a guardare i dati tenendo conto della loro significatività statistica. Se si tira una moneta e viene testa tre volte di seguito, non abbiamo motivi di pensare che la moneta sia truccata, se invece viene testa dieci volte di seguito incominciamo ad avere forti dubbi sull’integrità della moneta. Sfortunatamente nel mondo reale le situazioni non sono così chiare. Per esempio, nei primi sei mesi del 2019 i morti per incidente erano stati 1505 contro i 1483 del 2018, ovvero 18 di più: la notizia finì su tutti i giornali: «Istat: aumentano i morti». Tuttavia, una variazione così piccola non era statisticamente significativa (per essere significativa doveva essere 3-4 volte più grande): infatti alla fine dell’anno i morti erano calati di 161 unità, senza (temo) che nessun giornale abbia notato la scarsa significatività della notizia data sei mesi prima.

Tutte queste difficoltà sono diventate sempre più importanti in questo ultimo anno durante il quale dobbiamo utilizzare strumenti matematici e probabilistici che spesso ci sfuggono per capire veramente come si sta sviluppando la pandemia e quale potrebbe essere il suo impatto sulle nostre vite.

Questo libro, scritto in un linguaggio molto accessibile e scevro da tecnicismi, è un prezioso aiuto in quanto, guidandoci per mano, ci mostra come affrontare la «pandemia» di dati che ci circonda e come usare strumenti matematici, quali il teorema di Bayes o la definizione di probabilità di de Finetti, per poter arrivare a conclusioni praticamente certe in un mondo dominato dall’incertezza. 

Capire come utilizzare questi strumenti ci sarà utile non solo in questa triste occasione, ma è un acquisto per sempre. Il lettore guadagnerà quelle competenze di base che delineano una forma di intelligenza e di pensiero critico quanto mai necessarie per i cittadini di oggi e di domani.

Per una ventina d’anni ho insegnato all’università «Calcolo delle Probabilità» e mi sono sempre stupito di come sia quasi sconosciuto in Italia un pensatore profondo come de Finetti, che ha formulato la migliore definizione della parola probabilità. Può sembrare un’impresa da niente, ma provateci voi a farlo: non è affatto facile; tutti pensiamo di sapere cosa sia la probabilità, ma non siamo in grado di definirla.

Uno dei tanti meriti di questo libro è di colmare questa lacuna e di spiegare in termini chiari e semplici cosa sia la definizione soggettivista di probabilità (quella di de Finetti): è un concetto facile da capire, se spiegato bene, e la sua comprensione vi dà la chiave per poter vedere il mondo sotto una luce diversa.

 


Scienza in rete è un giornale senza pubblicità e aperto a tutti per garantire l’indipendenza dell’informazione e il diritto universale alla cittadinanza scientifica. Contribuisci a dar voce alla ricerca sostenendo Scienza in rete. In questo modo, potrai entrare a far parte della nostra comunità e condividere il nostro percorso. Clicca sul pulsante e scegli liberamente quanto donare! Anche una piccola somma è importante. Se vuoi fare una donazione ricorrente, ci consenti di programmare meglio il nostro lavoro e resti comunque libero di interromperla quando credi.


prossimo articolo

Why have neural networks won the Nobel Prizes in Physics and Chemistry?

This year, Artificial Intelligence played a leading role in the Nobel Prizes for Physics and Chemistry. More specifically, it would be better to say machine learning and neural networks, thanks to whose development we now have systems ranging from image recognition to generative AI like Chat-GPT. In this article, Chiara Sabelli tells the story of the research that led physicist and biologist John J. Hopfield and computer scientist and neuroscientist Geoffrey Hinton to lay the foundations of current machine learning.

Image modified from the article "Biohybrid and Bioinspired Magnetic Microswimmers" https://onlinelibrary.wiley.com/doi/epdf/10.1002/smll.201704374

The 2024 Nobel Prize in Physics was awarded to John J. Hopfield, an American physicist and biologist from Princeton University, and to Geoffrey Hinton, a British computer scientist and neuroscientist from the University of Toronto, for utilizing tools from statistical physics in the development of methods underlying today's powerful machine learning technologies.