Home > Cronaca > Lo statistico Mazzocchi: “Ecco cosa ci dicono i numeri sull’epidemia di Coronavirus”

Lo statistico Mazzocchi: “Ecco cosa ci dicono i numeri sull’epidemia di Coronavirus”

“Crescita del contagio”, “picco epidemico”. Decessi, nuovi malati, dimessi e guariti. Oltre che naturalmente agli aggettivi “positivo” e “negativo” riferiti agli esiti dei tamponi effettuati, sul cui numero ci si interroga spesso a piani alti e come ai piani bassi. Il lessico dell’emergenza entrato in voga durante la pandemia da coronavirus è racchiuso come spesso accade in un glossario.

Parole che come mantra scandiscono la lettura dei bollettini che ogni giorno leggiamo e rileggiamo e apprendiamo nel tardo pomeriggio con le comunicazioni della Protezione Civile o in videoconferenza, collegati virtualmente con le istituzioni locali e regionali.

Questo lessico di parole e termini si incrocia quotidianamente con un sistema di numeri, dati e percentuali. Parliamo di sistemi complessi e di difficile lettura. A questi guardano l’esecutivo nazionale, le istituzioni locali, le autorità sanitarie. E a questi guardiamo anche noi, sopraffatti, talvolta da una superficialità che ci spinge inevitabilmente ad essere ottimisti o pessimisti in base all’andamento giornaliero.

Per approfondire il discorso abbiamo intervistato uno statistico riminese, il Prof. Mario Mazzocchi, che ogni giorno cerca di analizzare la miriade di numeri che vengono comunicati al Paese e che inquadrano la situazione a livello nazionale, regionale, provinciale e spesso addirittura comune per comune. Mazzocchi – che pubblica numerosi report sulla sua pagina Facebook – premette di “essere uno statistico e non un medico esperto del reale problema sanitario“. Una premessa necessaria per capire di che cosa stiamo parlando.

Mazzocchi è Professore di Statistica Economica all’Università degli Studi di Bologna e responsabile dell’Unità riminese del Dipartimento di Scienze Statistiche dell’Alma Mater.

Prof. Mazzocchi, ogni giorno ad orari cadenzati aspettiamo i bollettini con i dati che riportano i nuovi casi accertati, le guarigioni, i decessi. Sia a livello locale, che regionale che nazionale. Da una parte rischiamo di fare confusione, sospesi tra ottimismo e pessimismo alla minima variazione al rialzo o al ribasso. I numeri, però sono complessi e solo apparentemente di facile interpretazione. Specie in un momento come questo, in cui l’isolamento crea aspettative che solo con il tempo potranno concretizzarsi. Conosciamo i pareri dei virologi, ma come lavora uno statistico in questi casi?

“Premetto che io sono uno statistico economico, quindi guardo al dato senza competenze mediche ed epidemiologiche. Detto questo, noi statistici diamo per scontato che i dati siano “rumorosi”, cioè non puliti, e le prime domande che ci poniamo riguardano proprio la qualità del dato. Nello specifico, sui dati giornalieri dovremmo evitare di costruire sia psicosi che facili entusiasmi. “Misurare” è sempre difficile, ma lo è in particolare in questa occasione, con dati che vengono raccolti quasi in tempo reale da una varietà di strutture sanitarie sparse sul territorio e in una situazione di emergenza. Per questo, non c’è da stupirsi se un giorno un dato viene rilevato in ritardo e magari finisce nell’aggiornamento del giorno seguente. Per questo tipo di problema, ad esempio, gli statistici tendono ad utilizzare una media su più giorni piuttosto che un singolo giorno, il che attutisce notevolmente il problema dello sfasamento tra un giorno e l’altro e permette di catturare meglio le tendenze”.

Quali sono le variabili in campo? La maggior parte di noi si limita a fare il parallelismo tra il numero dei tamponi effettuati e il numero dei casi accertati. Non è un metodo sbagliato suppongo, ma a leggere i suoi grafici e quelli dei suoi colleghi le variabili che entrano in campo sono parecchie.

“Ormai è evidente che il dato ufficiale sui casi accertati è solo una frazione del dato vero sui contagi totali e non conosciamo quale sia questa frazione… la strategia sui tamponi differisce per regione. Nelle regioni come la Lombardia, alle prese con un’epidemia più estesa, l’accesso al tampone pare più selettivo, tanto che la proporzione di tamponi positivi è quasi il 40%. In altre regioni dove l’epidemia è meno avanzata, la proporzione di tamponi positivi è molto più bassa. Ad esempio, l’Emilia-Romagna ha meno di un terzo degli ospedalizzati e dei casi della Lombardia, ma effettua la metà dei tamponi e la proporzione di tamponi positivi è il 25%. Viene quindi da pensare che nelle regioni più colpite come la Lombardia sia più probabile che sfuggano contagi con sintomi assenti o non gravi, il che rende difficoltoso qualsiasi ragionamento sul “numero di casi accertati”. A questo punto dell’epidemia credo che le variabili da considerare con più attenzione siano quelle relative ai ricoveri, in particolare a quelle in terapia intensiva, e ai decessi.

Detto questo, è preferibile guardare tutti questi dati nel loro insieme, piuttosto che fermarsi su quello peggiore o su quello migliore, come spesso fanno i mass media. Il dato sui contagi, per quanto “rumoroso” nella stima assoluta, ha mostrato segni di rallentamento praticamente in tutte le regioni nell’ultima settimana. Ora speriamo di trovare conferma nei numeri di ospedalizzati e decessi, che ovviamente sono di almeno 6-7  giorni in ritardo rispetto al contagio”.

I virologi, negli ultimi giorni parlano di dati moderatamente ma costantemente “favorevoli”. Lei usa spesso l’espressione, “Bicchiere mezzo pieno”. C’è qualche correlazione?

“Io ho cominciato a guardare questi dati, che come detto non competono strettamente i miei interessi di ricerca, perché trovo fuorviante la comunicazione del dato giornaliero decontestualizzato e spesso male interpretato. Voglio chiarirmi le idee e cercare di capire se tra tante statistiche giustamente preoccupanti ci fossero segnali che anticipassero un rallentamento dell’epidemia. Questi segnali ci sono da una settimana e gli epidemiologi lo confermano, anche se il miglioramento è lento.

Volevo inoltre capire se le misure restrittive producessero risultati, confrontando i dati regionali. Quando ho cominciato a fare questo esercizio ho visto che contestualizzare il dato mi rassicurava… e così ho deciso di condividerlo con i miei amici, evidenziando i dati più incoraggianti”.

Altra parola ricorrente è “trend”. Ricordiamo che parliamo di modelli statistici, nulla a che vedere con il comportamento di un virus e quindi con la possibilità di avere la sfera di cristallo. Intanto, però, possiamo limitarci a una domanda. Che cosa ci dicono i numeri di questa epidemia, guardando al passato e al futuro?

“Quando si usa il termine “trend negativo” mi viene in mente Nanni Moretti in Palombella Rossa… a lui non piaceva, ma in statistica la parola “trend” si riferisce proprio al desiderio di utilizzare più osservazioni nel tempo per “intuire” quelle che arriveranno nei prossimi giorni. Potremmo ovviamente sostituirla con tendenza. Detto questo, gli statistici fanno continuamente previsioni, le fanno anche quelli dell’Istituto Superiore di Sanità e ci sono diversi modelli e tante variabili in gioco, per cui si accetta un grande margine di incertezza e si tende a non comunicare ufficialmente previsioni che poi possono rivelarsi errate. Io personalmente non ho applicato modelli previsivi veri e propri, ma al momento le tendenze che osservo e le previsioni di colleghi sembrano suggerire che entro un paio di settimane dovrebbe esserci un primo miglioramento visibile anche senza analisi particolarmente complesse, mentre per un ridimensionamento vero dell’emergenza mi aspetto che dovremo attendere le prime settimane di maggio… però lo ripeto, queste sono elucubrazioni di uno statistico economico e  ci sono aspetti fondamentali da tenere in considerazione, ad esempio il rispetto delle norme da parte di tutti i cittadini, che si sta rivelando il fattore determinante per contrastare l’epidemia”.

Forse potrebbe apparire una richiesta esagerata, ma ci proviamo. Un consiglio per poter leggere i dati che ci arrivano ogni giorno in maniera approfondita?

“Difficile, effettivamente. Lascerei perdere prima di tutto i dati provinciali, troppo “ballerini”. A questo punto non darei neppure troppo peso al dato sul totale dei casi accertati, mentre i dati davvero importanti sono quelli che riguardano i ricoveri, le dimissioni e purtroppo i decessi. Poi, come dicevo, sarebbe bene mediare l’ultimo dato con i 2-3 precedenti e cercare di andare indietro nel tempo per i confronti, almeno di 10-12 giorni. Infine guardare bene al dato della Lombardia e del Veneto, le regioni che sono partite prima e che quindi si spera migliorino prima, confrontandole con regioni importanti dove l’epidemia è arrivata dopo, quando le misure restrittive erano già in atto, come la Campania e la Puglia. Se Lombardia e Veneto migliorano e le altre regioni rimangono stabili o almeno non peggiorano troppo, allora secondo me possiamo vedere la luce in fondo al tunnel”.

Scroll Up