Dataninja Magazine - Contenuti e risorse per capire il mondo con i dati

Leggere i dati · Open Data

I dati della pandemia: tra terza e quarta ondata

Dopo tre ondate e mezzo di pandemia e in vista di una quarta è sempre più evidente che quantità, qualità e tempestività dei dati sono fattori cruciali per prendere decisioni efficaci, sia a livello istituzionale sia individuale.
15 luglio 2021
11 minuti

Questa è la seconda estate in compagnia del Sars-CoV-2 e saper leggere i dati che descrivono l’andamento della pandemia non è mai stato così importante. Su questo magazine ci siamo occupati a più riprese del tema, fin da quando sembrava un problema esclusivamente cinese, poi per approfondire i limiti dei dati italiani e infine per fornire qualche strumento in più per capirli meglio. L’obiettivo è sempre quello di non farsi confondere da una comunicazione quotidiana fatta sempre più di dati, grafici e tabelle e di comprendere il racconto di una realtà caratterizzata dall’incertezza.

Si conosce solo ciò che si misura

L’evoluzione della pandemia da Sars-CoV-2 è ancora in pieno svolgimento in tutto il mondo, ma molte cose sono cambiate da quando è stato promulgato lo stato di emergenza tutt’ora in corso in Italia, prime fra tutte lo sviluppo di numerosi vaccini sicuri ed efficaci e l’emergere di varianti più contagiose del virus originale. Il panorama dei dati che descrivono la situazione pandemica si è arricchito notevolmente: non più solo i positivi, i malati (di COVID-19), i ricoveri e i decessi, ma anche i vaccini acquistati, quelli consegnati, le persone vaccinate e ancora le varianti del virus in circolazione e i relativi contagi. Eppure le basi metodologiche con cui oggi affrontiamo questo fenomeno non sono cambiate.

Per conoscere l’andamento della pandemia, l’efficacia delle campagne di vaccinazione e l’evoluzione del virus bisogna misurare una lunga serie di grandezze con una gran varietà di strumenti e di protocolli di misurazione, conoscendone i punti di forza e gli inevitabili limiti. La raccolta e l’analisi dei dati prodotti da queste misurazioni permettono di costruire teorie e modelli per capire come evolve il fenomeno e per sviluppare strategie pratiche (la ricerca scientifica). Messi in campo gli interventi ritenuti necessari e adeguati (l’azione politica di un governo, ma anche le nostre decisioni quotidiane individuali) si procede quindi alla misura del loro impatto (il monitoraggio) per poter prendere ulteriori decisioni, sempre più mirate e consapevoli, e per intervenire tempestivamente al cambiare della situazione.

Alla base di questo processo tutt’altro che semplice e lineare ci sono sempre loro, i dati, che rappresentano il mondo, ma anche le nostre convinzioni e i nostri pregiudizi su di esso. Dati che da una parte vanno comunicati, raccontati e spiegati e dall’altra vanno trovati, letti e capiti, in un dialogo continuo tra produttori, mediatori e consumatori, che bisogna imparare a sostenere senza cadere in errore.

Quantità, qualità e tempestività dei dati

Le decisioni che sono alla base di una misura sono cruciali, perché da esse dipende la qualità dei dati prodotti e, in ultima analisi, la loro utilità nel guidare azioni efficaci ed efficienti. E più il fenomeno è complesso più queste decisioni sono difficili.

I dati non sono tutti uguali. I più importanti e preziosi sono definiti primari, prodotti direttamente dal processo di misura adottato. Prendiamo il numero dei contagi come esempio, ormai sappiamo bene come si misura: operatori sanitari effettuano un test diagnostico alle persone che accettano di sottoporsi al tampone (molecolare o antigenico). Il dato primario in questo caso è l’insieme di informazioni associate al singolo tampone e descritte da uno schema dati deciso a priori e condiviso: tipologia di tampone, luogo, data e orario in cui è stato raccolto, luogo, data e orario in cui è stato analizzato, informazioni anagrafiche della persona testata, sue condizioni di salute pregresse, esito dell’analisi, data e orario di invio delle informazioni al sistema centrale e così via.

Il numero dei positivi è, invece, un dato derivato, ottenuto semplicemente contando i soli tamponi positivi. Anche il numero di persone positive per fascia d’età è un dato derivato, si ottiene contando le persone con tampone positivo separatamente per fascia d’età. Così come il numero di nuove persone positive al giorno o per territorio. Queste operazioni di aggregazione dei dati permettono di ottenere molte informazioni utili, ad esempio capire quando le cose stanno migliorando o peggiorando, ma sono operazioni a senso unico che non permettono di risalire ai dati primari.

In Italia, così come nella maggior parte dei paesi, i dati primari come quelli sui contagi o sui vaccini non sono pubblici. Non lo sono nemmeno i metadati, ovvero la descrizione degli schemi dati usati per la raccolta. A parte l’istituzione titolare dei dati che materialmente li produce o li raccoglie, come il Ministero della Salute o l’Istituto Superiore di Sanità, solo pochi altri soggetti possono accedervi direttamente, a fronte di un contratto siglato da entrambe le parti. Alcuni dati aggregati sono, invece, pubblicati regolarmente: sono per esempio rilasciati come open data dalla Protezione Civile e dalla Presidenza del Consiglio dei Ministri o altre fonti ufficiali (Ministero della Salute, Agenas, Regioni). Ma sono dati aggregati, appunto, che non contengono tutte le preziose informazioni originali.

Vaccini e varianti

L’accesso a dati primari di qualità è condizione imprescindibile per la ricerca scientifica, soprattutto in ambito epidemiologico, in cui la loro raccolta non è affatto banale e spesso avviene in piena emergenza. La famosa strategia delle tre T (testare, tracciare, trattare) mette al primo posto proprio la misura del contagio, quindi la produzione di dati da usare per capire e decidere.

Nell’ambito della campagna vaccinale nazionale, per esempio, sapere esattamente dove, quanto e chi si sta vaccinando è fondamentale per monitorare il raggiungimento degli obiettivi del piano. I dati epidemiologici provenienti dall’Inghilterra e da Israele sull’effetto della vaccinazione di massa mostrano quanto i vaccini che usiamo siano efficaci nel mitigare la severità dei sintomi della malattia COVID-19, soprattutto nei soggetti notoriamente più a rischio, e quindi nel limitare la pressione sugli ospedali. I dati dell’Istituto Superiore di Sanità sembrano confermare anche da noi la mitigazione dei sintomi nei soggetti parzialmente e completamente vaccinati, grazie anche al grande ruolo che ha l’età nella strategia di vaccinazione e nell’insorgere di forme gravi della malattia.

Spiegazione tanto semplificata, quanto accessibile, di come funziona un vaccino. Fonte originale: 幾加乘.

Purtroppo siamo ancora lontani da una copertura vaccinale completa della popolazione, in Italia, ma anche e soprattutto nel resto del mondo, e un nuovo aumento dei contagi, che si sta già registrando un po’ ovunque in Europa, si tradurrà realisticamente in un nuovo aumento di ricoveri e di decessi, anche se molto più contenuto rispetto alle ondate precedenti grazie ai vaccini già somministrati e in somministrazione nelle prossime settimane. Un fatto importante nella strategia di abbattere la curva che abbiamo imparato a conoscere.

Perché gli attuali vaccini, progettati e realizzati l’anno scorso, hanno un’efficacia differenziata nel limitare il contagio e la severità dei sintomi? Perché ormai non si confrontano più con il virus dell’anno scorso, ma con varianti che hanno caratteristiche differenti, capaci di trasmettersi molto più facilmente e rapidamente da un soggetto infetto a uno sano.

Da dove vengono queste varianti? Dal meccanismo naturale di replicazione dei virus, che non produce di volta in volta copie identiche, ma introduce in ogni replica piccole modifiche che nella maggior parte dei casi sono neutre, quindi non cambiano sostanzialmente le caratteristiche macroscopiche, ma che in alcuni casi si traducono in capacità differenti, come quella di causare malattie un po’ più gravi oppure di trasmettersi con un po’ più di facilità da individuo a individuo.

Tra tutte le sequenze genomiche analizzate e caricate nel database GISAID a partire dall’inizio di quest’anno, la percentuale di varianti Alpha è fortemente diminuita da quasi il 100% a pochi punti percentuali, in particolare in Europa (linea blu). Fonte: GISAID.

Come tracciamo queste varianti? Sempre con la strategia delle 3T: test (in questo caso si tratta di sequenziare il genoma del virus raccolto con un tampone) e tracciamento. Nel caso delle varianti il loro tracciamento è molto importante per due motivi: da una parte permette di stimarne la prevalenza in una popolazione infetta, quindi la percentuale di positivi a ogni variante, dall’altra di identificare e caratterizzare tempestivamente nuove varianti potenzialmente più pericolose delle precedenti. Grazie soprattutto al grande sforzo dell’Inghilterra nel tracciare contagi e varianti sappiamo per esempio che la versione originale del virus Sars-CoV-2 (quella cinese) è stata dapprima soppiantata, in termini di prevalenza, dalla variante Alpha (quella che per un po’ abbiamo chiamato inglese), il cui primato è adesso minacciato dalla variante Delta (ex indiana).

Nello stesso periodo la percentuale di varianti Delta individuate tra le sequenze genomiche analizzate e caricate nel database GISAID è fortemente aumentata a partire da aprile, segno che è ormai la variante prevalente in Europa (linea blu). Fonte: GISAID.

A livello internazionale i dati delle sequenze genomiche delle varianti sono condivisi con tutta la comunità scientifica grazie a progetti come la GISAID Initiative e il sistema europeo di sorveglianza TESSy. In Italia l’Istituto Superiore di Sanità ha attivato la piattaforma nazionale IRIDA-ARIES nell’ambito del progetto I-Co-Gen e da maggio pubblica regolarmente un bollettino con i risultati degli studi di prevalenza delle varianti in Italia. Purtroppo in Italia si fanno e condividono pochi test in generale, sia tamponi (meno di 200 mila al giorno a fronte del quasi milione dell’Inghilterra) sia sequenziamenti, e in molte regioni i numeri sono ancora troppo piccoli per considerare già significativi questi risultati.

Quantità, qualità e tempestività dei dati sono fattori cruciali per prendere decisioni efficaci, sia a livello istituzionale sia individuale. Cosa può accadere quando i dati primari, opportunamente anonimizzati in ottemperanza alle leggi sulla privacy, sono pochi, non sono pubblici e quando nemmeno i protocolli di misura sono chiari, rigorosi, condivisi e trasparenti? Nel migliore dei casi tanta, tanta, tanta confusione, perdita di credibilità e sfiducia. Nel peggiore una limitazione dell’efficacia delle azioni collettive e individuali di contrasto alla pandemia, a volte persino il realizzarsi di ipotesi di reato e il rischio di arrivare sistematicamente in ritardo, di trovarsi ad agire sempre e solo in situazioni di massima urgenza, e di prendere così decisioni non ottimali per sé e la collettività.

Questo articolo non sarebbe stato possibile senza i quotidiani contributi di OpenCovid-mr, Lorenzo Ruffino, Vittorio Nicoletta, Moreno Colaiacovo su Twitter.

Condividi l'articolo