Leggere i dati

Cos’è la curva epidemica e come si leggono i dati sul coronavirus

Tutto quello che c’è da sapere sui grafici che mostrano la diffusione del contagio del virus SARS-CoV-2
16 aprile 2020
8 minuti

Il contagiato è il protagonista indiscusso delle storie di epidemia e il numero di contagiati nel tempo è una delle misure fondamentali per capirne le dinamiche.

Prima dell’inizio di un’epidemia non ci sono chiaramente contagiati. Poi il loro numero comincia ad aumentare e possiamo considerare quello giornaliero (numero di nuovi contagiati al giorno) insieme a quello complessivo (numero totale di contagiati dall’inizio dell’epidemia). Alla fine l’agente epidemico sarà debellato, il numero dei nuovi contagiati al giorno arriverà a zero e quello di contagiati totali si fermerà a un valore costante.

Tra l’inizio e la fine di un’epidemia possiamo rappresentare questi numeri su un grafico cartesiano:

  • sull’asse delle ascisse (quello orizzontale) mettiamo il tempo (es. 1 giorno dall’inizio dell’epidemia, 2 giorni, 3 giorni, ecc.),
  • su quello delle ordinate (quello verticale) mettiamo il numero di contagiati (giornaliero o complessivo).

Unendo i puntini otteniamo la curva epidemica (anche detta curva dei contagi) nelle sue due versioni: quella propriamente detta (nuovi contagiati al giorno) e quella cumulata (contagiati totali).

La curva epidemica

Il conteggio giornaliero dei nuovi contagiati dal coronavirus, che nel dataset della Protezione Civile corrisponde alla colonna nuovi_positivi, partirà da zero, raggiungerà un massimo (il famoso picco) e poi scenderà nuovamente fino a zero.

L’andamento del numero dei nuovi contagiati giorno per giorno è quello atteso: partenza da zero, prima crescita esponenziale, picco, decrescita che porterà nuovamente a zero. Il rumore che si vede (tanti piccoli picchi) è in gran parte dovuto alle modalità di misura del numero di contagiati.

Il conteggio dei contagiati complessivi, che la Protezione Civile chiama totale_casi, partirà da zero, aumenterà rapidamente all’inizio, poi aumenterà sempre più lentamente, fino a raggiungere un valore costante. La posizione del cambio di regime (da una crescita veloce a una crescita sempre più lenta, il famoso flesso) corrisponde al picco della curva precedente.

L’andamento del numero complessivo di contagiati è quello atteso: partenza da zero, prima crescita esponenziale e poi un rallentamento che porterà a un valore massimo costante che non cambierà più dopo il termine dell’epidemia. A occhio non è però così facile apprezzare il rallentamento nella seconda parte della curva.

La forma specifica della curva dipende da molti fattori, molti dei quali legati alle caratteristiche proprie delle modalità di trasmissione dell’agente epidemico (es. il virus SARS-CoV-2). Per questo la curva epidemica è così importante: un conteggio può dire molto su cosa sta succedendo e fornire utili suggerimenti sulle azioni da intraprendere per controllare l’epidemia. Suggerimenti tanto più utili quanto più è affidabile il processo di misura di questi numeri, come abbiamo già discusso per il caso italiano.

Fase di crescita esponenziale

A guardar bene, l’inizio di entrambe le curve è molto simile: partono da zero e poi crescono molto rapidamente. Si tratta della famosa fase di crescita esponenziale, dovuta al fatto che il contagio si propaga liberamente con una trasmissione diretta del virus da una persona contagiata a un certo numero di persone non ancora contagiate. Questo certo numero è fondamentale, tanto da meritare un nome: numero di riproduzione di base. E un simbolo: R0.

Una rappresentazione schematica della propagazione del virus che porta a una diffusione esponenziale dell’epidemia. Fonte: theconversation.com.

Se il valore di R0 è minore di 1, l’epidemia tenderà a estinguersi da sola in un tempo più o meno lungo. Se invece è maggiore di 1 i nuovi casi saranno sempre di più rispetto ai guariti e ai deceduti (che non possono più infettare nessuno) e la propagazione dell’epidemia sarà appunto esponenziale. Possiamo considerare questo 1 come valore limite che separa le due situazioni e le attuali misure di contenimento (distanziamento sociale, parziale lockdown, uso massiccio dei dispositivi di protezione individuale) puntano proprio ad abbassare l’R0 ben sotto questa soglia.

In un contesto molto più piacevole, R0 ha un significato simile al numero medio di figli per donna, che quantifica la fertilità di una popolazione. In questo caso il valore limite è 2, perché sono necessarie due persone per generarne almeno una: sotto il 2 la popolazione tende a diminuire, sopra ad aumentare.

Scala logaritmica

Un andamento esponenziale è descritto dall’equazione y = ex, in cui e è un numero speciale, una costante universale che prende il nome di numero di Nepero (o anche di Eulero), un po’ come il Pi greco. Cresce così rapidamente che la prima parte della curva risulta molto schiacciata sull’asse delle x, quasi indistinguibile dall’asse stesso ed è quindi abbastanza scomodo da rappresentare graficamente.

Una tecnica molto usata risolve questo problema, cambiando la scala dell’asse delle ordinate. Sulle ascisse la scala rimane lineare: un intervallo di un giorno corrisponde sempre alla stessa distanza sull’asse. Sulle ordinate si usa, invece, una scala logaritmica: lo stesso numero di contagiati ha molto più spazio all’inizio, vicino a 0, mentre ne ha sempre meno man mano che si sale. Le zone basse dell’asse sono espanse, mentre quelle più alte sono compresse.

In questo modo la scala logaritmica ci consente di rappresentare graficamente un andamento esponenziale con una linea retta (perché il logaritmo di un esponenziale è semplicemente l’esponente).

In scala logaritmica la prima parte della curva del numero complessivo dei contagiati, che mostra una crescita esponenziale, viene rappresentata da un andamento lineare. La deviazione dalla linearità (e quindi dalla crescita esponenziale) nella seconda parte della curva è molto evidente.

I numeri sono sempre gli stessi, passando da una scala lineare a una logaritmica cambia solo il modo di rappresentarli. Ma con esso può cambiare anche la nostra prospettiva. Per i nostri occhi è molto difficile distinguere due curve esponenziali simili o una curva esponenziale da una retta molto ripida, mentre ci riesce più facile cogliere una deviazione da un andamento lineare. Ecco quindi un caso in cui una scelta puramente grafica può farci capire meglio come sta andando un’epidemia e come e quando mettere in campo le azioni per contrastarne la diffusione.

Bonus: evidenziare il picco

Paragrafo aggiunto il 20 aprile 2020 su ispirazione di questo video di Minute Physics su Youtube, ringrazio Michele Fabbri per la segnalazione e la stimolante discussione.

In nessuno dei precedenti grafici il famoso picco è ben visibile come vorremmo. La deviazione dall’andamento esponenziale, che abbiamo visto avvenire intorno al 21 marzo, è difficile da cogliere anche in scala logaritmica. Possiamo però guardare ai dati da un’altra prospettiva ancora, sfruttando una proprietà dell’andamento esponenziale: il numero di nuovi contagiati è proporzionale al numero totale di contagiati.

Si può testare questa relazione lineare tra nuovi contagiati (colonna nuovi_positivi del dataset della Protezione Civile) e contagiati totali (colonna totale_casi) mettendo sulle ascisse il numero complessivo di contagiati (che può solo crescere nel tempo) e sulle ordinate il corrispondente numero di nuovi contagiati del giorno (che invece tende a zero alla fine dell’epidemia). Non è poi strettamente necessario, ma ora che conosciamo bene la scala logaritmica, usiamola su entrambi gli assi.

Si possono comporre i precedenti grafici dei nuovi contagiati e dei contagiati totali al giorno in un unico grafico che evidenzia la relazione tra i due andamenti. Il punto più alto del picco corrisponde al 21 marzo 2020. La prima parte della curva evidenzia una dipendenza lineare tra nuovi contagiati e totale contagiati, che indica una diffusione esponenziale dell’epidemia. Entrambi gli assi sono in scala logaritmica.

Il picco del 21 marzo è ancor meglio visibile e l’andamento esponenziale alla sua sinistra è molto ben rappresentato dalla retta su cui si dispongono i punti. Ancora una volta la scelta di come visualizzare i dati può influenzare fortemente la nostra percezione e comprensione dei dati stessi.

Nota: da un punto di vista epidemiologico i nuovi contagiati di oggi possono essere prodotti solo da chi era contagiato ieri (colonna totale_positivi della Protezione Civile) e non da tutti quelli che si sono contagiati fino a ieri (colonna totale_casi che abbiamo usato nell’ultimo grafico), perché come già detto i guariti e i deceduti non contagiano più nessuno. La forma della curva però non cambia apprezzabilmente e ha il vantaggio che i punti rimangono disposti in ordine cronologico da sinistra a destra.

Condividi l'articolo