Il tasso di contagio Rt

Indice

Introduzione

L'evoluzione di una epidemia è controllato fondamentalmente da tre quantità:

  1. \(I_t\): è il numero di persone contagiate al tempo \(t\), in genere misurato in numero di giorni. Il numero di positivi giornalieri usualmente riportato nei dati ufficiali è una stima, necessariamente per difetto, di \(I_t\).
  2. \(R_t\): è il numero medio di persone che è in grado di contagiare un'altra persona contagiata al tempo \(t\).
  3. Il generation time \(s\): è la differenza tra il tempo di infezione di una persona contagiata e il tempo di infezione del suo contagiatore. In genere non è un numero fisso, ma segue una distribuzione di probabilità. La probabilità di contagiarsi dopo un tempo \(s\) viene indicata con \(w_s\). \(s\) in genere viene misurato in numero di giorni come \(t\).

Il numero atteso di persone contagiate il giorno \(t\) è legato al numero di persone contagiate nei giorni precedenti dalla formula:

\(E[I_{t}] = R_t\displaystyle\sum_{s=1}^{t} I_{t-s} w_s\).

dove \(s\) è il numero di giorni dopo cui è possibile il contagio, e va da \(1\) a \(t\).


Esistono in letteratura diversi metodi per stimare \(R_t\) quando è noto il numero di persone contagiate giorno per giorno, \(I_t\). Di seguito i metodi utilizzati nel nostro calcolo.

Wallinga-Teunis (2004)

\(R_t\) viene stimato direttamente dall’andamento del numero di contagiati \(I_t\), stimato dal numero di positivi giornalieri, assumendo di conoscere la distribuzione di probabilità \(w_s\)[1].

Viene usata una procedura statistica basata sulla probabilità che due contagiati, \(i\) e \(j\), con sintomi a tempi \(t_i>t_j\), siano una possibile coppia contagiante-contagiato, normalizzata dalla probabilità che il caso \(i\) sia stato contagiato da ogni altro caso \(k\). In formule:

\(\left. p_{ij}=w_{t_i-t_j} \right/ \displaystyle\sum_{i\ne k} w_{t_i-t_k}\).

Da questo si ottiene \(R_j = \sum_i p_{ij}\), e la stima di \(R_t\) si ottieme come la media di tutti i valori \(R_j\) dei contagi al giorno \(t\).

Per questo motivo, e per coerenza con gli altri algoritmi, riferiamo il valore calcolato non al primo giorno dell’intervallo considerato, ma al settimo. Questo metodo non può essere quindi usato per stimare \(R_t\) negli ultimi giorni di osservazione.


Per il calcolo di questo algoritmo utilizziamo il pacchetto open source EpiEstim[2]. Il solo contributo considerato nel calcolo dell'incertezza è quello statistico.

Bibliografia - metodo di Wallinga-Teunis

Bettencourt Ribeiro (2008)

Il metodo è simile a quello di Cori et al., ma al posto della funzione \(w_s\) viene considerato un intervallo di tempo fisso. \(R_t\) viene stimato con un Markov Chain Monte Carlo e non con calcoli analitici[1].

La banda di incertezza, riportata come intervallo di credibilità Bayesiano.


Per il calcolo di questo algoritmo utilizziamo il metodo proposto da Kevin Systrom[2] e implementato nel sito Rt COVID-19 Italia[3]

Bibliografia - metodo di Bettencourt-Ribeiro

[1] Bettencourt, Ribeiro (2008) PLoS ONE, Volume 3, Issue 5, e2185.

[2] Kevin Systrom, The Metric We Need to Manage COVID-19.

[3] G. Bonifazi, Rt COVID-19 Italia, https://rt-italy.live/.

Cori et al. (2013)

\(R_t\) viene stimato dal rapporto del numero di persone contagiate \(I_t\) al tempo \(t\) rispetto al numero di possibili contagi al tempo \(t\), dato da \(\displaystyle\sum_{s=1}^t I_{t-s}w_s\)[1].

Per calcolare \(R_t\) in questo modo viene introdotta una procedura Bayesiana. Va notato che in questo approccio \(R_t\) viene calcolato in base al numero di contagiati registrato nei giorni precedenti e non a quelli successivi. Per questo viene anche definito \(R_t\) istantaneo.

Per calcolare \(R_t\) con questa procedura è necessario definire la distribuzione \(w_s\). Noi utilizziamo la distribuzione pubblicata da Cereda et al.[2], che è la stessa utilizzata dall’Istituto Superiore di Sanità nelle sue stime.

Per il calcolo di questo algoritmo utilizziamo il pacchetto open source EpiEstim[3]. La banda di incertezza, riportata come intervallo di credibilità Bayesiano, tiene conto dell'incertezza statistica di Poisson e degli errori con cui è conosciuta \(w_s\).

Bibliografia - metodo di Cori et al.

RKI

L'istituto RKI, Robert Koch Institut[1] calcola \(R_t\) come il rapporto tra la somma del numero di contagiati negli ultimi 4 giorni e la somma del numero dei contagiati nei 4 giorni precedenti. La motivazione di questa stima di \(R_t\) è descritta in un articolo dell'RKI[2] disponibile in tedesco.

Esistono pacchetti software per fare questo calcolo ma, vista la semplicità dell'algoritmo, abbiamo preferito implementarlo con nostro codice che abbiamo validato confrontando i nostri risultati con quelli pubblicati in base ai dati tedeschi.

È necessario applicare una procedura di smoothing dell'andamento dei numer dei contagiati giornalieri per ridurre l'oscillazione alla modulazione settimanale. Infatti, nel fine settimana tipicamente il numero di tamponi analizzati è più basso che negli altri giorni, di conseguenza il numero di contagiati rilevato è anch'esso più basso. Abbiamo pertanto applicato un filtro di Savitzky-Golay[3] con una finestra di 15 giorni ed una polinomiale di 3° grado.

L'incertezza riportata al 68% CL è solo quella statistica che tiene conto della distribuzione poissoniana del numero di conteggi.

Bibliografia - metodo dell'RKI

[1] Robert Koch Institut, Berlin, Germany.

[2] Robert Koch Institut, Erläuterung der Schätzung der zeitlich variierenden Reproduktionszahl (2020).

[3] Savitzky, Golay, Anal. Chem., 36, 8, 1627–1639 (1964).

Il metodo CovidStat

Il metodo da noi sviluppato utilizza il tasso di crescita determinato negli ultimi 14 giorni con un fit esponenziale al numero di persone contagiate giornaliere[1] assumendo il valor medio del generation time pubblicato da Cereda et al.[2], utilizzato anche dall'Istituto Superiode di Sanità. Sono riportate separatamente il contributo dell'incertezza statistica e l'incertezza totale che è dominata dall'incertezza con la quale è noto il valor medio del generation time.

Bibliografia - metodo CovidStatI

[1] G. Bonifazi, L. Lista, D. Menasce, M. Mezzetto, D. Pedrini, R. Spighi, A. Zoccoli, A simplified estimate of the Effective Reproduction Number \(R_t\) using its relation with the doubling time and application to Italian COVID-19 data, arXiv:2012.05194, submitted to EPJ Plus (2020).

[2] Cereda et al., arXiv:2003.09320 (2020).

Metodi SIRD

I metodi SIRD descrivono l'evoluzione nel tempo dall’andamento del numero di persone suscettibli (Susceptible), cioè la popolazione che può essere contagiata, di persone contagiate (Infected), guarite (Recovered) e decedute (Dead). Questi modelli sono stati introdotti da circa 90 anni[1].

Il nostro calcolo di \(R_\mathrm{SIRD}\) si basa su un metodo semplificato[2] rispetto all'articolo originale[3].

L'andamento di \(R_\mathrm{SIRD}\) segue qualitativamente l'andamento nel tempo di \(R_t\), ma non il valore assoluto che può essere sensibilmente diverso.

Bibliografia - metodi SIRD

[1] Kermack, McKendrick (1991), Bltn Mathcal Biology 53, 33–55.

[2] Anastassopoulou, Russo, Tsakris, Siettos (2020), PLoS ONE 15(3): e0230405.

[3] Kermack, Mc Kendrik (1927), Proceedings of the Royal Society A. 115 (772): 700-721.

Calcolo di \(R_t\) dell'ISS

L'algoritmo utilizzato dall'Istituto Superiore di Sanità (ISS) è descritto in una nota esplicativa[1, 2] e si richiama direttamente alla metodologia sviluppata da Cori et al. (2013) sopracitata. Viene utilizza la distribuzione \(w_s\) pubblicata da Cereda et al.[3].

È importante notare che l'ISS non utilizza il valore dei nuovi contagi giornalieri riportato dalla Protezione Civile, ma calcola \(R_t\) sulla base dei soli contagiati sintomatici, il cui valore non è riportato dalla Protezione Civile. Questo permette di calcolare lo sviluppo del contagio non sulla base della data del tampone positivo, ma sulla base della data di comparsa dei sintomi. Per questo motivo la curva di \(R_t\) calcolata da ISS si trova in anticipo rispetto alle altre curve, ma ISS non è in grado di pubblicare il valore di \(R_t\) dell'ultimo giorno, proprio perché i tamponi positivi dell'ultimo giorno si riferiscono a date di comparsa sintomi distribuite nelle due settimane precedenti.

Il confonto tra gli algoritmi discussi sopra e il calcolo dell'ISS mostra comunque un buon accordo delle diverse stime, considerando che esistono comunque differenze tra i calcoli dei diversi algoritmi.

Bibliografia - metodo dell'ISS

[1] ISS, FAQ sul calcolo del Rt (2020).

[2] Stefano Merler, Fondazione Bruno Kessler, Monitoraggiodi COVID-19 in Italia (2020).

[3] Cereda et al., arXiv:2003.09320 (2020).

I diversi metodi a confronto

Nel grafico seguente i diversi metodi sono messi a confronto sullo stesso grafico. Il grafico è calcolato sul totale dei nuovi casi giornalieri, come pubblicato quotidianamente dalla Protezione Civile. È quindi riferito a sintomatici ed asintomatici facendo fede alla data del tampone e non alla data di comparsa sintomi. Il grafico mosta che i diversi algoritmi danno stime abbastanza vicine tra loro. Tuttavia, guardando i grafici per le singole regioni si nota che, quando il numero dei contagiati non è molto grande, per esempio nei mesi di luglio ed agosto, le diverse stime possono anche dare risultato molto diversi tra di loro.