Skip to content

Target di previsione e dati di sorveglianza

Nicolò Gozzi edited this page Nov 15, 2024 · 6 revisions

en

I dati della sorveglianza verranno aggiornati nel repository ogni venerdì, in seguito alla pubblicazione del Rapporto RespiVirNet da parte dell'Istituto Superiore di Sanità. I dati forniti in una specifica settimana sono riferiti ai valori riportati nella settimana precedente. A titolo di esempio, il bollettino RespiVirNet relativo alla settimana 45, contrassegnato come 2023-45, viene pubblicato nella settimana 46. All'interno della cartella sorveglianza/, che si trova al primo livello del repository sono presenti due cartelle, ILI/ e ILI+_FLU/ che contengono i dati di sorveglianza per i diversi target di previsione:

  • ILI
  • ILI+_FLU_A
  • ILI+_FLU_B

Target di previsione: ILI

Il target di previsione ILI rappresenta l'incidenza settimanale di sindromi simil-influenzali per 1000 assistiti. Il dato viene comunicato ogni settimana dall'Istituto Superiore di Sanità mediante il bollettino epidemiologico RespiVirNet. I file relativi ai dati di sorveglianza per questo target (sia storici che per la stagione in corso) sono contenuti nella cartella sorveglianza/ILI/. I file sono in formato CSV (comma-separated values) e contengono le seguenti colonne:

  • anno: l'anno a cui si riferisce il dato di sorveglianza
  • settimana: la settimana a cui si riferisce il dato di sorveglianza
  • incidenza: un numero decimale che indica l'incidenza rilevata per 1000 assistiti
  • numero_casi: numero di casi rilevati (numeratore per incidenza)
  • numero_assistiti: numero di assistiti (denominatore per incidenza)
  • target: il target di previsione a cui si riferiscono i dati di sorveglianza (in questo caso è sempre ILI)

All'interno della della cartella sorveglianza/ILI/2024-2025 verranno verranno caricati ogni settimana i seguenti file:

  • italia-YYYY_WW-ILI.csv
  • [regione]-YYYY_WW-ILI.csv

Dove YYYY rappresenta l'anno, WW la settimana indicata con due cifre (ovvero anteponendo lo 0 per le prime 9 settimane) dell'ultimo bollettino RespiVirNet, e [regione] può assumere uno dei 21 valori possibili (abruzzo, basilicata, calabria, campania, emilia_romagna, friuli_venezia_giulia, lazio, liguria, lombardia, marche, molise, pa_bolzano, pa_trento, piemonte, puglia, sardegna, sicilia, toscana, umbria, valle_d_aosta, veneto).

Ciascun file conterrà i valori per il target di riferimento dall'inizio della stagione influenzale fino alla settimana corrispondente (settimana precedente a quella corrente). Se i dati per una specifica data sono assenti, la corrispondente riga sarà mancante nel dataset.

Nota: per facilitare l'accesso ai dati più recenti, è possibile trovare i file più aggiornati all'interno della cartella denominata latest all'interno della directory corrispondente alla stagione in corso (i.e., sorveglianza/ILI/2024-2025/latest). Ad esempio, per recuperare il dato più recente per l'Italia utilizzando Python, è sufficiente eseguire le seguenti righe di codice:

import pandas as pd

df_italia_latest = pd.read_csv("https://raw.githubusercontent.com/Predizioni-Epidemiologiche-Italia/Influcast/main/sorveglianza/ILI/2024-2025/latest/italia-latest-ILI.csv")

Target di previsione: ILI+ (Flu A e B)

Il target di previsione ILI+_FLU rappresenta l'incidenza settimanale di sindromi simil-influenzali per 1000 assistiti riconducibili a virus influenzali (A e B). In particolare è calcolato separatamente per Influenza di tipo A e B secondo la seguente formula:

$ILI_+(FLU_A) = ILI \times \frac{positives_{Flu A}}{total \ positives}$

Dove:

  • ILI: è l'incidenza settimanale di sindromi simil-influenzali per 1000 assistiti (vedi sopra)
  • $positives_{Flu A}$: è il numero di campioni risultati positivi a virus influenzali di tipo A in una certa settimana
  • $total \ positives$: è il numero totale di campioni risultati positivi ad un virus respiratorio in una certa settimana

Con un calcolo analogo è possibile ottenere $ILI_+(FLU_B)$. Il dato di incidenza ILI viene comunicato ogni settimana dall'Istituto Superiore di Sanità mediante il bollettino epidemiologico mentre l'informazione sui campioni positivi viene comunicata settimanalmente tramite il bollettino virologico della sorveglianza integrata RespiVirNet.

I file relativi ai dati di sorveglianza per questo target (sia storici che per la stagione in corso) sono contenuti nella cartella sorveglianza/ILI+_FLU/. I file sono in formato CSV (comma-separated values) e contengono le seguenti colonne:

  • anno: l'anno a cui si riferisce il dato di sorveglianza
  • settimana: la settimana a cui si riferisce il dato di sorveglianza
  • incidenza: un numero decimale che indica l'incidenza ILI+ rilevata per 1000 assistiti
  • target: il target di previsione a cui si riferiscono i dati di sorveglianza (in questo caso può sempre ILI+_FLU_A oppure ILI+_FLU_B)

All'interno della della cartella sorveglianza/ILI+_FLU/2024-2025 verranno verranno caricati ogni settimana i seguenti file:

  • italia-YYYY_WW-ILI+_FLU_A.csv
  • italia-YYYY_WW-ILI+_FLU_B.csv

Dove YYYY rappresenta l'anno, WW la settimana indicata con due cifre (ovvero anteponendo lo 0 per le prime 9 settimane) dell'ultimo bollettino RespiVirNet. Il file italia-YYYY_WW-ILI+_FLU_A.csv è relativo ai dati di sorveglianza per il target ILI+_FLU_A, mentre italia-YYYY_WW-ILI+_FLU_B.csv per il target ILI+_FLU_B. Notiamo come questi target di previsione sono disponibili solo a livello nazionale.

Ciascun file conterrà i valori per il target di riferimento dall'inizio della stagione influenzale fino alla settimana corrispondente (settimana precedente a quella corrente). Se i dati per una specifica data sono assenti, la corrispondente riga sarà mancante nel dataset.

Nota: per facilitare l'accesso ai dati più recenti, è possibile trovare i file più aggiornati all'interno della cartella denominata latest all'interno della directory corrispondente alla stagione in corso (i.e., sorveglianza/ILI+_FLU/2024-2025/latest). Ad esempio, per recuperare il dato più recente per l'Italia utilizzando Python, è sufficiente eseguire le seguenti righe di codice:

import pandas as pd

# ILI+ Flu A
df_italia_latest_FLU_A = pd.read_csv("https://raw.githubusercontent.com/Predizioni-Epidemiologiche-Italia/Influcast/main/sorveglianza/ILI+_FLU/2024-2025/latest/italia-latest-ILI+_FLU_A.csv")

# ILI+ Flu B
df_italia_latest_FLU_B = pd.read_csv("https://raw.githubusercontent.com/Predizioni-Epidemiologiche-Italia/Influcast/main/sorveglianza/ILI+_FLU/2024-2025/latest/italia-latest-ILI+_FLU_B.csv")