dataninja / magazine - Contenuti e risorse per capire il mondo con i dati

Ispirazioni · Leggere i dati

Cosa sono i thick data e come usarli in tempi di crisi

Il limite dei dati ufficiali della pandemia potrebbe essere mitigato dall’osservazione etnografica e la raccolta di dati qualititativi: facciamo entrare i thick data nelle normali procedure di analisi e ricerca.
28 maggio 2020
7 minuti

Stiamo raccogliendo dati su scala mondiale, nazionale, regionale, comunale, abbiamo tutto, cosa potrebbe mai andare storto nella gestione di una crisi sanitaria globale?

Molte cose, se non si guarda abbastanza in profondità. Se a fianco delle statistiche ufficiali non viene fatta osservazione sul campo, raccolta delle testimonianze da parte di chi è in prima linea, analisi a livello locale. Parliamo sempre di dati, ma di piccole dimensioni, capaci di farci vedere nuove sfaccettature di uno stesso argomento: sono i thick data, che l’etnografa Tricia Wang, la prima ad averne parlato, definisce come dati che emergono da metodi della ricerca qualitativa ed etnografica con l’obiettivo di rivelare le emozioni e le storie delle persone.

Letteralmente, dati che aggiungono spessore o densità a un fenomeno osservato con lenti quantitative.



Dai dati ufficiali ai thick data, una cronologia

Dall’inizio della pandemia in Italia la Protezione civile e i sistemi sanitari regionali hanno cominciato a raccogliere dati per capire cosa stava succedendo e valutare le decisioni da prendere per contenere il virus: casi positivi, casi totali, decessi, persone in ospedale, sono i numeri che vediamo ogni giorno nel bollettino della Protezione civile.

Questi dati, accumulati nel tempo, servono in teoria a valutare l’efficacia di misure come quelle del lockdown e del distanziamento fisico, adottate ormai in tutti i paesi colpiti dal virus – con poche eccezioni.

Il limite di questi dati lo abbiamo visto quasi subito: le persone che hanno presentato sintomi – anche quando in diretto contatto con infetti – non sono state testate, le regioni hanno sistemi di raccolta e pubblicazione non omogenei che difficilmente permettono il confronto, i dati a livello comunale non sono disponibili per tutte le regioni e quando ne viene richiesto l’accesso non si ottiene una vera e propria risposta utile.

In più, chi ha guardato questi dati ogni giorno, da vicino, ad un certo punto si è accorto di un altro problema, oltre agli errori e alle imprecisioni di cui abbiamo già detto: quello che i dati raccontavano non era rappresentativo della realtà.

Soprattutto nelle zone più colpite della Lombardia, come la provincia di Bergamo, i sindaci e i cittadini hanno cominciato a percepire che quei numeri dei decessi comunicati in modo ufficiale non corrispondevano a quanto vedevano accadere sotto i loro occhi.

E poi, oltre alle sensazioni, una piccola prova empirica: le pagine dei necrologi dell’Eco di Bergamo più che triplicate nel mese di febbraio. Qualcosa non tornava.

L’intuizione di Isaia Invernizzi, giornalista del quotidiano locale, è stata quella di mettere da parte le statistiche ufficiali sulla pandemia e cercarne altre, per confermare le testimonianze di chi diceva sottovoce, sperando di sbagliare, “i morti sono molti di più”. Dalla sua parte aveva i sindaci che avevano sotto mano i numeri dei decessi nel proprio territorio.

Parte quindi un’indagine sulla mortalità nei primi tre mesi del 2020 con un confronto negli anni precedenti e purtroppo emerge che i morti sono più del doppio rispetto ai morti ufficiali.

A livello nazionale i dati di Istat sulla mortalità dei comuni più colpiti dal virus diventano pubblici il 1 aprile e il 4 maggio viene pubblicato il rapporto sull’impatto dell’epidemia sulla mortalità.

I thick data come guida

Quando Tricia Wang ha nominato i “thick data” sul palco della TED nel 2017 ha detto che “usare solo i big data aumenta la possibilità di perdersi qualcosa, mentre ci dà l’impressione di sapere tutto”. Wang aveva condotto una ricerca etnografica per conto di Nokia in Asia, ma le sue intuizioni, dopo anni passati a fare “osservazione partecipante”, come gli antropologi, non vennero considerate da Nokia, che preferì lasciarsi guidare da sondaggi e ricerche di mercato su larga scala – e tutti sappiamo come è andata a finire per l’azienda finlandese.

In una crisi sanitaria i thick data ci aiutano a capire aspetti della pandemia che altrimenti rischiamo di accantonare perché relativi a esperienze dei singoli o legati a un contesto locale.

È d’accordo anche Giulio Quaggiotto, responsabile del settore Innovazione nella regione dell’Asia-Pacifico per l’UNDP, che del tema è un esperto in relazione alla cooperazione internazionale: “Si può assolutamente parlare di thick data anche in questo caso. Penso al governo indiano che aveva deciso di usare un’app per tracciare i contagiati, dimenticandosi di come le persone si comportano negli ospedali”, ci racconta. Per due mesi il numero di telefono associato ai contagiati era quello dei propri parenti, segnalati come “positivi al virus” anche senza essere mai stati testati. Una volta in ospedale infatti i familiari segnalavano il proprio numero ai medici per conoscere le condizioni di salute dei propri cari, ma quel numero veniva erroneamente caricato sull’app come appartenente ai contagiati.

I thick data sono quindi “preziosi dati di carattere personale, come storie, interazioni ed emozioni che non possono essere quantificate”. In India ascoltare le testimonianze dagli ospedali avrebbe evitato due mesi di dati raccolti inutilmente.

“I nostri sistemi di big data hanno bisogno di persone come gli etnografi e i ricercatori per  raccogliere i cosiddetti dati densi”, diceva Wang nel 2017. “Abbiamo anche bisogno che sia incentivato il dialogo tra i dati quantitativi e qualitativi per individuare insight e significati a ciò che accade”, scrive oggi Alice Avallone in un pezzo sull’urgenza di avere “umanisti dei dati”.

I thick data post crisi

Fonte: From big to thick data: how do we make sense of the impacts of Covid 19?

Stiamo vivendo una crisi che ha altri aspetti oltre quello sanitario.

C’è quello economico, quello sociale, educativo, ed è per questo che il governo ha istituito delle task force per analizzare i modi migliori per accompagnare la transizione dal blocco totale alla graduale riapertura. Ma questi gruppi di esperti stanno usando un approccio thick data? Stanno raccogliendo dati e testimonianze dal basso per capire come accompagnare questa transizione, che probabilmente sarà lunga? Forse non in tutti i settori.

Ci sono state molte iniziative private, come quelle di Design For Emergency, con una ricerca sulle emozioni degli italiani avviata già nei primi mesi del lockdown, e la CoviDesignJam organizzata a maggio da Digital Entity e Nois3 per “progettare le relazioni del futuro”, ma al momento non siamo a conoscenza di iniziative istituzionali.

La visualizzazione dell’indagine di Design For Emergency.

Eppure questi due ultimi casi sono un’ottima ispirazione, perché l’approccio dei thick data assomiglia a quello del design thinking: ascolto, raccolta dati, mettersi nei panni degli altri, testare e poi prendere decisioni. Anche in fase 2.

Condividi l'articolo