Dataninja Magazine - Contenuti e risorse per capire il mondo con i dati

Data visualization · Leggere i dati

“Sono dati, non la realtà”: una conversazione sui dati situati con Jill Walker Rettberg

Una professoressa di cultura digitale parla del mito dell’oggettività nella data visualization e di molto altro.
8 luglio 2021
15 minuti

Una professoressa di cultura digitale parla del mito dell’oggettività nella data visualization e di molto altro.

Questo articolo è stato scritto per Nightingale da Roopika Risam

Immagine tratta da “A Better Understanding of Social Media with Situated Data Analysis” di Jill Walker Rettberg

Il 25 giugno 2020 ho fatto una chiacchierata con Jill Walker Rettberg, professoressa di cultura digitale all’Università di Bergen in Norvegia e tra le principali studiose di culture digitali. La professoressa Rettberg è specializzata in storytelling e autorappresentazione nei social media, ed è l’autrice di Seeing Ourselves Through Technology: How We Use Selfies, Blogs, and Wearable Devices to See and Shape Ourselves (Palgrave, 2014). Attualmente, la sua ricerca accademica esplora l’intersezione tra i sistemi algoritmici e la narrativa. Sono stata un’ammiratrice del suo lavoro per anni e, dopo aver letto recentemente il suo ultimo articolo, “Situated Data Analysis: A New Method for Analysing Encoded Power Relationships in Social Media Platforms and Apps”, ho chiesto alla professoressa Rettberg di condividere le sue idee con i lettori di Nightingale.

R: Trovo il concetto di “dati situati” da te sviluppato molto convincente. Lo spiegheresti meglio a chi ci legge?

J: Spesso c’è questa idea che i dati sono “neutrali” e “oggettivi” – sono solo fatti, giusto? Credo che sia decisamente importante riconoscere che i dati sono in realtà costruiti – sono parziali, c’è molto che manca, sono solamente alcuni tasselli di informazioni. Non abbiamo tutto. Inoltre, i dati sono presentati in un certo modo. Affermare che i dati sono situati, quindi, ci ricorda che essi sono sempre creati e presentati in un certo modo, stimolandoci di conseguenza a chiederci com’ è che sono situati.

Alcuni miei amici mi hanno chiesto, “Cosa intendi con ‘situati’?” “Vuoi dire dati geolocalizzati? Si riferisce al tracciamento della nostra posizione?” Non è questo: sto usando il concetto dal saggio di Donna Haraway “Situated Knowledges” – una famosa opera femminista che afferma che la conoscenza non è mai oggettiva. Non esiste una prospettiva dall’alto da cui si può vedere tutto. È veramente impossibile avere quel tipo di punto di vista oggettivo. La data visualization è un ambito che spinge a credere di poter vedere tutto, in quanto si dispone di tutti i dati con cui creare queste visualizzazioni convincenti. Alcune persone hanno criticato questa idea in vari modi. Credo che iI concetto di “dati situati” sia uno strumento utile per ricordarci che se iniziamo a pensare ai dati in questi termini, possiamo chiederci quali sono gli effetti del modo in cui i dati sono situati.

R: Cosa ti ha portato a questo concetto?

J: Molte cose! Ero parte di un progetto chiamato INDVIL – Innovative Data Visualization and Visual-Numeric Literacy  – che prevedeva una serie di workshop. Durante uno di questi, stavo parlando di tutti i modi in cui i dati non sono oggettivi quando Helen Kennedy citò il saggio di Haraway “Situated Knowledges”, che io avevo letto ma non avevo collegato a questo lavoro – ed effettivamente ci stava molto bene. Persone come Helen avevano scritto sul modo in cui i numeri possano dare l’illusione di una conoscenza totale. Inoltre, stavo leggendo il tuo saggio (di Roopika Risam) sulla visualizzazione dei dati sulle migrazioni. Il modo in cui parli dei diversi effetti che si ottengono utilizzando dati esistenti rispetto al parlare con i migranti è un esempio calzante dell’influenza del contesto sui dati (ciò che li rende appunto “situati”), e di cosa ciò implichi per i dati che scegliamo e per come li visualizziamo. Se vogliamo visualizzare i dati, come ci relazioniamo e come pensiamo a cosa rappresentano tali dati?

R: Che tipo di domande suggeriresti di porsi a chi si occupa di dataviz per capire come sono situati i loro dati?

J: Per prima cosa, guardate ciò che i dati sostengono di rappresentare. Come è scritto nel libro di Lisa Gitelman, “I ‘dati grezzi’ sono un ossimoro”. Partite da questo presupposto: sono dati, non è la realtà.

R: È una rappresentazione

J: Esattamente – e questo spesso viene dimenticato. Per esempio, se stiamo guardando i dati per il riconoscimento facciale delle emozioni, si tratta di cercare di capire se una persona è felice o triste, o se è minacciosa o probabilmente violenta. I dati sono le espressioni facciali – non sono in realtà le loro emozioni. Ma c’è un modo in cui i dati diventano una cosa presa per un’altra – è attraverso una sineddoche, è un proxy. Le espressioni facciali corrispondono davvero a quanto una persona sia arrabbiata? O a quanto è probabile che sia violenta? In alcuni casi, forse, ma in molti casi no.

R: E c’è anche il contesto in cui interpretiamo queste espressioni – anche le emozioni sono situate. Il modo in cui percepiamo le emozioni o attribuiamo significati ad alcune espressioni è a sua volta basato sulle nostre stesse prospettive, percezioni ed emozioni. E ciò può variare tra individui, culture e comunità diverse, persino in base all’interazione di una persona con l’altra, giusto?

J: Assolutamente sì. Ci sono interpretazioni culturali che vengono incorporate nei dati. Provengono da chi i dati li ha creati, da chi ha sviluppato gli algoritmi che a loro volta hanno creato i dati, e anche dalle persone che poi realizzano le visualizzazioni. E poi, certamente, anche il pubblico finale che guarda le dataviz vi imprime le proprie interpretazioni culturali. 

R: Ci sono molti livelli in cui questo processo può andare storto

J: Sì. Ci sono chiaramente dei modi in cui la visualizzazione dei dati può essere deliberatamente fuorviante. Ma dubito che la maggior parte lo cerchi di fare di proposito. Nel tuo esempio con le visualizzazioni dei dati sui migranti, penso che nessuno dei creatori di queste visualizzazioni stesse cercando di presentare i migranti come un problema. Ma c’è anche quello che dicono i media e quello che molte persone sostengono sia la versione della storia. Quindi è importante pensare criticamente e chiedersi: “Se visualizzo i dati in un modo particolare, cosa dice questo? E “Potrei visualizzare i dati in un altro modo che racconterebbe una storia diversa?”

R: È necessario pensare anche a come i dati che stiamo utilizzando sono stati raccolti all’origine. Che terminologia è stata usata per categorizzare persone o quantificare esperienze, fenomeni o circostanze? Lo stesso vocabolario ha significati specifici. Prendi per esempio raccogliere dati sul genere utilizzando solamente “maschio” e “femmina”.

J: Johanna Drucker ha idee interessanti su come visualizzare le cose, come il genere al di là di maschio e femmina – o, nella mia situazione, di che nazionalità sono – ha grandi intuizioni per visualizzare l’incertezza [in Graphesis]. Mentre leggevo di più sulla storia della dataviz, sono rimasta affascinata dall’invenzione dell’idea di “normale”. Si potrebbe dire che è stata inventata dalla statistica, quando hanno iniziato a raccogliere dati demografici sui soldati – quando vengono arruolati, i militari misurano la loro altezza e peso – e quando i dati vengono visualizzati, si ottiene la curva “normale”. E improvvisamente, tutto ciò che non è nel mezzo è “anormale”. Questo è un concetto davvero nuovo – si può fare solo con le statistiche, ma la visualizzazione è davvero importante per il nostro senso di ciò che è “normale”.

R: Conosci il libro The Bell Curve di Charles Murray e Richard Herrnstein?

J: Sì. Sì.

R: È la tesi riguardante la genetica e l’intelligenza umana, che sostiene sia distribuita su una curva a campana. E viene usata per argomentare la connessione tra razza e intelligenza, affermando che le persone nere sono intellettualmente inferiori. È disgustoso.

J: Esattamente – possono succedere brutte cose quando si definisce la “normalità”. Ho imparato dagli studi sulla disabilità che alla parola “normale” viene attribuito il suo significato attuale solo a partire dagli anni Quaranta dell’Ottocento [Davis: Constructing Normalcy]. Prima del “normale” avevamo l'”ideale” – come la “bellezza ideale”. Non pensavamo alla “media” o alla “normalità”, ed era un punto di partenza molto diverso.

R: Dalla prospettiva di un’umanista, sono interessata a ciò che dicono le visualizzazioni dei dati. Quali stratagemmi retorici vengono utilizzati? Quali sono potenziali errori di comunicazione? E il tuo concetto di dati situati è una lente davvero potente per leggere le dataviz. Può contribuire molto a scardinare queste narrazioni semplicistiche sui dati. L’alfabetizzazione sui dati è un argomento così importante in questo momento, e non è uno di quelli in cui molte persone ricevono una formazione.

J: Mi domando quanto la gente ne parli a scuola.

R: Ovviamente, è diverso nei vari paesi, ma negli Stati Uniti, non molto.

J: Oggi nelle scuole elementari fanno grafici Excel nell’ora di matematica, ma non sono sicura di quanto adottino un approccio critico nel farlo.

R: È il lato etico della visualizzazione dei dati che manca. Questa è la parte difficile. Mi trovo in Massachusetts, e lo stato ha rilasciato questi standard di alfabetizzazione digitale nel 2016 per le scuole K-12 (nel sistema scolastico statunitense, il periodo di 12 anni che dall’ultimo anno di scuola dell’infanzia si conclude con il diploma, ndr), e non hanno creato alcuna risorsa per la formazione degli insegnanti, quindi non sono stati adottati. Se le scuole avessero fatto saltare gli standard di English Language Arts, la gente sarebbe in rivolta!

J: Recentemente qui [in Norvegia] hanno aggiunto la “competenza digitale”, credo che la chiamino così, ai test standardizzati. Il mio bimbo di quarta elementare ne ha appena fatto uno ed è andato abbastanza bene. Sa esattamente come usare un mouse, come fare una ricerca su Google, come non parlare con uno sconosciuto – un sacco di roba sulla sicurezza su internet, che è importante.

R: Questo è sicuramente un punto di partenza. Ma poi penso, per esempio, alle considerazioni di Safiya Noble in Algorithms of Oppression secondo cui Google non è un servizio d’informazione – è un’azienda pubblicitaria.

J: Facevo un intervento all’Università dei bambini che abbiamo qui, un giorno all’anno, in cui parlavo di bias algoritmici a bambini di quinta elementare. È stato divertente e hanno fatto domande per tutto il tempo.

R: Faccio molti workshop per persone che pensano di integrare componenti digitali nel loro metodo di insegnamento, e spesso uso le ricerche di Google Immagini. Chiedo loro di scegliere un termine, come una professione, e guardare chi è rappresentato nei risultati – chi sembra un dottore, per esempio. E il peggio è quando scelgono un gruppo razziale o etnico. I risultati possono essere terribili – stereotipi razzisti.

J: Oltre al lavoro sul bias algoritmico, ho letto un sacco di studi in ambito Critical Race Theory e Black digital Humanities – e ci sono le opere femministe. Le persone che hanno vissuto cosa vuol dire essere in qualche modo considerate una minoranza possono forse individuare questi problemi più facilmente. Ho letto il libro di André Brock Distributed Blackness, e lui sostiene che dovremmo analizzare le cose dalla prospettiva della minoranza, la “posizione inaspettata”. Questo è un buon consiglio per la visualizzazione dei dati. Quindi, hai creato una visualizzazione di dati. Ora, come la leggerebbe qualcuno da una posizione diversa dalla tua? Come la leggerebbe qualcuno che è in minoranza? Che aspetto avrebbe per loro?

R: La mia formazione è in studi sulla diaspora africana e studi postcoloniali. Vengo dal Kashmir, un luogo che due paesi [India e Pakistan] si contendono da 60 anni e ciò ha colpito la mia famiglia. Sapendo che l’intera macchina dei dati e della conoscenza è stata mobilitata per diseredare, colonizzare e disumanizzare il mio popolo, non posso fare a meno di portare quella prospettiva e quel cinismo nel modo in cui leggo una visualizzazione.

J: Leggere attraverso quelle lenti è molto educativo e ci aiuta a vedere le lacune nella nostra conoscenza.

R: Penso che la vera sfida sia come si presenta questo lavoro di traduzione. Come possiamo progettare la visualizzazione dei dati in modo equo? Non è una check-list – è un processo, è una conversazione. È sapere chi sono le parti interessate, con chi hai bisogno di parlare.

J: Come potremmo decolonizzare la visualizzazione dei dati? Ovviamente fa parte di quali dati vengono selezionati. È una questione enorme. Sta mettendo in discussione tutte queste cose?

R: Per come si usa la parola “decolonizzazione” ultimamente, sembra che si sia completamente svuotata di ogni significato. Ciò che “decolonizzazione” vuol dire davvero è l’abolizione di tutte le strutture della conoscenza e la re-immaginazione di ciò che sono. È un processo redistributivo. Eve Tuck e K. Wayne Yang hanno scritto un ottimo articolo intitolato “Decolonization Is Not a Metaphor,” e criticano i modi in cui i gruppi antirazzisti chiedono la “decolonizzazione” quando in realtà intendono l’equità e la giustizia razziale. E questo ignora il fatto che gli indigeni sono letteralmente colonizzati. È un tema difficile. Mi piacerebbe essere fiduciosa, ma dubito che l’intera struttura di conoscenza dietro ai dati e alla loro visualizzazione – ovvero secoli in cui i dati sono stati usati dai poteri coloniali e dagli schiavisti per opprimere le persone – venga ribaltata.

J: Forse iniziamo con il modo in cui la visualizzazione dei dati dà la priorità al “normale”. Le visualizzazioni di dati su larga scala – di Big Data, in ogni caso – rendono ancora più invisibili le posizioni minoritarie o le posizioni meno centrali. E questo è davvero problematico. Fa un po’ paura.

R: Credo sia un buon punto di partenza

J: E c’è una differenza tra visualizzare le esperienze delle persone e visualizzare, per esempio, il cambiamento climatico.

R: Questo mi fa pensare a un corso che ho tenuto una volta con Micha Cárdenas [digital theorist e artista] sugli approcci postcoloniali alle digital humanities, e la classe ha creato un sito web, chiamato Social Justice and Digital Humanities, per fornire alle persone domande da porsi quando stanno pianificando un progetto digitale – ecco le domande da fare, ecco le risorse da guardare. Considererei il tuo concetto di dati situati in un modo simile, spostando su chi fa visualizzazione di dati l’onere di rendere trasparente il processo decisionale dietro le loro pratiche, di pensare a come possono comunicarlo. Per farlo, potrebbero accompagnare la visualizzazione dei dati con un testo critico che spieghi le scelte che stanno facendo.

J: Questo è davvero un buon punto: come avete situato questi dati?

R: E quali sono i modi in cui i dati vi arrivano già situati? E poi cosa ci fate? E come interagiscono tra loro queste due sfaccettature?

J: Nella maggior parte dei casi, si potrebbe inserire un link su cui cliccare e delle spiegazioni.

R: Un’ultima domanda. Con tutti i dati generati sul COVID-19 e sul razzismo e attività della polizia contro le persone nere negli Stati Uniti, che consiglio daresti alle persone che vogliono visualizzare questi dati?

J: La cosa più importante è avere un approccio critico ai dati. Qual è la fonte? Come vengono raccolti? Sono stati raccolti volontariamente? Potrebbe mettere in pericolo qualcuno se si visualizzano questi dati? Cosa manca nei dati? È complicato. Per esempio, la Norvegia aveva un’applicazione di tracciamento del COVID-19 che è totalmente fallita. Ci hanno speso un sacco di soldi e l’hanno fatta uscire molto velocemente. Hanno scelto di usare banche dati centrali –

R: Oh, no.

J: Lo so. Usavano la localizzazione GPS totale, così come il Bluetooth. Ed è stata chiusa per problemi di privacy. Ma hanno condiviso solo una dataviz, ed era davvero banale. Tutto quello che sono stati in grado di fare è stato dire che dopo aver allentato un po’ le misure, c’è stato solo un leggero aumento delle persone che passano più di 7,5 minuti vicino a qualcuno a una distanza di 2 metri, ma un aumento maggiore di persone che trascorrono più di 15 minuti vicino a qualcuno, a quella distanza. Il punto è che le persone passano più tempo con le persone a cui sono vicine, ma non molto più tempo con gli estranei. Questo è così tipico di alcune visualizzazioni di dati – non c’è davvero bisogno di una visualizzazione o di una massiccia raccolta di dati per dirci questo. Sto anche pensando ai dati su piccola scala. Alle persone spesso piace vedere i propri dati ma tenerli per sé, senza condividerli con il mondo. C’è chiaramente una sorta di piacere nei propri dati, ma c’è una differenza tra questo e rinunciare al proprio potere o al controllo su quei dati. E con i dati COVID-19 e i dati relativi al razzismo contro le persone nere e alle proteste negli Stati Uniti, cosa viene tralasciato? Cosa viene travisato? Le persone che vengono rappresentate si sentiranno rappresentate correttamente? Ci possono essere casi in cui anche se la risposta è no, forse si dovrebbe comunque pubblicarli – ma bisognerebbe almeno pensarci e capire che implicazioni ci sono se la risposta è no.

R: E questo, a sua volta, riflette anche il modo in cui si strutturano i dati. Potremmo osservare le visualizzazioni dal punto di vista più immediato. Che tipo di supposizioni potrebbero sorgere  dalla visualizzazione? Che genere di malintesi si potrebbero generare?

J: E qual è il fraintendimento più ovvio in cui le persone potrebbero incorrere per  la mia visualizzazione. Questa è un’ottima domanda da fare.

Condividi l'articolo