Diritto all’oblio

Esposito fa varie considerazioni intorno al diritto all’oblio così come lo ha definito 13 marzo 2014, la Corte di Giustizia Europea, che ha emesso una sentenza favorevole all’attore nella causa C-131/12 a proposito del diritto dei cittadini di chiedere la rimozione dai risultati di ricerca web dei link associati al proprio nome

In particolare, colpisce questa riflessione

Si può ricordare senza dimenticare? Per ricordare meglio è necessario dimenticare di meno, oppure l’efficienza della memoria dipende dalla capacità di coordinare due abilità diverse e correlate, la capacità di ricordare e la capacità di dimenticare? Non è possibile rispondere a queste domande senza tener conto delle tecnologie dell’informazione e della comunicazione disponibili in un dato momento, a partire dal potente e rivoluzionario strumento della scrittura. Per molti secoli, tecnologie sempre più raffinate come la stampa e i sistemi per l’archiviazione delle informazioni hanno dovuto affrontare in primo luogo il problema del rafforzamento della capacità di ricordare, sottraendo alla vista il relativo problema della capacità di dimenticare, un problema con l’uso delle informazioni che ha accompagnò la civiltà occidentale fin dalla sua nascita nell’antica Grecia.
Oggi le tecniche digitali portano l’oblio in primo piano. La memoria della nostra società è affidata non solo ai testi e ai materiali d’archivio, ma anche agli strumenti che consentono di accedere e distribuire i contenuti individuali sul web, cioè gli algoritmi che partecipano alla comunicazione. Con il loro contributo possiamo trovare, archiviare e accedere a una quantità e varietà di contenuti che prima sarebbero stati impensabili, creando una forma di memoria che ricorda moltissimo. Questa memoria, però, non sembra dimenticare abbastanza, a meno che un regolamento – come quello perseguito dalla Corte di giustizia europea – non lo costringa a farlo.
Trovare il giusto equilibrio non è facile. Il tentativo di creare una forma digitale dell’oblio fa emergere tutti gli enigmi e i paradossi latenti da tanti secoli: nella forma umana della memoria, per rafforzare l’oblio, bisogna prima ricordare, ricordarsi di dimenticare. Ma gli algoritmi che creano il problema possono aiutare a risolverlo. Gli strumenti digitali ricordano così bene perché funzionano in modo diverso dall’intelligenza umana. E per lo stesso motivo possono dimenticare in modo diverso: possono dimenticare senza ricordare. Gli algoritmi che partecipano alla comunicazione possono implementare, per la prima volta, l’intuizione classica secondo cui potrebbe essere possibile rafforzare l’oblio, non cancellando i ricordi ma moltiplicandoli. Ciò richiede un cambio di prospettiva radicale. Non risolve tutti i problemi della memoria digitale e della difficoltà nel controllare la produzione continua di un eccesso di dati, ma sposta questi problemi a un livello diverso e molto più efficace: dal quadro di riferimento degli individui a quello della comunicazione.
[Infatti, anche] se Google non dirige l’elaborazione dei dati, l’attività dei motori di ricerca rende i dati accessibili agli utenti di Internet, compresi coloro che altrimenti non avrebbero trovato una determinata pagina. Permette inoltre agli utenti di avere una “panoramica strutturata” delle informazioni relative a una persona, “consentendo loro di stabilire un profilo più o meno dettagliato”. Ciò pregiudica la privacy degli interessati in modi diversi e più incisivi rispetto alla mera pubblicazione delle informazioni. Il trattamento dei dati da parte di Google è più subdolo ma più pericoloso di quello svolto da editori e giornalisti; pertanto, la società ha il compito di sopprimere i collegamenti a persone che richiedono l’oblio di tali pagine, anche se la pubblicazione è lecita e l’informazione rimane disponibile.
Questa decisione implica, senza esplicitarla, una definizione specifica di memoria sociale e oblio.
(…) Google agisce sui dati senza conoscerli e senza controllarli; quindi, non è né una biblioteca, un catalogo, un giornale, un’edicola, né un fornitore di servizi. Google è un motore di ricerca.
I motori di ricerca non sono attivi allo stesso modo di giornali, editori e biblioteche, che selezionano e organizzano le informazioni da divulgare. I motori di ricerca sono intermediari puramente passivi che forniscono semplicemente l’accesso a materiali che non hanno scelto e non conoscono. Le informazioni che gli utenti ricevono in risposta alle loro richieste sono organizzate, selezionate e classificate in un modo che non era stato precedentemente deciso da nessuno e non possono essere attribuite a nient’altro che al motore di ricerca. I motori di ricerca danno accesso alle informazioni prodotte da loro stessi. (…) L’attore che ha selezionato e prodotto le informazioni aggiuntive – il ranking – in Google è un algoritmo come PageRank che utilizza i segnali disponibili per produrre informazioni che non erano previste né dai suoi programmatori, né dagli autori di contenuti o dagli utenti della ricerca. (…) Mentre l’elaborazione delle informazioni umane si riferisce al significato, le pratiche di apprendimento automatico consentono agli algoritmi di produrre informazioni che non partomp da elementi significativi. Gli algoritmi non elaborano informazioni, elaborano solo dati. I dati di per sé non sono significativi. Sono solo numeri e cifre, cifre digitali che diventano significative solo se elaborate e presentate in un contesto, producendo informazioni. Le informazioni richiedono dati, ma i dati non sono sufficienti per avere informazioni. Gli stessi dati (ad esempio, sui movimenti del mercato azionario) possono essere informativi o meno per persone diverse in contesti diversi. (…) Gli algoritmi elaborano solo differenze, da qualsiasi fonte e con qualsiasi significato. Hanno bisogno solo dei dati che ottengono dal web, derivandoli da ciò che pensiamo e anche da ciò che facciamo senza pensarci e senza esserne consapevoli. Le macchine digitali sono in grado di identificare nei materiali che circolano sul web pattern e correlazioni che nessun essere umano ha individuato, elaborandoli in modo tale da risultare informativi per i propri utenti. Gli esseri umani, tuttavia, hanno bisogno di informazioni. Quando comunicati agli utenti, i risultati dell’elaborazione algoritmica generano informazioni e hanno conseguenze, ma le informazioni in uscita non hanno bisogno di informazioni in entrata: il significato comunicativo rivoluzionario dei big data è la sua capacità di produrre informazioni a partire da dati che non sono essi stessi informazioni. (…) Ricordiamo quindi tutto, registrandolo negli spazi (nel cloud) di un web che di per sé non ha nessuna procedura da dimenticare. La sentenza della Corte europea rispecchia questo approccio: il problema è l’accessibilità dei dati dei cittadini negli archivi indelebili del web, e la legge vuole creare la capacità del web di dimenticare (e la possibilità che i cittadini vengano dimenticati. (…) La memoria [però] richiede di concentrarsi e di selezionare i dati per produrre informazioni che si riferiscono a un contesto significativo. La memoria richiede quindi sia la capacità di ricordare che la capacità di dimenticare. (…) Il web, che conserva tutti i dati in una sorta di eterno presente, non è in grado di dimenticare, ma non è nemmeno in grado di ricordare correttamente. (…)
Gli algoritmi non ricordano correttamente e non dimenticano correttamente; si limitano a calcolare.
Quando gli algoritmi ci permettono di dimenticare (come in effetti fanno – otteniamo da Google, ad esempio, elenchi selettivi di link a siti che potrebbero interessarci), lo fanno non perché imparino a dimenticare, ma perché le loro procedure “importano” le selezioni realizzati dagli utenti per guidare il proprio comportamento. I criteri per decidere quali siti sono rilevanti e dovrebbero comparire per primi in un elenco di risultati di ricerca non sono prodotti dall’algoritmo e non sono nemmeno decisi fin dall’inizio dai programmatori; derivano invece dalle scelte degli utenti precedenti. Un sito web è considerato rilevante per l’algoritmo se molti utenti web vi si sono connessi molte volte. L’algoritmo dimentica ciò che era stato dimenticato dagli utenti. (…) I siti di gestione della reputazione sul Web (ad esempio, reputation.com) avvertono che i tentativi di rimozione dei contenuti sono spesso controproducenti. Una volta accettata da Google la richiesta di “dimenticare” e effettuata una ricerca su quella determinata persona, tra i risultati compare un avviso che alcuni contenuti sono stati rimossi in nome del diritto all’oblio. L’ovvia conseguenza è un aumento della curiosità e dell’interesse per quel contenuto. (…) per controllare l’oblio sul web in un modo specifico della memoria algoritmica, si potrebbe adottare una procedura direttamente opposta alla pratica di eliminare i contenuti o renderli non disponibili. Questa è la direzione in cui stanno andando alcune recenti tecniche di protezione della privacy, spesso intesa come protezione dell’oblio. Sono state progettate strategie di offuscamento per produrre dati fuorvianti, falsi o ambigui parallelamente a ciascuna transazione sul web — in pratica, moltiplicando la produzione di informazioni per ostacolare una contestualizzazione significativa. Se, insieme a ogni ricerca di informazioni sul web, o insieme a qualsiasi input di informazioni sui social media come Facebook, un programma software dedicato produce una massa di altre operazioni del tutto irrilevanti, sarà difficile selezionare e concentrare le informazioni rilevanti: cioè da ricordare. (…) L’indicizzazione di Google, come il catalogo di una biblioteca, fornisce informazioni. L’algoritmo stesso, però, “si nutre” di dati, che sono molto più diffusi e molto più estesi delle informazioni comprese e pensate da qualcuno in un determinato momento. 49 Gli algoritmi ricavano dati dalle informazioni disponibili nei materiali online (testi, documenti, video, blog, file di ogni tipo), e dalle informazioni fornite dagli utenti: loro richieste, consigli, commenti, chat. Gli algoritmi sono anche in grado di estrarre dati dalle informazioni sulle informazioni: i metadati che descrivono il contenuto e le proprietà di ogni documento, come il titolo, il creatore, l’oggetto, la descrizione, l’editore, i contributori, il tipo, il formato, l’identificatore, la fonte, la lingua e molto altro di più. Ciascuno di questi bit di dati si riferisce a un contesto diverso rispetto all’informazione originale, contesto di cui l’autore è solitamente inconsapevole e non aveva esplicitamente inteso comunicare. L’Internet delle cose e altre forme di intelligenza ambientale producono anche una moltitudine di dati di cui gli individui non sono a conoscenza, monitorando il loro comportamento, la loro posizione, i loro movimenti e le loro relazioni.
Inoltre, e soprattutto, gli algoritmi sono in grado di utilizzare tutti questi dati per una varietà di usi secondari che sono ampiamente indipendenti dall’intento o dal contesto originale per cui sono stati prodotti, elaborandoli per trovare correlazioni e modelli eseguendo calcoli che l’uomo la mente non potrebbe realizzare né comprendere, ma che diviene Informativo. Tali usi secondari dei dati consentono inoltre di acquisire informazioni rilevanti per la profilazione e la sorveglianza dei cittadini.
In questi processi, gli algoritmi utilizzano il “data exhaust” o le “data shadows” generate come sottoprodotto delle attività delle persone sul web e, sempre più, nel mondo in generale. È una sorta di aldilà dei dati che va ben oltre la qualità rappresentativa dei numeri e delle informazioni e dipende dall’attività autonoma degli algoritmi. Ogni differenza fa la differenza in molti modi diversi, diventando sempre più indipendente dall’informazione originaria. Gli algoritmi utilizzano i dati per produrre informazioni che non possono essere attribuite a nessun essere umano. In un certo senso, gli algoritmi ricordano ricordi che non erano mai stati pensati da nessuno.
Questa è una grande opportunità per la gestione sociale delle informazioni; tuttavia, è anche una grave minaccia alla libertà di autodeterminazione degli individui e alla possibilità di un futuro aperto. Le informazioni possono essere rese inaccessibili all’indicizzazione in virtù del diritto all’oblio, mentre i dati continuano ad essere ricordati e utilizzati dagli algoritmi per produrre informazioni diversInoltre, l’attuazione stessa del diritto all’oblio implica la raccolta di molti metadati su quali dati personali vengono utilizzati per quale scopo. Questo processo rivela preferenze personali che, seppur anonime, possono essere sfruttate da altri per la profilazione. (Elena Esposito, “Artificial Communication. How Algorithms Produce Social Intelligence”, MIT Press – rilasciato in Creative Commons, CC-BY-NC-ND)