“Lettura a distanza” – che elabora corpora – è un’espressione introdotta da Franco Moretti per contrapposizione alla “lettura umana ravvicinata“, che insiste su testi, come ci ricorda Elena Esposito
La lettura a distanza si basa sul fatto che, attraverso tecniche di data mining e visualizzazione, possiamo trattare testi diversi da quelli trasmessi da libri: la stabilità del testo stampato si perde nella “processualità” dei testi su supporti elettronici.
Vi è poi, oltre a quella dall’oggetto, che consente di allargare il campo, la distanza dal significato: gli algoritmi riconoscono di cosa tratta un testo non perché ne comprendano le parole o ne interpretino il significato, ma perché trattano i significati come cose; il significato è connesso ad altri significati per rivelare schemi; ma i modelli stessi non hanno necessariamente un significato e non sono il risultato di un’interpretazione.
Trattando grandi corpora, invece di leggere, si contano le cose; invece di interpretare, si costruiscono grafici, mappe e alberi. Invece di comprendere il significato, si sviluppa un’analisi topologica che consente la visualizzazione di schemi “a distanza” che sarebbe sfuggita alla vista della tradizionale lettura ravvicinata.
L’uso di tecniche algoritmiche prefigura una modalità di trattare i testi che non cancella ma, al contrario, accentua e sfrutta le differenze tra le diverse modalità di utilizzo dei materiali scritti. La combinazione di elaborazione algoritmica e lettura umana produce un nuovo e potente modo di analizzare i testi. Il contributo produttivo degli algoritmi alla produzione di informazioni si basa infatti sulla loro partecipazione alla comunicazione artificiale.
Gli algoritmi in sé non leggono e la lettura non può essere eseguita senza interpretazione. Gli algoritmi producono solo modelli, che di per sé non hanno significato e sono generalmente sovrabbondanti. Lavorando con insiemi di dati di grandi dimensioni, come i corpora su cui si pratica la lettura a distanza, è inevitabile trovare schemi, anzi, trovarne troppi: queste visualizzazioni vanno considerate provocazioni, che possono essere accettate, perché consentono di identificare aree o relazioni di interesse all’interno di grandi volumi di testi. L’interpretazione è invece prodotta da un lettore umano, sebbene attraverso modalità e potenzialità che non sarebbero possibili senza il contributo autonomo di algoritmi.
Ciò che si configura non è più la lettura tradizionale. Un grafico a dispersione che analizza la distribuzione delle forme delle parole in un corpus di testi può generare gruppi che non sono basati sull’interpretazione, ma possono modificare in modo significativo la lettura interpretativa, ad esempio trovando connessioni tra parole e gruppi di parole in un modo che non potrebbe essere rilevato da qualsiasi osservatore umano e sollevando così nuovi interrogativi.
In questi casi, la macchina opera come un partner che formula proposte che possono indirizzare l’interpretazione in direzioni inesplorate.
In sintesi, la lettura algoritmica non coincide con la lettura interpretativa tradizionale e non implica che gli algoritmi stessi leggano. È ancora una forma di lettura perché parte dai testi e produce interpretazioni, ma in un modo nuovo e potente che si basa sul ruolo attivo e autonomo di algoritmi che non interpretano essi stessi.