La tesi di fondo di Mayer-Schönberger e di Ramge sul fatto che siamo nel migliore dei mondi economici possibile, fondato su “profitti sani”, è questa:
i mercati costituiscono una straordinaria innovazione sociale che ci consente di coordinare le nostre attività in modo efficiente, almeno in linea di principio. Nella pratica, soffrono di flussi di informazione limitati. Per ridurre la quantità di informazioni da comunicare ed elaborare ci affidiamo al denaro e al prezzo. Ma questa compressione delle informazioni significa che gli attori del mercato non sono sempre in grado di condividere le loro preferenze in modo completo o di valutarle in maniera adeguata nel loro processo decisionale. Se il prezzo può risolvere il problema di un eccesso di informazioni, può indurci però a scelte errate. La nostra ossessione per il prezzo ha frenato la capacità del mercato di fare ciò che meglio dovrebbe fare: coordinare. La risposta a questo problema non è il pagamento digitale o il denaro virtuale. Questo potrebbe accelerare i flussi di informazione esistenti o renderli più economici, ma le informazioni sarebbero comunque compresse in termini di prezzo, e private di dettagli preziosi. La soluzione non consiste nell’armeggiare con il denaro ma nel sostituire – o almeno integrare – il suo ruolo informativo con flussi di dati ricchi e completi. Per il fatto di aiutare gli attori a trovare matching sempre migliori, potremmo definire i dati come il nuovo lubrificante con cui oliare gli ingranaggi del mercato. La differenza più immediata ed evidente tra i mercati convenzionali e quelli data-rich risiede pertanto nel volume e nella varietà dei dati che fluiscono tra i diversi attori. Piuttosto che limitarsi al flusso di informazioni sul prezzo, nei mercati dati-rich gli operatori mirano a trasmettere e ad agire sull’intera gamma di informazioni relative alle preferenze, utilizzando le strutture informative del mercato stesso per comunicare tutti questi dati a basso costo. In teoria, avremmo potuto utilizzare dati più ricchi anche ai tempi dell’analogico, ma i costi sarebbero stati molto più elevati. Grazie alle reti digitali, enormi quantità di dati possono adesso fluire rapidamente, facilmente e a buon mercato tra i partner di una transazione, e a prescindere dalla distanza che li separa. Ma il semplice allargamento delle pipeline dei dati, per quanto possa risolvere la sfida posta dalla «carenza di informazioni», verrebbe probabilmente a creare un sovraccarico di informazioni.(…) Non abbiamo bisogno soltanto di molti più dati, ma anche dei metodi e degli strumenti giusti per lavorare con quei dati. È stata proprio l’assenza di tali metodi a mantenere in vita i mercati basati sul denaro nei primi decenni dell’era digitale. Tuttavia, le cose stanno cambiando. La recente convergenza dei progressi nella gestione dei dati ci consente finalmente di lasciarci alle spalle i limiti imposti dal denaro e dai prezzi e di sfruttare la ricchezza dei dati sui mercati. Le tecnologie cruciali per questa riconfigurazione dei mercati sono tre e ci permettono di (1) utilizzare un linguaggio standard quando confrontiamo le nostre preferenze, (2) abbinare meglio le preferenze su più variabili in modo da poter selezionare i partner di transazione ottimali e (3) mettere a punto un sistema efficace per registrare in maniera esaustiva le nostre preferenze. Tutte e tre le tecnologie hanno in comune il fatto che facilitano la traduzione di rich-data in decisioni di transazione efficaci. (…) Quando facciamo acquisti online (…) disponiamo di tutta una serie di caratteristiche da considerare, oltre che di sofisticati strumenti di ricerca e filtro che ci consentono di esplorare, ricercare e confrontare i prodotti. A rendere possibile tutto questo non sono la velocità, il basso costo o la capacità di archiviazione della tecnologia che utilizziamo. Non è nemmeno semplicemente l’accresciuto volume delle informazioni disponibili. Ciò che consente migliori matching è l’efficacia che abbiamo acquisito nel taggare e categorizzare le informazioni. (…) Come fa un rivenditore online a fornirvi così tante informazioni [sui propri beni o servizi]? Taggando ciascun articolo con i dati che ne descrivono le caratteristiche. Il che richiede, comunque, che tutti gli articoli di un determinato tipo (…) siano taggati utilizzando lo stesso insieme di categorie. Queste categorie non sono che dati; anzi, trattandosi di dati su dati, sono più precisamente metadati. (…) Ai tempi dei database relazionali, i dati erano puliti e ordinati, perché ogni campo era definito con chiarezza, fino a specificare il formato esatto del proprio contenuto. Dalla fine degli anni Novanta, tuttavia, quest’accuratezza è stata messa in discussione dalla crescita esponenziale delle informazioni digitali, molte delle quali non rientrano perfettamente in un campo di database, dal momento che si presentano sotto forma di email, pagine web, immagini e file audio e video. (…) ESPN si è affidata al lavoro [di categorizzazione] umano, impiegando decine di persone perché guardassero contemporaneamente più eventi sportivi in tempo reale e taggassero manualmente ogni fase o scambio di gioco. (…) Questi taggatori (…) hanno ricevuto una formazione che consente loro di utilizzare una gerarchia di parole chiave ben sviluppata (…) mentre etichettano i video che guardano. (…). Ogni volta che esiste un insieme ben delimitato di parametri, la ricerca dell’articolo più appropriato per un determinato consumatore risulta semplificata. (…) una delle ragioni per cui Jeff Bezos ha lanciato Amazon come libreria online nel 1994 risiedeva (…) nel fatto che le case editrici avessero da poco digitalizzato i propri cataloghi stagionali: Bezos ha pensato insomma di costruire la propria azienda partendo da quei dati. Lo stesso fondamento consente agli utenti Amazon di selezionare, filtrare e confrontare i prodotti non solo in base a brand, prezzi e recensioni degli acquirenti, ma anche in base a molte altre caratteristiche meno ovvie. (…) Al contrario, sviluppare [una gerarchia di parole chiave] per un mercato generico è molto più complicato. (…) Al momento, YouTube non è in grado di competere con la profondità e l’ampiezza delle parole chiave che costituiscono ormai lo standard di ESPN (…) Senza filtri in grado di facilitare in maniera pratica l’individuazione, l’efficienza del mercato diminuisce considerevolmente. Poiché il successo in molti mercati dipende appunto dalla ricchezza del flusso di dati che si riesce a garantire, si è venuta a creare una notevole pressione economica sullo sviluppo di strategie di taggatura efficaci. (…) Sono numerosi i settori – viaggi, car sharing, elettronica – in cui possiamo già trarre profitto dai mercati data-rich. Più ricca e complessa è l’informazione, però, e più sarà difficile elaborarla (valutare, cioè, ogni parametro in base alle nostre preferenze e selezionare il partner di transazione ottimale). Tradurre una valanga di informazioni in decisioni è un processo complicato. (…) La vera sfida proviene dal sovraccarico di informazioni, tra cui figurano anche le troppe opzioni attraverso cui filtrare e selezionare alla ricerca della corrispondenza ottimale. (…) negli ultimi decenni matematici ed economisti hanno lavorato sodo per sviluppare algoritmi in grado di valutare insiemi di preferenze multiple e la relativa ponderazione, e per identificare le corrispondenze migliori. (…) Poiché quelli relativi alle preferenze non costituiscono che un unico flusso di dati che forma un particolare schema ricorrente, possiamo adattare gli algoritmi di pattern matching perché ci aiutino a identificare i partner ottimali per ogni transazione. Il che non è semplice sotto nessun punto di vista (scegliere esattamente che cosa confrontare con che cosa non è irrilevante), ma grazie ad algoritmi sempre più performanti, affinati in gran parte attraverso l’utilizzo di enormi quantità di dati per l’addestramento, il compito è andato via via semplificandosi. Nei mercati data-rich questi algoritmi sono il metodo attraverso cui i partner di una transazione possono trovarsi a vicenda. Ciò costituisce un enorme passo avanti rispetto alle decisioni basate sul prezzo, dal momento che consente ad acquirenti e venditori di sfruttare appieno i flussi di dati completi disponibili e di tradurli efficacemente in transazioni. (…) Nei mercati data-rich ogni scambio tra potenziali partner rivela più informazioni, migliorando gli esiti anche quando non porta a una transazione. (…) così da migliorare il benessere generale. (…) siamo solo all’inizio. Non tutti questi algoritmi impiegano tutte le variabili delle preferenze a loro disposizione. E questo apre elettrizzanti opportunità per le startup più innovative, attualmente in competizione verso il prossimo salto di qualità in fatto di matching. (…) A lungo termine, (…) il matching sarà ormai considerato un servizio di base, e verrà dato dunque per scontato che i mercati lo forniscano. (…) Perché i mercati data-rich possano funzionare, tuttavia, è necessario un ulteriore elemento. (…) Grazie ai rich-data, ciascun attore del mercato può apprendere le preferenze degli altri e associarle utilizzando algoritmi di matching; resta però da capire in che modo i vari attori possano esprimere le loro preferenze (e la ponderazione relativa) e comunicarle agli altri. Si tratta di una sfida ardua, la cui risoluzione però è cruciale. Nessuno vuole effettuare transazioni su mercati che richiedono ore di tempo per rispondere a questionari. Fortunatamente, anche in questo campo i recenti progressi tecnologici ci hanno avvicinato parecchio a quelle che potremmo definire soluzioni praticabili. Prendiamo ancora una volta in esame il motore utilizzato da Amazon per consigliare i propri prodotti: (…) Amazon non intercetta le nostre preferenze direttamente da noi, ma dal flusso di dati complessivo che raccoglie su ogni nostra interazione con il suo sito web: quali prodotti guardiamo, quando e per quanto tempo li guardiamo, quali recensioni leggiamo. Nei dati Amazon ricerca particolari ricorsività che rivelano le nostre preferenze. L’identificazione di tali pattern consente all’azienda di ricavare statisticamente i nostri desideri e i nostri bisogni senza doverceli chiedere direttamente. (…)
La strategia di Amazon (…= è rappresentativa di Big Data, un approccio all’analisi dei dati che mira a catturare una mole esaustiva di dati su un particolare fenomeno, alla ricerca dei complessi schemi ricorrenti che incorporano. Concentrandosi sull’analisi di questi pattern, si differenzia dalle statistiche convenzionali che puntano invece a condensare i dati alla loro essenza, calcolandone la media o la regressione. Una caratteristica di molti approcci del tipo Big Data è che lo schema che si cerca non è definito a priori; piuttosto, emerge man mano che enormi quantità di dati di addestramento vengono analizzate. Nel contesto delle raccomandazioni di Amazon, per esempio, ciò significa che il sistema non sa quale pattern di dati suggerisca una particolare preferenza del cliente; è solo analizzando anni di interazioni e acquisti che riesce a individuare il più probabile. (…)
Affinché un simile approccio di machine learning funzioni bene, devono essere soddisfatte due condizioni. Prima di tutto, servono inizialmente enormi volumi di dati, per consentire ai sistemi di machine learning di addestrarsi ed esplicitare il contenuto incorporato nei dati. (…) In secondo luogo, il sistema deve ricevere feedback frequenti che gli consentano, nel tempo, di autoregolarsi in base a circostanze specifiche e mutevoli che vadano oltre l’addestramento iniziale. I nuovi sistemi di machine learning cercano qualcosa in più dei semplici pattern nei dati: utilizzano i dati di feedback in modo più sfumato e differenziato, declassando per esempio quelli più vecchi, un po’ come fa la memoria umana.
(…) [Il] feedback è fondamentale per qualsiasi sistema di questo tipo, specialmente quando venga utilizzato per prestare assistenza a un processo decisionale importante. (…) [e] può essere utilizzato per apprendere le mutevoli preferenze degli attori del mercato. (…) Nel mercato, la combinazione di un addestramento massivo basato sui dati seguito da feedback adattivi e apprendimento personalizzato offre il potenziale per significativi vantaggi in termini di efficienza. I sistemi adattivi di machine learning possono ridurre l’influenza dei nostri bias cognitivi nel processo decisionale pur consentendoci di rimanere noi stessi. (…) Sebbene ogni individuo sia gravato da una combinazione unica di bias, i segnali provenienti da un ampio gruppo di individui diversi possono diminuire il peso delle forme di bias più estreme. Le limitazioni cognitive implicite nelle nostre preferenze non scompariranno, ma il sistema potrebbe aiutarci a ritornare sul significato medio, se è quello che vogliamo.(…) un sistema di questo tipo ha tutto il potenziale per offrirci il meglio di entrambi i mondi: ci espone alle competenze decisionali di migliaia o milioni di altri partecipanti al mercato mentre impara a seguire le nostre preferenze e priorità nel tempo. (…) Ogni segnale – dallo scambio di denaro allorché una transazione viene concordata fino al più piccolo accenno di interesse (o alla sua assenza) allorché un soggetto analizza le opzioni disponibili – possiede un valore informativo. Anche la sequenza delle interazioni, ovvero l’ordine in cui si manifestano i segnali, è importante. I segnali sono abbastanza piccoli da dar vita a un’elevata quantità di dati; tuttavia, i dati puntuali sono sufficientemente collegati per l’analisi delle preferenze. (…)
Tutti gli elementi necessari per ri-creare il mercato sono operativi. I miglioramenti ottenuti nell’ontologia dei dati ci consentono di estrarre dati preziosi da flussi enormi e di suddividerli in base a svariate dimensioni. I progressi negli algoritmi di matching ci consentono di trovare e selezionare il partner di transazione ottimale nel mercato di nostra scelta. E i sistemi di machine learning identificano le nostre preferenze osservandoci, così da non rendere necessario, da parte nostra, perdere tempo a esplicitare le nostre preferenze (e la loro relativa ponderazione). Come nostri fidati assistenti, ci consigliano quando scegliamo e ci mettono in guardia (se desideriamo che lo facciano) quando stiamo per prendere una decisione influenzata da un bias. Potrebbero anche finire per decidere al posto nostro in diverse situazioni.
Se combinate, queste tecniche faranno di noi compratori e venditori formidabili, e non perché vinceremo ogni trattativa, ma perché agiremo con efficienza, grazie all’incessante ottimizzazione dei risultati in base alle nostre preferenze. Non solo gioveranno ai partecipanti, ma miglioreranno notevolmente il mercato nel suo complesso, facendone lo strumento più efficiente attraverso cui coordinare l’attività umana. (Mayer-Schönberger V. – Ramge T., “Reinventare il capitalismo nell’era dei big data“, Egea)