Tubaro e Casilli ricostruiscono:
Rispondere anche a una banale domanda sul tempo in una certa località o sulla ricetta di un piatto casalingo richiede la realizzazione di una sequenza di operazioni, ognuna delle quali può essere impegnativa per una macchina. Prima di poter fornire una risposta vera e propria, la domanda pronunciata dall’utente deve essere trascritta, analizzata alla ricerca di caratteristiche semantiche e sintattiche e confrontata con un database di fatti e di domande precedenti. La soluzione computazionale a questi problemi si basa sull’apprendimento automatico (…) un algoritmo deve essere “addestrato” con dati campione (…) È necessario un gran numero di registrazioni di questo tipo, in modo che l’algoritmo possa imparare che tutti significano la stessa cosa, nonostante le differenze di timbro, tipo e tono di voce, accenti regionali e livello di rumore di fondo. Ma l’addestramento iniziale è solo un passo verso la produzione di una soluzione AI funzionante, poiché successivamente l’algoritmo deve essere testato e può essere sottoposto ad altre fasi di addestramento per migliorare le sue prestazioni. Alcune di queste fasi possono includere interventi umani diretti, in cui un operatore si occupa di eseguire i compiti che il sistema di intelligenza artificiale non è in grado di eseguire a causa della mancanza di dati, di parametri difettosi o di difetti nel codice. [Inoltre] possono successivamente rendersi necessari aggiornamenti. [Questi processi si basano su molti dati personali e su molti interventi di esseri umani]. (…) Anche quando una nuova tecnologia ad attivazione vocale sarà sufficientemente matura e non avrà più bisogno di imitatori umani, la necessità di lavoratori per preparare i set di dati e, soprattutto, per eseguire controlli di qualità sui risultati resterà elevata. (…) I rischi per la privacy sia per i consumatori che per i lavoratori e i rischi psicosociali per i lavoratori vanno di pari passo e derivano dalla natura stessa della produzione di questi sistemi. Il modo in cui oggi viene prodotta l’intelligenza artificiale basata sulla voce, che richiede enormi quantità di dati, genera la necessità di masse sempre più grandi di registrazioni in tutte le fasi del processo produttivo, con effetti potenzialmente rivelatori. I modelli di organizzazione industriale che meglio si adattano a queste tecnologie, basati sul subappalto e sulla piattaforma, pongono i lavoratori in una posizione di svantaggio e li espongono alle conseguenze della
precarietà e dei bassi salari. (P. Tubaro – A. A. Casilli, “Human Listeners and Virtual Assistants: Privacy and Labor Arbitrage in the Production of Smart Technologies” – traduzione in proprio)

Da “The trainer, the verifier, the imitator: Three ways in which human platform workers support artificial intelligence” – traduzione in proprio