Prima di tutto, invisibilizzare il lavoro di base

Il contenzioso sulla distillazione fa riemergere lo stanco cliché xenofonico secondo cui l’innovazione asiatica è solo ingegno occidentale venduto a prezzi scontati. È importante notare che, mentre gli esperti analizzano le specifiche tecniche e le implicazioni strategiche nazionali, trascurano una verità fondamentale: i modelli di intelligenza artificiale non si addestrano da soli. Le fondamenta di DeepSeek poggiano sul lavoro umano. Questo punto cieco nel discorso sull’IA rivela come le metriche tecniche e gli interessi geopolitici mettano costantemente in ombra l’elemento umano. (…) DeepSeek può anche promettere un’automazione che consenta di risparmiare lavoro, ma, come tutti i modelli di IA, si basa sul lavoro umano. (…) L’annotazione dei dati è un mercato del lavoro globale guidato dall’intelligenza artificiale. Sebbene le stime indichino un numero enorme di lavoratori, la realtà rimane frammentata, con regioni significative – in particolare la Cina – che rimangono in una zona cieca. A differenza della documentazione dettagliata dei lavoratori in altre regioni, abbiamo incontrato notevoli ostacoli nell’accesso alle informazioni sugli annotatori di dati per le aziende cinesi. I rari casi che abbiamo documentato includono giovani donne del Cairo che lavorano per l’azienda cinese Tencent sui sistemi di riconoscimento facciale e lavoratori europei che trascrivono conversazioni di assistenti vocali per una piattaforma cinese che verifica i dati per un gigante tecnologico statunitense. (…) , le aziende cinesi di intelligenza artificiale sfruttano principalmente le regioni urbane a basso reddito. Le grandi aziende tecnologiche delle città ricche come Shanghai, Shenzhen e Hangzhou, dove ha sede DeepSeek, reclutano sistematicamente lavoratori dalle aree urbane popolose a bassa crescita economica. Aziende come DataTang, DreamDate e DataOceanAI hanno avviato massicce operazioni di annotazione dei dati in queste città “Tier- 3”, dove assumono lavoratori disposti ad accettare salari minimi per lavori ripetitivi. (…) In uno studio storico del 2023, i sociologi Wu Tong -yu e Xia Bing -qing illustrano la struttura di questo mercato. Le aziende specializzate nell’annotazione fungono da intermediari, mettendo in contatto le imprese di IA con i pool di annotatori e gestendo la formazione dei lavoratori. Queste operazioni ricevono spesso il sostegno del governo locale, e alcune di esse nascono da programmi di riduzione della povertà. Tuttavia, la concorrenza tra queste basi di annotazione ha innescato una spirale salariale verso il basso. (…) il governo cinese riconosce pienamente la centralità del lavoro sui dati nel guidare il suo settore dell’IA. (…) Negli ultimi anni, il settore dell’annotazione dei dati in Cina ha subito una notevole trasformazione, passando da un mercato sostenuto dalle amministrazioni locali all’oggetto di una strategia nazionale globale per la crescita dell’industria. L’intervento strategico del governo centrale, dettagliato nei documenti politici emessi dalla National Data Administration e dalla National Development and Reform Commission, ha rimodellato radicalmente il panorama dell’etichettatura dei dati. (…) L’annotazione dei dati gode ora del sostegno ufficiale del governo cinese, che riduce il costo del lavoro sui dati, un vantaggio che probabilmente ha contribuito alla rapida ascesa di DeepSeek. L’obiettivo strategico è ambizioso: raggiungere un tasso di crescita medio annuo superiore al 20% nel mercato dell’annotazione dei dati entro il 2027. (…) l’annotazione umana non si sta solo espandendo, ma sembra destinata a diventare un pilastro duraturo dell’economia cinese, grazie alla creazione di centri e distretti dedicati. Le regioni sono incoraggiate a investire in prodotti di dati, con iniziative degne di nota come la Base nazionale di annotazione dei dati prevista per l’isola di Hainan (…) la posizione di DeepSeek sull’etichettatura dei dati oscilla tra la segretezza e l’incoerenza. L’azienda di IA insiste nel bollare i suoi modelli come frugali, non solo per la potenza di calcolo ma anche per la loro presunta minima dipendenza dal lavoro umano sui dati. Tuttavia, nonostante tutte le sue dichiarazioni di apertura, l’azienda continua a mantenere una notevole segretezza sulle dimensioni e sulla composizione del suo database di addestramento, e quindi sulle dimensioni del suo gruppo di annotatori. (…) . Ogni sofisticata attività di ragionamento, nella sua essenza, dipende ancora dall’apprendimento guidato dall’uomo. Un rapporto tecnico pubblicato da DeepSeek nel gennaio 2025 rivela come anche il loro modello più recente si basi pesantemente sui dati filtrati e arricchiti dal lavoro umano in domini come la scrittura, la risposta a domande concrete e la autonomacognizione . La narrazione della startup oscilla tra la banalizzazione e la contemporanea nobilitazione di questo lavoro sui dati. DeepSeek sminuisce l’annotazione come banale e al tempo stesso la presenta come un’attività scientifica. (…) Da questo punto di vista, l’approccio di DeepSeek al lavoro e ai lavoratori rispecchia quello delle sue controparti occidentali. L’offuscamento delle pratiche di lavoro sui dati è standard nell’industria tecnologica: l’azienda non solo segue il manuale convenzionale di divulgazione selettiva, ma attinge anche allo stesso pool di risorse e metodi globali per generare i dati su cui lavorano gli annotatori. Un esempio è Common Crawl, il vasto archivio di documenti Internet utilizzato sia per il modello DeepSeekMath sia… dal suo acerrimo nemico OpenAI nello sviluppo di ChatGPT. La forza lavoro di annotazione che sta dietro alla loro tecnologia rimane avvolta nel mistero, mettendo in dubbio come un team apparentemente modesto possa orchestrare un modello che comprende trilioni di parametri. Questa strategia incarna una tendenza pervasiva del settore: grandi proclami di indipendenza tecnologica che mascherano la vasta infrastruttura umana, strategicamente nascosta, che alimenta i sistemi di intelligenza artificiale contemporanei. (Casilli, A. A., Le Bonniec, T., Posada, J. 2025. “The Human Cost of DeepSeek. Hype the technology, hide the workers”, DiPLab Policy Memo, vol. 1, n. 1. – traduzione in proprio)