Machine vision: il potere sulle immagini

Charisce Paglen:

La stragrande maggioranza delle immagini è ormai creata da macchine per altre macchine, con raro coinvolgimento degli umani: (…) esse non sono più chiamate a rappresentare ai mediare, ma ad attivare, operare ed eseguire (…) Ciò che è davvero rivoluzionario nell’avvento delle immagini digitali è il fatto che esse sono essenzialmente leggibili dalle macchine (…) l’immagine non ha bisogno di essere leggibile dagli umani affinché una macchina possa utilizzarla [e questo comporta immense implicazioni: amplifica] l’automazione della visione e, allo stesso tempo, consente un esercizio di potere senza precedenti su una scala che va dalle infinitesimo al planetario (…) lettori automatici di targhe automobilistiche (ALPR), montati su auto della polizia, edifici, ponti, autostrade e flotte di veicoli privati, scattano foto di ogni auto che entra nel campo visivo delle loro telecamere (…) [creando] dataset poi usati da polizia compagnie assicurative [e altri soggetti] (…) [altre piattaforme] installano telecamere in centri commerciali e negozi per tracciare i movimenti delle persone. Tramite un software dedicato identificano chi sta guardando cosa e per quanto tempo e rilevano le espressioni facciali intercettando l’umore lo stato emotivo delle persone che stanno osservando. Anche gli annunci pubblicitari hanno cominciato a guardare e registrare le persone. Nel settore industriale, (…) [alcune aziende] offrono sistemi di machine vision studiati per segnalare difetti nella lavorazione o nei materiali, per monitorare l’imballaggio, la spedizione, la logistica e il trasporto per le industrie automobilistiche, farmaceutiche, elettroniche (…). [Siamo di fronte a una] cultura visiva invisibile, [ingenuamente considerata come] cultura visiva umana. (…) Le interfacce studiate per la condivisione delle immagini digitali imitano per di più (…) [i formati tradizionali,] creando album di selfie, foto di neonati, gatti e foto di viaggio. (…) [In realtà quando] carichiamo una foto su Facebook o su altri social network stiamo addestrando una serie di sistemi AI immensamente potenti a identificare le persone, a riconoscere posti e oggetti, abitudini e preferenze, etnie, (…) genere, status economici e molto altro ancora (…) le fotografie sui social network sono esaminate da reti neurali con un livello di attenzione che farebbe arrossire anche il più accurato storico dell’arte. L’algoritmo DeepFace di Facebook (…) produce astrazioni tridimensionali dei volti degli individui e usa una rete neurale con un livello di accuratezza nell’identificare le persone superiore al 97%. È una percentuale comparabile solo a quella raggiungibile da un essere umano, fatto salvo che nessun umano può ricordare i volti di miliardi di persone. (…) Nel complesso i sistemi AI si sono appropriati della cultura visiva umana e l’hanno trasformata in un enorme e flessibile dataset. Più immagini i sistemi di AI di Facebook e Google ingeriscono, più accurati diventano, e più crescerà la loro influenza sulla vita quotidiana. I miliardi di immagini che siamo stati abituati a considerare come cultura umana costituiscono il fondamento per modalità di visione sempre più autonomi, che hanno scarsa somiglianza con la cultura visiva del passato. [Siamo di fronte a] strumenti immensamente potenti di controllo sociale a servizi e di specifici interessi di etnia e di classe, che però si presentano come imparziali e oggettivi. [Pertanto, non basta – anzi è fuorviante – rivendicare accuratezza del modo di procedere, perché questo approccio si illude di una possibile neutralità (T. Paglen, “Immagini invisibili”, – “AI & Conflicts 01”, Krisis Publishing)