

Il libro “Sustainable AI: Tools for Moving Toward Green AI” di Raghavendra Selvan affronta il dilemma centrale della tecnologia moderna: l’intelligenza artificiale (IA) è uno strumento indispensabile per combattere il cambiamento climatico, ma il suo stesso sviluppo e utilizzo sono estremamente dispendiosi in termini di risorse, con un’impronta ambientale in rapida crescita. L’argomentazione principale del testo è che la base materiale di qualsiasi tecnologia, inclusa l’IA, non può essere ignorata. Ignorare i costi massicci in termini di energia, acqua, minerali e carbonio rischia di annullare i benefici che l’IA promette di offrire per la sostenibilità.
Il documento delinea un approccio pragmatico per affrontare questa sfida, rivolto principalmente agli operatori di machine learning (ML), ai manager e ai responsabili politici. Introduce un quadro concettuale chiamato “Piramide delle Risorse” per misurare e comprendere l’impatto dell’IA, partendo dalla complessità del modello (parametri, FLOPs) fino al consumo di energia (kWh) e all’impronta di carbonio (CO2e).
Il nucleo del libro presenta una serie di strumenti e strategie pratiche per migliorare l’efficienza delle risorse in ogni fase del ciclo di vita di un modello di IA:
- Dati (Parsimonia dei Dati): Ridurre la ridondanza e il volume dei dati attraverso tecniche come la selezione di coreset, la compressione e la condensazione dei dataset.
- Selezione del Modello (MC3-Space): Navigare in modo efficiente nel vasto spazio delle architetture possibili attraverso l’ottimizzazione degli iperparametri (HPO) e la ricerca di architetture neurali (NAS) con un focus sul compromesso tra prestazioni e risorse.
- Addestramento (Efficienza dell’Addestramento): Ridurre i costi computazionali esorbitanti dell’addestramento tramite transfer learning (modelli pre-addestrati, fine-tuning, LoRA), potatura (pruning) delle reti e quantizzazione a bassa precisione.
- Inferenza (Inferenza Snella): Ottimizzare i modelli per l’implementazione, dove i costi si accumulano nel tempo, utilizzando la distillazione della conoscenza, la quantizzazione post-addestramento e la compilazione in linguaggi a basso livello come il C++.
- Hardware (Considerazioni sull’Hardware): Migliorare l’utilizzo dell’hardware attraverso la parallelizzazione, la pianificazione ecologica (green scheduling) e la collocazione dei carichi di lavoro sulle GPU, tenendo conto delle emissioni incorporate e dei rifiuti elettronici.
Infine, il testo sostiene che l’efficienza da sola non è sufficiente. A causa degli “effetti di rimbalzo” (il paradosso di Jevons), i guadagni di efficienza possono portare a un aumento del consumo totale. La vera sostenibilità dell’IA richiede un cambiamento sistemico verso un “pensiero frugale”, formalizzato nel concetto di “MLOps Verdi” (Green MLOps). Questo approccio integra la sostenibilità fin dalla fase di progettazione e richiede di affrontare le tre colonne della sostenibilità: ambientale, economica (affrontando il divario digitale globale) e sociale (considerando equità e pregiudizi).
——————————————————————————–
1. Il Dilemma Centrale: Sostenibilità e Intelligenza Artificiale
Il libro si apre evidenziando una tensione fondamentale: da un lato, l’IA è uno degli strumenti più potenti a nostra disposizione per affrontare le sfide della sostenibilità, come il cambiamento climatico; dall’altro, l’IA stessa è diventata una tecnologia ad alta intensità di risorse.
1.1. IA per la Sostenibilità (AI for Sustainability)
L’IA ha un potenziale significativo per contribuire agli Obiettivi di Sviluppo Sostenibile (SDG) delle Nazioni Unite. Il testo evidenzia un crescente interesse nella ricerca su “IA e sostenibilità”, con un aumento quasi esponenziale delle pubblicazioni nell’ultimo decennio.
Casi d’uso chiave includono:
- Mappatura della povertà (SDG #1): Modelli di deep learning analizzano immagini satellitari per stimare la ricchezza locale e informare gli sforzi di riduzione della povertà.
- Salute e benessere (SDG #3): Sistemi di IA superano i radiologi esperti nell’accuratezza dello screening del cancro al seno, migliorando la diagnosi precoce.
- Energia pulita e accessibile (SDG #7): Algoritmi di ML ottimizzano la produzione e la distribuzione di energia rinnovabile, prevedendo la produzione solare/eolica e bilanciando le reti intelligenti.
- Vita sott’acqua (SDG #14): L’IA satellitare rileva pescherecci illegali (“oscuri”) che non appaiono nei sistemi di tracciamento pubblico, aiutando a combattere la pesca eccessiva.
Il testo mette in guardia contro il “tecno-soluzionismo”, l’idea che la tecnologia da sola possa risolvere problemi complessi che hanno radici politiche, economiche e sociali.
1.2. Sostenibilità dell’IA (Sustainability of AI)
La principale argomentazione del libro è che “la base materiale di qualsiasi tecnologia non dovrebbe essere scontata”. La recente tendenza verso la scalabilità (“scale is all you need”) ha portato a modelli di IA con costi di risorse insostenibili.
I principali impatti ambientali includono:
- Consumo di Energia: I data center consumano circa l’1,5% dell’elettricità mondiale, una cifra che potrebbe raddoppiare entro il 2030. Entro il 2028, i data center mondiali potrebbero consumare più elettricità dell’intero continente africano.
- Consumo di Acqua: I data center richiedono enormi volumi di acqua dolce per il raffreddamento. L’addestramento di GPT-3, ad esempio, ha richiesto circa 5,4 milioni di litri di acqua. Questo è particolarmente problematico in aree soggette a stress idrico.
- Emissioni di Carbonio: Oltre alle emissioni operative derivanti dal consumo di elettricità, l’impatto climatico dell’IA include le emissioni “incorporate” dalla produzione di hardware, dall’estrazione di minerali critici (litio, cobalto) e dalla gestione dei rifiuti elettronici (e-waste).
- Divario Digitale: I costi fiscali elevati dell’IA su larga scala approfondiscono il divario digitale, ostacolando la sostenibilità economica e sociale.
——————————————————————————–
2. Quadri Concettuali per un’IA Sostenibile
Per affrontare questo dilemma, il libro propone diversi quadri concettuali per definire, misurare e gestire la sostenibilità dell’IA.
2.1. Definizione della Sostenibilità e dell’IA
- Sostenibilità: Aderisce alla definizione delle Nazioni Unite: “soddisfare i bisogni del presente senza compromettere la capacità delle generazioni future di soddisfare i propri bisogni”. Questa è sostenuta da tre pilastri illustrati dalla storia dell’isola danese di Samsø:
- Ambientale: Riduzione delle emissioni di carbonio e utilizzo di energie rinnovabili.
- Economico: Creazione di posti di lavoro, generazione di entrate e investimenti comunitari.
- Sociale: Proprietà collettiva, orgoglio comunitario e supporto politico.
- Intelligenza Artificiale: Piuttosto che una definizione astratta, il libro adotta una visione pragmatica dell’IA come infrastruttura—simile all’elettricità. Questa prospettiva radica l’IA nelle sue componenti materiali: data center, chip elettronici, reti energetiche e lavoro umano.
Il testo raccoglie diverse metafore sull’IA da esperti del settore:
| Citazione | Autore |
| “la nuova elettricità” | Andrew Ng |
| “uno strumento, e i suoi valori sono valori umani” | Fei-Fei Li |
| “più profondo dell’elettricità o del fuoco” | Sundar Pichai |
| “completamento automatico sotto steroidi” | Gary Marcus |
| “la scienza e l’ingegneria per creare macchine intelligenti” | McCarthy et al. |
| “né artificiale né intelligente” | Kate Crawford |
| “capace di causare un danno globale significativo” | Sam Altman |
| “un pappagallo stocastico” | Emily Bender et al. |
2.2. La Piramide delle Risorse: Un Quadro per la Misurazione
Per quantificare l’efficienza dell’IA in modo olistico, viene introdotta la “Piramide delle Risorse”, che ordina le metriche per crescente rilevanza informativa per la sostenibilità.
- Complessità del Modello (Base): Metriche indipendenti dall’hardware come numero di parametri, memoria, FLOPs e operazioni MAC (Multiply-Accumulate).
- Tempo di Calcolo: Metriche dipendenti dall’hardware come ore di GPU, tempo di inferenza e latenza.
- Consumo di Energia: Misura l’utilizzo complessivo di potenza (ad es. in kWh), includendo CPU, GPU, DRAM e l’overhead dell’infrastruttura (PUE – Power Usage Effectiveness).
- Impronta di Carbonio (Vertice): La metrica più informativa, che traduce il consumo di energia in emissioni aggregate di CO2e (equivalente di anidride carbonica) in base all’intensità di carbonio della rete elettrica.
2.3. Il Debito Ambientale e gli MLOps Verdi
Partendo dal concetto di “debito tecnico” nell’ingegneria del software, il libro introduce il “debito ambientale” dell’IA: il fardello ecologico cumulativo che si accumula a causa di scelte progettuali a breve termine che privilegiano le prestazioni rispetto alla sostenibilità. Questo debito si manifesta come:
- Debito di trasparenza: Mancata misurazione e comunicazione dei costi ambientali.
- Debito di dati: Raccolta e archiviazione di dati non necessari.
- Debito algoritmico: Scelta di modelli inefficienti o sovradimensionati.
- Debito infrastrutturale: Utilizzo di hardware o configurazioni di deployment non ottimizzati.
Per affrontare questo debito in modo sistemico, viene proposto il framework degli MLOps Verdi (Green MLOps), che integra considerazioni sulla sostenibilità in ogni fase del ciclo di vita del machine learning.
| Fase MLOps Verdi | Passi Chiave | Descrizione |
| Progettazione | Scoping della sostenibilità, valutazione impatto-costo, pianificazione dati consapevole del carbonio. | Includere limiti di emissioni e budget energetici come requisiti di progetto. Dare priorità a casi d’uso con alta utilità per unità di energia. |
| Sviluppo Modello | Parsimonia dei dati, modellazione Pareto-ottimale, valutazione allineata all’impatto climatico. | Scegliere modelli con compromessi ottimali tra accuratezza ed energia. Misurare l’energia per inferenza/addestramento. |
| Operazioni | Telemetria ambientale, deployment sostenibile, automazione consapevole del carbonio. | Registrare l’utilizzo di energia. Implementare in regioni a basse emissioni. Automatizzare gli aggiornamenti in modo intelligente per evitare sprechi. |
——————————————————————————–
3. Strategie Tecniche per un’IA Sostenibile
Il corpo centrale del libro è dedicato a un’analisi approfondita delle tecniche per ridurre gli “sprechi di IA” (AI waste) in ogni fase del ciclo di vita di un modello.
3.1. Capitolo 4: Parsimonia dei Dati
L’idea che “i dati sono il nuovo petrolio” cattura involontariamente la crescente impronta di carbonio associata all’archiviazione e all’elaborazione di vasti dataset. Questo capitolo si concentra sulla riduzione dello spreco dal punto di vista dei dati.
- Costo dei Dati: L’archiviazione di 1 TB di dati per un anno può costare circa 60 kWh e avere un’impronta di carbonio fino a 44 kgCO2e, a seconda della posizione del data center.
- Creazione Efficiente di Dataset: L’Active Learning consente di creare dataset etichettati in modo efficiente, selezionando iterativamente i campioni più informativi da far etichettare a un oracolo umano.
- Apprendimento con Dataset Ridotti (Pruned Datasets):
- Selezione di Istanze: Scegliere un sottoinsieme di dati rappresentativi utilizzando metodi come il campionamento casuale, il K-means o il K-center.
- Selezione di Coreset: Un approccio più mirato che crea un piccolo insieme di istanze che approssima il comportamento dell’intero dataset per un compito specifico.
- Apprendimento con Dati Compressi:
- Compressione dei Punti Dati: Ridurre la dimensionalità di ciascun punto dati tramite Proiezione Casuale, Analisi delle Componenti Principali (PCA) o Autoencoder.
- Condensazione del Dataset: Distillare le informazioni di un grande dataset in pochi campioni sintetici che, se usati per l’addestramento, producono prestazioni simili all’utilizzo del dataset originale.
3.2. Capitolo 5: Selezione del Modello
La scelta dell’architettura del modello e degli iperparametri corretti è un processo ad alta intensità di calcolo. L’esplorazione esaustiva di uno spazio di ricerca come NAS-Bench-101 richiederebbe 100 anni-TPU.
- MC3-Space: Un quadro gerarchico per la selezione del modello: Classe del Modello (es. CNN, Transformer), Configurazione (es. profondità, larghezza) e Complementi (es. dropout, batch norm).
- Ottimizzazione degli Iperparametri (HPO):
- Grid Search: Esplorazione esaustiva di una griglia predefinita. Inefficiente e scala esponenzialmente.
- Random Search: Campionamento casuale di combinazioni. Più efficiente della grid search con un budget di calcolo limitato.
- Ottimizzazione Bayesiana: Approccio sequenziale che costruisce un modello surrogato della funzione obiettivo per scegliere in modo intelligente i punti successivi da valutare.
- Ricerca di Architetture Neurali (NAS): Progettazione automatizzata di architetture di rete. A causa dei costi esorbitanti, la ricerca si affida sempre più a benchmark NAS tabellari o surrogati che pre-calcolano le prestazioni di migliaia di architetture.
- Modelli Fondamentali e Mixture-of-Experts (MoE): Per i modelli su larga scala, l’HPO è più comune del NAS. Le architetture MoE aumentano la capacità del modello senza un aumento proporzionale del calcolo, utilizzando un “router” per attivare solo un sottoinsieme di “esperti” per ogni token.
3.3. Capitolo 6: Efficienza dell’Addestramento
L’addestramento dei modelli di IA è la fase più intensiva in termini di calcolo, con un trend di crescita di 4-5 volte all’anno nel calcolo (FLOP) richiesto.
- Transfer Learning: Riciclare la conoscenza da modelli già addestrati.
- Modelli Pre-addestrati: Utilizzare modelli open-source da repository come Hugging Face.
- Fine-Tuning: Adattare un modello pre-addestrato a un nuovo dataset, aggiornando tutti o una parte dei suoi pesi.
- Low-Rank Adaptation (LoRA): Una forma di fine-tuning efficiente che congela i pesi del modello pre-addestrato e addestra solo piccole matrici a basso rango (“adattatori”) iniettate nel modello, riducendo drasticamente il numero di parametri addestrabili.
- Potatura (Pruning) delle Reti Neurali: Rimuovere i pesi di bassa importanza (es. quelli con la magnitudine più piccola) durante o dopo l’addestramento per creare un modello più piccolo e sparso.
- Quantizzazione: Ridurre la precisione numerica (numero di bit) utilizzata per rappresentare pesi, attivazioni e stati dell’ottimizzatore. Passare da FP32 a FP16 (mezza precisione) o INT8 può ridurre significativamente il consumo di memoria e accelerare i calcoli, specialmente su hardware supportato.
3.4. Capitolo 7: Inferenza Snella (Lean Inference)
Sebbene l’addestramento sia costoso, il costo totale del ciclo di vita di un modello di successo è spesso dominato dall’inferenza, poiché viene utilizzato milioni o miliardi di volte.
- Architetture Efficienti in Termini di Risorse: Utilizzare il NAS con ottimizzazione multiobiettivo per trovare architetture che offrano il miglior compromesso (frontiera di Pareto) tra accuratezza e una metrica di risorsa (es. latenza, consumo energetico).
- Distillazione della Conoscenza: Addestrare un modello piccolo (“studente”) per imitare le previsioni di un modello più grande e performante (“insegnante”). Lo studente impara non solo dalle etichette vere ma anche dalle probabilità “soft” prodotte dall’insegnante, catturando così la sua conoscenza più ricca.
- Quantizzazione Post-Addestramento (PTQ): Convertire un modello addestrato a piena precisione in uno a precisione inferiore (es. INT8) per l’implementazione. Questo riduce significativamente le dimensioni del modello e accelera l’inferenza.
- Implementazione Inter-Piattaforma e a Basso Livello:
- ONNX (Open Neural Network Exchange): Un formato standard aperto per rappresentare i modelli, che consente l’interoperabilità tra diversi framework (es. da PyTorch a TensorFlow) ed esecuzione efficiente.
- Inferenza in C++: Convertire i modelli sviluppati in Python in C++ compilato per ottenere massime prestazioni e un consumo minimo di risorse, specialmente per dispositivi edge. Progetti come
llama.cpphanno dimostrato l’efficacia di questo approccio per gli LLM.
3.5. Capitolo 8: Considerazioni sull’Hardware
L’hardware è il fondamento materiale dell’IA. L’ottimizzazione del suo utilizzo è cruciale.
- Costo Ambientale dell’Hardware: Le emissioni incorporate dalla produzione, il trasporto e l’assemblaggio dell’hardware (in particolare le GPU) e il crescente problema dei rifiuti elettronici (e-waste) sono componenti significativi dell’impronta dell’IA.
- Ottimizzazione a Livello di Cluster:
- Green Scheduling: Eseguire carichi di lavoro computazionali in momenti o luoghi in cui l’elettricità è più pulita (cioè con minore intensità di carbonio).
- Parallelismo: Distribuire i carichi di lavoro su più GPU utilizzando il parallelismo dei dati, del modello o della pipeline per massimizzare l’utilizzo.
- Ottimizzazione a Livello di Acceleratore:
- Collocazione su GPU: Eseguire più processi su una singola GPU contemporaneamente per massimizzare l’utilizzo, utilizzando tecniche come Multi-Process Service (MPS) o Multi-Instance GPU (MIG).
- Scaling Dinamico di Tensione e Frequenza (DVFS): Regolare dinamicamente la tensione e la frequenza di clock di un processore in base al carico di lavoro per risparmiare energia.
- Software Ottimizzato per l’Hardware: Utilizzare compilatori specializzati (es. NVCC di NVIDIA per CUDA) per generare codice che sfrutta appieno le capacità di un’architettura hardware specifica.
——————————————————————————–
4. La Via da Seguire: Oltre l’Efficienza
Il capitolo finale del libro offre una riflessione critica, sostenendo che l’efficienza è una condizione necessaria ma non sufficiente per un’IA sostenibile.
- Effetti di Rimbalzo e il Paradosso di Jevons: I miglioramenti nell’efficienza hardware e algoritmica, invece di ridurre il consumo totale di risorse, hanno spesso incoraggiato lo sviluppo di modelli ancora più grandi, portando a un aumento netto del consumo.
- Il Quadro Agenzia-Scopo: L’impatto di un professionista di ML è limitato. Mentre hanno un’alta agenzia (controllo) sulle ottimizzazioni a livello di efficienza, la loro agenzia diminuisce man mano che lo scopo si allarga per includere il ciclo di vita del modello, le piattaforme hardware e infine i sistemi ambientali, economici e sociali.
- Sostenibilità Economica e Sociale: La vera sostenibilità deve affrontare le disuguaglianze globali. L’enorme investimento richiesto per l’IA all’avanguardia concentra il potere in pochi paesi ad alto reddito, creando un rischio di “colonialismo digitale”. Inoltre, la sostenibilità sociale richiede di affrontare l’equità, i pregiudizi e la privacy, che possono comportare costi computazionali aggiuntivi, creando una tensione con la sostenibilità ambientale.
- Il Pensiero Sistemico: Per evitare conseguenze indesiderate, è necessario adottare un approccio di “pensiero sistemico”, considerando l’IA come parte di un tutto interconnesso. Il libro propone il Sustainable AI Systems Assessment (SASA), un quadro di domande per anticipare gli effetti sistemici delle decisioni di progettazione.
In conclusione, “Sustainable AI” è un appello a una visione olistica. I professionisti di ML devono iniziare con gli strumenti a loro disposizione—ottimizzando dati, modelli, addestramento e inferenza—ma la comunità nel suo insieme deve spingere per un cambiamento sistemico che integri la sostenibilità ambientale, economica e sociale nel tessuto stesso dello sviluppo dell’IA.
Devi effettuare l'accesso per postare un commento.