Ricorro a NotebookLM per riassumere rapidamente e analizzare secondo più approcci un articolo davvero basilare per la comprensione dei dispositivi di intelligenza, da considerare insieme alle riflessioni di DipLAB sulla costante invisibilizzazione del lavoro umano, in termini di quantità e di importanza.
Introduzione
Questo documento analizza l’articolo di Franco Marra intitolato “La bolla dell’intelligenza artificiale e un gol segnato in contropiede”, pubblicato il 7 febbraio 2025. L’articolo esamina criticamente lo stato attuale dell’intelligenza artificiale (IA), in particolare l’ascesa dei modelli di linguaggio di grandi dimensioni (LLM), evidenziando la loro dipendenza da un’enorme potenza computazionale e i conseguenti costi energetici. L’articolo sottolinea inoltre l’emergere di un approccio cinese all’IA più efficiente, che potrebbe sfidare il dominio occidentale.
Temi Principali
- L’IA come Forza Bruta Matematica: L’articolo descrive l’IA come un sistema basato sulla “forza bruta matematica”. I dati sono trasformati in “vettori” numerici, sui quali le reti neurali eseguono calcoli per classificare e categorizzare informazioni. “Ogni cosa viene misurata e rappresentata in macchina secondo un gran numero di parametri (la cui scelta è già un atto politico).”
- Consumo Energetico Eccessivo: Un punto cruciale è l’enorme consumo di energia delle reti neurali: “A differenza del cervello umano però, che consuma come una lampadina da 20W, gli algoritmi di calcolo vettoriale delle reti neurali divorano spropositate quantità di energia.” Questo consumo è legato all’addestramento dei modelli (training), processo molto costoso in termini di energia e risorse.
- LLM Come “Estrusori di Stringhe di Testo Probabili”: Gli LLM, come ChatGPT, sono descritti come “estrusori di stringhe di testo probabili”, citando Daniela Tafani. Sono definiti anche come “pappagalli stocastici” (termine ripreso dall’articolo di Timnit Gebru e Margareth Mitchell che causò il loro licenziamento da Google). Questo sottolinea la loro mancanza di comprensione del significato del testo che generano e la loro tendenza a produrre “stronzate” che per caso sono vere.
- Il Ruolo dell’Attenzione: L’articolo spiega come l’ “attenzione” (concetto chiave nel funzionamento delle reti neurali), basata sull’analisi statistica del contesto, aiuti a disambiguare il significato delle parole. Tuttavia, questo processo aumenta ulteriormente il carico computazionale.
- Il Contropiede Cinese con DeepSeek: L’articolo evidenzia il successo di DeepSeek, un’IA cinese che ha ottenuto risultati notevoli con un minor consumo energetico e un approccio “frugale” basato sulla cultura locale. “Gli ingegneri cinesi, soggetti all’embargo delle GPU più potenti, hanno infatti fatto leva sulle caratteristiche della loro cultura – frugalità, cooperazione, e inventività… per entrare, con il botto, in un mercato popolato da brontosauri”. DeepSeek utilizza “vecchi” chip H800 di NVIDIA, dimostrando che non è necessaria la tecnologia più avanzata per ottenere prestazioni elevate.
- La Bolla dell’IA e la Reazione Americana: L’articolo paragona l’attuale situazione dell’IA alla bolla dotcom degli anni ’90, sottolineando le promesse di AGI (Intelligenza Artificiale Generale) di Sam Altman per attirare investimenti. La risposta americana al successo di DeepSeek è descritta come scomposta, con accuse di furto di modelli e preoccupazioni sulla sicurezza, ma che non cambiano la “sostanza del problema.”
- L’Open Source di DeepSeek e il Downsizing dell’IA: Un altro punto cruciale è che il modello di DeepSeek è open-source, al contrario di ChatGPT, che è proprietario. Ciò facilita la diffusione dell’IA e il suo utilizzo su molte macchine, portando potenzialmente a una fase di “downsizing” dell’IA.
- Guerra dei Prezzi e Fine delle Speranze di Guadagno: La comparsa dell’IA cinese ha portato a una “guerra dei prezzi” nel settore, con i servizi premium americani che diventano gratuiti, mettendo in discussione le speranze di rapidi ritorni sugli investimenti.
- L’arrivo di altri contendenti: Oltre a DeepSeek, emergono altri attori, come Qwen (Cina) e Velvet (Italia), indicando un panorama sempre più competitivo.
Idee e Fatti Chiave
- L’IA attuale, basata su reti neurali, richiede un enorme dispendio energetico.
- Gli LLM sono “estrusori di stringhe di testo” senza una vera comprensione del significato.
- Il modello cinese di DeepSeek rappresenta un approccio più efficiente e “frugale” all’IA, mettendo in discussione il dominio occidentale.
- Il mercato dell’IA potrebbe essere in una fase di bolla finanziaria.
- La disponibilità open source di modelli come DeepSeek potrebbe portare al “downsizing” dell’IA.
Citazioni significative:
- “L’Intelligenza Artificiale si basa sulla forza bruta matematica.”
- “A differenza del cervello umano però, che consuma come una lampadina da 20W, gli algoritmi di calcolo vettoriale delle reti neurali divorano spropositate quantità di energia.”
- “Nel caso dei linguaggi, gli LLM (Large Language Model) che scrivono e traducono, altro non sono quindi che “estrusori di stringhe di testo probabili”, come dice Daniela Tafani… o “pappagalli stocastici”, come definiti dal famoso articolo…”
- “Gli ingegneri cinesi, soggetti all’embargo delle GPU più potenti, hanno infatti fatto leva sulle caratteristiche della loro cultura – frugalità, cooperazione, e inventività… per entrare, con il botto, in un mercato popolato da brontosauri”
Conclusioni
L’articolo di Marra offre una visione critica e approfondita dell’attuale panorama dell’IA, mettendo in luce le sue limitazioni e i rischi, ma anche le potenziali opportunità. Il successo di DeepSeek sottolinea l’importanza dell’innovazione e dell’efficienza, e suggerisce che il futuro dell’IA potrebbe essere più diversificato e meno concentrato nelle mani dei giganti tecnologici occidentali.NotebookLM potrebbe essere impreciso; verifica le sue risposte.
—-
Ecco un riassunto per punti delle spiegazioni tecniche contenute nel testo, seguito da una tabella che ne raccoglie i concetti fondamentali:
Spiegazioni Tecniche:
- L’Intelligenza Artificiale (IA) si basa sulla forza bruta matematica, dove ogni elemento è misurato e rappresentato attraverso numerosi parametri, creando “vettori” numerici.
- La classificazione di oggetti o relazioni avviene tramite il calcolo dell’affinità tra i loro vettori e quelli di campioni noti. Oggetti con alta affinità vengono etichettati nella stessa categoria.
- Questi calcoli sono eseguiti da reti neurali, strutture che, sebbene ispirate a quelle biologiche, consumano enormi quantità di energia rispetto al cervello umano.
- Le reti neurali vengono addestrate (training) attraverso sequenze di micro-scelte su miliardi di parametri, noti come “modello”. Questo processo comporta l’esposizione della rete a numerosi esempi (come immagini di gattini) per tarare i parametri e farle riconoscere schemi.
- Una volta addestrata, la rete è in grado di classificare nuovi input (come nuove immagini) e di associarli a una determinata categoria.
- I sistemi “generativi” utilizzano il calcolo per “predire” il prossimo oggetto o testo, scegliendolo dalla categoria più probabile nel contesto corrente.
- I Large Language Models (LLM), usati per la scrittura e la traduzione, sono essenzialmente “estrusori di stringhe di testo probabili” o “pappagalli stocastici”. Non hanno la capacità di comprendere il significato di ciò che generano e talvolta producono risultati senza senso, anche se spesso veri per caso.
- L’ambiguità del linguaggio (es. “riso” come cereale o azione) viene risolta attraverso l’analisi dell’affinità statistica con i termini circostanti, analizzando le frequenze con cui le parole si accoppiano nei dintorni.
- Le operazioni di calcolo delle reti neurali possono essere eseguite in parallelo, sfruttando le GPU (Graphics Processing Unit), schede inizialmente sviluppate per i videogiochi.
- La necessità di calcolo parallelo ha portato a un’impennata nella capitalizzazione di mercato delle aziende che producono GPU come NVIDIA.
- Le IA cinesi, come DeepSeek, sono riuscite ad abbattere i costi di addestramento e di consumo energetico, utilizzando tecnologie meno recenti e strategie più frugali.
Tabella dei Concetti Fondamentali:
| Concetto Chiave | Descrizione |
|---|---|
| Forza Bruta Matematica | Base dell’IA: misurazione e rappresentazione di dati tramite parametri numerici (vettori). |
| Calcolo dell’Affinità | Classificazione basata sulla somiglianza tra vettori di input e vettori di campioni noti. |
| Reti Neurali | Strutture di calcolo ispirate al cervello, ma con elevato consumo energetico. |
| Training | Addestramento delle reti neurali attraverso l’esposizione a grandi quantità di dati per tarare i parametri del modello. |
| Classificazione | Capacità delle reti di identificare e categorizzare nuovi input. |
| Sistemi Generativi | Sistemi che “predicono” risultati scegliendoli dalle categorie più probabili in un determinato contesto. |
| LLM (Large Language Models) | “Estrusori di stringhe di testo probabili”, che non comprendono il significato del testo che generano. |
| Affinità Statistica | Metodo per risolvere ambiguità linguistiche analizzando le frequenze di co-occorrenza tra le parole. |
| Calcolo Parallelo | Tecnica di calcolo eseguita su più processori contemporaneamente, essenziale per l’IA, eseguita su GPU. |
| GPU (Graphics Processing Unit) | Schede hardware per l’elaborazione parallela, fondamentali per l’IA. |
La tesi fondamentale dell’articolo è che l’attuale sviluppo dell’Intelligenza Artificiale (IA), in particolare nel contesto occidentale, sia caratterizzato da un approccio dispendioso e inefficiente, che sta generando una “bolla” finanziaria. L’articolo sostiene che questa situazione è stata messa in discussione dall’emergere di approcci più agili ed economici, come quelli adottati in Cina, che rappresentano un “gol in contropiede” nel mercato dell’IA. L’articolo sottolinea come la cultura cinese, basata sulla frugalità e l’inventiva, abbia permesso di sviluppare modelli di IA meno esosi dal punto di vista energetico e più accessibili.
Ecco una tabella che riassume i concetti principali a cui fa riferimento l’articolo:
| Concetto Chiave | Descrizione |
|---|---|
| Bolla dell’IA | L’attuale situazione del mercato dell’IA, caratterizzata da valutazioni elevate e investimenti ingenti, che potrebbe essere insostenibile. |
| Approccio Occidentale | Sviluppo dell’IA basato su grandi quantità di risorse, elevate potenze di calcolo e notevole dispendio energetico, in particolare con l’uso di GPU avanzate. |
| Contropiede | L’emergere di un approccio alternativo e più efficiente nello sviluppo dell’IA, in particolare ad opera di aziende cinesi, che sorprende i concorrenti. |
| Cultura Cinese | Frugalità, cooperazione e inventiva come fattori chiave per lo sviluppo di modelli di IA più efficienti e meno dispendiosi. |
| DeepSeek | Esempio di IA cinese che ha ridotto significativamente i costi di addestramento e consumo energetico, utilizzando hardware meno recente e approcci più parsimoniosi. |
| Modelli Aperti | Modelli di IA il cui codice è disponibile al pubblico, come nel caso di DeepSeek, che permette una più ampia diffusione e utilizzo. |
| Guerra dei Prezzi | Riduzione dei prezzi dei servizi di IA a seguito dell’aumento della concorrenza, che mette in discussione la sostenibilità degli investimenti iniziali. |
| Consumo Energetico | Fattore critico nello sviluppo dell’IA, con i modelli occidentali che consumano quantità ingenti di energia, mentre i modelli cinesi dimostrano una maggiore efficienza |
| GPU e calcolo parallelo | Schede hardware (GPU) sviluppate per i videogiochi che vengono sfruttate per il calcolo parallelo e l’addestramento delle IA. |
| Classificazione e Training | Processi fondamentali dell’IA, che permettono alle reti neurali di riconoscere pattern e categorizzare informazioni attraverso un lungo addestramento. |
| LLM (Large Language Models) | Modelli di IA che generano testo, ma che non ne comprendono il significato, e producono risultati probabilistici. |
| Affinità statistica | Metodo usato per risolvere l’ambiguità nel linguaggio, analizzando come le parole si accoppiano tra loro. |
In sintesi, l’articolo evidenzia un cambio di paradigma nel mondo dell’IA, con un passaggio da un approccio “bigger is better” a uno basato su efficienza e accessibilità, sottolineando le implicazioni economiche e strategiche di tale transizione.
Ecco la timeline, i personaggi e le loro bio, basati sul testo fornito:
Timeline degli Eventi Principali:
- Anni ’90: Sviluppo delle GPU (Graphics Processing Unit) per i videogiochi, in particolare “sparatutto” come Quake. Nvidia è una startup che inizialmente fatica a ottenere profitti. TSMC in Taiwan produce i chip su misura.
- Inizio anni 2000: Scoppia la bolla delle dot-com.
- Pre-Ottobre 2024: L’intelligenza artificiale (IA) basata su reti neurali e calcolo vettoriale inizia ad attrarre grandi investimenti. La startup OpenAI, guidata da Sam Altman, promette l’AGI (Artificial General Intelligence).
- Ottobre 2024: OpenAI raggiunge una capitalizzazione di mercato di 157 miliardi di dollari, nonostante i profitti di 3,7 miliardi e una perdita di 5 miliardi.
- Periodo Successivo: Elon Musk annuncia l’uso di un cluster di 100.000 GPU NVIDIA H100 (con intenzione di arrivare a 1.000.000) per gli sviluppi IA di X. Il programma “Stargate” di OpenAI, Oracle e Softbank prevede investimenti per 500 miliardi di dollari in infrastrutture di calcolo.
- Periodo Imprecisato, Prima di Gennaio 2025: Gli ingegneri cinesi, soggetti all’embargo sulle GPU avanzate, sviluppano DeepSeek, un’IA più efficiente e meno costosa, utilizzando le “vecchie” GPU H800.
- Fine Gennaio 2025: Le azioni di NVIDIA perdono il 17% a causa della concorrenza di DeepSeek. Constellation, operatore USA nel campo dell’energia nucleare, crolla del 20%.
- Post-Gennaio 2025: I servizi premium delle IA americane iniziano a essere offerti gratuitamente a causa della “guerra dei prezzi”. Altre IA, come Qwen (Cina) e Velvet (Almawave, Italia) emergono.
Cast di Personaggi:
- Franco Marra: Autore dell’articolo “La bolla dell’intelligenza artificiale e un gol segnato in contropiede”. (Bio basata sul contesto: giornalista o analista tecnologico che scrive dell’intelligenza artificiale e dei suoi sviluppi economici).
- Daniela Tafani: Docente del Dipartimento di Scienze Politiche dell’Università di Pisa. (Bio basata sul contesto: Esperta di linguistica o scienze politiche, critica dell’IA come semplice “estrusore di stringhe di testo probabili”).
- Timnit Gebru e Margaret Mitchell: Ricercatrici licenziate da Google. (Bio basata sul contesto: Esperte di IA, critiche verso l’approccio della società all’IA, hanno definito gli LLM come “pappagalli stocastici”).
- Douglas Adams: Autore del romanzo “Guida galattica per gli autostoppisti”, in cui si pone la “domanda fondamentale sulla vita, l’universo e tutto quanto”. (Bio basata sul contesto: Autore di fantascienza, citato per la sua riflessione sull’immensità dei calcoli necessari per comprendere l’universo, comparata alla velocità del calcolo IA).
- Sam Altman: CEO di OpenAI. (Bio basata sul contesto: Imprenditore e dirigente, noto per aver guidato OpenAI e lo sviluppo di ChatGPT, citato per aver alimentato la “bolla IA” con la promessa di AGI).
- Elon Musk: Imprenditore e dirigente di X (precedentemente Twitter). (Bio basata sul contesto: Imprenditore tecnologico, noto per i suoi investimenti nell’IA e nell’uso di grandi cluster di GPU).
- Marc Andreessen: Papà del primo browser della storia, consigliere di Trump e sostenitore della tecno-autocrazia. (Bio basata sul contesto: Imprenditore tecnologico, figura influente nella Silicon Valley, con opinioni politiche controverse).
- Liang Wenfeng: Creatore dell’IA DeepSeek. (Bio basata sul contesto: Ingegnere o scienziato cinese, responsabile dello sviluppo dell’IA DeepSeek, più efficiente ed economica).
- Fabrizio De André: Cantautore italiano, citato nella conclusione dell’articolo. (Bio basata sul contesto: Cantautore italiano famoso per i testi con una vena di disillusione e critica sociale).
Guida allo Studio: L’Intelligenza Artificiale e il Contropiede Tecnologico
Quiz di Comprensione
Rispondi alle seguenti domande in 2-3 frasi ciascuna:
- Cosa significa “contropiede” nel contesto dell’articolo?
- Come funziona, a livello base, il processo di classificazione in una rete neurale artificiale?
- Qual è la principale differenza, in termini di consumo energetico, tra il cervello umano e gli algoritmi delle reti neurali?
- Spiega, con parole tue, cosa si intende per “training” di una rete neurale.
- Cosa sono gli LLM e qual è la critica principale mossa a questi sistemi?
- Come le reti neurali risolvono l’ambiguità nel linguaggio, come l’esempio della parola “riso”?
- Perché le GPU sono diventate così importanti nel campo dell’IA?
- Qual è la “bolla” di cui si parla nell’articolo, e quali sono gli indicatori che ne suggeriscono l’esistenza?
- In che modo l’approccio cinese all’IA si differenzia da quello statunitense, e qual è il risultato di questa differenza?
- Qual è l’implicazione del fatto che il modello di DeepSeek sia aperto, rispetto a quello di ChatGPT?
Chiave di Risposte al Quiz
- Nel contesto dell’articolo, “contropiede” si riferisce all’azione rapida e inaspettata della Cina nel settore dell’IA, che ha colto di sorpresa gli Stati Uniti, così come accade in una partita di calcio. Il contropiede implica un’azione efficace in un momento di vulnerabilità dell’avversario.
- Il processo di classificazione avviene attraverso il calcolo delle affinità tra i vettori numerici che rappresentano gli oggetti e i vettori di campioni già noti. Gli oggetti con vettori simili vengono quindi etichettati nella stessa categoria.
- Il cervello umano consuma una quantità molto bassa di energia, paragonabile a una lampadina da 20W, mentre gli algoritmi delle reti neurali richiedono quantità spropositate di energia, essendo basati su calcoli vettoriali intensivi.
- Il training di una rete neurale è il processo di addestramento in cui la rete impara a riconoscere specifici pattern attraverso l’esposizione a grandi quantità di dati. I parametri del modello vengono aggiustati ripetutamente per migliorare la precisione del riconoscimento.
- Gli LLM (Large Language Model) sono modelli di linguaggio che generano testo e traducono; vengono criticati perché producono stringhe di testo probabilistiche senza comprendere il significato di quello che generano, a volte producendo risultati insensati o inesatti.
- Le reti neurali risolvono l’ambiguità nel linguaggio attraverso l’analisi statistica dei termini circostanti. Il vettore della parola analizzata esprime le frequenze del suo accoppiamento con gli altri termini nel contesto.
- Le GPU sono diventate fondamentali per l’IA perché il calcolo vettoriale, su cui si basano le reti neurali, è eseguibile in parallelo, caratteristica che le GPU sono state create per svolgere in modo ottimale.
- La “bolla” di cui si parla è una bolla speculativa nel settore dell’IA, caratterizzata da una capitalizzazione di mercato elevatissima rispetto ai profitti reali e alle perdite, simile a quanto successo con la bolla dotcom.
- L’approccio cinese all’IA si basa sulla frugalità, cooperazione e inventiva, sviluppando soluzioni efficienti con consumi energetici inferiori e, al contrario, quello statunitense tende a usare approcci costosi e energivori. Ciò ha permesso alla Cina di emergere nel mercato con un “contropiede” tecnologico.
- Il fatto che il modello di DeepSeek sia aperto significa che chiunque può scaricarlo e usarlo, facilitandone la diffusione e l’adattamento alle proprie esigenze. Questo contrasta con il modello proprietario e chiuso di ChatGPT.
Domande per Saggio
Queste domande sono pensate per stimolare un’analisi approfondita dei temi trattati nell’articolo. Non ci sono risposte “giuste” o “sbagliate”, l’importante è argomentare in modo coerente e basato sulle informazioni contenute nel testo.
- Analizzare il concetto di “contropiede” nel contesto dello sviluppo dell’intelligenza artificiale, confrontando l’approccio statunitense con quello cinese e spiegando come le scelte politiche e culturali influenzino lo sviluppo tecnologico.
- Discutere il ruolo del consumo energetico e dell’infrastruttura di calcolo nell’evoluzione dell’IA, valutando l’impatto ambientale e i potenziali vantaggi derivanti da approcci più efficienti e sostenibili.
- Valutare le implicazioni della “bolla” speculativa nell’IA, esplorando le dinamiche del mercato, i rischi finanziari e le possibili conseguenze per l’innovazione e lo sviluppo tecnologico.
- Esaminare il concetto di “modello aperto” versus “modello chiuso” nell’IA, confrontando i vantaggi e gli svantaggi di ciascun approccio in termini di democratizzazione dell’accesso alla tecnologia e controllo della stessa.
- Discutere le implicazioni delle critiche mosse agli LLM come “pappagalli stocastici”, valutando i limiti attuali dell’IA nel comprendere e generare significato, e le future direzioni di ricerca.
Glossario
- Contropiede: Azione rapida e inattesa condotta quando l’avversario è sbilanciato in attacco. Nel contesto dell’IA, si riferisce all’approccio cinese che ha colto di sorpresa gli Stati Uniti.
- Rete Neurale: Struttura computazionale ispirata al cervello biologico, usata per calcolare affinità tra dati e classificare o generare contenuti.
- Vettore: Sequenza di numeri che rappresenta un oggetto o una relazione, usata come input per le reti neurali.
- Training: Processo di addestramento di una rete neurale tramite l’esposizione a grandi quantità di dati, per permetterle di imparare a riconoscere specifici pattern.
- LLM (Large Language Model): Modello di intelligenza artificiale in grado di generare testo e tradurre, spesso criticato per la sua mancanza di comprensione del significato.
- GPU (Graphics Processing Unit): Scheda di calcolo sviluppata inizialmente per la grafica, poi diventata fondamentale per il calcolo parallelo necessario all’IA.
- Bolla (speculativa): Situazione di mercato in cui i prezzi degli asset sono gonfiati al di là del loro valore reale, spesso con rischi di crollo.
- Modello Aperto: Modello di IA il cui codice e parametri sono liberamente accessibili e modificabili.
- Modello Chiuso: Modello di IA il cui codice e parametri sono proprietari e non accessibili al pubblico.
- AGI (Artificial General Intelligence): Forma ipotetica di IA con capacità cognitive paragonabili a quelle umane.
- Downsizing: Riduzione delle dimensioni e del consumo energetico, applicata all’informatica.
- Stocastico: Qualcosa che ha un elemento di casualità o probabilità.
- Bullshit: Termine informale per indicare qualcosa di insensato o falso, spesso usato in ambito accademico per descrivere i risultati degli LLM.