Avere i numeri per “capire”

Cristianini è molto netto su chi possa davvero permettersi strategie data driven:

  • per i modelli statistici del linguaggio funzionano sono necessari dati di addestramento che sorpassano il miliardo di parole, in funziona dell’altissima quantità di parametri;
  • le raccomandazioni di Amazon si fondano su centinaia di milioni di clienti,
  • le raccomandazioni di YouTube di basano su due miliardi di utenti,
  • GPT-3 è impostato su circa 175 miliardi di parametri, appresi analizzando circa 45 terabyte di testo ottenuti da fonti diverse.

(fonte: N. Cristianini, “La scorciatoia. Come le macchine sono diventate intelligenti senza pensare in modo umano”)