Cristianini è molto netto su chi possa davvero permettersi strategie data driven:
- per i modelli statistici del linguaggio funzionano sono necessari dati di addestramento che sorpassano il miliardo di parole, in funziona dell’altissima quantità di parametri;
- le raccomandazioni di Amazon si fondano su centinaia di milioni di clienti,
- le raccomandazioni di YouTube di basano su due miliardi di utenti,
- GPT-3 è impostato su circa 175 miliardi di parametri, appresi analizzando circa 45 terabyte di testo ottenuti da fonti diverse.
(fonte: N. Cristianini, “La scorciatoia. Come le macchine sono diventate intelligenti senza pensare in modo umano”)