La scalata – concettuale e operativa – di ChatGPT

*Discesa del gradiente (tecnica): esamina gli output che un modello di IA sta producendo, li confronta con i dati di addestramento e calcola una “direzione” per regolare i parametri della rete neurale in modo che gli output diventino “più” corretti, cioè siano più simili ai dati di addestramento forniti all’ IA

**Messa a punto (tecnica): specializza un modello di IA in un modo particolare addestrandolo con un set curato di dati e su come rispondere e produrre output; l’apprendimento per rinforzo (RLHF) appartiene a questo insieme.