
*Discesa del gradiente (tecnica): esamina gli output che un modello di IA sta producendo, li confronta con i dati di addestramento e calcola una “direzione” per regolare i parametri della rete neurale in modo che gli output diventino “più” corretti, cioè siano più simili ai dati di addestramento forniti all’ IA
**Messa a punto (tecnica): specializza un modello di IA in un modo particolare addestrandolo con un set curato di dati e su come rispondere e produrre output; l’apprendimento per rinforzo (RLHF) appartiene a questo insieme.
Devi effettuare l'accesso per postare un commento.