Agenti guidati dall’approvazione

Alternativa ai dispositivi di IA e simili con comportamenti diretti all’obiettivo, ideata da Paul Christiano. Prevede una supervisione umana e che l’agente artificiale sia così orientato: “Stima la valutazione attesa che (…) [l’agente umano] darebbe a ciascuna azione se la considerasse a lungo. Intraprendi l’azione con il punteggio più alto previsto”.