Generative Adversarial Network

Gallina spiega con chiarezza come funziona una GAN:

Una GAN è composta da due reti neurali (network) che competono (avversarie) al fine di mimare un processo creativo. (…) Supponiamo di realizzare una GAN che abbia il compito di generare immagini di fiori con le seguenti caratteristiche: essere belli, verosimili, ma inusuali. Per farlo sono necessarie due reti neurali che operano in parallelo e, per certi aspetti, in antagonismo. La prima rete è il generatore (…). Esso si occupa di produrre immagini di fiori casuali. La seconda rete è quella del discriminatore. Il discriminatore ha il compito di affermare se il generatore crea immagini che assomigliano a un fiore oppure no. Entrambe le reti imparano; vengono istruite. All’inizio infatti, il generatore, invece di rappresentare fiori, produce immagini a casaccio: sfuocate, rumorose, prive di soggetto, ecc. La stessa cosa vale per il discriminatore, che non è in grado di distinguere un fiore da un martello. Ma, col tempo, le due reti si adattano e migliorano. Come? Al discriminatore vengono mostrate sia immagini di fiori reali che non; in questo modo imparerà a fare la cernita. Contemporaneamente, i giudizi forniti dal discriminatore verranno a loro volta utilizzati dal generatore per migliorarsi, proprio come faceva il personaggio di Gene. Infatti, se il generatore introduce un dettaglio grafico che avvicina l’immagine generata a un petalo, il discriminatore gli assegna un punteggio più elevato, comunicandogli così l’avvenuto miglioramento. Da un certo punto di vista, il generatore esegue fake painting con cui tenta di ingannare il discriminatore. Da parte sua, il discriminatore tenta di smascherare il generatore; e questo avviene quando si genera un’opera manifestatamente fake. Se smascherato, il generatore fa tesoro dell’esperienza e si migliora. Il processo è iterativo e viene ripetuto finché il generatore non produce immagini in grado di ingannare sempre il discriminatore. (…) Da un punto di vista del tutto generale e teorico, le GAN sono sistemi in grado di “riprodurre il comune noto”. Le GAN perciò sono quanto di più conformista possa esistere nel cogliere una tendenza umana. Da una parte creano dal nulla, dall’altra, l’oggetto delle loro creazioni è omologato e atteso. L’artista che ne fa uso deve aver ben presente queste due facce della medaglia. (P. Gallina, “La protoarte dei robot. Quando l’arte, la robotica e l’intelligenza artificiale si intrecciano”)