Utente:PoliFL/Sandbox

Nel campo dell'apprendimento automatico, si definisce rete antagonista generativa, o in inglese generative adversarial network (GAN), una classe di metodi, introdotta per la prima volta da Ian Goodfellow^[1], in cui due reti neurali vengono addestrate in maniera competitiva all'interno di un framework di gioco minimax. Questo tipo di framework permette alla rete neurale di apprendere come generare nuovi dati aventi la stessa distribuzione dei dati usati in fase di addestramento. Ad esempio, è possibile ottenere una rete neurale in grado di generare volti umani iperrealistici^[2], come dimostrato nel 2018 da NVIDIA Corporation, azienda produttrice di GPU.

Metodo

Nella sua versione originale, una rete antagonista generativa è composta da due componenti: un modello generativo, o generatore $G$ , e un modello discriminativo, o discriminatore $D$ , entrambi realizzati tramite reti neurali. Lo scopo del modello generativo è quello di produrre nuovi dati, mentre il modello discriminativo apprende come distinguere i dati reali da quelli generati. In particolare, dato uno spazio latente ${\boldsymbol {z}}$ , avente una distribuzione a priori $p_{\boldsymbol {z}}\left({\boldsymbol {z}}\right)$ , il generatore rappresenta una funzione differenziabile $G\left({\boldsymbol {z}};\theta _{g}\right)$ che fornisce in output i nuovi dati secondo una certa distribuzione $p_{g}$ , dove $\theta _{g}$ sono i parametri del modello generativo. Il discriminatore rappresenta una funzione differenziabile $D\left({\boldsymbol {x}};\theta _{d}\right)$ , dove $\theta _{d}$ sono i parametri del modello discriminativo, che produce in output la probabilità che ${\boldsymbol {x}}$ provenga dalla distribuzione dei dati di addestramento $p_{data}$ . Lo scopo è quello di ottenere un generatore che sia un buon stimatore di $p_{data}$ . Quando questo avviene, il discriminatore viene "ingannato" e non riesce più a distinguere i campioni provenienti da $p_{data}$ da quelli provenienti da $p_{g}$ .

La chiave per raggiungere questa situazione è l'addestramento competitivo. la rete discriminativa viene addestrata in modo da massimizzare la probabilità di classificare correttamente i campioni provenienti dai dati di addestramento e i campioni generati.

Allo stesso tempo, la rete generativa viene addestrata minimizzando

log(1-D(G({\boldsymbol {z}}))

,

massimizzando quindi la probabilità del discriminatore di considerare i campioni ${\boldsymbol {x}}\sim p_{g}$ come provenienti da $p_{data}$ .

L'ottimizzazione consiste quindi in un gioco minimax a due giocatori (D e G):

\min _{G}\max _{D}\mathbb {E} _{{\boldsymbol {x}}\sim p_{\text{ data }}({\boldsymbol {x}})}[\log D({\boldsymbol {x}})]+\mathbb {E} _{{\boldsymbol {z}}\sim p_{\boldsymbol {z}}({\boldsymbol {z}})}[\log(1-D(G({\boldsymbol {z}})))]

,

che ha un ottimo globale per $p_{g}=p_{data}$ ^[1].

Varianti

Negli ultimi anni si è assistito ad un rapido sviluppo di metodi che rappresentano versioni modificate del framework originale.

Rete antagonista generativa condizionale, o cGAN dall'inglese conditional generative adversarial network

Applicazioni

Note

^ ^a ^b Generative Adversarial Nets (PDF), in Advances in Neural Information Processing Systems 27, Curran Associates, Inc., 2014, pp. 2672–2680. URL consultato il 2 luglio 2019.
^ A Style-Based Generator Architecture for Generative Adversarial Networks, in arXiv:1812.04948 [cs, stat], 12 dicembre 2018. URL consultato il 2 luglio 2019.

[GAN-1] Generative Adversarial Nets (PDF), in Advances in Neural Information Processing Systems 27, Curran Associates, Inc., 2014, pp. 2672–2680. URL consultato il 2 luglio 2019.

[2] A Style-Based Generator Architecture for Generative Adversarial Networks, in arXiv:1812.04948 [cs, stat], 12 dicembre 2018. URL consultato il 2 luglio 2019.

[1]

[2]