Utente:PoliFL/Sandbox: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica |
Nessun oggetto della modifica |
||
Riga 2:
==Metodo==
Nella sua versione originale, una rete antagonista generativa è composta da due componenti: un [[:en:generative model|modello generativo]], o generatore <math>G</math>, e un [[:en:discriminative model|modello discriminativo]], o discriminatore <math>D</math>, entrambi realizzati tramite reti neurali. Lo scopo del modello generativo è quello di produrre nuovi dati, mentre il modello discriminativo apprende come distinguere i dati reali da quelli generati. In particolare, dato uno spazio latente <math>\boldsymbol{z}</math>, avente una [[distribuzione di probabilità a priori|distribuzione a priori]] <math>p_\boldsymbol{z}\left(\boldsymbol{z}\right)</math>, il generatore rappresenta una [[funzione differenziabile]] <math>G\left(\boldsymbol{z} ; \theta_{g}\right)</math> che fornisce in output i nuovi dati secondo una certa distribuzione <math>p_g</math>, dove <math>\theta_{g}</math> sono i parametri del modello generativo. Il discriminatore rappresenta una funzione differenziabile <math>D\left(\boldsymbol{x}; \theta_{d}\right)</math>, dove <math>\theta_{d}</math> sono i parametri del modello discriminativo, che produce in output la [[probabilità]] che <math>\boldsymbol{x}</math> provenga
La chiave per raggiungere questa situazione è l'addestramento competitivo. la rete discriminativa viene addestrata in modo da massimizzare la probabilità di classificare correttamente i campioni provenienti dai dati di addestramento e i campioni generati.
Allo stesso tempo, la rete generativa viene addestrata minimizzando
:<math>log(1-D(G(\boldsymbol{z}))</math>,
massimizzando quindi la probabilità del discriminatore di considerare i campioni <math>\boldsymbol{x} \sim p_g</math> come provenienti da <math>p_{data}</math>.
L'ottimizzazione consiste quindi in un gioco minimax a due giocatori (D e G):
:<math>\min _{G} \max _{D} \mathbb{E}_{\boldsymbol{x} \sim p_{\text { data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]+\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]</math>.
==Varianti==
|