Utente:PoliFL/Sandbox: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
PoliFL (discussione | contributi)
Nessun oggetto della modifica
PoliFL (discussione | contributi)
Nessun oggetto della modifica
Riga 2:
 
==Metodo==
Nella sua versione originale, una rete antagonista generativa è composta da due componenti: un [[:en:generative model|modello generativo]], o generatore <math>G</math>, e un [[:en:discriminative model|modello discriminativo]], o discriminatore <math>D</math>, entrambi realizzati tramite reti neurali. Lo scopo del modello generativo è quello di produrre nuovi dati, mentre il modello discriminativo apprende come distinguere i dati reali da quelli generati. In particolare, dato uno spazio latente <math>\boldsymbol{z}</math>, avente una [[distribuzione di probabilità a priori|distribuzione a priori]] <math>p_\boldsymbol{z}\left(\boldsymbol{z}\right)</math>, il generatore rappresenta una [[funzione differenziabile]] <math>G\left(\boldsymbol{z} ; \theta_{g}\right)</math> che fornisce in output i nuovi dati secondo una certa distribuzione <math>p_g</math>, dove <math>\theta_{g}</math> sono i parametri del modello generativo. Il discriminatore rappresenta una funzione differenziabile <math>D\left(\boldsymbol{x}; \theta_{d}\right)</math>, dove <math>\theta_{d}</math> sono i parametri del modello discriminativo, che produce in output la [[probabilità]] che <math>\boldsymbol{x}</math> provenga daidalla datidistribuzione realidei piuttostodati chedi daladdestramento generatore<math>p_{data}</math>. Lo scopo è quello di ottenere un generatore che sia un buon [[stimatore]] delladi distribuzione<math>p_{data}</math>. deiQuando datiquesto diavviene, addestramentoil discriminatore viene "ingannato" e non riesce più a distinguere i campioni provenienti da <math>p_{data}</math> da quelli provenienti da <math>p_g</math>.
In questo modo il discriminatore "ingannando" il discriminatore che non riuscirà più a distinguere i campioni provenienti da <math>p_{data}</math> da quelli provenienti da <math>p_g</math>. I parametri delle rete generativa vengono quindi ottimizzati in modo da trovare un buon massimizzando la probabilità
 
La chiave per raggiungere questa situazione è l'addestramento competitivo. la rete discriminativa viene addestrata in modo da massimizzare la probabilità di classificare correttamente i campioni provenienti dai dati di addestramento e i campioni generati.
 
Allo stesso tempo, la rete generativa viene addestrata minimizzando
:<math>log(1-D(G(\boldsymbol{z}))</math>,
massimizzando quindi la probabilità del discriminatore di considerare i campioni <math>\boldsymbol{x} \sim p_g</math> come provenienti da <math>p_{data}</math>.
 
L'ottimizzazione consiste quindi in un gioco minimax a due giocatori (D e G):
:<math>\min _{G} \max _{D} \mathbb{E}_{\boldsymbol{x} \sim p_{\text { data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]+\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]</math>.
==Varianti==