Utente:PoliFL/Sandbox: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
PoliFL (discussione | contributi)
Nessun oggetto della modifica
PoliFL (discussione | contributi)
Nessun oggetto della modifica
Riga 1:
Nel campo dell'[[apprendimento automatico]], si definisce '''rete generativa avversaria''', o in inglese '''generative adversarial network (GAN)''', una classe di metodi, introdotta per la prima volta da [[Ian Goodfellow]]<ref name='GAN'>{{Cite book| publisher = Curran Associates, Inc.| pages = 2672–2680| editors = Z. Ghahramani, M. Welling, C. Cortes, N. D. Lawrence, K. Q. Weinberger (eds.)| last1 = Goodfellow| first1 = Ian| last2 = Pouget-Abadie| first2 = Jean| last3 = Mirza| first3 = Mehdi| last4 = Xu| first4 = Bing| last5 = Warde-Farley| first5 = David| last6 = Ozair| first6 = Sherjil| last7 = Courville| first7 = Aaron| last8 = Bengio| first8 = Yoshua| title = Advances in Neural Information Processing Systems 27| chapter = Generative Adversarial Nets| accessdate = 2019-07-02| date = 2014| chapterurl = http://papers.nips.cc/paper/5423-generative-adversarial-nets.pdf}}</ref>, in cui due [[rete neurale artificiale|reti neurali]] vengono addestrate in maniera competitiva all'interno di un [[framework]] di gioco [[minimax]]. Questo tipo di framework permette alla rete neurale di apprendere come generare nuovi dati aventi la stessa distribuzione dei dati usati in fase di addestramento. Ad esempio, è possibile ottenere una rete neurale in grado di generare volti umani iperrealistici<ref>{{Cite journal| last1 = Karras| first1 = Tero| last2 = Laine| first2 = Samuli| last3 = Aila| first3 = Timo| title = A Style-Based Generator Architecture for Generative Adversarial Networks| journal = arXiv:1812.04948 [cs, stat]| accessdate = 2019-07-02| date = 2018-12-12| url = http://arxiv.org/abs/1812.04948}}</ref>, come dimostrato nel 2018 da [[NVIDIA Corporation]], azienda produttrice di [[Graphic processing unit|GPU]].
 
==Metodo==
[[File:Rete generativa avversaria.png|thumb|upright=2|Rete generativa avversaria]]
Nella sua versione originale, una rete antagonista generativa è composta da due componenti: un [[modello generativo]], o generatore <math>G</math>, e un [[modello discriminativo]], o discriminatore <math>D</math>, entrambi realizzati tramite reti neurali. Lo scopo del modello generativo è quello di produrre nuovi dati, mentre il modello discriminativo apprende come distinguere i dati reali da quelli generati. In particolare, dato uno spazio latente <math>\boldsymbol{z}</math>, avente una [[distribuzione di probabilità a priori|distribuzione a priori]] <math>p_\boldsymbol{z}(\boldsymbol{z})</math>, il generatore rappresenta una [[funzione differenziabile]] <math>G(\boldsymbol{z} ; \theta_{g})</math> che fornisce in output i nuovi dati secondo una certa distribuzione <math>p_g</math>, dove <math>\theta_{g}</math> sono i parametri del modello generativo. Il discriminatore rappresenta una funzione differenziabile <math>D(\boldsymbol{x}; \theta_{d})</math>, dove <math>\theta_{d}</math> sono i parametri del modello discriminativo, che produce in output la [[probabilità]] che <math>\boldsymbol{x}</math> provenga dalla distribuzione dei dati di addestramento <math>p_{data}</math>. Lo scopo è quello di ottenere un generatore che sia un buon [[stimatore]] di <math>p_{data}</math>. Quando questo avviene, il discriminatore viene "ingannato" e non riesce più a distinguere i campioni provenienti da <math>p_{data}</math> da quelli provenienti da <math>p_g</math>.