Algoritmo EM: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
titolo rif [1] |
+ link ad altre voci, miglioramento del testo |
||
Riga 1:
In [[statistica]], un '''algoritmo''' '''expectation–maximization''' ('''EM''')<ref>{{Cita pubblicazione|nome=A. P.|cognome=Dempster|nome2=N. M.|cognome2=Laird|nome3=D. B.|cognome3=Rubin|data=1977-09|titolo=Maximum Likelihood from Incomplete Data Via the EM Algorithm|rivista=Journal of the Royal Statistical Society: Series B (Methodological)|volume=39|numero=1|pp=1–22|accesso=2022-03-20|doi=10.1111/j.2517-6161.1977.tb01600.x|url=http://dx.doi.org/10.1111/j.2517-6161.1977.tb01600.x}}</ref> è un metodo iterativo per trovare [[Stima|stime]] (locali) di [[Metodo della massima verosimiglianza|massima verosimiglianza]] (o le stime [[maximum a posteriori]])
== Descrizione ==
Riga 6:
:<math>L(\boldsymbol\theta; \mathbf{X}) = p(\mathbf{X}\mid\boldsymbol\theta) = \int p(\mathbf{X},\mathbf{Z} \mid \boldsymbol\theta) \, d\mathbf{Z} = \int p(\mathbf{X} \mid \mathbf{Z}, \boldsymbol\theta) p(\mathbf{Z} \mid \boldsymbol\theta) \, d\mathbf{Z} </math>
Tuttavia determinare questa quantità è spesso
L'algoritmo EM cerca di trovare la MLE della likelihood marginale eseguendo iterativamente questi passi:
:''Expectation
::<math>Q(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) = \operatorname{E}_{\mathbf{Z}\mid\mathbf{X},\boldsymbol\theta^{(t)}}\left[ \log L (\boldsymbol\theta; \mathbf{X},\mathbf{Z}) \right] \,</math>
▲:''Maximization step (M step)'': Trovare i parametri che massimizzino questa quantità:
::<math>\boldsymbol\theta^{(t+1)} = \underset{\boldsymbol\theta}{\operatorname{arg\,max}} \ Q(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) \, </math>
Tipici modelli cui si applica EM
I punti osservati <math>\mathbf{X}</math> possono essere discreti o continui a seconda che assumano valori da un dominio [[Insieme finito|finito]] (o [[Insieme infinito|infinito]] [[Insieme numerabile|numerabile]]) o infinito non numerabile. Si può associare a ogni punto un vettore di osservazioni. ▼
I valori mancanti (e quindi le variabili latenti <math>\mathbf{Z}</math>) sono discreti, tratti da un numero prefissato di valori e con una variabile latente per ogni unità osservata. ▼
I parametri sono continui e di due tipi: parametri associati a tutti i punti e parametri associati
▲I punti osservati <math>\mathbf{X}</math> possono essere discreti o continui a seconda che assumano valori da un dominio finito (o infinito numerabile) o infinito non numerabile. Si può associare a ogni punto un vettore di osservazioni.
▲I valori mancanti (e quindi le variabili latenti <math>\mathbf{Z}</math>) sono discreti, tratti da un numero prefissato di valori e con una variabile latente per ogni unità osservata.
▲I parametri sono continui e di due tipi: parametri associati a tutti i punti e parametri associati con uno specifico valore di una variabile latente (ossia associati a tutti i punti con quel valore per la corrispondente variabile latente).
== Note ==
|