Versione delle 14:31, 20 mar 2022 modifica 94.37.57.18 (discussione) +titolo sez. riferimenti Etichetta: Modifica visuale ← Differenza precedente		Versione delle 14:44, 20 mar 2022 modifica annulla 94.37.57.18 (discussione) Nessun oggetto della modifica Etichetta: Modifica visuale: commutato Differenza successiva →
Riga 1: In [[statistica]], un '''algoritmo''' '''expectation–maximization''' ('''EM''')<ref>{{Cita pubblicazione\|nome=A. P.\|cognome=Dempster\|nome2=N. M.\|cognome2=Laird\|nome3=D. B.\|cognome3=Rubin\|data=1977-09\|titolo=Maximum Likelihood from Incomplete Data Via theEMAlgorithm\|rivista=Journal of the Royal Statistical Society: Series B (Methodological)\|volume=39\|numero=1\|pp=1–22\|accesso=2022-03-20\|doi=10.1111/j.2517-6161.1977.tb01600.x\|url=http://dx.doi.org/10.1111/j.2517-6161.1977.tb01600.x}}</ref> è un metodo iterativo per trovare stime (locali) di [[Metodo della massima verosimiglianza\|massima verosimiglianza]] o stime [[maximum a posteriori]] (MAP) di parametri di modelli statistici, in cui il modello dipende da [[Variabile casuale\|variabili latenti]] (non osservate). L' iterazione di EM alterna l'esecuzione di un passo ''expectation'' (E), che crea una funzione per il valore atteso della ''log-likelihood'' calcolata usando la stima dei parametri corrente, e un passo ''maximization'' (M), che calcola i parametri massimizzando la funzione di log-likelihood attesa trovata al passo ''E''. Tali stime di parametri possono poi essere usate per determinare la distribuzione delle variabili latenti al prossimo passo E step. === ~~Riferimenti~~Descrizione === Dato il modello statistico che genera un insieme <math>\mathbf{X}</math> di dati osservati, un insieme di dati latenti non osservati o dati mancanti <math>\mathbf{Z}</math> e un vettore di parametri incogniti <math>\boldsymbol\theta</math> assieme a una funzione di verosimiglianza <math>L(\boldsymbol\theta; \mathbf{X}, \mathbf{Z}) = p(\mathbf{X}, \mathbf{Z}\mid\boldsymbol\theta)</math>, la stima di massima verosimiglianza (MLE) dei parametri sconosciuti viene determinata massimizzando la likelihood marginale dei dati osservati :<math>L(\boldsymbol\theta; \mathbf{X}) = p(\mathbf{X}\mid\boldsymbol\theta) = \int p(\mathbf{X},\mathbf{Z} \mid \boldsymbol\theta) \, d\mathbf{Z} = \int p(\mathbf{X} \mid \mathbf{Z}, \boldsymbol\theta) p(\mathbf{Z} \mid \boldsymbol\theta) \, d\mathbf{Z} </math> Tuttavia questa quantità è spesso intrattabile dato che <math>\mathbf{Z}</math> non è osservato e la distribuzione di <math>\mathbf{Z}</math> è sconosciuta prima di determinare <math>\boldsymbol\theta</math>. L'algoritmo EM cerca di trovare la MLE della likelihood marginale eseguendo iterativamente questi passi: :''Expectation step (E step)'': Definire <math>Q(\boldsymbol\theta\mid\boldsymbol\theta^{(t)})</math> come il valore atteso [[expected value]] della funzione di log-likelihood per <math>\boldsymbol\theta</math>, rispetto alla distribuzione di probabilità condizionata corrente di <math>\mathbf{Z}</math> dati <math>\mathbf{X}</math> e le stime correnti dei parametri <math>\boldsymbol\theta^{(t)}</math>: ::<math>Q(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) = \operatorname{E}_{\mathbf{Z}\mid\mathbf{X},\boldsymbol\theta^{(t)}}\left[ \log L (\boldsymbol\theta; \mathbf{X},\mathbf{Z}) \right] \,</math> :''Maximization step (M step)'': Trovare i parametri che massimizzino questa quantità: ::<math>\boldsymbol\theta^{(t+1)} = \underset{\boldsymbol\theta}{\operatorname{arg\,max}} \ Q(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) \, </math> == Riferimenti ==

Algoritmo EM: differenze tra le versioni