Algoritmo EM: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
+categoria |
ita |
||
(9 versioni intermedie di 8 utenti non mostrate) | |||
Riga 1:
In [[statistica]], un '''algoritmo
L'iterazione dell'algoritmo EM alterna l'esecuzione di un passo detto aspettazione (E), che crea una funzione per il [[valore atteso]] della verosimiglianza logaritmica calcolata usando la stima dei parametri corrente, e un passo detto massimizzazione (M), che calcola nuove stime dei parametri massimizzando la [[Funzione di verosimiglianza|funzione di verosimiglianza logaritmica]] attesa trovata al passo ''E''. Tali stime dei parametri possono poi essere usate per determinare la distribuzione delle variabili latenti al passo E dell'iterata successiva.
== Descrizione ==
Dato il modello statistico che genera un insieme <math>\mathbf{X}</math> di dati osservati, un insieme <math>\mathbf{Z}</math> di dati latenti non osservati o dati mancanti
:<math>L(\boldsymbol\theta; \mathbf{X}) = p(\mathbf{X}\mid\boldsymbol\theta) = \int p(\mathbf{X},\mathbf{Z} \mid \boldsymbol\theta) \, d\mathbf{Z} = \int p(\mathbf{X} \mid \mathbf{Z}, \boldsymbol\theta) p(\mathbf{Z} \mid \boldsymbol\theta) \, d\mathbf{Z} </math>
Tuttavia determinare questa quantità è spesso
L'algoritmo EM cerca di trovare la
::<math>Q(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) = \operatorname{E}_{\mathbf{Z}\mid\mathbf{X},\boldsymbol\theta^{(t)}}\left[ \log L (\boldsymbol\theta; \mathbf{X},\mathbf{Z}) \right] \,</math>
▲:''Maximization step (M step)'': Trovare i parametri che massimizzino questa quantità:
::<math>\boldsymbol\theta^{(t+1)} = \underset{\boldsymbol\theta}{\operatorname{arg\,max}} \ Q(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) \, </math>
Tipici modelli cui si applica EM
I punti osservati <math>\mathbf{X}</math> possono essere discreti o continui a seconda che assumano valori da un dominio [[Insieme finito|finito]] (o [[Insieme infinito|infinito]] [[Insieme numerabile|numerabile]]) o infinito non numerabile. Si può associare a ogni punto un vettore di osservazioni. ▼
I valori mancanti (e quindi le variabili latenti <math>\mathbf{Z}</math>) sono discreti, tratti da un numero prefissato di valori e con una variabile latente per ogni unità osservata. ▼
I parametri sono continui e di due tipi: parametri associati a tutti i punti e parametri associati
▲I punti osservati <math>\mathbf{X}</math> possono essere discreti o continui a seconda che assumano valori da un dominio finito (o infinito numerabile) o infinito non numerabile. Si può associare a ogni punto un vettore di osservazioni.
▲I valori mancanti (e quindi le variabili latenti <math>\mathbf{Z}</math>) sono discreti, tratti da un numero prefissato di valori e con una variabile latente per ogni unità osservata.
▲I parametri sono continui e di due tipi: parametri associati a tutti i punti e parametri associati con uno specifico valore di una variabile latente (ossia associati a tutti i punti con quel valore per la corrispondente variabile latente).
== Note ==
<references/>
{{Apprendimento automatico}}
{{Portale|statistica}}
[[Categoria:
[[Categoria:Apprendimento automatico]]
|