Revision as of 09:49, 18 November 2024 edit 2001:620:618:5d0:2:80b3:0:c2 (talk) Aligned log ← Previous edit		Revision as of 09:52, 18 November 2024 edit undo 2001:620:618:5d0:2:80b3:0:c2 (talk) Aligned proofs Next edit →
Line 88: In this case, the global minimizer <math>Q^{}(\mathbf{Z}) = q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)q^{}(\mathbf{Z}_2) = q^{}(\mathbf{Z}_2\mid\mathbf{Z}_1)q^{}(\mathbf{Z}_1),</math> with <math>\mathbf{Z}=\{\mathbf{Z_1},\mathbf{Z_2}\},</math> can be found as follows:<ref name=Tran2018/> :<math> ~~q^{}(\mathbf{Z}_2)~~ \begin{array}{rl} = \frac{P(\mathbf{X})}{\zeta(\mathbf{X})}\frac{P(\mathbf{Z}_2\mid\mathbf{X})}{\exp(D_{\mathrm{KL}}(q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)\parallel P(\mathbf{Z}_1\mid\mathbf{Z}_2,\mathbf{X})))} ▼ q^{}(\mathbf{Z}_2) = \frac{1}{\zeta(\mathbf{X})}\exp\mathbb{E}_{q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)}\left(\log\frac{P(\mathbf{Z},\mathbf{X})}{q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)}\right),</math>▼ ▲&= \frac{P(\mathbf{X})}{\zeta(\mathbf{X})}\frac{P(\mathbf{Z}_2\mid\mathbf{X})}{\exp(D_{\mathrm{KL}}(q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)\parallel P(\mathbf{Z}_1\mid\mathbf{Z}_2,\mathbf{X})))} \\ ▲&= \frac{1}{\zeta(\mathbf{X})}\exp\mathbb{E}_{q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)}\left(\log\frac{P(\mathbf{Z},\mathbf{X})}{q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)}\right),~~</math>~~ \end{array}</math> in which the normalizing constant is: :<math>~~\zeta(\mathbf{X})~~ \begin{array}{rl} =P(\mathbf{X})\int_{\mathbf{Z}_2}\frac{P(\mathbf{Z}_2\mid\mathbf{X})}{\exp(D_{\mathrm{KL}}(q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)\parallel P(\mathbf{Z}_1\mid\mathbf{Z}_2,\mathbf{X})))}▼ \zeta(\mathbf{X}) = \int_{\mathbf{Z}_{2}}\exp\mathbb{E}_{q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)}\left(\log\frac{P(\mathbf{Z},\mathbf{X})}{q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)}\right).</math>▼ ▲&=P(\mathbf{X})\int_{\mathbf{Z}_2}\frac{P(\mathbf{Z}_2\mid\mathbf{X})}{\exp(D_{\mathrm{KL}}(q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)\parallel P(\mathbf{Z}_1\mid\mathbf{Z}_2,\mathbf{X})))} \\ ▲&= \int_{\mathbf{Z}_{2}}\exp\mathbb{E}_{q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)}\left(\log\frac{P(\mathbf{Z},\mathbf{X})}{q^{}(\mathbf{Z}_1\mid\mathbf{Z}_2)}\right).~~</math>~~ \end{array}</math> The term <math>\zeta(\mathbf{X})</math> is often called the [[model evidence\|evidence]] lower bound ('''ELBO''') in practice, since <math>P(\mathbf{X})\geq\zeta(\mathbf{X})=\exp(\mathcal{L}(Q^{}))</math>,<ref name=Tran2018/> as shown above.

Variational Bayesian methods: Difference between revisions