Formula computazionale per la varianza: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Messbot (discussione | contributi)
m In termini di momenti di origine zero: fix errore Lint - Tag di chiusura mancante
 
(11 versioni intermedie di 7 utenti non mostrate)
Riga 2:
 
== In termini di momenti di origine zero ==
Se i [[momento (probabilità)|momenti di origine zero]] <math>E(''X'')</math> e <math>E(''X''<sup>^2)</supmath>) di una [[variabile casuale]] ''<math>X''</math> sono noti (dove <math>E(''X'')</math> è il [[valore atteso]] di ''<math>X''</math>), allora <math>\operatorname{Var}(''X'')</math> è data da
 
:<math>\operatorname{Var}(X) = \operatorname{E}(X^2) - [\operatorname{E}(X)]^2 .</math>
 
Il risultato è chiamato formula di [[Johann Samuel König|König]]–[[Christiaan Huygens|Huygens]] nella letteratura [[Lingua francese|francese]]<ref>In French:{{fr}} formule dedi Koenig–Huygens. SeeConsultare, e.g.per esempio, {{citationCita pubblicazione|titletitolo=Maths: prépas commerciales|firstnome=Jean-Jacques|lastcognome=Martiano|publishereditore=Studyrama|yearanno=2006|isbn=9782844728289978-2-84472-828-9|pagep=148}}</ref> e noto come teorema di traslazione di [[Jakob Steiner|Steiner]] in [[Germania]].<ref>In German:{{de}} Verschiebungssatz von Steiner. SeeConsultare, e.g.per esempio, {{citationCita pubblicazione|titletitolo=Starthilfe Stochastik: Studium|first1nome1=Gerd|last1cognome1=Christoph|first2nome2=Horst|last2cognome2=Hackel|publishereditore=Springer|yearanno=2013|isbn=9783322847997978-3-322-84799-7|pagep=50|url=https://books.google.com/books?id=Hiw25tqvScsC&pg=PA50}}.</ref>
 
Esiste una formula corrispondente da utilizzare per la stima della varianza da dati campione, che può essere utile nei calcoli manuali. Si tratta di un'identità strettamente correlata che è strutturata per creare una stima [[Bias (statistica)|priva di bias]] della varianza della popolazione
 
:<math>
\hat{\sigma}^2 = \frac{1}{N-1}\sum_{i=1}^N(x_i-\bar{x})^2 = \frac{N}{N-1}\left( \bar{x^2} - \bar{x}^2\right) = \frac{N}{N-1}\left(\frac{1}{N}\left(\sum_{i=1}^N x_i^2\right) - \bar{x}^2\right)
\equiv \frac{1}{N-1}\left(\left(\sum_{i=1}^N x_i^2\right) - N \left(\bar{x}\right)^2\right) .
</math>
 
L'uso di queste formule può tuttavia essere sconveniente nella pratica quando si utilizza l'aritmetica in [[virgola mobile]] con precisione limitata: la sottrazione tra due valori di grandezza analoga può portare a una [[Cancellazione numerica|cancellazione catastrofica]],<ref>{{cita libro|autore=[[Donald E. Knuth]] (1998). ''|titolo=[[The Art of Computer Programming]]'', volumevol. 2: ''"Seminumerical Algorithms'', 3rd edn., p. 232. "|edizione=3|anno=1998|città=Boston: |editore=Addison-Wesley|lingua=en}} p. 232</ref> e causare così una perdita di significato quando <math>\operatorname{E}(X)^2 \gg \operatorname{Var}(X)</math>.
Esistono altri [[algoritmi per il calcolo della varianza]] [[stabilità numerica|numericamente sabilistabili]] per l'uso con l'aritmetica in virgola mobile.
 
{{Approfondimento
=== Dimostrazione ===
|larghezza = 100%
 
==|titolo = Dimostrazione ===
|contenuto = La formula computazionale per la varianza della popolazione segue in maniera diretta dalla proprietà di [[Valore atteso#Linearità|linearità dei valori attesi]] e dalla definizione di varianza:
 
:<math>
Riga 32 ⟶ 33:
\end{align}
</math>
}}
 
{{Approfondimento
|larghezza = 100%
|titolo = Dimostrazione per la stima della varianza
|contenuto =
:<math>
\begin{align}
\hat{\sigma}^2 &= \frac{1}{N-1}\sum_{i=1}^N(x_i-\bar{x})^2 \\
&= \frac{1}{N-1}\sum_{i=1}^N(x_i^2- 2x_i \bar{x} + \bar{x}^2) \\
&= \frac{1}{N-1}\left(\left(\sum_{i=1}^N x_i^2\right) - 2 \bar{x} \left(\sum_{i=1}^N x_i \right) + N \bar{x}^2 \right) \\
&= \frac{1}{N-1}\left(\left(\sum_{i=1}^N x_i^2\right) - 2 N \bar{x}^2 + N \bar{x}^2 \right) \\
&= \frac{1}{N-1}\left(\left(\sum_{i=1}^N x_i^2\right) - N \bar{x}^2 \right) \\
&= \frac{N}{N-1}\left(\frac{1}{N}\left(\sum_{i=1}^N x_i^2\right) - \bar{x}^2\right)
&= \frac{N}{N-1}\left(\bar{x^2} - \bar{x}^2\right)
\end{align}
</math>
}}
 
=== Generalizzazione per la covarianza ===
 
Questa formula può essere generalizzata per la [[covarianza (probabilità)|covarianza]], con due variabili casuali X<submath>iX_i</submath> e X<submath>jX_j</submath>:
 
:<math>\operatorname{Cov}(X_i, X_j) = \operatorname{E}(X_iX_j) -\operatorname{E}(X_i)\operatorname{E}(X_j)</math>
 
così come per la [[matrice delle covarianze]] ''<math>n''</math> per ''<math>n''</math> di un [[vettore casuale]] di lunghezza ''<math>n''</math>:
 
:<math> \operatorname{Var}(\mathbf{X}) = \operatorname{E}(\mathbf{X X^\top}) - \operatorname{E}(\mathbf{X})\operatorname{E}(\mathbf{X})^\top</math>
 
e per la [[matrice delle covarianze incrociate]] ''<math>n''</math> per ''<math>m''</math> ''tra'' due vettori casuali di lunghezze ''<math>n''</math> ed ''<math>m''</math>:
 
:<math>
Riga 49 ⟶ 68:
\operatorname{E}(\mathbf{X Y^\top}) - \operatorname{E}(\mathbf{X})\operatorname{E}(\mathbf{Y})^\top</math>
 
dove le aspettazioni sono prese elemento per elemento e <math>\mathbf{X}=\{X_1,X_2,\ldots,X_n\}</math> e <math>\mathbf{Y}=\{Y_1,Y_2,\ldots,Y_m\}</math> sono vettori casuali di lunghezze rispettive ''<math>n''</math> e ''<math>m''</math>.
 
Notare che questa formula soffre della stessa [[Cancellazione numerica|perdita di significato]] di cui soffre la formula per la varianza se usata per calcularecalcolare stime della covarianza.
 
== BibliografiaNote ==
<references/>