Simmetria (statistica): differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Aggiunta sezione: "Indice di Bowley-Yule"
m fix minori
Riga 1:
[[File:SkewedDistribution.png|thumb|Esempio di dati sperimentali che presentano asimmetria]]
In [[teoria delle probabilità]] una [[distribuzione di probabilità]] è '''simmetrica''' quando la sua [[funzione di probabilità]] ''<math>P''</math> (nel caso [[distribuzione discreta|discreto]]) o la sua [[funzione di densità di probabilità]] (nel caso [[distribuzione continua|continuo]]) siano [[simmetria (matematica)|simmetriche]] rispetto ad un particolare valore <math>x_0</math>:
 
:<math>P(x_0+x)=P(x_0-x)</math> oppure <math>f(x_0+x)=f(x_0-x).</math>.
 
Esempi di distribuzioni simmetriche sono le distribuzioni uniformi ([[distribuzione discreta uniforme|discreta]] e [[distribuzione continua uniforme]]) su insiemi simmetrici, la [[distribuzione normale]] e altre distribuzioni derivate da distribuzioni simmetriche (la [[distribuzione t di Student]]) oppure definite in maniera simmetrica (la [[distribuzione di Skellam]] con parametri uguali).
Riga 15 ⟶ 16:
== Indice di asimmetria ==
L'indice più utilizzato, noto semplicemente come ''indice di asimmetria'' o ''skewness'', è definito come
 
:<math>\gamma_1=\frac{m_3}{m_2^{3/2}}</math>
 
tramite i momenti centrali <math>m_k=E[\bar{X}^k]</math>, ossia i valori attesi delle potenze della variabile aleatoria [[valore atteso|centrata]] <math>\bar{X}=X-E[X].</math>
 
Riga 21 ⟶ 24:
 
Talvolta viene utilizzato al posto di <math>\gamma_1</math> l'indice
 
:<math>\beta_1=\gamma_1^2=\frac{m_3^2}{m_2^3},</math>
 
che tuttavia perde l'informazione sul [[segno (matematica)|segno]] dell'asimmetria.
 
In [[statistica]] l'indice di asimmetria calcolato su un campione osservato <math>\{x_1,\ldots,x_n\}</math> di media <math>\bar{x}</math> segue la formula
 
:<math>\gamma_1=\frac{\sum_{i=1}^n\frac{1}{n}(x_i-\bar{x})^3}{\left(\sum_{i=1}^n\frac{1}{n}(x_i-\bar{x})^2\right)^{3/2}}.</math>
 
Riga 33 ⟶ 39:
 
La somma <math>Y=X_1+\ldots+X_n</math> di <math>n</math> variabili aleatorie [[variabili indipendenti]] con la ''stessa'' distribuzione ha momenti centrali <math>m_k(Y)=nm_k(X);</math> in particolare
 
:<math>\gamma_1(Y)=\frac{1}{\sqrt{n}}\gamma_1(X).</math>
 
Una convinzione '''sbagliata''' ma diffusa (e "sostenuta" da alcuni testi che la riportano come ''"regola indicativa''") è che il segno del coefficiente <math>\gamma_1</math> possa determinare le posizioni reciproche del valore atteso, della [[mediana (statistica)|mediana]] e della [[moda (statistica)|moda]] (se questa è unica) di una distribuzione, in particolare che esse debbano coincidere se <math>\gamma_1=0</math>.<ref>{{cita web|url=https://doi.org/10.1080/10691898.2005.11910556|titolo=Mean, Median, and Skew: Correcting a Textbook Rule|lingua={{en}}|autore=Paul T. von Hippel|accesso=06 novembre 2022|opera=Journal of Statistics Education}}</ref>
 
== Indice di Pearson ==
Riga 51 ⟶ 58:
Un altro indice di asimmetria, basato sui quantili, introdotto da [[Arthur Lyon Bowley|Bowley]] e riproposto da [[George Udny Yule|Yule]] usa la formula
 
:<math>\gamma = \frac{(x_{(0.,75)} - x_{(0.,5)})-(x_{(0.,5)}-x_{(0.,25)})}{x_{(0.,75)}-x_{(0.,25)}}=\frac{q_1+q_3-2M}{q_3-q_1},</math>
 
dove <math display="inline">x_{( \alpha)}</math> indica il quantile di ordine <math display="inline">\alpha</math>, <math display="inline">q_1</math> e <math display="inline">q_3</math> identificano rispettivamente il primo e il terzo quartile di <math display="inline">x</math> e <math display="inline">M=q_2</math> è la mediana della distribuzione.<ref>{{Cita libro|autore=Arthur Lyon Bowley|nome=Arthur Lyon|cognome=Bowley|titolo=Elements of Statistics|edizione=4|annooriginale=1901|anno=1920|editore=P.S. King & Son|città=Londra|lingua=inglese}}</ref>
 
Talvolta questa quantità viene generalizzata nella forma
 
:<math>\gamma_\alpha = \frac{x_{(\alpha)}+x_{(1-\alpha)}-2M}{x_{(1-\alpha)}-x_{( \alpha)}},\qquad</math> con <math display="inline">0 \le \alpha < 0.,5.</math>.
 
== Esempio ==
Un esempio di distribuzione non simmetrica con coefficiente di asimmetria 0 è la distribuzione discreta
 
:<math>P(-4)=\tfrac{1}{3},\quad P(1)=\tfrac{1}{2},\quad P(5)=\tfrac{1}{6},</math>
 
che può essere visualizzata come il lancio di un dado le cui sei facce presentino i numeri "-4, -4, 1, 1, 1, 5".