Simmetria (statistica): differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
fix minori
Riga 16:
L'indice più utilizzato, noto semplicemente come ''indice di asimmetria'' o ''skewness'', è definito come
:<math>\gamma_1=\frac{m_3}{m_2^{3/2}}</math>
tramite i momenti centrali <math>m_k=E[\bar{X}^k]</math>, ovveroossia i valori attesi delle potenze della variabile aleatoria [[valore atteso|centrata]] <math>\bar{X}=X-E[X].</math>.
 
Poiché il primo momento centrale è sempre nullo ed il secondo momento centrale (la [[varianza]]) è nullo solo per le distribuzioni concentrate su un unico valore, il terzo momento centrale <math>m_3</math> è quello di ordine più basso che può "sperare" di misurare l'asimmetria di una distribuzione. Inoltre il riscalamento per <math>m_2^{3/2}</math> permette all'indice <math>\gamma_1</math> di restare invariato per [[trasformazione lineare|trasformazioni lineari]] <math>Y=aX+b,</math> che trasformano i momenti centrali come <math>m_k(aX+b)=a^km_k(X).</math>
Inoltre il riscalamento per <math>m_2^{3/2}</math> permette all'indice <math>\gamma_1</math> di restare invariato per [[trasformazione lineare|trasformazioni lineari]] <math>Y=aX+b</math>, che trasformano i momenti centrali come <math>m_k(aX+b)=a^km_k(X)</math>.
 
Talvolta viene utilizzato al posto di <math>\gamma_1</math> l'indice
:<math>\beta_1=\gamma_1^2=\frac{m_3^2}{m_2^3},</math>
che tuttavia perde l'informazione sul [[segno (matematica)|segno]] dell'asimmetria.
 
In [[statistica]] l'indice di asimmetria calcolato su un campione osservato <math>\{x_1,...\ldots,x_n\}</math> di media <math>\bar{x}</math> segue la formula
:<math>\gamma_1=\frac{\sum_{i=1}^n\frac{1}{n}(x_i-\bar{x})^3}{\left(\sum_{i=1}^n\frac{1}{n}(x_i-\bar{x})^2\right)^{3/2}}.</math>.
 
Il successivo momento centrale <math>m_4</math> viene invece utilizzato per calcolare la [[curtosi]] (che vuole "misurare" l'allontanamento della distribuzione dalla distribuzione normale).
Riga 33 ⟶ 32:
Ogni distribuzione simmetrica ha indice di asimmetria 0.
 
La somma <math>Y=X_1+...\ldots+X_n</math> di ''<math>n''</math> variabili aleatorie [[variabili indipendenti]] con la ''stessa'' distribuzione ha momenti centrali <math>m_k(Y)=nm_k(X);</math>; in particolare
:<math>\gamma_1(Y)=\frac{1}{\sqrt{n}}\gamma_1(X).</math>
 
Una convinzione '''sbagliata''' ma diffusa (e "sostenuta" da alcuni testi che la riportano come ''regola indicativa'') è che il segno del coefficiente <math>\gamma_1</math> possa determinare le posizioni reciproche del valore atteso, della [[mediana (statistica)|mediana]] e della [[moda (statistica)|moda]] (se questa è unica) di una distribuzione, in particolare che esse debbano coincidere se <math>\gamma_1=0</math>.<ref>{{cita web|url=https://www.amstat.org/publications/jse/v13n2/vonhippel.html|titolo=Mean, Median, and Skew: Correcting a Textbook Rule|lingua={{en}}|autore=Paul T. von Hippel|accesso=21 marzo 2010|opera=Journal of Statistics Education}}</ref>
Riga 41 ⟶ 40:
Alcuni indici di asimmetria alternativi per un [[campione (statistica)|campione statistico]] sono stati proposti da [[Karl Pearson]]; coinvolgono la media (il [[valore atteso]]), la [[mediana (statistica)|mediana]], la [[moda (statistica)|moda]] e lo [[scarto quadratico medio]] (la radice quadrata della varianza):
* l'asimmetria di moda di Pearson
:( :<math>\frac{\text{media} - \text{moda ) / }}{\text{scarto quadratico medio,}};</math>
* il primo coefficiente di asimmetria di Pearson
::<math>\frac{3 ( \text{media} - \text{moda }) / }{\text{scarto quadratico medio,}};</math>
* il secondo coefficiente di asimmetria di Pearson
::<math>\frac{3 ( \text{media} - \text{mediana }) / }{\text{scarto quadratico medio}}.</math>
 
== Esempio ==
Un esempio di distribuzione non simmetrica con coefficiente di asimmetria 0 è la distribuzione discreta
:<math>P(-4)=\tfrac{1}{3},\quad P(1)=\tfrac{1}{2},\quad P(5)=\tfrac{1}{6},</math>,
che può essere visualizzata come il lancio di un dado le cui sei facce presentino i numeri " -4, -4, 1, 1, 1, 5 ".
 
Questa distribuzione è chiaramente non simmetrica, tuttavia ha [[valore atteso]] pariuguale a 0 (è centrata) e terzo momento centrale pariuguale a <math>(\tfrac{-64-64+1+1+1+125)/}{6}=0,</math>, pertanto ha indici di asimmetria <math>\gamma_1=\beta_1=0.</math>.
 
Nell'esempio la moda e la mediana non coincidono con la media, ma questo si può ottenere aggiungendo altre 4 "facce" con valore 0; in questo modo anche gli indici di Pearson diventano nulli e la distribuzione resta non simmetrica.