Test Q: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
sistemo un po' |
|||
(30 versioni intermedie di 19 utenti non mostrate) | |||
Riga 1:
Il '''test Q''' o '''test di [[Wilfrid Dixon|Dixon]]''' (''Q test'' in inglese) è un semplice [[test non parametrico|test statistico non parametrico]] utilizzato per valutare se scartare o meno dati ritenuti [[outlier]].
Per effettuare il
:<math>Q_n=\frac{|x_n-x_{n-1}|}{|R|},</math>
dove <math>R=\max_j(x_j)-\min_j(x_j)</math> è l'ampiezza dell'intervallo contenente tutti i valori osservati.
Sia <math>Q=\max_n(Q_n).</math> Si confronta <math>Q_n</math> con <math>Q_{\text{tabella}},</math> dove <math>Q_{\text{tabella}}</math> è un valore di riferimento ottenuto a partire dall'ampiezza del campione e dal [[livello di confidenza]] (alcuni esempi sono riportati di seguito). Se <math>Q_n>Q_{\text{tabella}},</math> allora si può scartare il valore, con affidabilità pari alla percentuale riportata.
'''Importante''': al massimo '''un''' valore per serie di dati può essere eliminato con il test Q, se si vuole preservare l'integrità statistica dei dati.▼
▲
==Valori di Q<sub>tabella</sub>==
{|style="vertical-align: top;"
|Numero di dati:
Riga 24:
|-
|Q<sub>90%</sub>:
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|-
|Q<sub>95%</sub>:
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|style=" text-align: center;"|0
|-----
| style="text-align: left;" | Q<sub>99%</sub>:
| 0,994
| 0,926
| 0,821
| 0,740
| 0,680
| 0,634
| 0,598
| 0,568
|}
Riga 47 ⟶ 57:
Consideriamo i dati seguenti:
:0
Dopo averli ordinati in ordine crescente,
{|
| 0
| 0
| 0
| 0
| 0
| 0
| 0
| 0
| 0
| 0
|-
| ---
| 0
| 0
| 0
| 0
| 0
| 0
| 0
| 0
| 0
|}
Il valore che più si discosta dagli altri è 0,169.
Con 10 dati,
▲:<math>Q= \frac {(0.177-0.168)} {(0.189-0.168)} \simeq 0.429</math>
== Bibliografia ==
▲Con 10 dati, e al 90% di affidabilità, Q<sub>n</sub> è maggiore del Q<sub>tabella</sub>. Possimo quindi scartare 0.168 se vogliamo il 90% di affidabilità, mentre al 95% possiamo tenerlo. Esiste dunque una probabilità inferiore al 10%, ma superiore al 5%, che quel dato appartenga alla stessa popolazione degli altri nove numeri.
* R. B. Dean and [[Wilfrid Dixon|W. J. Dixon]] (1951) "Simplified Statistics for Small Numbers of Observations". Anal. Chem., 1951
== Voci correlate ==
* [[Wilfrid Dixon]], coautore del test
{{portale|statistica}}
[[Categoria:Test statistici|Q]]
|