Test Q: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica |
sistemo un po' |
||
(35 versioni intermedie di 20 utenti non mostrate) | |||
Riga 1:
Il '''test Q''' o '''test di [[Wilfrid Dixon|Dixon]]''' (''Q test'' in inglese) è un semplice [[test non parametrico|test statistico non parametrico]] utilizzato per valutare se scartare o meno dati ritenuti [[outlier]].
Per effettuare il test Q al fine di individuare i dati errati, si devono disporre i dati in ordine di valore crescente, e quindi per ognuno calcolare il coefficiente <math>Q_n,</math> definito come:
:<math>
dove <math>R=\max_j(x_j)-\min_j(x_j)</math> è l'ampiezza dell'intervallo contenente tutti i valori osservati.
Sia <math>Q=\max_n(Q_n).</math> Si confronta <math>Q_n</math> con <math>Q_{\text{tabella}},</math> dove <math>Q_{\text{tabella}}</math> è un valore di riferimento ottenuto a partire dall'ampiezza del campione e dal [[livello di confidenza]] (alcuni esempi sono riportati di seguito). Se <math>Q_n>Q_{\text{tabella}},</math> allora si può scartare il valore, con affidabilità pari alla percentuale riportata.
Importante: con il test Q può essere eliminato al massimo un solo valore per insieme di dati se si vuole preservare l'integrità statistica dei dati.
==Valori di Q<sub>tabella</sub>==
{|style="vertical-align: top;"
|Numero di dati:
| style="text-align: center;"|3
| style=" text-align: center;"|4
| style=" text-align: center;"|5
| style="text-align: center;"|6
|style=" text-align: center;"|7
|style=" text-align: center;"|8
|style=" text-align: center;"|9
|style=" text-align: center;"|10
|-
|Q<sub>90%</sub>:
|style=" text-align: center;"|0,941
|style=" text-align: center;"|0,765
|style=" text-align: center;"|0,642
|style=" text-align: center;"|0,560
|style=" text-align: center;"|0,507
|style=" text-align: center;"|0,468
|style=" text-align: center;"|0,437
|style=" text-align: center;"|0,412
|-
|Q<sub>95%</sub>:
|style=" text-align: center;"|0,970
|style=" text-align: center;"|0,829
|style=" text-align: center;"|0,710
|style=" text-align: center;"|0,625
|style=" text-align: center;"|0,568
|style=" text-align: center;"|0,526
|style=" text-align: center;"|0,493
|style=" text-align: center;"|0,466
|-----
| style="text-align: left;" | Q<sub>99%</sub>:
| 0,994
| 0,926
| 0,821
| 0,740
| 0,680
| 0,634
| 0,598
| 0,568
|}
==Esempio di applicazione==
Consideriamo i dati seguenti:
:
Dopo averli ordinati in ordine crescente, si calcoli per ognuno la differenza tra i valori successivi:
{|
| 0,169
| 0,177
| 0,181
| 0,181
| 0,182
| 0,183
| 0,184
| 0,186
| 0,187
| 0,189
|-
| ---
| 0,008
| 0,004
| 0,000
| 0,001
| 0,001
| 0,001
| 0,002
| 0,001
| 0,002
|}
Il valore che più si discosta dagli altri è 0,169. Allora:
:<math>Q= \frac {(0,177-0,169)} {(0,189-0,169)} \simeq 0,40.</math>
Con 10 dati, <math>Q</math> è minore sia di Q<sub>90%</sub> sia di Q<sub>95%</sub> (riportati in tabella). Possiamo quindi mantenere 0,169 sia se vogliamo il 90% di affidabilità, sia al 95%. Esiste dunque una probabilità superiore al 10%, che quel dato appartenga alla stessa popolazione degli altri nove valori.
== Bibliografia ==
* R. B. Dean and [[Wilfrid Dixon|W. J. Dixon]] (1951) "Simplified Statistics for Small Numbers of Observations". Anal. Chem., 1951
== Voci correlate ==
* [[Wilfrid Dixon]], coautore del test
{{statistica}}
{{portale|statistica}}
[[Categoria:Test statistici|Q]]
|