Errore di primo tipo
L'errore di primo tipo (detto pure errore alfa) è una variabile che si utilizza in statistica. Nella verifica di ipotesi statistiche è necessario tener conto della possibilità di commettere errori legati all’accettazione o al rifiuto di ipotesi. L'errore di primo tipo è quello che si fa rifiutando la cosiddetta ipotesi nulla quando questa in realtà è vera (falso positivo). Più in generale i casi che si possono presentare sono riassunti nella seguente tabella:
vera | falsa | |
accetto | decisione giusta | errore di II tipo(β) |
rifiuto | errore di I tipo (α) | decisione giusta |
Si definisce errore di I tipo l’errore che si commette rifiutando l’ipotesi nulla quando essa è vera nella realtà. Si indica con α la probabilità di commettere un errore di I tipo; i valori più frequentemente impiegati per α sono 0,05 oppure 0,01.
α =Pr (errore di I tipo) =Pr ( rifiutare | vera ) =Pr ((,...)∈ R| vera )
dove (,...) rappresenta un campione casuale ed R rappresenta la regione critica, cioè l’insieme dei valori dello spazio campionario che portano al rifiuto dell’ipotesi nulla .
Esempio: data la variabile aleatoria X ≡ N (μ;2), calcoliamo il valore di α per il seguente sistema di ipotesi:
Dato il campione (,...), l’ipotesi verrà rifiutata se
- > k;
e verrà accettata in caso contrario, cioè se
- <= k.
In questo caso risulta
- R = { (,... ) | > k },
perciò
- α = Pr (errore di I tipo) = Pr ( rifiutare | vera ) = Pr ((,... ) ∈ R | vera ) =
Pr ( > k | μ = 18) = Pr ( N (18,2/ ) > k)
Supponendo che n = 100 e che
- = 18,6
risulta
- α = Pr ( > 18,6 | μ = 18) = Pr ( N (18,2/10) > 18,6) = Pr ( Z > 0,6 * 10 / 2) = Pr (Z > 3 ) = 0,0013
dove Z ≡ N (0,1). In questo caso il livello critico per il campione considerato, cioè il minor livello di significatività per il quale si rifiuta l’ipotesi nulla, è 0.0013.
La gravità dei due tipi di errore dipende dalla definizione delle ipotesi (ipotesi nulla e ipotesi alternativa). La situazione ideale sarebbe minimizzare entrambe le probabilità associate ai due tipi di errori ma questo è nella pratica difficilmente attuabile, l’unica possibilità è aumentare la dimensione del campione ma questo non sempre è possibile. La cosa migliore da fare è dunque minimizzare l’errore più importante (che come abbiamo detto sopra dipende da come sono state definite le ipotesi) cercando di tenere costante l’altro tipo di errore.