Test t: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
 
(57 versioni intermedie di 39 utenti non mostrate)
Riga 1:
Il '''test t''' (o, dall'[[lingua inglese|inglese]], '''t-test''') è un test [[statistica|statistico]] di tipo [[test parametrico|parametrico]] con lo scopo di [[test di verifica d'ipotesi|verificare]] se il valore medio di una distribuzione si discosta significativamente da un certo valore di riferimento. Differisce dal [[test Z]] per il fatto che la [[varianza]] <math>\sigma^2</math> è sconosciuta.
== Il test t di Student per la verifica d'ipotesi su un valor medio ==
Se la varianza deggglla popolazione non è nota la verifica d'ipotesi sulla media della popolazione si effettua sostituendo alla varianza di universo la sua stima ottenuta a partire dallo stimatore varianza corretta del campione:
 
== Il test t di Student per la verifica d'ipotesi su un valorvalore medio ==
<math>s^2=\frac{\sum_{i=1}^n (x_i-\overline{x})^2}{n-1}.</math>
Se la varianza deggglladella popolazione non è nota, la verifica d'ipotesi sulla media della popolazione si effettua sostituendo alla varianza di universo la sua stima ottenuta a partire dallo [[stimatore]] varianza corretta del campione:
 
:<math>s^2=\frac{\sum_{i=1}^n (x_i-\overline{x})^2}{n-1}.,</math>
In questo modo la statistica test è:
 
dove <math>n</math> è il numero di elementi del campione e <math>\overline{x}</math> è la media campionaria. In questo modo la statistica test è:
<math>Y_0=\frac{\overline{X}-\mu_0}{s/ \sqrt{n}},</math>
 
:<math>Y_0=\frac{\overline{X}-\mu_0}{s/ \sqrt{n}},</math>
la cui distribuzione è quella della T di Student con n-1 gdl.
Il test in questo caso non si chiama più [[test z]], ma test t.
Ad ogni modo all'aumentare dei gradi di libertà per il [[teorema del Limite Centrale]] la
v.c. T tende alla Normale e quindi alla T si può sostituire la Z
(diciamo per una soglia campionaria n maggiore di 30).
Ovviamente se il test è bidirezionale si rifiuterà l'ipotesi nulla se la t empirica è maggiore
della t teorica di <math>\alpha/2</math> a n-1 gdl e si accetterà l'ipotesi alternativa <math>H_1</math>, con un errore <math>\alpha</math> di I specie.
 
la cui distribuzione è quella della <math>T</math> di Student con <math>n-1</math> [[Grado di libertà (statistica)|gradi di libertà]]. Ad ogni modo, all'aumentare dei gradi di libertà, per il [[teorema del limite centrale]], la [[variabile casuale]] <math>T</math> tende alla [[distribuzione normale]] e quindi alla <math>T</math> si può sostituire la <math>Z,</math> solitamente per una soglia campionaria <math>n</math> maggiore di 30. Se il test è bidirezionale, si rifiuterà l'ipotesi nulla se la <math>t</math> empirica è maggiore della <math>t</math> teorica di <math>\alpha/2</math> con <math>n-1</math> gradi di libertà e si accetterà l'ipotesi alternativa <math>H_1</math> con un errore <math>\alpha</math> di I specie.
In [[econometria]] la statistica t ha la seguente forma:
 
In [[econometria]] la statistica <math>t</math> ha la seguente forma:

:<math>t = \frac{{\hat{\beta_1}} - \beta_{1,0}}{SE({\hat{\beta_1}})}</math> =<math>=\frac{\text{stimatore} - \text{valore. ipotizzato}}{ \text{errore. standard. dello. stimatore}}.</math>
 
== Esempio in R ==
Utilizzando il linguaggio di programmazione R ed il software RStudio si vuole verificare che il reddito familiare medio degli uomini statunitensi (variabile coninc) è maggiore di quello delle donne. Il dataset usato è stato ottenuto tramite Il "General Social Surveys", un questionario sottoposto a persone intervistate di 18 anni o più che parlavano in inglese all'interno degli Stati Uniti d'America. In totale le interviste sono state {{formatnum:57061}} che rappresentano meno del 10% della popolazione americana. Tali interviste sono state fatte tra il 1972 e il 2014 e ciascuna contiene 114 variabili di cui alcune numeriche ed altre categoriali. L'analisi fatta è osservazionale e non sperimentale quindi non si possono stabilire relazioni casuali tra le variabili.
 
Ogni osservazione nel gruppo degli uomini non ha una corrispondenza speciale con esattamente un'osservazione nel gruppo delle donne, quindi i dati non sono accoppiati. Le dimensioni dei campioni sono {{formatnum:25146}} per gli uomini e {{formatnum:31915}} per le donne, quindi sono molto grandi. Ci possiamo rilassare sul requisito della distribuzione quasi normale e possiamo usare la distribuzione t, sebbene ognuna delle 2 distribuzioni è fortemente distorta.
 
<syntaxhighlight lang="R">
library(statsr)
g<- gss %>%
filter(!is.na(sex),!is.na(coninc))
 
inference(y = coninc, x = sex, data = g, statistic = "mean", type = "ht", null=0,
alternative = "greater", method = "theoretical")
 
</syntaxhighlight>
 
Response variable: numerical
Explanatory variable: categorical (2 levels)
n_Male = 23043, y_bar_Male = 48763.6453, s_Male = 36916.3394
n_Female = 28189, y_bar_Female = 41020.2199, s_Female = 34728.8358
H0: mu_Male = mu_Female
HA: mu_Male > mu_Female
t = 24.2541, df = 23042
p_value = < 0.0001
 
'''Rifiutiamo l'ipotesi nulla H0 essendo p_value <0,05. I dati forniscono una prova evidente che il reddito familiare dichiarato dagli uomini statunitensi è maggiore di quello dichiarato dalle donne statunitensi.'''
 
== Voci correlate ==
* [[Variabile casualeDistribuzione t di Student]]
* [[Test di Wilcoxon-Mann-Whitney]]
* [[de:T-Test F]]
 
==Collegamenti esterni==
*{{cita web|http://www.quadernodiepidemiologia.it/epi/assoc/t_stu.htm|Quaderno di epidemiologia}}
 
==Argomenti correlati==
*[[Variabile casuale t di Student]]
{{Statistica}}
{{Controllo di autorità}}
{{portale|statistica}}
 
[[Categoria:Test statistici|T]]
 
[[de:T-Test]]
[[fi:Studentin t-testi]]
[[hu:Egymintás t-próba]]
[[ja:T検定]]
[[nl:T-toets]]
[[ru:T-критерий Стьюдента]]
[[sv:T-test]]
[[zh:T分配]]