Modello lineare generalizzato: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Aggiunta della sezione bontà del modello |
Aggiunta sottosezioni confronto tra modelli annidati e confronto tra modelli generici |
||
Riga 81:
* regressione logistica e binomiale: <math>\widehat{OR}=\exp{\beta_j}</math> corrisponde all'aumento percentuale dell'[[Odds ratio|Odds Ratio]] all'aumentare di un'unità della j-esima covariata a parità delle altre condiioni
* regressione poissoniana: <math>\widehat{IRR}=\exp{\widehat{\beta_j}}</math> corrisponde alla variazione percentuale della risposta media all'aumentare di un'unità della j-esima covariata a parità delle altre condizioni (Incident Rate Ratio)
Riga 91 ⟶ 92:
=== Bontà del modello ===
Per varificare la bontà del modello si può ricorrere a due test statistici: uno basato sulla devianza ed uno basato sulla <math>\mathrm{X}^2</math> di [[Karl Pearson|Pearson]]. Entrambi hanno come ipotesi nulla l'adaguetezza del modello.
# Test basato devianza: la statistica test è <math>D^*\sim\chi_{n-k-1}^2</math> (per n grande)
#Test basato sulla <math>\mathrm{X}^2</math> di Pearson: la statistica test è <math>\mathrm{X}^2=\sum_{i=1}^N{(y_i-\widehat\mu_i)^2 \over \mathrm{V}(\widehat\mu_i)d(\tau)}\sim \chi^2_{n-k-1}</math>. (per n grande)
In entrambi i casi se il [[Valore p|p-value]] è maggiore del livello di significatività fisato a priori, non rifiuto l'ipotesi nulla e concludo che il modello è adeguato.
=== Confronto tra modelli annidati ===
Due modelli <math>M_1</math> (con <math>k_1</math> covariate) ed <math>M_2</math> (con <math>k_2</math> covariate), tali che <math>k_1<k_2</math>, si dicono annidati se hanno la stessa specificazione e le prime <math>k_1</math> covariate di <math>M_2</math> coincidono con le covariate di <math>M_1</math> a cui s ene aggiungono altre. Pe rconfrontare due modelli annidati si può ricorrere a due [[Test di verifica d'ipotesi|test statistici]]: il test basato sulla devianza e quello basato sulla statistica F.
Per entrambi i test l'[[ipotesi nulla]] è: <math>H_0: \beta_{k_1+1}=\beta_{k_2+2}=...=\beta_{k_2}=0</math>.
Le statistiche test sono:
# Test basato sulla devianza: <math>D^*_1-D^*_2\sim\chi^2_{k_2-k_1}</math>
# Test basato sulla statistica F: <math>F={(D_1-D_2)/(k_2-k_1 ) \over D_2/(n-k_2-1)}\sim\mathcal{F}_{k_2-k_1,n-k_2-1}</math>.
In entrambi i test se il [[Valore p|p-value]] è inferiore al valore soglia fissato a priori e scelgo il modello <math>M_2</math>.
=== Confronto tra modelli generici ===
Per il confronto tra due generici modelli si può ricorrere all'<math>R^2</math> di Naglekerke oppure ai criteri AIC ([[Akaike information criterion|Akaike Information Criterion]]) e BIC (Bayesian Information Criterion).
# <math>R^2={1-exp((-D_{M_0}+D_{M})/n) \over 1-exp(-D_{M_0}/n)}\in[0,1]</math>, il modello migliore ha valore più alto
# <math>AIC=-2*[l_M-(k+1)]</math>, il modello migliore ha valore più basso
# <math>BIC=-2l_M+(k+1)log(n)</math>, il modello migliore ha valotre più basso
== Note ==
|