Modello lineare generalizzato: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
fix vari
Riga 15:
 
== Panoramica ==
In un GLM, ciascun valore dalla variabile dipendente '''<math>\mathbf{Y'''}</math> si assume venga generato da una particolare variabile casuale della famiglia esponenziale, la quale comprende parecchie variabili casuali quali [[variabile casuale binomiale|binomiale]], [[variabile casuale poissoniana|poissoniana]], [[variabile casuale gamma|gamma]], [[variabile casuale normale inversa|normale inversa]] e altre. La media <math>\boldsymbol{\mu}</math> della distribuzione dipende dalla variabile indipendente <math>\mathbf{X}</math>:
La media '''''μ''''' della distribuzione dipende dalla variabile indipendente '''X''':
 
: <math>\operatorname{E}(\mathbf{Y}) = \boldsymbol{\mu} = g^{-1}(\mathbf{X}\boldsymbol{\beta}) ,</math>
 
dove <math>\operatorname{E}('''\mathbf{Y'''})</math> è il [[valore atteso]] di '''<math>\mathbf{Y'''}</math>; '''<math>\mathbf{X''&}\boldsymbol{\beta;'''''}</math> è il predittore lineare, ovvero una combinazione lineare di '''<math>\mathbf{X'''}</math> e parametri ignoti '''''&<math>\boldsymbol{\beta;'''''}</math>; ''<math>g''</math> è la cosiddetta funzione di collegamento.
 
In questo ambito, la varianza è tipicamente una funzione '''<math>\operatorname{V'''}</math> della media:
:<math> \operatorname{Var}(\mathbf{Y}) = \operatorname{V}( \boldsymbol{\mu} ) = \operatorname{V}(g^{-1}(\mathbf{X}\boldsymbol{\beta})). </math>
 
:<math> \operatorname{Var}(\mathbf{Y}) = \operatorname{V}( \boldsymbol{\mu} ) = \operatorname{V}(g^{-1}(\mathbf{X}\boldsymbol{\beta})). </math>
Ciò risulta conveniente se '''V''' è distribuita come una variabile aleatoria della famiglia esponenziale, ma la varianza può essere semplicemente una funzione del valore stimato.
 
Ciò risulta conveniente se '''<math>\operatorname{V'''}</math> è distribuita come una variabile aleatoria della famiglia esponenziale, ma la varianza può essere semplicemente una funzione del valore stimato.
I parametri ignoti '''''&beta;''''' vengono stimati solitamente con il [[metodo della massima verosimiglianza]], quello della massima quasi-verosimiglianza o con tecniche bayesiane.
 
I parametri ignoti '''''&<math>\boldsymbol{\beta;'''''}</math> vengono stimati solitamente con il [[metodo della massima verosimiglianza]], quello della massima quasi-verosimiglianza o con tecniche bayesiane.
 
== Le componenti del modello ==
Il GLM è composto da tre elementi<ref>{{Cita web|url=https://online.stat.psu.edu/stat504/node/216/|titolo=6.1 - Introduction to Generalized Linear Models {{!}} STAT 504|sito=online.stat.psu.edu|accesso=2020-11-01}}</ref>:
# Lala funzione di distribuzione ''<math>f''</math>, facente parte della famiglia esponenziale;
# Ilil predittore lineare ''&<math>\eta;'' = '''\mathbf{X''&}\boldsymbol{\beta}</math>;'''''
# Unauna funzione ''<math>g''</math>, detta di collegamento, tale che <math>\operatorname{E}('''\mathbf{Y'''}) = '''&\boldsymbol{\mu;'''} = ''g''<sup>−1</sup>^{-1}(''&\eta;'')</math>.
 
=== Distribuzione della probabilità ===
Una '''famiglia esponenziale iperdispersa''' di distribuzioni è una generalizzazione di una famiglia esponenziale e il [[modello di dispersione esponenziale]] di distribuzioni e include quelle famiglie di distribuzioni di probabilità, con parametri <math>\boldsymbol\theta</math> e <math>\tau</math>, mentre la funzione di densità ''<math>f''</math>, per il caso di una [[distribuzione discreta]] può essere espressa nella forma:
 
:<math> f_Y(\mathbf{y} \mid \boldsymbol\theta, \tau) = h(\mathbf{y},\tau) \exp \left(\frac{\mathbf{b}(\boldsymbol\theta)^{\rm T}\mathbf{T}(\mathbf{y}) - A(\boldsymbol\theta)} {d(\tau)} \right).</math>
Riga 48:
Il parametro <math>\boldsymbol\theta</math> è correlato alla media della distribuzione. Se <math>\mathbf{b}(\boldsymbol\theta)</math> è la funzione identità, si suol dire che la distribuzione è nella [[forma canonica]] (o ''forma naturale''). Si noti che qualsiasi distribuzione può essere convertita in forma canonica mediante la sostituzione di <math>\boldsymbol\theta</math> con <math>\boldsymbol\theta'</math> per mezzo della trasformazione <math>\boldsymbol\theta = \mathbf{b}(\boldsymbol\theta')</math>. È sempre possibile convertire <math>A(\boldsymbol\theta)</math> in termini del nuovo parametro <math>\boldsymbol\theta'</math>, anche se <math>\mathbf{b}(\boldsymbol\theta')</math> non è una [[funzione invertibile]]. Se inoltre, <math>\mathbf{T}(\mathbf{y})</math> è l'identità e <math>\tau</math> è conosciuto, allora <math>\boldsymbol\theta</math> è detto ''parametro canonico'' (o parametro naturale) ed è correlato alla media dalla relazione
 
:<math> \boldsymbol\mu = \operatorname{E}(\mathbf{Y}) = \nabla A(\boldsymbol\theta).</math>
 
== Note ==
<references />

{{Controllo di autorità}}
{{Portale|economia}}