Regressione logistica multinomiale: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m →Note: fix rif. |
m fix + aggiunta template |
||
Riga 1:
In [[statistica]] e [[apprendimento automatico]] la '''regressione logistica multinomiale''' è un metodo [[Classificazione statistica|di classificazione]] che generalizza [[Modello logit|la regressione logistica]] al caso dei problemi ''multiclasse'', cioè con più di due possibili esiti discreti.<ref>{{Cita libro|nome=William H.|cognome=Greene|titolo=Econometric Analysis|edizione=Seventh|anno=2012|editore=Pearson Education|pp=803–806|ISBN=978-0-273-75356-8}}</ref> Si tratta, cioè, di un modello utilizzato per predire le probabilità dei diversi possibili valori di una [[Variabili dipendenti e indipendenti|variabile dipendente]] distribuita categoricamente, dato un insieme di [[Variabili dipendenti e indipendenti|variabili indipendenti]] (che possono essere a valori reali, a valori binari, a valori categorici, ecc.).
Riga 209 ⟶ 207:
# In generale, se <math>X \sim \operatorname{EV}_1(a,b)</math> e <math>Y \sim \operatorname{EV}_1(a,b)</math> allora <math>X - Y \sim \operatorname{Logistica}(0,b).</math> Ciò significa che la differenza di due variabili [[Variabili indipendenti e identicamente distribuite|indipendenti con distribuzione identica]] dei valori estremi segue la [[distribuzione logistica]], e il primo parametro è irrilevante. Ciò è comprensibile poiché il primo parametro è un ''parametro di posizione'', ovvero sposta la media di una quantità fissa e se due valori vengono entrambi spostati della stessa quantità, la loro differenza rimane invariata. Ciò significa che tutti gli enunciati affermazioni relazionali alla base della probabilità di una data scelta coinvolgono la distribuzione logistica, il che rende la scelta iniziale della distribuzione dei valori estremi, che sembrava piuttosto arbitraria, in qualche modo più comprensibile.
# Il secondo parametro in una distribuzione di valori estremi o logistica è un ''parametro di scala'', tale che se <math>X \sim \operatorname{Logistic}(0,1)</math>
# Poiché vengono utilizzate solo le differenze dei vettori dei coefficienti di regressione, l'aggiunta a tutti i vettori di coefficienti di una costante arbitraria non ha alcun effetto sul modello. Ciò significa che, proprio come nel modello log-lineare, solo ''K'' − 1 dei vettori dei coefficienti è identificabile e l'ultimo può essere impostato su un valore arbitrario (ad esempio 0).
Riga 243 ⟶ 241:
{{apprendimento automatico}}
{{Statistica}}
[[Categoria:Algoritmi di classificazione]]
[[Categoria:Apprendimento automatico]]
|