Regressione logistica multinomiale: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Creata dalla traduzione della pagina "Multinomial logistic regression" |
m Capagira ha spostato la pagina Utente:Capagira/Regressione logistica multinomiale a Regressione logistica multinomiale: Pubblicazione bozza Etichetta: Bozza o sandbox pubblicata da non AV |
||
(3 versioni intermedie di uno stesso utente non sono mostrate) | |||
Riga 1:
In [[statistica]] e [[apprendimento automatico]] la '''regressione logistica multinomiale''' è un metodo [[Classificazione statistica|di classificazione]] che generalizza [[Modello logit|la regressione logistica]] al caso dei problemi ''multiclasse'', cioè con più di due possibili esiti discreti.<ref>{{Cita libro|nome=William H.|cognome=Greene|titolo=Econometric Analysis|edizione=Seventh|anno=2012|editore=Pearson Education|pp=803–806|ISBN=978-0-273-75356-8
▲In [[statistica]] e [[apprendimento automatico]] la '''regressione logistica multinomiale''' è un metodo [[Classificazione statistica|di classificazione]] che generalizza [[Modello logit|la regressione logistica]] al caso dei problemi ''multiclasse'', cioè con più di due possibili esiti discreti.<ref>{{Cita libro|nome=William H.|cognome=Greene|titolo=Econometric Analysis|edizione=Seventh|anno=2012|editore=Pearson Education|pp=803–806|ISBN=978-0-273-75356-8|linkautore1=William Greene (economist)}}</ref> Si tratta, cioè, di un modello utilizzato per predire le probabilità dei diversi possibili valori di una [[Variabili dipendenti e indipendenti|variabile dipendente]] distribuita categoricamente, dato un insieme di [[Variabili dipendenti e indipendenti|variabili indipendenti]] (che possono essere a valori reali, a valori binari, a valori categorici, ecc.).
La regressione logistica multinomiale è nota con una varietà di altri nomi, tra cui ''RL politomica'', <ref>{{Cita pubblicazione|autore=Engel|anno=1988|titolo=Polytomous logistic regression|rivista=Statistica Neerlandica|volume=42|pp=233–252|doi=10.1111/j.1467-9574.1988.tb01238.x}}</ref><ref>{{Cita libro|nome=Scott|cognome=Menard|titolo=Applied Logistic Regression Analysis|url=https://archive.org/details/appliedlogisticr00mena|anno=2002|editore=SAGE|p=[https://archive.org/details/appliedlogisticr00mena/page/n99 91]|ISBN=9780761922087}}</ref> ''RL multiclasse'', ''regressione'' [[Funzione softmax|softmax]], ''logit multinomiale'' (''mlogit''), ''classificatore di massima entropia'' (''MaxEnt'') e ''modello di massima entropia condizionata''.<ref name="malouf">{{Cita conferenza|url=http://aclweb.org/anthology/W/W02/W02-2018.pdf|anno=2002}}</ref>
Riga 15 ⟶ 13:
Se si usa il logit multinomiale per modellare le scelte, esso si basa sull'ipotesi di indipendenza delle alternative irrilevanti (IIA, acronimo in inglese), che non è sempre auspicabile. Con questa ipotesi la probabilità di preferire una classe rispetto a un'altra non dipende dalla presenza o dall'assenza di altre alternative "''irrilevanti''". Ad esempio, le probabilità relative di prendere un'auto o un autobus per andare al lavoro non cambiano se si aggiunge una bicicletta come possibilità aggiuntiva. Ciò consente di modellare la scelta di ''K'' alternative come un insieme di ''K'' − 1 scelte binarie indipendenti, in cui un'alternativa viene scelta come "''pivot''" e le altre ''K'' − 1 sono confrontate con questo, una alla volta. L'ipotesi IIA è un'assunzione fondamentale nella ''teoria della scelta razionale''; tuttavia, numerosi studi in psicologia dimostrano che gli individui spesso violano questo presupposto quando fanno delle scelte. Un esempio di caso problematico si verifica se le scelte includono un'auto e un autobus blu. Supponiamo che il rapporto di probabilità tra i due casi sia 1. : 1. Ora, se viene introdotta l'opzione di un autobus rosso, una persona potrebbe rimanere indifferente nella scelta tra un autobus rosso e uno blu e quindi potrebbe esibire un rapporto di probabilità fra auto : autobus blu : autobus rosso di 1 : 0,5 : 0,5, mantenendo così un rapporto 1 : 1 fra auto : autobus qualsiasi mentre si adotta un rapporto modificato auto : autobus blu di 1 : 0,5. In questo caso l'opzione dell'autobus rosso non era irrilevante, perché un autobus rosso era un sostituto perfetto per l'autobus blu.
Se si usa il logit multinomiale per modellare le scelte, in alcune situazioni questo potrebbe imporre vincoli eccessivi sulle preferenze relative tra le diverse alternative. È particolarmente importante tenerne conto se l'analisi mira a prevedere come cambierebbero le scelte se un'alternativa dovesse scomparire (ad esempio se un candidato politico si ritirasse da una corsa a tre candidati). In questi casi possono essere utilizzati altri modelli, come il ''logit annidato'' o il probit multinomiale, che consentono la violazione dell'IIA. <ref>{{Cita pubblicazione|autore=Baltas|anno=2001|titolo=Random Utility Models in Marketing Research: A Survey|rivista=
== Modello ==
Riga 209 ⟶ 207:
# In generale, se <math>X \sim \operatorname{EV}_1(a,b)</math> e <math>Y \sim \operatorname{EV}_1(a,b)</math> allora <math>X - Y \sim \operatorname{Logistica}(0,b).</math> Ciò significa che la differenza di due variabili [[Variabili indipendenti e identicamente distribuite|indipendenti con distribuzione identica]] dei valori estremi segue la [[distribuzione logistica]], e il primo parametro è irrilevante. Ciò è comprensibile poiché il primo parametro è un ''parametro di posizione'', ovvero sposta la media di una quantità fissa e se due valori vengono entrambi spostati della stessa quantità, la loro differenza rimane invariata. Ciò significa che tutti gli enunciati affermazioni relazionali alla base della probabilità di una data scelta coinvolgono la distribuzione logistica, il che rende la scelta iniziale della distribuzione dei valori estremi, che sembrava piuttosto arbitraria, in qualche modo più comprensibile.
# Il secondo parametro in una distribuzione di valori estremi o logistica è un ''parametro di scala'', tale che se <math>X \sim \operatorname{Logistic}(0,1)</math>
# Poiché vengono utilizzate solo le differenze dei vettori dei coefficienti di regressione, l'aggiunta a tutti i vettori di coefficienti di una costante arbitraria non ha alcun effetto sul modello. Ciò significa che, proprio come nel modello log-lineare, solo ''K'' − 1 dei vettori dei coefficienti è identificabile e l'ultimo può essere impostato su un valore arbitrario (ad esempio 0).
Riga 231 ⟶ 229:
: <math>-\log L = - \sum_{i=1}^n \sum_{j=1}^K \delta_{j,y_i} \log(P(Y_i=j))= - \sum_{j=1}^K\sum_{y_i=j}\log(P(Y_i=j)).</math>
== Voci correlate ==
* [[Modello logit|Regressione logistica]]
* [[Probit multinomiale]]
== Note ==
<references/>
{{apprendimento automatico}}
{{Statistica}}
[[Categoria:Algoritmi di classificazione]]
[[Categoria:Apprendimento automatico]]
|