Distribuzione categorica

distribuzione di probabilità discreta, generalizza la bernoulli e specializza la multinomiale
Versione del 15 ott 2025 alle 17:30 di Capagira (discussione | contributi) (abbozzo)
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)

In teoria della probabilità, statistica e apprendimento automatico una distribuzione categorica (detta anche distribuzione Bernoulli generalizzata o multinoulli[1]) è una distribuzione di probabilità discreta che descrive una variabile aleatoria che può assumere una fra K possibili categorie, con probabilità di ciascuna categoria specificata separatamente. Non si assume alcuna inerente ordine fra questi valori ma spesso, per comodità, si associano etichette con valori numerici nel descrivere la distribuzione, (ad es. da 1 a K). La distribuzione categorica K-dimensionale la distribuzione più generale su un evento con K possibili esiti; qualsiasi altra distribuzione discreta su uno spazio campionario con K valori ne è un caso speciale. I parametri che specificano le probabilità di ciascuna possibile categoria sono vincolati solo dal fatto di dover essere nell'intervallo fra 0 e 1 e di avere una somma unitaria.

La distribuzione categorica costituisce la generalizzazione della distribuzione di Bernoulli per una variabile aleatoria categorica, ossia per una variabile discreta con più di due possibili valori osservabili, come ad esempio l'esito del lancio di un dado. D'altro canto, la distribuzione categorica è un caso speciale della distribuzione multinomiale, poiché stabilisce le probabilità degli esiti potenziali di una singola estrazione invece che di estrazioni ripetute.

  1. ^ Kevin P. Murphy, Machine Learning - A Probabilistic Perspective, collana Adaptive Computation and Machine Learning, MIT Press, 2014, ISBN 978-0-262-01802-9.