Distribuzione beta-binomiale
La variabile casuale betabinomiale è una variabile casuale discreta che può essere vista come generalizzazione della variabile casuale binomiale, nel senso che come in quest'ultima si vuole determinare la probabilità di un successo su n, ma contrariamente alla Binomiale la probabilità di successo non è un parametro fisso, ma un valore incerto distribuito come una variabile casuale Beta B(a,b).
La v.c. betabinomiale ha tre parametri: n, a, b
Definizione
Se X~BeB(n,a,b) è una variabile casuale distribuita come una v.c. betabinomiale con i parametri n, a, b allora per
dove la costante C è data da
e è la funzione gamma.
Caratteristiche
Il valore atteso dipende da tutti e tre i parametri
cosí come pure la varianza
Casi particolari
Nel caso che a=1 e b=1, allora si tratta di una variabile casuale uniforme discreta con P(X=x)=1/(n+1) essendoci n+1 valori possibili.
Esempio
Un modello
Nell'ambito dell'inferenza bayesiana, da un urna della quale si ignora il numero di palline presenti ma che da estrazioni precedenti risulta che vi siano una percentuale di palline rosse che varia come una v.c. Beta(a,b), dovranno essere estratte (e ogni volta renserite) n palline. Ci si chiede quale sia la probabilità che x di queste siano rosse. La risposta sta nella v.c. BetaB(n,a,b)
Esempio numerico
Partendo da un concetto di completa ignoranza che ci porta a descrivere la distribuzione a priori come una v.c. uniforme continua e dunque come una Beta(1,1) vengono estratte 15 palline, delle quali solo una è rossa. In questo modo la probabilità a posteriori diventa una v.c. Beta(1+1,1+14)=Beta(2,15).
A questo punto si decide di fare una ulteriore estrazione di 40 palline e ci si chiede quale sia la probabilità che esattamente due di queste siano rosse.
Essendo in questa seconda estrazione la probabilità P(X=x) quella di una v.c. BetaB(40,2,15) si ottiene che
dove
ed essendo e inoltre essendo in generale e pertanto
si ottiene
Questo risultato è diverso da quello che si sarebbe ottenuto utilizzando come probabilità di successo la stima puntuale, vale a dire la semplice proporzione ottenuta nella prima serie di estrazioni (1/15 = 6,67%) e applicando per la seconda la v.c. binomiale B(n=40,p=1/15). In qeusto caso si sarebbe ottenuto P(X=2 | n=40, p=1/15) = 25,19%.
Il grafico mette in evidenza il fatto che la v.c. B(n=40,p=1/15) è molto più "stretta" della BetaB(40,2,15), ciò è dovuto al fatto che nell'approccio bayesiano non ci si "dimentica" che vi è una incertezza su quale sia la vera proporzione di palline rosse e questa incertezza rende probabili anche valori più "distanti".