La variabile casuale betabinomiale è una variabile casuale discreta che può essere vista come generalizzazione della variabile casuale binomiale, nel senso che come in quest'ultima si vuole determinare la probabilità di un successo su n, ma contrariamente alla Binomiale la probabilità di successo non è un parametro fisso, ma un valore incerto distribuito come una variabile casuale Beta B(a,b).

La v.c. betabinomiale ha tre parametri: n, a, b

Definizione

Se X~BeB(n,a,b) è una variabile casuale distribuita come una v.c. betabinomiale con i parametri n, a, b allora per  

 

dove la costante C è data da

 

e   è la funzione gamma.

Un modo alternativo per descrivere la BeB(n,a,b) è dato da

 

dove   è la funzione beta.

Caratteristiche

Il valore atteso dipende da tutti e tre i parametri

 

cosí come pure la varianza

 

Casi particolari

Nel caso che a=1 e b=1, allora si tratta di una variabile casuale uniforme discreta con P(X=x)=1/(n+1) essendoci n+1 valori possibili.

Esempio

Un modello

Nell'ambito dell'inferenza bayesiana, da un urna della quale si ignora il numero di palline presenti ma che da estrazioni precedenti risulta che vi siano una percentuale di palline rosse che varia come una v.c. Beta(a,b), dovranno essere estratte (e ogni volta renserite) n palline. Ci si chiede quale sia la probabilità che x di queste siano rosse. La risposta sta nella v.c. BetaB(n,a,b)

Esempio numerico

Partendo da un concetto di completa ignoranza che ci porta a descrivere la distribuzione a priori come una v.c. uniforme continua e dunque come una Beta(1,1) vengono estratte 15 palline, delle quali solo una è rossa. In questo modo la probabilità a posteriori diventa una v.c. Beta(1+1,1+14)=Beta(2,15).

A questo punto si decide di fare una ulteriore estrazione di 40 palline e ci si chiede quale sia la probabilità che esattamente due di queste siano rosse.

Essendo in questa seconda estrazione la probabilità P(X=x) quella di una v.c. BetaB(40,2,15) si ottiene che

 

dove

 

ed essendo   e inoltre essendo in generale   e pertanto

 
 
 
 
 
 


si ottiene

 
 
 
 
Le due v.c. usate nell'esempio


Questo risultato è diverso da quello che si sarebbe ottenuto utilizzando come probabilità di successo la stima puntuale, vale a dire la semplice proporzione ottenuta nella prima serie di estrazioni (1/15 = 6,67%) e applicando per la seconda la v.c. binomiale B(n=40,p=1/15). In qeusto caso si sarebbe ottenuto P(X=2 | n=40, p=1/15) = 25,19%.

Il grafico mette in evidenza il fatto che la v.c. B(n=40,p=1/15) è molto più "stretta" della BetaB(40,2,15), ciò è dovuto al fatto che nell'approccio bayesiano non ci si "dimentica" che vi è una incertezza su quale sia la vera proporzione di palline rosse e questa incertezza rende probabili anche valori più "distanti".

Bibliografia

  • Leonhard Held, "Methoden der statistischen Inferenz. Likelihood und Bayes", con la collaborazione di Daniel Sabanés Bové, Spektrum Akademischer Verlag Heidelberg 2008, ISBN: 978-3-8274-1939-2
  • Jim Albert, "Bayesian Computation With R", Springer New York, 2009, ISBN: 978-0-387-92297-3 [1]