Distribuzione beta-binomiale: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Riga 23:
Nel caso che a=1 e b=1, allora si tratta di una [[variabile casuale uniforme discreta]] con P(X=x)=1/(n+1) essendoci n+1 valori possibili.
==
=== Probabilità di estrarre X palline rosse da un urna della quale si conosce solo approssimativamente la composizione ===
==== Un modello ====
Nell'ambito dell'[[inferenza bayesiana]], da un urna della quale si ignora il numero di palline presenti ma che da estrazioni precedenti risulta che vi siano una percentuale di palline rosse che varia come una v.c. Beta(a,b), dovranno essere estratte (e ogni volta renserite) ''n'' palline. Ci si chiede quale sia la probabilità che ''x'' di queste siano rosse. La risposta sta nella v.c. BetaB(n,a,b)
==== Esempio numerico ====
Partendo da un concetto di completa ignoranza che ci porta a descrivere la distribuzione a priori come una v.c. uniforme continua e dunque come una Beta(1,1) vengono estratte 15 palline, delle quali solo una è rossa. In questo modo la probabilità a posteriori diventa una v.c. Beta(1+1,1+14)=Beta(2,15).
Riga 56 ⟶ 57:
Il grafico mette in evidenza il fatto che la v.c. B(n=40,p=1/15) è molto più "stretta" della BetaB(40,2,15), ciò è dovuto al fatto che nell'approccio bayesiano non ci si "dimentica" che vi è una incertezza su quale sia la vera proporzione di palline rosse e questa incertezza rende probabili anche valori più "distanti".
=== Scelta bayesiana tra due modelli: Estrazione da un urna: determinare a quale urna nota corrisponda un'urna ===
* Di un'urna si sa che una percentuale di palline sono rosse.
* Si sa che l'urna è o l'urna A oppure l'urna B.
* Dall'urna A sono state estratte in passato 10 palline, delle quali 2 rosse (dunque il 20%),
* mentre dall'urna B in passato su 15 palline estratte 10 erano rosse (pari al 67%).
* Nulla fa pensare che l'urna in questione sia quella A o quella B.
* Né dell'urna A, né dell'urna B si conosce il numero complessivo di palline.
* dall'urna in questione vengono estratte 50 palline, delle quali 12 sono rosse (il 24%).
Domande
* qual'è la probabilità che l'urna in questione sia l'urna A?
* qual'è la distribuzione a posteriori della percentuale di palline rosse?
* qual'è la probabilità che dall'urna in questione alla prossima estrazione di 10 palline, neanche una volta esca una rossa?
Nell'ambito dell'inferenza bayesiana si può dire pertanto che
* la probabilità a priori che l'urna in questione sia l'urna A è pari a P(U=A)=1/2 e di conseguenza P(U=B)=1-P(U=A)=1/2
* per l'urna A, grazie all'estrazione di 10 palline, delle quali 2 rosse, la distribuzione a posteriori della percentuale di palline rosse è una v.c. Beta <math>Beta(a_A=1+2,b_A=1+10-2)</math>, nel caso che la distribuzione a priori sia una rettangolare, equivalente ad una Beta(1,1)
* analogamente per l'urna B, la distribuzione a posteriori è una <math>Beta(a_B=1+10,b_B=1+15-10)</math>
Per procedere è necessario fare ricorso alla v.c. beta-binomiale, infatti sapendo che su 50 palline estratte 12 sono rosse, si può calcolare la probabilità <math>P(U=A|X=12,n=50)</math> che si tratti dell'urna A, nel seguente modo
:<math>P(U=A|X=x,n)=\frac{P(U=A) BetaB(X=x,n,a_A,b_A)}{P(U=A) BetaB(X=x,n,a_A,b_A) + P(U=B) BetaB(X=x,n,a_B,b_B)}</math>
che grazie al fatto che P(U=B)=1-P(U=A)=1/2=P(U=A) si semplifica ottenendo
:<math>P(U=A|X=x,n)=\frac{ BetaB(X=x,n,a_A,b_A)}{ BetaB(X=x,n,a_A,b_A) + BetaB(X=x,n,a_B,b_B)}</math>
tenuto conto dei valori dell'esempio, si calcola
:<math>BetaB(X=12,n=50,a_A=2,b_A=9) = 0,04499198</math>
:<math>BetaB(X=12,n=50,a_B=11,b_B=6) = 0,0007276656</math>
:<math>P(U=A|X=12,n=50)=\frac{ 0,04499198}{0,04499198 + 0,0007276656 }=\frac{ 0,04499198}{0.04571965 } = 0,984084 = 98,4%</math>
ciò vuol dire che la probabilità che l'urna in questione sia l'urna A è del 98,4%.
Questo risultato è comprensibile, visto che il 24% dell'urna ignota è molto più prossimo al 20% dell'urna A che non al 67% dell'urna B.
Tenuto conto delle prime due estrazioni (quando le urne erano note) e l'estrazione dall'urna della quale si era perso il nome, e del fatto che al 98,4% l'urna in questione è l'urna A, ma che c'è pur sempre una probabilità del 1,6% che si tratti dell'urna B, la percentuale di palline rosse in questa urna della quale non si sa quale delle due sia viene descritta dalla mistura delle due v.c. <math>Beta(n,a=a_i,b=b_i)</math> (con i=A,B) ponderate con le probabilità P(U=i|X=x,n).
Una volta nota tale mistura di v.c. è possibile calcolare la probabilità che alla prossima estrazione di 10 palline neanche una sia rossa. Par fare ciò è necessario fare ricorso a tecniche di [[calcolo numerico]].
== Link esterni ==
|