Distribuzione di Pascal: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Thijs!bot (discussione | contributi)
m sistemazione fonti, smistamento lavoro sporco e fix vari
 
(85 versioni intermedie di 64 utenti non mostrate)
Riga 1:
{{F|statistica|maggio 2017}}
La '''variabile casuale binomiale negativa''' è una
{{Variabile casuale
[[variabile casuale discreta|v.c. discreta]],
| nome = Distribuzione di Pascal, o binomiale negativa <math>\mathcal{NB}(p,n)</math>
usata spesso per descrivere eventi rari in cui la probabilità
| tipo = distribuzione discreta
dell'evento non è uguale per tutti gli elementi
| pdf_image =[[File:Negbinomial.gif|300px|Distribuzione di probabilità]]
(contrariamente alla [[variabile casuale poissoniana|v.c. poissoniana]]),
| cdf_image =
p.es. nel caso del numero di incidenti stradali mortali in determinato intervallo di tempo.
| parametri = <math>p \in [0,1]\ </math><br /><math>q=1-p</math><br /><math>n\in\mathbb{N}</math> oppure <math>r\in\mathbb{R}</math>
È anche il risultato finale di un [[processo markoviano]] continuo nel tempo ([[Processo di Yule]]).
| supporto = <math>\mathbb{N}</math>
| pdf = <math>{k+n\choose k-1}p^k\ =\ {-n\choose k}p^n(-q)^k</math>
| cdf = <math>I_p(n,k+1)\ </math><br /><small>[[funzione beta di Eulero#Funzione beta incompleta|funzione Beta incompleta regolarizzata]] </small>
| media =<math>\frac{nq}{p}</math>
| mediana =
| moda =
| varianza =<math>n\frac{q}{p^2} </math>
| skewness =<math>\frac{1+q}{ \sqrt{nq} } </math>
| curtosi =<math>\frac{6}{n}+\frac{p^2}{nq}</math>
| entropia =
| momgenfun =<math>\left(\frac{pe^{t} }{1-qe^t}\right)^n</math>
| funzcar =<math>\left(\frac{pe^{it} }{ 1-qe^{it} }\right)^n</math>
}}
In [[Teoria della probabilità|teoria delle probabilità]] la '''distribuzione di Pascal''' è una [[Variabile casuale#Distribuzione di probabilità|distribuzione di probabilità]] [[distribuzione discreta|discreta]] con due parametri, <math>p</math> ed <math>n</math>, che descrive il numero di ''fallimenti'' precedenti il ''successo'' ''n''-esimo in un [[processo di Bernoulli]] di parametro ''p''.
 
A volte si considera la distribuzione di Pascal come quella distribuzione che descrive il numero di prove necessarie per ottenere ''n'' successi. Questa distribuzione è equivalente alla precedente ma riscalata, ovvero descrive una [[Variabile casuale|variabile aleatoria]] <math>T_n+n</math> anziché <math>T_n</math>.
== Definizione e caratteristiche ==
La [[funzione di probabilità]] è data da
:<math>P_r(k)={r+k-1 \choose k}\ p^r\ (1-p)^k</math>
ove ''k'' e ''r'' sono interi non negativi e ''p'' una probabilità (0<p<1)
 
Ad esempio, lanciando una moneta fino ad ottenere 3 volte ''testa'', la distribuzione di Pascal descrive le probabilità per il numero di risultati ''croce'' visti nel frattempo.
La [[funzione generatrice dei momenti]] è:
:<math>g(t)=({\frac{p}{1-q\ e^t}})^r</math> , ove q=1-p
Si hanno:
;[[valore atteso]]: &mu; = rq/p
;[[varianza]]: &sigma;&sup2; = rq/p&sup2; = &mu;/p
;[[simmetria (statistica)|simmetria]]: &beta;<sub>1</sub> = (1+q)&sup2; / (rq)
;[[curtosi]]: &beta;<sub>2</sub> = 3 + (1+4q+q&sup2;) / (rq)
 
La distribuzione prende il nome dal [[matematico]] [[Francia|francese]] [[Blaise Pascal]].
A confronto con le due v.c. più simili (anche come utilizzo) si può osservare che:
*La v.c. Binomiale Negativa ha la media minore della varianza
*La [[variabile casuale poissoniana|v.c. poissoniana]] ha la media uguale alla varianza
*La [[variabile casuale binomiale|v.c. binomiale]] ha la media superiore alla varianza
 
Questa distribuzione di probabilità può essere generalizzata sostituendo il [[numero naturale]] ''n'' con un [[numero reale|numero reale positivo]] ''r''. In questo caso viene detta anche '''distribuzione binomiale negativa''' (per la sua particolare formula) o '''di Polya''' (dal [[matematico]] [[Ungheria|ungherese]] [[George Polya]]).
== Teoremi ==
=== Teoremi che coinvolgono altre v.c. ===
==== Somma di v.c. geometriche ====
Se X<sub>1</sub>, X<sub>2</sub>, ... , X<sub>r</sub> sono variabili casuali uguali e indipendenti
distribuite come una [[variabile casuale geometrica]], allora la loro somma
:<math>X=X_1+X_2+...+X_r</math>
è una v.c.Binomiale Negativa.
 
== Definizione ==
==== v.c. di Poisson e v.c. Gamma ====
Dato un [[processo di Bernoulli]], ovvero una serie di [[Variabile casuale|variabili aleatorie]] [[Variabili dipendenti e indipendenti|indipendenti]] <math>X_1,X_2,...</math> di uguale [[distribuzione di Bernoulli]] <math>\mathcal{B}(p)</math>, la distribuzione di Pascal <math>\mathcal{NB}(p,n)</math>descrive la variabile aleatoria <math>T_n</math> che conta il numero di ''fallimenti'' precedenti il ''successo'' numero <math>n</math> (ovvero il numero di prove necessarie ad ottenerlo, meno ''n''):
Se X è una [[variabile casuale di Poisson generalizzata]] con il parametro &lambda; distribuito come
:<math>T_n=\min\{t\colon X_1+...+X_{t+n}=n\}</math>,
una [[variabile casuale Gamma]], allora si tratta di una v.c. Binomiale Negativa.
:<math>T_n+n=\min\{t\colon X_1+...+X_t=n\}</math>.
 
La probabilità di fallimento di una singola prova è <math>q=1-p</math>.
{|-
La [[probabilità]] che si verifichino esattamente ''k'' fallimenti prima di ottenere un totale di ''n'' successi è data dalla probabilità di ottenere un successo nella prova numero ''k+n'' (<math>X_{k+n}=1</math>) '''e''' di ottenere esattamente ''k'' fallimenti e ''n-1'' successi nelle prove precedenti, ovvero
|<math>f(k)\!\!\!\!</math>
:<math>P(k)={k+n-1\choose k}p^nq^k</math>
|<math>= \int_0^{\infty} \mathrm{Poisson}(k \,|\, \lambda) \times \mathrm{Gamma}(\lambda \,|\, r, (1-p)/p) \; \mathrm{d}\lambda </math>
dove il [[coefficiente binomiale]] ''conta'' il numero di possibili combinazioni di ''successi'' e ''fallimenti''.
|-
Questa probabilità può anche essere scritta nella forma ''binomiale negativa''
|
:<math>P(k)={-n \choose k}p^n(-q)^k</math>
|<math>= \int_0^{\infty} \frac{\lambda^k}{k!} \exp(-\lambda) \times \frac{\lambda^{r-1} \exp(-\lambda (1-p)/p)}{\Gamma(r)\;((1-p)/p)^r} \; \mathrm{d}\lambda</math>
dove si considera la generalizzazione del coefficiente binomiale
|-
:<math>{-n\choose k}=\frac{(-n)(-n-1)\cdots(-n-k+1)}{k!}=(-1)^k{n+k-1\choose k}</math>.
|
|<math>= \frac{1}{k!\;\Gamma(r)} \; p^r \; \frac{1}{(1-p)^r} \;
\int_0^{\infty} \lambda^{(r+k)-1} \, \exp(-\lambda/(1-p)) \;\mathrm{d}\lambda </math>
|-
|
|<math>= \frac{1}{k!\;\Gamma(r)} \; p^r \; \frac{1}{(1-p)^r} \; (1-p)^{r+k} \; \Gamma(r+k) </math>
|-
|
|<math>= \frac{\Gamma(r+k)}{k!\;\Gamma(r)} \; p^r \, (1-p)^k </math>
|}
 
=== Definizioni alternative ===
==== La v.c. Beta come priori coniugati della v.c. Binomiale Negativa ====
Sostituendo il numero naturale ''n'' con il numero reale positivo ''r'' la formula mantiene un significato, anche se il coefficiente binomiale può essere espresso tramite la [[funzione Gamma]], che estende il concetto di [[fattoriale]] (<math>\Gamma(n+1)=n!</math>):
Nell'ambito dell'[[inferenza bayesiana]] si trova la seguente relazione tra la v.c. binomiale negativa e la [[variabile casuale Beta]].
:<math>{k+r-1\choose k}p^rq^k=\frac{r(r+1)\cdots(k+r-1)}{k!}p^rq^k=\frac{\Gamma(k+r)}{k!\Gamma(r)}p^rq^k</math>.
 
Alcuni testi definiscono la distribuzione di Pascal come quella che descrive il numero di prove fino al successo ''n''-esimo, ed altri scambiano i termini ''successo'' ed ''insuccesso'' nella definizione. Per collegare queste definizioni basta rispettivamente considerare la variabile aleatoria <math>T_n+n</math> al posto di <math>T_n</math> nel primo caso e scambiare i valori di ''p'' e ''q'' nell'altro.
Se X è distribuita come una v.c. binomiale negativa
con parametri ''m'' e &theta;
:<math>f(x|\theta)=BinNeg(x|m;\theta)</math>
e il parametro &theta; è distribuito a priori come una [[variabile casuale Beta|v.c. Beta]] con i parametri ''a'' e ''b''
:<math>g(\theta)=Beta(\theta|a;b)</math>
allora il parametro &theta; è distribuito a posteriori anch'esso come una v.c. Beta, ma con parametri ''a+m'' e ''b+x''
:<math>g(\theta|x)=Beta(\theta|a+m;b+x)</math>
Qualora la distribuzione a priori sia una [[variabile casuale rettangolare]] nell'intervallo [0;1] (ovvero ipotizzando a priori tutti i possibilii valori di &theta; equiprobabili), e pertanto ''a=1'' e ''b=1'', allora la distribuzione a posteriori è una Beta con parametri ''m+1'' e ''x+1''
 
===Distribuzione geometrica===
che ha come valore modale ''t'' (e dunque come valore più probabile)
Una [[Variabile casuale|variabile aleatoria]] <math>T_n</math> con distribuzione di Pascal <math>\mathcal{NB}(p,n)</math> è pari alla somma <math>Y_1+...+Y_n</math> di ''n'' variabili aleatorie [[Variabili dipendenti e indipendenti|indipendenti]] con uguale [[distribuzione geometrica]] <math>\mathcal{G}(p)-1</math>, poiché a differenza della distribuzione geometrica che rappresenta il numero totale di tentativi necessari per ottenere un successo, una variabile binomiale negativa descrive i fallimenti, quindi il numero di tentativi - 1, ovvero il successo. Questo si può vedere considerando come <math>Y_i</math> la variabile aleatoria che ''conta'' il numero di ''fallimenti'' intercorsi tra il ''successo'' numero <math>i-1</math> e il ''successo'' numero <math>i</math>: le <math>Y_1,...,Y_n</math> sono allora indipendenti ed hanno distribuzione geometrica di parametro ''p'' sottratto di uno perché la distribuzione geometrica conta il numero di prove per ottenere un successo che corrispondono al numero di fallimenti e la prova finale del successo.
:t=m/(m+x)
In particolare, la distribuzione di Pascal <math>\mathcal{NB}(p,1)</math> coincide con la distribuzione geometrica <math>\mathcal{G}(p)-1</math>, e la somma di ''m'' variabili aleatorie indipendenti con distribuzioni di Pascal aventi lo stesso parametro ''p'' segue ancora la distribuzione di Pascal con parametro ''p'' (è sempre somma di variabili aleatorie indipendenti con uguale distribuzione geometrica).
 
== Caratteristiche ==
==== La v.c. binomiale negativa come caso particolare della v.c. di Panjer ====
Alcune caratteristiche di una variabile aleatoria ''T<sub>n</sub>'' che segue la distribuzione di Pascal <math>\mathcal{NB}(p,n)</math> si possono ricavare dalle caratteristiche di una variabile aleatoria ''T'' con distribuzione geometrica <math>\mathcal{G}(p)-1</math>:
Applicando alla [[variabile casuale di Panjer]] i parametri <math>a=1-p,~b=(r-1) \cdot (1-p),~p_0=p^r</math> si ottiene la v.c binomiale negativa.
*il [[valore atteso]]
<math>E[T_n]=nE[T]=\frac{n}{p}</math>,
*la [[varianza]]
:<math>\text{Var}(T_n)=n\text{Var}(T)=n\frac{q}{p^2}</math>,
*la [[funzione generatrice dei momenti]]
:<math>g_{T_n}(t)=g_{T}(t)^n=\left({\frac{p}{1-qe^t}}\right)^n</math>,
*gli indici di [[simmetria (statistica)|simmetria]] e di [[curtosi]]
:<math>\gamma_1=\frac{1}{\sqrt{n}}\frac{1+q}{\sqrt{q}},\qquad\gamma_2=\frac{1}{n}\left(6+\frac{p^2}{q}\right)</math>.
 
La [[funzione di ripartizione]] può essere definita tramite la [[Funzione beta di Eulero#Funzione beta incompleta|funzione Beta incompleta regolarizzata]]:
:<math>P(T_n\leqslant k)=I_p(n,k+1)</math>
 
Tutte le formule valgono ancora anche sostituendo il numero naturale ''n'' con il numero reale positivo ''r''.
==== La v.c. binomiale negativa come una composta di Poisson ====
Se <math>X_1, X_2, X_3, \dots</math> sono distribuite come la [[variabile casuale logaritmica]]
allora la [[distribuzione composta di Poisson]] è una [[variabile casuale binomiale negativa]].
 
== Altre distribuzioni ==
=== Processo di Yule ===
La distribuzione di Pascal è una [[mistura di distribuzioni|mistura]] della [[distribuzione Gamma]] e della [[distribuzione di Poisson]]: una variabile aleatoria con distribuzione di Poisson <math>\mathcal{P}(L)</math>, il cui parametro ''L'' segua una distribuzione Gamma, segue la distribuzione di Pascal.
Un [[processo di Yule]] (un [[processo Markoviano]] di pure nascite)
 
genera una v.c. Binomiale Negativa.
La distribuzione di Pascal <math>\mathcal{NB}\left(\frac{r-\lambda}{r},r\right)</math> di speranza <math>\lambda</math>, per <math>r\longrightarrow +\infty</math> [[Convergenza di variabili casuali#Convergenza in distribuzione|converge]] alla distribuzione di Poisson <math>\mathcal{P}(\lambda)</math>.
 
La distribuzione di Pascal si trova anche come mistura della distribuzione di Poisson e della [[distribuzione logaritmica]], ovvero descrive la somma <math>X_1+...+X_N</math> di un numero <math>N</math>, che segue la distribuzione di Poisson, di variabili aleatorie indipendenti che seguono una stessa distribuzione logaritmica.
 
Considerando le variabili aleatorie <math>S_n=X_1+...+X_n</math> di [[distribuzione binomiale]] <math>\mathcal{B}(p,n)</math> e le variabili aleatorie <math>T_n=\min\{k\colon X_1+...+X_{k+n}=n\}=\min\{k\colon S_{k+n}=n\}</math> di distribuzione di Pascal <math>\mathcal{NB}(p,n)</math> si trova la formula
:<math>P(T_n\leqslant k)=P(T_n+n\leqslant n+k)=P(S_{n+k}\geqslant n)</math>,
che esprime per un [[processo di Bernoulli]] l'equivalenza degli eventi "ottenere meno di ''k'' insuccessi prima del successo ''n''-esimo" e "ottenere almeno ''n'' successi nelle prime ''n+k'' prove".
 
La [[distribuzione di Panjer]], che definisce i valori per [[Algoritmo ricorsivo|ricorsione]], generalizza la distribuzione di Pascal:
:<math>P(k)=\left(q+\frac{q(n-1)}{k}\right)P(k-1)</math>
 
== Statistica ==
La distribuzione di Pascal viene talvolta utilizzata in alternativa alla [[distribuzione di Poisson]], a cui converge in legge sotto la condizione <math>\lambda=r\tfrac{q}{p}</math>, nei casi in cui il modello empirico presenti una varianza maggiore del valore medio: la distribuzione di Poisson ha sempre speranza pari al valore medio, mentre la distribuzione di Pascal è più ''dispersa'' (ha una varianza maggiore).
 
Come spesso avviene nell'[[inferenza bayesiana]], se il parametro ''p'' di una distribuzione di Pascal segue ''a priori'' la [[distribuzione Beta]], allora la segue anche ''a posteriori''.
 
== Voci correlate ==
* [[Coefficiente binomiale]]
*[[variabile casuale]], [[variabile casuale discreta|v.c. discreta]]
* [[Convergenza di variabili casuali]]
* [[Processo di Yule]] (un [[processo markoviano]] continuo nel tempo)
* [[Distribuzione geometrica]]
* [[variabile casuale geometrica|v.c. Geometrica]], [[variabile casuale poissoniana|v.c. poissoniana]], [[variabile casuale Gamma|v.c. Gamma]]
* [[Distribuzione di Poisson]]
* [[Mistura di distribuzioni]]
* [[Processo di Bernoulli]]
 
== Altri progetti ==
{{interprogetto}}
 
== Collegamenti esterni ==
* {{Collegamenti esterni}}
 
{{Probabilità}}
[[Categoria:Variabili casuali|Binomiale negativa]]
{{Portale|matematica}}
 
[[Categoria:Distribuzioni di probabilità|Pascal]]
[[de:Negative Binomialverteilung]]
[[en:Negative binomial distribution]]
[[es:Distribución binomial negativa]]
[[fi:Negatiivinen binomijakauma]]
[[hu:Negatív binomiális eloszlás]]
[[nl:Negatief-binomiale verdeling]]
[[nov:Negativ binomial distributione]]
[[su:Sebaran binomial négatip]]