Distribuzione di Pascal: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m robot Aggiungo: nl:Negatief-binomiale verdeling |
m sistemazione fonti, smistamento lavoro sporco e fix vari |
||
| (85 versioni intermedie di 64 utenti non mostrate) | |||
Riga 1:
{{F|statistica|maggio 2017}}
{{Variabile casuale
| nome = Distribuzione di Pascal, o binomiale negativa <math>\mathcal{NB}(p,n)</math>
| tipo = distribuzione discreta
| pdf_image =[[File:Negbinomial.gif|300px|Distribuzione di probabilità]]
| cdf_image =
| parametri = <math>p \in [0,1]\ </math><br /><math>q=1-p</math><br /><math>n\in\mathbb{N}</math> oppure <math>r\in\mathbb{R}</math>
| supporto = <math>\mathbb{N}</math>
| pdf = <math>{k+n\choose k-1}p^k\ =\ {-n\choose k}p^n(-q)^k</math>
| cdf = <math>I_p(n,k+1)\ </math><br /><small>[[funzione beta di Eulero#Funzione beta incompleta|funzione Beta incompleta regolarizzata]] </small>
| media =<math>\frac{nq}{p}</math>
| mediana =
| moda =
| varianza =<math>n\frac{q}{p^2} </math>
| skewness =<math>\frac{1+q}{ \sqrt{nq} } </math>
| curtosi =<math>\frac{6}{n}+\frac{p^2}{nq}</math>
| entropia =
| momgenfun =<math>\left(\frac{pe^{t} }{1-qe^t}\right)^n</math>
| funzcar =<math>\left(\frac{pe^{it} }{ 1-qe^{it} }\right)^n</math>
}}
In [[Teoria della probabilità|teoria delle probabilità]] la '''distribuzione di Pascal''' è una [[Variabile casuale#Distribuzione di probabilità|distribuzione di probabilità]] [[distribuzione discreta|discreta]] con due parametri, <math>p</math> ed <math>n</math>, che descrive il numero di ''fallimenti'' precedenti il ''successo'' ''n''-esimo in un [[processo di Bernoulli]] di parametro ''p''.
A volte si considera la distribuzione di Pascal come quella distribuzione che descrive il numero di prove necessarie per ottenere ''n'' successi. Questa distribuzione è equivalente alla precedente ma riscalata, ovvero descrive una [[Variabile casuale|variabile aleatoria]] <math>T_n+n</math> anziché <math>T_n</math>.
Ad esempio, lanciando una moneta fino ad ottenere 3 volte ''testa'', la distribuzione di Pascal descrive le probabilità per il numero di risultati ''croce'' visti nel frattempo.
La distribuzione prende il nome dal [[matematico]] [[Francia|francese]] [[Blaise Pascal]].
Questa distribuzione di probabilità può essere generalizzata sostituendo il [[numero naturale]] ''n'' con un [[numero reale|numero reale positivo]] ''r''. In questo caso viene detta anche '''distribuzione binomiale negativa''' (per la sua particolare formula) o '''di Polya''' (dal [[matematico]] [[Ungheria|ungherese]] [[George Polya]]).
== Definizione ==
Dato un [[processo di Bernoulli]], ovvero una serie di [[Variabile casuale|variabili aleatorie]] [[Variabili dipendenti e indipendenti|indipendenti]] <math>X_1,X_2,...</math> di uguale [[distribuzione di Bernoulli]] <math>\mathcal{B}(p)</math>, la distribuzione di Pascal <math>\mathcal{NB}(p,n)</math>descrive la variabile aleatoria <math>T_n</math> che conta il numero di ''fallimenti'' precedenti il ''successo'' numero <math>n</math> (ovvero il numero di prove necessarie ad ottenerlo, meno ''n''):
:<math>T_n=\min\{t\colon X_1+...+X_{t+n}=n\}</math>,
:<math>T_n+n=\min\{t\colon X_1+...+X_t=n\}</math>.
La probabilità di fallimento di una singola prova è <math>q=1-p</math>.
La [[probabilità]] che si verifichino esattamente ''k'' fallimenti prima di ottenere un totale di ''n'' successi è data dalla probabilità di ottenere un successo nella prova numero ''k+n'' (<math>X_{k+n}=1</math>) '''e''' di ottenere esattamente ''k'' fallimenti e ''n-1'' successi nelle prove precedenti, ovvero
:<math>P(k)={k+n-1\choose k}p^nq^k</math>
dove il [[coefficiente binomiale]] ''conta'' il numero di possibili combinazioni di ''successi'' e ''fallimenti''.
Questa probabilità può anche essere scritta nella forma ''binomiale negativa''
:<math>P(k)={-n \choose k}p^n(-q)^k</math>
dove si considera la generalizzazione del coefficiente binomiale
:<math>{-n\choose k}=\frac{(-n)(-n-1)\cdots(-n-k+1)}{k!}=(-1)^k{n+k-1\choose k}</math>.
=== Definizioni alternative ===
Sostituendo il numero naturale ''n'' con il numero reale positivo ''r'' la formula mantiene un significato, anche se il coefficiente binomiale può essere espresso tramite la [[funzione Gamma]], che estende il concetto di [[fattoriale]] (<math>\Gamma(n+1)=n!</math>):
:<math>{k+r-1\choose k}p^rq^k=\frac{r(r+1)\cdots(k+r-1)}{k!}p^rq^k=\frac{\Gamma(k+r)}{k!\Gamma(r)}p^rq^k</math>.
Alcuni testi definiscono la distribuzione di Pascal come quella che descrive il numero di prove fino al successo ''n''-esimo, ed altri scambiano i termini ''successo'' ed ''insuccesso'' nella definizione. Per collegare queste definizioni basta rispettivamente considerare la variabile aleatoria <math>T_n+n</math> al posto di <math>T_n</math> nel primo caso e scambiare i valori di ''p'' e ''q'' nell'altro.
===Distribuzione geometrica===
Una [[Variabile casuale|variabile aleatoria]] <math>T_n</math> con distribuzione di Pascal <math>\mathcal{NB}(p,n)</math> è pari alla somma <math>Y_1+...+Y_n</math> di ''n'' variabili aleatorie [[Variabili dipendenti e indipendenti|indipendenti]] con uguale [[distribuzione geometrica]] <math>\mathcal{G}(p)-1</math>, poiché a differenza della distribuzione geometrica che rappresenta il numero totale di tentativi necessari per ottenere un successo, una variabile binomiale negativa descrive i fallimenti, quindi il numero di tentativi - 1, ovvero il successo. Questo si può vedere considerando come <math>Y_i</math> la variabile aleatoria che ''conta'' il numero di ''fallimenti'' intercorsi tra il ''successo'' numero <math>i-1</math> e il ''successo'' numero <math>i</math>: le <math>Y_1,...,Y_n</math> sono allora indipendenti ed hanno distribuzione geometrica di parametro ''p'' sottratto di uno perché la distribuzione geometrica conta il numero di prove per ottenere un successo che corrispondono al numero di fallimenti e la prova finale del successo.
In particolare, la distribuzione di Pascal <math>\mathcal{NB}(p,1)</math> coincide con la distribuzione geometrica <math>\mathcal{G}(p)-1</math>, e la somma di ''m'' variabili aleatorie indipendenti con distribuzioni di Pascal aventi lo stesso parametro ''p'' segue ancora la distribuzione di Pascal con parametro ''p'' (è sempre somma di variabili aleatorie indipendenti con uguale distribuzione geometrica).
== Caratteristiche ==
Alcune caratteristiche di una variabile aleatoria ''T<sub>n</sub>'' che segue la distribuzione di Pascal <math>\mathcal{NB}(p,n)</math> si possono ricavare dalle caratteristiche di una variabile aleatoria ''T'' con distribuzione geometrica <math>\mathcal{G}(p)-1</math>:
*il [[valore atteso]]
<math>E[T_n]=nE[T]=\frac{n}{p}</math>,
*la [[varianza]]
:<math>\text{Var}(T_n)=n\text{Var}(T)=n\frac{q}{p^2}</math>,
*la [[funzione generatrice dei momenti]]
:<math>g_{T_n}(t)=g_{T}(t)^n=\left({\frac{p}{1-qe^t}}\right)^n</math>,
*gli indici di [[simmetria (statistica)|simmetria]] e di [[curtosi]]
:<math>\gamma_1=\frac{1}{\sqrt{n}}\frac{1+q}{\sqrt{q}},\qquad\gamma_2=\frac{1}{n}\left(6+\frac{p^2}{q}\right)</math>.
La [[funzione di ripartizione]] può essere definita tramite la [[Funzione beta di Eulero#Funzione beta incompleta|funzione Beta incompleta regolarizzata]]:
:<math>P(T_n\leqslant k)=I_p(n,k+1)</math>
Tutte le formule valgono ancora anche sostituendo il numero naturale ''n'' con il numero reale positivo ''r''.
== Altre distribuzioni ==
La distribuzione di Pascal è una [[mistura di distribuzioni|mistura]] della [[distribuzione Gamma]] e della [[distribuzione di Poisson]]: una variabile aleatoria con distribuzione di Poisson <math>\mathcal{P}(L)</math>, il cui parametro ''L'' segua una distribuzione Gamma, segue la distribuzione di Pascal.
La distribuzione di Pascal <math>\mathcal{NB}\left(\frac{r-\lambda}{r},r\right)</math> di speranza <math>\lambda</math>, per <math>r\longrightarrow +\infty</math> [[Convergenza di variabili casuali#Convergenza in distribuzione|converge]] alla distribuzione di Poisson <math>\mathcal{P}(\lambda)</math>.
La distribuzione di Pascal si trova anche come mistura della distribuzione di Poisson e della [[distribuzione logaritmica]], ovvero descrive la somma <math>X_1+...+X_N</math> di un numero <math>N</math>, che segue la distribuzione di Poisson, di variabili aleatorie indipendenti che seguono una stessa distribuzione logaritmica.
Considerando le variabili aleatorie <math>S_n=X_1+...+X_n</math> di [[distribuzione binomiale]] <math>\mathcal{B}(p,n)</math> e le variabili aleatorie <math>T_n=\min\{k\colon X_1+...+X_{k+n}=n\}=\min\{k\colon S_{k+n}=n\}</math> di distribuzione di Pascal <math>\mathcal{NB}(p,n)</math> si trova la formula
:<math>P(T_n\leqslant k)=P(T_n+n\leqslant n+k)=P(S_{n+k}\geqslant n)</math>,
che esprime per un [[processo di Bernoulli]] l'equivalenza degli eventi "ottenere meno di ''k'' insuccessi prima del successo ''n''-esimo" e "ottenere almeno ''n'' successi nelle prime ''n+k'' prove".
La [[distribuzione di Panjer]], che definisce i valori per [[Algoritmo ricorsivo|ricorsione]], generalizza la distribuzione di Pascal:
:<math>P(k)=\left(q+\frac{q(n-1)}{k}\right)P(k-1)</math>
== Statistica ==
La distribuzione di Pascal viene talvolta utilizzata in alternativa alla [[distribuzione di Poisson]], a cui converge in legge sotto la condizione <math>\lambda=r\tfrac{q}{p}</math>, nei casi in cui il modello empirico presenti una varianza maggiore del valore medio: la distribuzione di Poisson ha sempre speranza pari al valore medio, mentre la distribuzione di Pascal è più ''dispersa'' (ha una varianza maggiore).
Come spesso avviene nell'[[inferenza bayesiana]], se il parametro ''p'' di una distribuzione di Pascal segue ''a priori'' la [[distribuzione Beta]], allora la segue anche ''a posteriori''.
== Voci correlate ==
* [[Coefficiente binomiale]]
* [[Convergenza di variabili casuali]]
* [[Distribuzione geometrica]]
* [[Distribuzione di Poisson]]
* [[Mistura di distribuzioni]]
* [[Processo di Bernoulli]]
== Altri progetti ==
{{interprogetto}}
== Collegamenti esterni ==
* {{Collegamenti esterni}}
{{Probabilità}}
{{Portale|matematica}}
[[Categoria:Distribuzioni di probabilità|Pascal]]
| |||