Bootstrap (statistica): differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Xr1blu (discussione | contributi)
Funzionalità collegamenti suggeriti: 2 collegamenti inseriti.
Aggiunta di una fonte bibliografica, aggiunta di dettagli nel funzionamento del metodo.
Riga 3:
Permette perciò di approssimare media e varianza di uno [[stimatore]], costruire intervalli di confidenza e calcolare p-value di test quando, in particolare, non si conosce la distribuzione della statistica di interesse.
 
Nel caso di [[campionamento casuale]] semplice, il funzionamento è il seguente: consideriamo un campione effettivamente osservato di numerosità pari ad ''<math>n''</math>, diciamo <math>\mathbf{x}=(x_1,...,x_n)</math>. Da <math>\mathbf{x}</math> si ricampionano ''m''<math>B</math> altri campioni di numerosità costante pari ad ''<math>n''</math>, diciamo <math>\mathbf{x}^*_1,...,\mathbf{x}^*_m_B</math>;. inSe ciascuna<math>F</math> estrazioneè bootstrap,la ifunzione datidi provenientiripartizione del fenomeno aleatorio dal primoquale elementoè delstato campionecampionato <math>\textbf{x}</math>, cioèallora la [[funzione di ripartizione empirica]] <math>x_1\hat{F}</math>, possonoè essereun'approssimazione estrattidi <math>F</math>; per cui un ricampionamento da essa approssima un ricampionamento dal modello originale. Per costruzione <math>\hat{F}</math> è la funzione di piùripartizione di una voltavariabile ealeatoria ciascununiforme datosu ha<math>\textbf{x}</math>, probabilitàdunque paridi afatto ''ogni ricampionamento <math>\textbf{x}_k^*</math>, con <math>k=1,\dots,B</math>, è ottenuto scegliendo in modo uniforme con ripetizione <math>n''</math> divalori essereda estratto<math>\textbf{x}</math>.
 
Sia <math>T</math> lo stimatore di <math>\theta</math> che ci interessa studiare, diciamo <math>T(\mathbf{x})=\hat{\theta}</math>. Si calcola tale quantità per ogni campione bootstrap, <math>T(x^*_1),...,T(x^*_m_B)</math>. In questo modo si hanno a disposizione ''<math>m''</math> stime di <math>\theta</math>, dalle quali è possibile calcolare la [[media (statistica)|media]] bootstrap, la [[varianza]] bootstrap, i percentili bootstrap etc. che sono approssimazioni dei corrispondenti valori ignoti e portano informazioni sulla distribuzione di <math>T(\mathbf{x})</math>.
 
Partendo quindi da queste quantità stimate è possibile calcolare [[intervallo di confidenza|intervalli di confidenza]], saggiare [[Ipotesi statistica|ipotesi]], etc.
 
== Bibliografia ==
 
* Efron,Bradley e Tibshirani, Robert, ''An Introduction to the Bootstrap'', New York, Chapman & Hall, 1994, ISBN 9781489945419
 
==Voci correlate==