Bootstrap (statistica): differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m Bot: aggiungo template {{Collegamenti esterni}} (ref) |
Funzionalità collegamenti suggeriti: 2 collegamenti inseriti. |
||
Riga 1:
{{F|statistica|marzo 2022}}
Il '''bootstrap''' è una tecnica [[statistica]] di [[ricampionamento]] con reimmissione per approssimare la distribuzione campionaria di una statistica.
Permette perciò di approssimare media e varianza di uno [[stimatore]], costruire intervalli di confidenza e calcolare p-value di test quando, in particolare, non si conosce la distribuzione della statistica di interesse.
Nel caso di [[campionamento casuale]] semplice, il funzionamento è il seguente: consideriamo un campione effettivamente osservato di numerosità pari ad ''n'', diciamo <math>x=(x_1,...,x_n)</math>. Da <math>x</math> si ricampionano ''m'' altri campioni di numerosità costante pari ad ''n'', diciamo <math>x^*_1,...,x^*_m</math>; in ciascuna estrazione bootstrap, i dati provenienti dal primo elemento del campione, cioè <math>x_1</math>, possono essere estratti più di una volta e ciascun dato ha probabilità pari a ''1/n'' di essere estratto.
Sia <math>T</math> lo stimatore di <math>\theta</math> che ci interessa studiare, diciamo <math>T(x)=\hat{\theta}</math>. Si calcola tale quantità per ogni campione bootstrap, <math>T(x^*_1),...,T(x^*_m)</math>. In questo modo si hanno a disposizione ''m'' stime di <math>\theta</math>, dalle quali è possibile calcolare la [[media (statistica)|media]] bootstrap, la [[varianza]] bootstrap, i percentili bootstrap etc. che sono approssimazioni dei corrispondenti valori ignoti e portano informazioni sulla distribuzione di <math>T(x)</math>.
|