Distribuzione (statistica): differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
 
(35 versioni intermedie di 27 utenti non mostrate)
Riga 1:
In [[statistica]], in particolare nella [[statistica descrittiva]], launa '''distribuzione''' è una rappresentazione del modo in cui le diverse [[CarattereModalità (statistica)|modalità]] di un [[Carattere (statistica)|carattere]] si distribuiscono nelle [[Popolazione statistica|unità statistiche]] che compongono il [[Popolazione statistica|collettivo]] oggetto di studio.<ref>[http://www3.istat.it/servizi/studenti/binariodie/CorsoExcel/Glossario.htm Glossario Istat] {{webarchive|url=https://web.archive.org/web/20111231130402/http://www3.istat.it/servizi/studenti/binariodie/CorsoExcel/Glossario.htm |data=31 dicembre 2011 }}</ref>
 
Le distribuzioni possonoin esserestatistica vengono anche distinte in ''semplici'' se si rileva un solo carattere, ''multiple'' se si rilevano più caratteri sullo stesso collettivo.
 
== Distribuzione unitaria ==
Riga 16:
 
== Distribuzione di frequenze ==
In una distribuzione di [[Frequenza (statistica)|frequenze]] viene presentato il numero di unità sulle quali viene rilevata ciascuna modalità del carattere. In una rilevazione del titolo di studio, ad esempio, la distribuzione di frequenze è un insieme di ''k'' coppie, dove ''k'' è il numero delle modalità del carattere (potrebbe essere 4: "analfabeta e alfabeta", "scuola dell'obbligo", "diploma di scuola superiore", "laurea o superiore"); in ciascuna coppia il primo elemento indica la modalità ed il secondo indica il numero ''n''<sub>i</sub> di unità su cui quella modalità è stata osservata (la ''frequenza assoluta'' con cui viene osservata).
 
Se il carattere è [[Carattere (statistica)|quantitativo continuo]], o presenta comunque numerose modalità, queste vengono vengono raggruppate in classi. Ad esempio, se si rileva la statura le diverse stature possibili vengono raggruppate in intervalli ("meno di 150", "da 150 a 160" ecc.), se si rileva il numero dei dipendenti di un insieme di aziende si usano classi del tipo "fino a 5 addetti", "da 6 a 20", "da 21 a 50" ecc.
 
Nella tabella che rappresenta una distribuzione di frequenza semplice, la prima colonna contiene le modalità o le loro classi, la seconda contiene i numeri delle unità che presentano le diverse modalità. La somma della seconda colonna è uguale al numero totale ''n'' delle unità. Da una distribuzione di frequenze si possono derivare distribuzioni di frequenze ''relative'' e(o ''percentuali''). Nel primo caso, le frequenze ''n''<sub>i</sub>, dette ''assolute'', vengono sostituite dai rapporti ''f''<sub>i</sub>=''n''<sub>i</sub>/''n''; nel secondo tali rapporti vengono moltiplicati per 100.
 
Infine, se il carattere è qualitativo ordinato o quantitativo, le sue diverse modalità vengono esposte in ordine crescente e si possono calcolare le ''frequenze cumulate'' assolute, relative o percentualirelative; le frequenze assolute cumulate si calcolano come segue:
:<math>N_i=\sum_{j=1}^in_j=n_1+n_2+\cdots+n_i</math>
Le altre si calcolano in modo analogo.
 
Lo schema generale delle corrispondenti tabelle è il seguente:
 
 
{| border="0" align="center" style="border-top:2px solid black; border-bottom:2px solid black; text-align:center"
! <br />Modalità<br />&nbsp; || || Frequenze<br />assolute || || Frequenze<br />relative || || Frequenze<br />percentuali
! || Frequenze<br />assolute<br />cumulate|| || Frequenze<br />relative<br />cumulate
! || Frequenze<br />percentuali<br />cumulate
|-
|style="border-bottom:1px solid black" | <math>x_i\,\!</math> ||
|style="border-bottom:1px solid black" | <math>n_i\,\!</math> ||
|style="border-bottom:1px solid black" | <math>f_i=\frac{n_i}{n}\,\!</math> ||
|style="border-bottom:1px solid black" | <math>p_i=f_1f_i\cdot 100\,\!</math> ||
|style="border-bottom:1px solid black" | <math>N_i=\sum_{j=1}^in_j\,\!</math> ||
|style="border-bottom:1px solid black" | <math>F_i=\sum_{j=1}^if_j\,\!</math> ||
|style="border-bottom:1px solid black" | <math>P_i=\sum_{j=1}^ip_j\,\!</math> ||
|-
| <math>x_1\,\!</math> || || <math>n_1\,\!</math> ||
| <math>f_1\,\!</math> || || <math>p_1\,\!</math> || || <math>n_1\,\!</math> || || <math>f_1\,\!</math> || || <math>p_1\,\!</math>
|-
|<math>x_2\,\!</math> || || <math>n_2\,\!</math> ||
|<math>f_2\,\!</math> || || <math>p_2\,\!</math> || || <math>n_1+n_2\,\!</math> || || <math>f_1+f_2\,\!</math> || || <math>p_1+p_2\,\!</math>
|-
|<math>x_3\,\!</math> || || <math>n_3\,\!</math> ||
|<math>f_3\,\!</math> || || <math>p_3\,\!</math> || || <math>n_1+n_2+n_3\,\!</math> || || <math>f_1+f_2+f_3\,\!</math> || || <math>p_1+p_2+p_3\,\!</math>
|-
| &nbsp;
Riga 58 ⟶ 57:
| &nbsp;
|-
|<math>x_k\,\!</math> || || <math>n_k\,\!</math> ||
|<math>f_k\,\!</math> || || <math>p_k\,\!</math> || || <math>n\,\!</math> || || <math>1\,\!</math> || || <math>100\,\!</math>
|-
| ||
|style="border-top:1px solid black" |<math>n\,\!</math> ||
|style="border-top:1px solid black" |<math>1\,\!</math> ||
|style="border-top:1px solid black" |<math>100\,\!</math> ||
|}
 
 
dove:
Riga 72 ⟶ 70:
* ''n''<sub>1</sub>, ''n''<sub>2</sub>, ..., ''n''<sub>k</sub> sono le frequenze assolute con le quali le diverse modalità vengono osservate, il cui totale ''n'' è il numero complessivo delle unità statistiche;
* ''f''<sub>1</sub>, ''f''<sub>2</sub>, ..., ''f''<sub>k</sub> sono le frequenze relative, calcolate come rapporti tra le frequenze assolute ed il numero complessivo delle unità statistiche; il loro totale è 1;
* ''p''<sub>1</sub>, ''p''<sub>2</sub>, ..., ''p''<sub>k</sub> sono le frequenze percentuali, ottenute moltiplicando per 100 le frequenze relative; il loro totale è 100;
* ''N''<sub>1</sub>, ''N''<sub>2</sub>, ..., ''N''<sub>k</sub> sono le frequenze assolute cumulate, ottenute sommando alla frequenza assoluta della ''i''-esima modalità le frequenze assolute delle modalità precedenti;
* ''F''<sub>1</sub>, ''F''<sub>2</sub>, ..., ''F''<sub>k</sub> sono le frequenze relative cumulate, ottenute sommando alla frequenza relativa della ''i''-esima modalità le frequenze relative delle modalità precedenti;
* ''P''<sub>1</sub>, ''P''<sub>2</sub>, ..., ''P''<sub>k</sub> sono le frequenze percentuali cumulate, ottenute sommando alla frequenza percentuale della ''i''-esima modalità le frequenze percentuali delle modalità precedenti.
 
Le frequenze relative cumulate sono utilizzate per calcolare la [[Funzione di ripartizione|funzione di ripartizione empirica]].
Riga 82 ⟶ 78:
Le distribuzioni di frequenza vengono talvolta dette:
* ''serie'', se si contano le unità che presentano le stesse modalità di un carattere qualitativo (geografico, alfabetico, cromatico ecc.);
* ''seriazioni'', se si contano le unità che presentano gli stessi valori di un carattere quantitativo.semo
 
==== Serie statistica ====
In altre parole la serie è una collezione '''ordinata''' di dati ovvero un insieme di dati disposti in ordine consecutivo (sequenza), dove ogni dato rappresenta una modalità o un valore del carattere osservato su ciascuna delle unità statistiche considerate.
 
== Distribuzione di quantità ==
Riga 88 ⟶ 87:
 
Nella tabella che segue si suppone di aver rilevato il numero di dipendenti (il carattere quantitativo) presso 3.443.915 aziende (le unità statistiche):
 
 
{| border="0" align="center" style="border-top:2px solid black; border-bottom:2px solid black; text-align:right"
Riga 120 ⟶ 118:
|style="border-top:1px solid black" | 3.443.915
|}
 
 
La prima colonna contiene le modalità del carattere raggruppate in classi.
Riga 130 ⟶ 127:
 
== Rappresentazione grafica ==
Per le serie territoriali, si usano spesso ''cartogrammi'', nei quali viene rappresentato l'intero territorio considerato (ad esempio una cartina dell'[[Italia]]) e si usano diversi colori per mostrare la diversa intensità del fenomeno rilevato nelle diverse province o regioni.
 
Le [[Serie storica|serie storiche]] vengono normalmente rappresentate con linee spezzate.
 
Le distribuzioni di frequenza sono rappresentate graficamente con [[diagrammi a barre]] o [[diagramma a torta|a torta]] se il carattere è [[carattere (statistica)|qualitativo]] o [[carattere (statistica)|quantitativo discreto]], con [[istogramma|istogrammi]] se il carattere è [[carattere (statistica)|quantitativo continuo]].
 
== Note ==
<references/>
 
== Bibliografia ==
Riga 142:
 
== Voci correlate ==
* [[Variabile (statistica)]]
* [[Carattere (statistica)]]
* [[Frequenza (statistica)]]
* [[Funzione di ripartizione]]
* [[Popolazione statistica]]
{{Portale|matematica}}
 
== Altri progetti ==
[[Categoria:Statistica descrittiva]]
{{interprogetto|preposizione=sulla}}
 
== Collegamenti esterni ==
* {{Collegamenti esterni}}
* {{cita web|http://goldbook.iupac.org/F02526.html|IUPAC Gold Book, "frequency distribution"|lingua=en}}
 
{{Controllo di autorità}}
{{Portale|matematica|statistica}}
 
[[Categoria:Distribuzioni di probabilità| ]]