Mediana (statistica)
In statistica descrittiva, data una distribuzione X di un carattere quantitativo oppure qualitativo ordinabile (ovvero le cui modalità possano essere ordinate in base a qualche criterio), si definisce la mediana, o mediano, come il valore/modalità (o l'insieme di valori/modalità) assunto dalle unità statistiche che si trovano nel mezzo della distribuzione.
Se si procede al riordinamento delle unità in base ai valori crescenti del carattere da esse detenuto, in sostanza la Mediana bipartisce la distribuzione in due sotto-distribuzioni: la prima a sinistra della Mediana (costituita dalla metà delle unità la cui modalità è minore o uguale alla Mediana) e la seconda a destra della Mediana (costituita dalla metà delle unità la cui modalità è maggiore o uguale alla Mediana). Tecnicamente si afferma che la mediana è il valore/modalità per il quale la frequenza relativa cumulata vale 0,5, cioè il secondo quartile, ossia il 50° percentile. Usualmente si indica la Mediana con Me.
Se le modalità sono raggruppate in classi non si definisce un valore univoco, ma una classe mediana . La determinazione di tale classe avviene considerando le frequenze cumulate; indicando con la generica frequenza cumulata dell'osservazione i-esima sarà: e . Pur essendo corretto considerare un qualsiasi elemento dell'intervallo un valore mediano si è soliti procedere, al fine di avere una misura unica del valore, a un'approssimazione della mediana con la seguente formula:
se si assume che la distribuzione dei dati all'interno della classe sia uniforme, che corrisponde ad un processo di interpolazione.
La mediana è un indice di posizione e rientra nell'insieme delle statistiche di ordine.
Una proprietà della mediana è di rendere minima la somma dei valori assoluti degli scarti delle da un generico valore
Per calcolare la mediana di dati:
- si ordinano gli di dati in ordine crescente o decrescente;
- se il numero di dati è dispari la mediana corrisponde al valore centrale, ovvero al valore che occupa la posizione .
- se il numero di dati è pari, la mediana è stimata utilizzando i due valori che occupano le posizione e (generalmente si sceglie la loro media aritmetica).
Storia
Il termine mediano venne introdotto da Antoine Augustin Cournot e adottato da Francis Galton. Gustav Theodor Fechner sviluppò l'uso della mediana come sostituto della media in quanto riteneva che il calcolo della media fosse troppo laborioso rispetto al vantaggio in termini di precisioni che offriva.