La mediana

Se i dati da elaborare sono dati numerici, quindi ordinabili, è naturale considerare un altro indice di posizione: il dato in posizione centrale dei dati detto mediana. Supponiamo ad esempio che i dati seguenti:

175, 169, 165, 174, 172, 171, 172, 173, 168

rappresentino le altezze in centimetri di 9 ragazzi. Per calcolare la mediana di questi dati dovremo prima di tutto disporli in ordine crescente:

165, 168, 169, 171, 172, 172, 173, 174, 175

e poi individuare il valore centrale che, come si vede, è 172 (il primo 172). Tale valore divide i dati (ordinati) in due parti ciascuna delle quali contiene lo stesso numero di dati. Osserviamo che in questo caso i dati sono in numero dispari e dunque esiste un dato centrale. Se i dati fossero invece in numero pari come in questo caso:

165, 168, 169, 171, 171, 172, 172, 173, 174, 175

avremmo due valori centrali, 171 e 172, ed è naturale prendere come mediana dei dati la semisomma dei due valori centrali cioè:

In questo caso la mediana non è un valore rintracciabile tra i nostri dati ma è un valore che viene calcolato mediante un procedimento aritmetico e rappresenta in forma sintetica l'intera serie di dati. La mediana lascia dunque, in ogni caso, lo stesso numero di dati alla sua sinistra e alla sua destra. In generale,

La mediana di una serie di n dati numerici disposti in ordine crescente è:

  • il valore centrale se n è dispari; tale valore si trova al

    posto;

  • la semisomma dei due valori centrali se n è pari; tali valori centrali si trovano rispettivamente al

    posto.

Anche la mediana, come si era già detto per la moda, è un indice di posizione che ha il vantaggio di eliminare gli effetti dei valori estremi, dipendendo solo dal valore centrale (o dai due valori centrali). Tuttavia la mediana non tiene conto dell'insieme dei valori come in molti casi potrebbe essere necessario.

Quando si ha un insieme di dati molto grande, oltre alla mediana che divide a metà i dati ordinati, si possono utilizzare altri indici di posizione non centrali, detti quantili che dividono l'insieme dei dati ordinati in un dato numero di parti uguali. Ad esempio, i quartili dividono l'insieme dei dati ordinati in quattro parti uguali. Ecco ad esempio una distribuzione in cui sono rappresentati mediana e quartili:

Possiamo considerare la mediana come il secondo quartile. Conoscendo non solo la mediana ma anche il primo e terzo quartile di una serie di dati numerici si ha un'informazione che è ancora relativamente sintetica ma più significativa per quanto concerne la distribuzione dei dati.

© giuseppe sarnataro