Un insieme di dati è caratterizzato, oltre che da un valore medio, anche da un valore numerico che ne esprime la maggiore o minore dispersione, cioè il minore o maggiore addensarsi dei dati attorno al valore medio. Diversi sono i modi in cui è possibile definire un indice di dispersione; ne vediamo alcuni:
Campo di variazione o range: il campo di variazione di un insieme di dati è espresso dalla differenza fra il più grande ed il più piccolo dei valori appartenenti all'insieme stesso. Tale indice non è molto attendibile, in quanto è sufficiente un solo errore materiale nel rilevamento, che generi un dato molto maggiore o minore degli altri, per falsare notevolmente il suo valore. Inoltre il campo di variazione non fornisce alcuna indicazione sulla dispersione dei valori intermedi.
Deviazione standard del campione: siano x1, x2, ...., xn dei dati, rilevati su un campione; si chiama deviazione standard o scarto quadratico medio di tali dati, il numero reale s così definito:
La sommatoria dei quadrati degli scarti dalla media
prende il nome di devianza.
Varianza del campione: il quadrato della deviazione standard
prende il nome di varianza; pertanto per un campione la varianza sarà
espressa da:
il divisore (n - 1) di questa espressione rappresenta i gradi di libertà
della varianza.
Vediamo un esempio pratico, consideriamo l'escrezione
urinaria di magnesio (mg/24 h) calcoliamo il range, la deviazione standard
e la varianza. I dati li ricaviamo dalla Tabella
I.
Determinazione del range o campo di variazione: nella colonna dei dati ordinati dobbiamo considerare il primo e l'ultimo valore che corrispondono, rispettivamente al valore minimo e massimo osservati. Vediamo che il valore minimo è 9 ed il valore massimo è 186. Il range si ricava sottraendo il valore minimo dal valore massimo, cioè range = 186 - 9 = 177.
Calcolo della deviazione standard: il metodo classico per la
determinazione della deviazione standard prevede come primo passo il calcolo
delle singole differenze di ogni dato dalla media, come riportato nella
colonna (xi - m) della Tabella
I. E' bene ricordare che la ,
la sommatoria delle differenze dalla media (xi - m) è
sempre zero cioè .
Ogni valore delle differenze dalla media (xi - m) si eleva
al quadrato ed i risultati si dispongono come nella colonna (xi
- m)2 della Tabella
I. Sommando questi valori si ottiene la sommatoria dei quadrati
delle differenza dalla media; nel nostro caso è
.
Dividendo questo valore per (n - 1), i gradi di libertà della varianza, otteniamo la varianza (s2). Cioè:
Estraendo la radice quadrata della varianza otteniamo la deviazione
standard:
|
|
|
|