Se in uno studio utilizziamo dei dati di tipo ordinale o se, pur essendo
di tipo intervallare, i dati non mostrano una distribuzione normale, per
decidere se due gruppi di osservazioni possono essere considerati, a ragione,
campioni diversi di una stessa popolazione dobbiamo servirci di un test
statistico non parametrico. Il test di Wilcoxon per campioni indipendenti
è uno dei più potenti test non parametrici; corrisponde al
test t di Student per campioni indipendenti.
Vediamo un semplice esempio. Durante una sperimentazione clinica di un
farmaco contro l'ipertrofia prostatica, ai pazienti del gruppo A, formato
da 27 individui (n1), viene somministrato il farmaco A mentre
i pazienti del gruppo B, formato anch'esso da 27 individui (n2),
ricevono il farmaco B. In genere si indica con n1 il gruppo
con numero inferiore di osservazioni e con n2 il gruppo con
numero maggiore di osservazioni, mentre se i due gruppi hanno la stessa
numerosità è indifferente.
Tutti i pazienti
all'inizio della terapia mostravano i tipici segni di ostacolato deflusso
dell'urina durante la minzione. Dopo un mese di terapia i soggetti di entrambi
i gruppi compilano un questionario composto da 50 domande alle quali il
soggetto risponde scegliendo fra tre possibili risposte; ogni risposta
è correlata all'importanza della sintomatologia (assente = 1, moderata
= 2, grave = 3). Sommando tutti i punteggi di ogni domanda, ad ogni paziente
sarà assegnato un punteggio totale che potrà variare da 50
a 150.
Ci chiediamo: esistono dei validi motivi per affermare che i pazienti appartenenti
al gruppo A hanno una sintomatologia più grave rispetto ai pazienti
del gruppo B in base ai dati riportati nella seguente tabella.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Per applicare il test di Wilcoxon per campioni indipendenti assegniamo
ad ogni punteggio, di entrambi i gruppi, un numero di rango, disponendo
i dati in ordine di grandezza crescente in una singola lista, etichettandoli
in modo che possano essere successivamente di nuovo distinti. Quando
due o più numeri sono uguali, si assegna a ciascuno di essi la media
dei numeri di posizione, come nella Tabella seguente.
50 B |
53 B |
53 A |
64 B |
65 A |
65 B |
68 A |
68 B |
70 B |
80 B |
83 A |
86 A |
86 B |
93 A |
93 B |
93 B |
96 A |
98 A |
98 B |
98 B |
104 B |
105 B |
106 A |
106 B |
106 B |
107 A |
107 B |
110 A |
110 A |
110 A |
113 A |
113 A |
115 A |
115 A |
115 A |
115 A |
115 B |
115 B |
115 B |
116 A |
116 B |
120 A |
120 A |
121 A |
121 B |
126 B |
126 B |
127 A |
130 B |
131 A |
140 A |
141 A |
143 A |
145 B |
|
Si sommano i ranghi indicando con T il più piccolo di questi totali
se i campioni hanno lo stesso numero di dati.
Se invece i due campioni hanno diverso numero di dati si chiama T1
il totale del campione che ha minore numero di dati, diciamo n1
ed il numero dei dati del secondo campione si indica con n2.
La somma dei ranghi del campione più numeroso sarà calcolato
come:
anche in questo caso si indicherà con T il più piccolo fra i valori T1 e T2.
Se l'ipotesi nulla è vera dobbiamo aspettarci che in media i ranghi,
in ognuno dei due gruppi siano quasi uguali. Se la somma dei ranghi per
un gruppo è molto grande (o molto piccola), potremmo aver ragione
di sospettare che i campioni siano tratti dalla stessa popolazione o che
vi siano differenze fra due gruppi tratti dalla stessa popolazione.
Il test di Wilcoxon fornisce una risposta sempre più attendibile
con l'aumento della numerosità dei gruppi in esame.
Quando n1 e n2 aumentano di dimensioni, la distribuzione
campionaria di T, si avvicina rapidamente alla distribuzione normale ridotta
con:
e deviazione standard:
da cui:
zT può essere confrontato con la distribuzione di t corrispondente ad un numero infinito di gradi di libertà perché quando i campioni sono numerosi (n > 20) tale distribuzione si avvicina a quella normale. Il confronto è reso più accurato introducendo una correzione per la continuità. Consideriamo ancora i dati del nostro esempio, essendoci 27 soggetti in ciascun gruppo, ricaviamo il valore di p calcolando zT e confrontiamo il valore ottenuto con la distribuzione normale. La media di tutti i possibili valori di T, per esperimenti di queste dimensioni, è:
e deviazione standard
Utilizziamo la somma dei ranghi più piccola perchè i gruppi nello studio hanno la stessa numerosità, pertanto:
Si confronta la tabella dei valori critici del
t di Student per un numero di gradi di libertà infinito. Questo
valore è minore di 1,960, il valore di z che individua, nella distribuzione
normale, una quota di valori pari al 5% dei valori più elevati.
Lo studio non da quindi elementi sufficienti per dire che il farmaco B
abbia fornito un effetto nel miglioramento dei sintomi quando confrontato
con il farmaco A.
|
|
|