Il test di Wilcoxon per dati appaiati è l'equivalente
non parametrico del test t di Student per dati appaiati, e va utilizzato
al posto di questo quando i dati non sono distribuiti normalmente.
Per i calcoli si procede in questo modo:
- si determinano le differenze (con il segno) fra le n coppie di valori;
- si stabilisce, per ciascuna differenza, il rango nella lista delle
differenze ordinate (questa volta ignorando il segno) in ordine numerico
crescente: la più piccola differenza osservata avrà numero
di posizione 1, e via dicendo.
- quando due o più differenze sono uguali, si assegna
a ciascuna di esse la media dei numeri di posizione che esse dovrebbero
avere;
- si riassegna il segno ai ranghi nella lista, in pratica se
la differenza corrispondente a quel rango è negativa, si assegna
il segno meno anche al rango, se era positiva si assegna il segno più;
- se una coppia di valori ha come differenza 0 (zero) si elimina e
non è considerata nello studio;
- si calcola la somma dei ranghi con segno negativo e quella
dei ranghi con segno positivo; indichiamo con T la somma dei ranghi con
valore minore;
- a questo punto possiamo calcolare la deviata normale standardizzata
Z come
dove
e
La statistica Z così calcolata corrisponde a sottoporre al test la mediana delle differenze. Se il valore di probabilità p ottenuto supera quella del valore critico si conclude per una significatività della differenza. La soluzione riportata è sufficientemente accurata per n 20.
Vediamo un esempio pratico utilizzando gli stessi
dati della sperimentazione precedente, in questo caso però consideriamo
i dati come pre-terapia e post-terapia. Durante una sperimentazione clinica
di un farmaco contro l'ipertrofia prostatica, viene somministrato lo stesso
farmaco ad un gruppo di pazienti formato da 27 individui (n = 27). Tutti
i pazienti all'inizio della terapia mostravano i tipici segni di ostacolato
deflusso dell'urina durante la minzione. I pazienti rispondono alle domande
di un questionario sia prima dell'inizio della terapia che dopo un mese.
Il questionario è composto da 50 domande alle quali il soggetto
risponde scegliendo fra tre possibili risposte; ogni risposta è
correlata all'importanza della sintomatologia (assente = 1, moderata =
2, grave = 3) perciò sommando tutti i punteggi ad ogni paziente
sarà assegnato un totale che potrà andare da 50 a 150.
Ci chiediamo se esistono dei validi motivi per affermare
che i pazienti osservati prima dell'inizio della terapia avevano una sintomatologia
più grave rispetto a quella che gli stessi pazienti mostrano dopo
un mese di terapia in base ai dati riportati nella Tabella seguente.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Disponiamo in ordine crescente le differenze ed assegnamo
il rango senza considerare il segno, come nella Tabella seguente.
|
-2 |
+3 |
+3 |
+4 |
-5 |
-5 |
+9 |
+9 |
+10 |
+10 |
+11 |
+12 |
+15 |
+17 |
-20 |
+22 |
+27 |
-29 |
+30 |
+33 |
-36 |
-38 |
+40 |
+41 |
+42 |
+54 |
|
|
Riassegnamo il segno ad ogni rango tenendo conto che il
rango assumerà il segno della differenza. La somma dei ranghi con
segno negativo è pari a 88, mentre quella dei ranghi con segno positivo
è pari 263; T sarà perciò uguale a 88. Dobbiamo anche
considerare che la coppia di dati no 23 ha come differenza 0
(ties) perciò non viene considerata nel test ed utilizziamo solo
le restanti 26 coppie di dati.
A questo punto possiamo calcolare la deviata normale
standardizzata Z come:
e
e per sostituzione otteniamo Z
Il valore Z ottenuto si confronta con il valore
critico per la distribuzione del t di Student corrispondente
ad un numero infinito di gradi di libertà. Poiché è
superiore a 1,960, si può affermare che lo studio fornisce elementi
sufficienti per dire che il farmaco ha avuto un effetto nel miglioramento
dei sintomi nei pazienti in studio.
|
|
|
|