Test di Wilcoxon per dati appaiati

Il test di Wilcoxon per dati appaiati è l'equivalente non parametrico del test t di Student per dati appaiati, e va utilizzato al posto di questo quando i dati non sono distribuiti normalmente.
Per i calcoli si procede in questo modo:
- si determinano le differenze (con il segno) fra le n coppie di valori;
- si stabilisce, per ciascuna differenza, il rango nella lista delle differenze ordinate (questa volta ignorando il segno) in ordine numerico crescente: la più piccola differenza osservata avrà numero di posizione 1, e via dicendo.
- quando due o più differenze sono uguali, si assegna a ciascuna di esse la media dei numeri di posizione che esse dovrebbero avere;
- si riassegna il segno ai ranghi nella lista, in pratica se la differenza corrispondente a quel rango è negativa, si assegna il segno meno anche al rango, se era positiva si assegna il segno più;
- se una coppia di valori ha come differenza 0 (zero) si elimina e non è considerata nello studio;
- si calcola la somma dei ranghi con segno negativo e quella dei ranghi con segno positivo; indichiamo con T la somma dei ranghi con valore minore;
- a questo punto possiamo calcolare la deviata normale standardizzata Z come

dove

e

La statistica Z così calcolata corrisponde a sottoporre al test la mediana delle differenze. Se il valore di probabilità p ottenuto supera quella del valore critico si conclude per una significatività della differenza. La soluzione riportata è sufficientemente accurata per n 20.

Vediamo un esempio pratico utilizzando gli stessi dati della sperimentazione precedente, in questo caso però consideriamo i dati come pre-terapia e post-terapia. Durante una sperimentazione clinica di un farmaco contro l'ipertrofia prostatica, viene somministrato lo stesso farmaco ad un gruppo di pazienti formato da 27 individui (n = 27). Tutti i pazienti all'inizio della terapia mostravano i tipici segni di ostacolato deflusso dell'urina durante la minzione. I pazienti rispondono alle domande di un questionario sia prima dell'inizio della terapia che dopo un mese. Il questionario è composto da 50 domande alle quali il soggetto risponde scegliendo fra tre possibili risposte; ogni risposta è correlata all'importanza della sintomatologia (assente = 1, moderata = 2, grave = 3) perciò sommando tutti i punteggi ad ogni paziente sarà assegnato un totale che potrà andare da 50 a 150.
Ci chiediamo se esistono dei validi motivi per affermare che i pazienti osservati prima dell'inizio della terapia avevano una sintomatologia più grave rispetto a quella che gli stessi pazienti mostrano dopo un mese di terapia in base ai dati riportati nella Tabella seguente.

pre terapia post terapia differenza rango

1 116 145 -29 -18

2 143 126 +17 +14

3 141 130 +11 +11

4 106 126 -20 -15

5 110 107 +3 +2,5

6 115 106 +9 +7,5

7 120 93 +27 +14

8 113 110 +3 +2,5

9 127 115 +12 +12

10 107 65 +42 +25

11 98 68 +30 +19

12 131 121 +10 +9,5

13 55 93 -38 -22

14 140 86 +54 +26

15 110 115 -5 -5,5

16 115 106 +9 +7,5

17 65 70 -5 -5,5

18 68 104 -36 -21

19 121 80 +41 +24

20 93 53 +40 +23

21 86 64 +22 +16

22 115 105 +10 +9,5

23 115 115 0 ties

24 120 116 +4 +4

25 96 98 -2 -1

26 83 50 +33 +20

27 113 98 +15 +13

Disponiamo in ordine crescente le differenze ed assegnamo il rango senza considerare il segno, come nella Tabella seguente.

0 1
-2
2,5
+3
2,5
+3
4
+4
5,5
-5
5,5
-5
7,5
+9
7,5
+9
9,5
+10

9,5
+10
11
+11
12
+12
13
+15
14
+17
15
-20
16
+22
17
+27
18
-29
19
+30

20
+33
21
-36
22
-38
23
+40
24
+41
25
+42
26
+54

Riassegnamo il segno ad ogni rango tenendo conto che il rango assumerà il segno della differenza. La somma dei ranghi con segno negativo è pari a 88, mentre quella dei ranghi con segno positivo è pari 263; T sarà perciò uguale a 88. Dobbiamo anche considerare che la coppia di dati n^o 23 ha come differenza 0 (ties) perciò non viene considerata nel test ed utilizziamo solo le restanti 26 coppie di dati.
A questo punto possiamo calcolare la deviata normale standardizzata Z come:

e

e per sostituzione otteniamo Z

Il valore Z ottenuto si confronta con il valore critico per la distribuzione del t di Student corrispondente ad un numero infinito di gradi di libertà. Poiché è superiore a 1,960, si può affermare che lo studio fornisce elementi sufficienti per dire che il farmaco ha avuto un effetto nel miglioramento dei sintomi nei pazienti in studio.

Indice generale

Pagina precedente

Pagina principale

Pagina successiva