Test di Wilcoxon per dati appaiati

    Il test di Wilcoxon per dati appaiati è l'equivalente non parametrico del test t di Student per dati appaiati, e va utilizzato al posto di questo quando i dati non sono distribuiti normalmente.
Per i calcoli si procede in questo modo:
- si determinano le differenze (con il segno) fra le n coppie di valori;
- si stabilisce, per ciascuna differenza, il rango nella lista delle differenze ordinate (questa volta ignorando il segno) in ordine numerico crescente: la più piccola differenza osservata avrà numero di posizione 1, e via dicendo.
-  quando due o più differenze sono uguali, si assegna a ciascuna di  esse la media dei numeri di posizione che esse dovrebbero avere;
-  si riassegna il segno ai ranghi nella lista, in pratica se la differenza corrispondente a quel rango è negativa, si assegna il segno meno anche al rango, se era positiva si assegna il segno più;
- se una coppia di valori ha come differenza 0 (zero) si elimina e non è considerata nello studio;
-  si calcola la somma dei ranghi con segno negativo e quella dei ranghi con segno positivo; indichiamo con T la somma dei ranghi con valore minore;
- a questo punto possiamo calcolare la deviata normale standardizzata Z come

dove

e

    La statistica Z così calcolata corrisponde a sottoporre al test la mediana delle differenze. Se il valore di probabilità p ottenuto supera quella del valore critico si conclude per una significatività della differenza. La soluzione riportata è sufficientemente accurata per n 20.

    Vediamo un esempio pratico utilizzando gli stessi dati della sperimentazione precedente, in questo caso però consideriamo i dati come pre-terapia e post-terapia. Durante una sperimentazione clinica di un farmaco contro l'ipertrofia prostatica, viene somministrato lo stesso farmaco ad un gruppo di pazienti formato da 27 individui (n = 27). Tutti i pazienti all'inizio della terapia mostravano i tipici segni di ostacolato deflusso dell'urina durante la minzione. I pazienti rispondono alle domande di un questionario sia prima dell'inizio della terapia che dopo un mese. Il questionario è composto da 50 domande alle quali il soggetto risponde scegliendo fra tre possibili risposte; ogni risposta è correlata all'importanza della sintomatologia (assente = 1, moderata = 2, grave = 3) perciò sommando tutti i punteggi ad ogni paziente sarà assegnato un totale che potrà andare da 50 a 150.
    Ci chiediamo se esistono dei validi motivi per affermare che i pazienti osservati prima dell'inizio della terapia avevano una sintomatologia più grave rispetto a quella che gli stessi pazienti mostrano dopo un mese di terapia in base ai dati riportati nella Tabella seguente.
 
 
 
pre terapia
post terapia
differenza
rango
 1
116
145
-29
-18
 2
143
126
+17
+14
 3
141
130
+11
+11
 4
106
126
-20
-15
 5
110
107
+3
+2,5
 6
115
106
+9
+7,5
 7
120
 93
+27
+14
 8
113
110
+3
+2,5
 9
127
115
+12
+12
10
107
 65
+42
+25
11
 98
 68
+30
+19
12
131
121
+10
+9,5
13
 55
 93
-38
-22
14
140
 86
+54
+26
15
110
115
-5
-5,5
16
115
106
+9
+7,5
17
 65
 70
-5
-5,5
18
 68
104
-36
-21
19
121
 80
+41
+24
20
 93
53
+40
+23
21
 86
 64
+22
+16
22
115
105
+10
+9,5
23
115
115
0
ties
24
120
116
+4
+4
25
 96
 98
-2
-1
26
 83
 50
+33
+20
27
113
 98
+15
+13

    Disponiamo in ordine crescente le differenze ed assegnamo il rango senza considerare il segno, come nella Tabella seguente.
 
 
0
1

-2

2,5

+3

2,5

+3

4

+4

5,5

-5

5,5

-5

7,5

+9

7,5

+9

9,5

+10

9,5

+10

11

+11

12

+12

13

+15

14

+17

15

-20

16

+22

17

+27

18

-29

19

+30

20

+33

21

-36

22

-38

23

+40

24

+41

25

+42

26

+54

 
 
 

 

   Riassegnamo il segno ad ogni rango tenendo conto che il rango assumerà il segno della differenza. La somma dei ranghi con segno negativo è pari a 88, mentre quella dei ranghi con segno positivo è pari 263; T sarà perciò uguale a 88. Dobbiamo anche considerare che la coppia di dati no 23 ha come differenza 0 (ties) perciò non viene considerata nel test ed utilizziamo solo le restanti 26 coppie di dati.
    A questo punto possiamo calcolare la deviata normale standardizzata Z come:

e

e per sostituzione otteniamo Z

    Il valore Z ottenuto si confronta con il valore critico per la distribuzione del t di Student corrispondente ad un numero infinito di gradi di libertà. Poiché è superiore a 1,960, si può affermare che lo studio fornisce elementi sufficienti per dire che il farmaco ha avuto un effetto nel miglioramento dei sintomi nei pazienti in studio.
 
 

Indice generale
Pagina precedente
Pagina principale
Pagina successiva