Hii-ruut
test
Klassikaliseim
kahemõõtmelise sagedustabeli alusel
teostav test, otsustamaks tabelis esitatud tunnuste
seotuse statistilise olulisuse üle, on χ2-test
(hii-ruut test; ingl. chi-square test
või Pearson's goodness-of-fit test).
χ2-test
võrdleb andmete alusel konstrueeritud sagedustabelit
nö ideaalse, sõltumatuse juhule vastava,
sagedustabeliga. Viimases avalduvad sagedused kujul
ni.n.j/n
(vt punkt 2.3).
Testitav
hüpoteeside paar on kujul:
H0:
tunnused on sõltumatud ehk potentsiaalne
riskifaktor ei mõjuta uuritava sündmuse
toimumist,
H1: tunnused on sõltuvad ehk potentsiaalne
riskifaktor mõjutab uuritava sündmuse
toimumist;
ehk
matemaatilisel kujul:
H0:
nij = ni.n.j/n,
H1: nij ≠ ni.n.j/n.
Teststatistikut,
mis mõõdab erinevust nullhüpoteesile
vastava ja tegeliku sagedustabeli vahel ning mis nullhüpoteesi
kehtides on ligikaudu χ2-jaotusega
vabadusastmete arvuga (m-1)(k-1), nimetatakse
χ2-statistikuks ja see avaldub kujul
,
kus
m ja k on uuritavate tunnuste erinevate
väärtuste arvud. Binaarse uuritava tunnuse
ja kaheväärtuselise faktortunnuse tarvis
konstrueeritava 2x2-sagedustabeli puhul on teststatistik
χ2-jaotusega vabadusastmete arvuga
üks.
Seega
summeeritakse χ2-statistiku väärtuse
leidmiseks kõigi tegelike ja sõltumatuse
juhule vastavate sageduste ruuterinevus, mis on täiendavalt
läbi jagatud sõltumatuse juhule vastavate
sagedustega.
Otsuse
vastu võtmine, kumb hüpoteesidest kehtib,
käib tänapäeval enamasti olulisuse
tõenäoses p alusel, mis leitakse kui tõenäosus,
et vastava χ2-jaotusega suurus võib
omandada teststatistiku väärtusega võrdse
või suurema väärtuse. Kui p≤0,05,
loetakse traditsiooniliselt tõestatuks alternatiivne
hüpotees H1, kui aga p>0,05,
jäädakse nullhüpoteesi H0
juurde.
Kuna
χ2-testil leitav teststatistik on
nullhüpoteesi kehtides χ2-jaotusega
vaid ligikaudu, ei sobi χ2-test väga
väikeste valimite analüüsimiseks. Enamasti
pannakse χ2-testi eeldusena kirja,
et kõik oodatavad sagedused ni.n.j/n
peaksid olema suuremad-võrdsed viiest.
Koerte
näite puhul võib testitava hüpoteeside
paari sõnastada kujul:
H0:
ravi tulemus ei sõltu koera soost,
H1: ravi tulemus on soospetsiifiline.
χ2-statistiku
väärtuse arvutamiseks vajalikud sagedustabelid
tegelike ja nullhüpoteesile vastavate sagedustega
on kujul (vt punkt
2.3)
|
Ei
saanud terveks
|
Sai
terveks
|
Emane |
9
|
4
|
Isane |
2
|
10
|
ja
|
Ei
saanud terveks
|
Sai
terveks
|
Emane |
5,72
|
7,28
|
Isane |
5,28
|
6,72
|
Suurused
(nij - ni.n.j/n)2
/ (ni.n.j/n)
iga sagedustabeli lahtri tarvis on kirjas järgmises
tabelis
|
Ei
saanud terveks
|
Sai
terveks
|
Emane |
1,60
|
2,04
|
Isane |
1,48
|
1,8
|
millest
χ2 = 1,60+1,48+2,04+1,88 = 6,997.
Ühe
vabadusastmega χ2-jaotuse puhul
on sellele teststatistiku väärtusele vastav
olulisuse tõenäosus p = 0,008,
mistap võib lugeda tõestatuks alternatiivse
hüpoteesi: ravi tulemus on soospetsiifiline
(ehk seos ravi tulemuse ja koera soo vahel on statistiliselt
oluline).
Valik
online-kalkulaatoreid, mis pakuvad χ2-testi
teostamise võimalust:
|