Hii2-test
(χ2-test)
Mittearvuliste
ja/või diskreetsete arvtunnuste vahelise kahemõõtmelise
sagedustabeli kujul esitatud seose statistilise olulisuse
testimiseks kasutatakse sagedaimini χ2-testi, millele
vastav hüpoteeside paar on kujul:
H0:
tunnused on sõltumatud ehk potentsiaalne
riskifaktor ei mõjuta uuritava sündmuse
toimumist,
H1: tunnused on sõltuvad ehk potentsiaalne
riskifaktor mõjutab uuritava sündmuse
toimumist.
MS
Excelis on χ2-test teostatav funktsiooniga CHISQ.TEST,
mis teostab andmetele vastava empiirilise ja nullhüpoteesile
vastava teoreetilise sagedustabeli võrdluse
ning annab tulemuseks olulisuse tõenäosuse
p väärtuse.
Funktsiooni
CHISQ.TEST rakendamiseks tuleb
-
konstrueerida uuritavate tunnuste vaid absoluutsagedusi
sisaldav kahemõõtmeline sagedustabel
(nö empiiriline, andmetele vastav sagedustabel),
-
arvutada teise tabelisse tunnuste sõltumatuse
juhule (nullhüpoteesile) vastavad oodatavad
teoreetilised sagedused valemist
nij
= ni.*n.j
/ n,
kus
nij on oodatav sagedus tabeli
i. reas ja j. veerus, ni.
ja n.j on vastavalt sagedustabeli
i. rea ja j. veeru summad ning n
on vaatluste arv,
-
panna kursor lahtrisse, kuhu soovite saada χ2-testi
p-väärtust, ning rakendada funktsiooni
CHISQ.TEST, andes argumentidena ette
- empiirilised
sagedused (Actual_range) ja
- oodatavad
teoreetilised sagedused (Expected_range).
NB!
Funktsiooni CHISQ.TEST argumentidena antakse sagedustabelid
ette ilma ääre-summadeta.
Joonisel
65 on näidatud χ2-testi teostamist
testimaks tudengite soo ja õllejoomise vahelise
seose statistilist olulisust. Nagu eelmise punkti
lõpus kirjutatud, on tudengite sugu ja õllejoomine
seotud - noormeeste hulgas on õllejoojaid rohkem.
χ2-testi alusel saab väita, et
see seos on ka statistiliselt oluline (p <
0,001).
Märkus.
χ2-test on asümptootiline test,
st et arvutatav teststatistik on χ2-jaotusega
vaid ligikaudu ja testi tulemus on seda täpsem,
mida rohkem on andmeid. Traditsiooniliselt loetakse
χ2-testi kasutamine õigustatuks,
kui kõigis teoreetilise sagedustabeli lahtrites
paiknevad sagedused on viiest suuremad (nij
≥ 5).
Täpsemalt
χ2-testi kohta vt õpiobjektist
"Binaarsete
tunnuste analüüsimeetodid".
Joonis
65. χ2-testi läbiviimine Excelis
funktsiooniga CHISQ.TEST testimaks tudengite soo ja
õllejoomise vahelise seose statistilist olulisust
kahemõõtmelise sagedustabeli alusel.
|