Õpiobjektid -> Binaarsete tunnuste analüüsimeetodid

BINAARSETE TUNNUSTE ANALÜÜSIMEETODID


Õpiobjekti kirjeldus
Õpijuhis
 
1. Sissejuhatus
2. Binaarse tunnuse seos mittearvulise tunnusega või diskreetse arvtunnusega
3. Binaarse tunnuse seos pideva arvtunnusega
4. Enesekontroll
Lisa
¤ Kogu materjal ühe pdf-failina: bin_tunnuste_analyys.pdf

Hii-ruut test

Klassikaliseim kahemõõtmelise sagedustabeli alusel teostav test, otsustamaks tabelis esitatud tunnuste seotuse statistilise olulisuse üle, on χ2-test (hii-ruut test; ingl. chi-square test või Pearson's goodness-of-fit test).

χ2-test võrdleb andmete alusel konstrueeritud sagedustabelit nö ideaalse, sõltumatuse juhule vastava, sagedustabeliga. Viimases avalduvad sagedused kujul ni.n.j/n (vt punkt 2.3).

Testitav hüpoteeside paar on kujul:

H0: tunnused on sõltumatud ehk potentsiaalne riskifaktor ei mõjuta uuritava sündmuse toimumist,
H1: tunnused on sõltuvad ehk potentsiaalne riskifaktor mõjutab uuritava sündmuse toimumist;

ehk matemaatilisel kujul:

H0: nij = ni.n.j/n,
H1: nijni.n.j/n.

Teststatistikut, mis mõõdab erinevust nullhüpoteesile vastava ja tegeliku sagedustabeli vahel ning mis nullhüpoteesi kehtides on ligikaudu χ2-jaotusega vabadusastmete arvuga (m-1)(k-1), nimetatakse χ2-statistikuks ja see avaldub kujul

,

kus m ja k on uuritavate tunnuste erinevate väärtuste arvud. Binaarse uuritava tunnuse ja kaheväärtuselise faktortunnuse tarvis konstrueeritava 2x2-sagedustabeli puhul on teststatistik χ2-jaotusega vabadusastmete arvuga üks.

Seega summeeritakse χ2-statistiku väärtuse leidmiseks kõigi tegelike ja sõltumatuse juhule vastavate sageduste ruuterinevus, mis on täiendavalt läbi jagatud sõltumatuse juhule vastavate sagedustega.

Otsuse vastu võtmine, kumb hüpoteesidest kehtib, käib tänapäeval enamasti olulisuse tõenäoses p alusel, mis leitakse kui tõenäosus, et vastava χ2-jaotusega suurus võib omandada teststatistiku väärtusega võrdse või suurema väärtuse. Kui p≤0,05, loetakse traditsiooniliselt tõestatuks alternatiivne hüpotees H1, kui aga p>0,05, jäädakse nullhüpoteesi H0 juurde.

Kuna χ2-testil leitav teststatistik on nullhüpoteesi kehtides χ2-jaotusega vaid ligikaudu, ei sobi χ2-test väga väikeste valimite analüüsimiseks. Enamasti pannakse χ2-testi eeldusena kirja, et kõik oodatavad sagedused ni.n.j/n peaksid olema suuremad-võrdsed viiest.


Koerte näite puhul võib testitava hüpoteeside paari sõnastada kujul:

H0: ravi tulemus ei sõltu koera soost,
H1: ravi tulemus on soospetsiifiline.

χ2-statistiku väärtuse arvutamiseks vajalikud sagedustabelid tegelike ja nullhüpoteesile vastavate sagedustega on kujul (vt punkt 2.3)

 
Ei saanud terveks
Sai terveks
Emane
9
4
Isane
2
10

ja

 
Ei saanud terveks
Sai terveks
Emane
5,72
7,28
Isane
5,28
6,72

Suurused (nij - ni.n.j/n)2 / (ni.n.j/n) iga sagedustabeli lahtri tarvis on kirjas järgmises tabelis

 
Ei saanud terveks
Sai terveks
Emane
1,60
2,04
Isane
1,48
1,8

millest χ2 = 1,60+1,48+2,04+1,88 = 6,997.

Ühe vabadusastmega χ2-jaotuse puhul on sellele teststatistiku väärtusele vastav olulisuse tõenäosus p = 0,008, mistap võib lugeda tõestatuks alternatiivse hüpoteesi: ravi tulemus on soospetsiifiline (ehk seos ravi tulemuse ja koera soo vahel on statistiliselt oluline).


Valik online-kalkulaatoreid, mis pakuvad χ2-testi teostamise võimalust:


< Eelmine

Creative Commons License Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License