--- Tanel Kaart --- Binaarsete tunnuste analüüsimeetodid ---

Õpiobjektid -> Binaarsete tunnuste analüüsimeetodid

BINAARSETE TUNNUSTE ANALÜÜSIMEETODID

Õpijuhis

1. Sissejuhatus

¤	Binaarsete tunnuste olemus ja kodeerimine
¤	Binaarsete tunnuste esitus arvutis
¤	Binaarne tunnus kui fiktiivne muutuja

2. Binaarse tunnuse seos mittearvulise tunnusega või diskreetse arvtunnusega

¤	Kahemõõtmeline sagedustabel
¤	Suhtelised sagedused
¤	Sõltumatuse juhule vastavad sagedused
¤	Juhtude esinemissagedus ja riskisuhe
¤	Šansside suhe
¤	Hii-ruut test
¤	Fisheri täpne test

3. Binaarse tunnuse seos pideva arvtunnusega

¤	Logistiline regressioon
¤	Probit-regressioon
¤	Logit- vs probit-regressioon ning tulemuste illustreerimine
¤	50% ja 90% vastuse määr (LD50, LTemp90 jmt)
¤	Tundlikkus ja spetsiifilisus
¤	ROC-kõver
¤	Optimaalne piirväärtus
¤	ROC-kõvera alune pindala
¤	Diskreetse argumendiga logistiline mudel

4. Enesekontroll

¤	Küsimused ja ülesanded
¤	Vastused ja lahendused

Lisa

¤	Kogu materjal ühe pdf-failina: bin_tunnuste_analyys.pdf

Binaarsete tunnuste olemus ja kodeerimine

Binaarne tunnus on tunnus, millel on vaid kaks võimalikku väärtust (näiteks sugu väärtustega 'isane' ja 'emane').

Katse/uuringu tulemusena tekivad binaarsed tunnused siis, kui uuritakse mingi sündmuse toimumist -- a'la lehm tiinestus/ei tiinestunud, koera ravi oli tulemuslik/ei olnud tulemuslik, kahjur suri ära/ei surnud ära jne.

Sageli moodustatakse binaarne tunnus algselt pideval skaalal mõõdetud tunnuse väärtuste alusel -- näiteks fikseerides ära piirid normaalse vererõhu tarvis, saab reaalselt mõõdetud vererõhu väärtuste alusel moodustada binaarse tunnuse väärtustega vererõhk on normis/ei ole normis.

Analüüsimiseks esitatakse binaarne tunnus enamasti nö 0-1-tunnusena, st et huvipakkuva sündmuse toimumist tähistatakse arvuga 1 ja sündmuse mittetoimumist arvuga 0. Sellise tähistuse puhul näitab tavaline aritmeetiline keskmine uuritava sündmuse toimumise osakaalu. Näiteks oletades, et kuuest ravitud koerast neli said terveks, ning tähistades terveks saamist ühega ja terveks mittesaamist nulliga -- andmestik, kus kaks esimest koera ei saanud terveks ja neli järgnevat said, on siis kujul {0,0,1,1,1,1} --, annab aritmeetiline keskmine (0+0+1+1+1+1)/6=4/6=2/3 terveks saanud koerte osakaalu (2/3 ehk 66,7% ravitud koertest said terveks).

Et suur osa binaarsete tunnuste analüüsimetoodikast on välja kasvanud epidemioloogiast, kasutatakse teooria esitamisel enamasti ka epidemioloogiast pärit mõisteid.

Näiteks indiviide/objekte, kelle/mille puhul leidis aset uuritav sündmus (a'la lehm jäi tiineks, inimene põdes uuritavat haigust, taimekahjur suri ära, talunik läks pankrotti jne), nimetatakse juhtudeks (ingl. cases, responders) ja neid, kelle/mille puhul uuritavat sündmust ei toimunud, nimetatakse kontrollideks (ingl. controls, nonresponders), mõnikord ka baas- ehk referentsgrupiks (ingl. reference).

Juhul, kui uuritava sündmuse toimumist potentsiaalselt mõjutav või sellega assotsieeruv faktor on kaheväärtuseline (a'la sai ravimit/ei saanud ravimit, on naine/ei ole naine jne), nimetatakse indiviide/objekte, kelle/mille puhul realiseerus faktori huvipakkuv variant (a'la sai ravimit, on naine jne), eksponeerituteks (ingl. exposed), ja ülejäänuid (ei saanud ravimit, ei ole naine jne) mitteeksponeerituteks (ingl. non-exposed). Mitteeksponeerituid ja uuritava sündmuse toimumise sagedust neil käsitletakse enamasti nö baasina, mille suhtes hinnatakse uuritava sündmuse toimumist eksponeerituil.

< Eelmine

Järgmine >

Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License