Binaarsete
tunnuste olemus ja kodeerimine
Binaarne
tunnus on tunnus, millel on vaid kaks võimalikku
väärtust (näiteks sugu väärtustega
'isane' ja 'emane').
Katse/uuringu
tulemusena tekivad binaarsed tunnused siis, kui uuritakse
mingi sündmuse toimumist -- a'la lehm tiinestus/ei
tiinestunud, koera ravi oli tulemuslik/ei olnud tulemuslik,
kahjur suri ära/ei surnud ära jne.
Sageli
moodustatakse binaarne tunnus algselt pideval skaalal
mõõdetud tunnuse väärtuste
alusel -- näiteks fikseerides ära piirid
normaalse vererõhu tarvis, saab reaalselt mõõdetud
vererõhu väärtuste alusel moodustada
binaarse tunnuse väärtustega vererõhk
on normis/ei ole normis.
Analüüsimiseks
esitatakse binaarne tunnus enamasti nö 0-1-tunnusena,
st et huvipakkuva sündmuse toimumist tähistatakse
arvuga 1 ja sündmuse mittetoimumist arvuga 0.
Sellise tähistuse puhul näitab tavaline
aritmeetiline keskmine uuritava sündmuse toimumise
osakaalu. Näiteks oletades, et kuuest ravitud
koerast neli said terveks, ning tähistades terveks
saamist ühega ja terveks mittesaamist nulliga
-- andmestik, kus kaks esimest koera ei saanud terveks
ja neli järgnevat said, on siis kujul {0,0,1,1,1,1}
--, annab aritmeetiline keskmine (0+0+1+1+1+1)/6=4/6=2/3
terveks saanud koerte osakaalu (2/3 ehk 66,7% ravitud
koertest said terveks).
Et
suur osa binaarsete tunnuste analüüsimetoodikast
on välja kasvanud epidemioloogiast, kasutatakse
teooria esitamisel enamasti ka epidemioloogiast pärit
mõisteid.
Näiteks
indiviide/objekte, kelle/mille puhul leidis aset uuritav
sündmus (a'la lehm jäi tiineks, inimene
põdes uuritavat haigust, taimekahjur suri ära,
talunik läks pankrotti jne), nimetatakse juhtudeks
(ingl. cases, responders)
ja neid, kelle/mille puhul uuritavat sündmust
ei toimunud, nimetatakse kontrollideks (ingl.
controls, nonresponders),
mõnikord ka baas- ehk referentsgrupiks
(ingl. reference).
Juhul,
kui uuritava sündmuse toimumist potentsiaalselt
mõjutav või sellega assotsieeruv faktor
on kaheväärtuseline (a'la sai ravimit/ei
saanud ravimit, on naine/ei ole naine jne), nimetatakse
indiviide/objekte, kelle/mille puhul realiseerus faktori
huvipakkuv variant (a'la sai ravimit, on naine jne),
eksponeerituteks (ingl. exposed),
ja ülejäänuid (ei saanud ravimit, ei
ole naine jne) mitteeksponeerituteks (ingl.
non-exposed). Mitteeksponeerituid ja uuritava
sündmuse toimumise sagedust neil käsitletakse
enamasti nö baasina, mille suhtes hinnatakse
uuritava sündmuse toimumist eksponeerituil.
|