Binaarne tunnus kui fiktiivne muutuja
Ankeetküsitluse
puhul, kus ühele küsimusele võib
anda mitu vastust, tuleks andmete analüüsimiseks
tekitada ühest küsimusest nii mitu vaid
kahe üksteist välistava vastusevariandiga
alamküsimust, kui palju on algsel küsimusel
vastusevariante. Näiteks kui küsimuses talu
tegevusala kohta võib talu tegevusalaks märkida
'turismi', 'loomakasvatuse' või 'taimekasvatuse'
või ükskõik millise kombinatsiooni
antud tegevusaladest, a'la 'turism, loomakasvatus'),
tuleks andmetabelisse tekitada kolm nulle ja ühtesid
väärtustena kasutavat fiktiivset binaarset
tunnust (ingl. dummy variable),
millest esimene märgib seda, kas talu tegevusalaks
on turism või mitte, teine seda, kas talu tegevusalaks
on loomakasvatus või mitte, ja kolmas seda,
kas talu tegevusalaks on taimekasvatus või
mitte (vt järgnevat tabelit).
Tegevusala
|
->
|
Turism
|
Loomakasvatus
|
Taimekasvatus
|
Turism
|
1
|
0
|
0
|
Turism,
loomakasvatus
|
1
|
1
|
0
|
Loomakasvatus
|
0
|
1
|
0
|
Loomakasvatus,
taimekasvatus
|
0
|
1
|
1
|
Mõnikord
esitatakse üks mitmeväärtuselise tunnus
seeria binaarsete tunnustena ka siis, kui igas andmetabeli
reas saab olla vaid üks väärtus. Näiteks
uurides teatud veeselgrootsete esinemist sõltuvalt
setetest veekogus (liiv, savi, turvas), võib
veeru 'Setted' alusel moodustada kolm nulle ja ühtesid
sisaldavat veergu 'Liiv, 'Savi', 'Turvas' (vt järgnevat
tabelit). Taoline esitus annab võimaluse teostada
lihtsalt võrdlusi 'liivased vs mitteliivased'
vmt, samuti on taoline esitus mõttekas mõnede
mitmemõõtmeliste statistikameetodite
puhul.
Setted
|
->
|
Liiv
|
Savi
|
Turvas
|
Liiv
|
1
|
0
|
0
|
Savi
|
0
|
1
|
0
|
Liiv
|
1
|
0
|
0
|
Turvas
|
0
|
0
|
1
|
|