Õpiobjektid -> Binaarsete tunnuste analüüsimeetodid

BINAARSETE TUNNUSTE ANALÜÜSIMEETODID


Õpiobjekti kirjeldus
Õpijuhis
 
1. Sissejuhatus
2. Binaarse tunnuse seos mittearvulise tunnusega või diskreetse arvtunnusega
3. Binaarse tunnuse seos pideva arvtunnusega
4. Enesekontroll
Lisa
¤ Kogu materjal ühe pdf-failina: bin_tunnuste_analyys.pdf

Diskreetse argumendiga logistiline mudel

Juhul, kui binaarse tunnuse väärtusi soovitakse prognoosida mitte pideva vaid hoopis diskreetse argumendi väärtuste alusel, tuleb ka mudel vastavalt esitada. Seejuures on argumentide suhtes lineaarses mudelis prognoositavaks ikkagi tõenäosuse logit- või probit-funktsiooni väärtus, mudeli paremal poolel sisaldub aga mudeli vabaliige pluss diskreetsete faktorite mõjud, mis on vaja andmetest hinnata.


Peatükkides 2.1-2.7 näitena vaadatud koerte andmestiku puhul on mudel, hindamaks soo mõju ravi tulemusele, logistilise mudelina esitatav kujul

logit(pij) = μ + Si + eij,

kus pij on i. sugu j. koera terveks mittesaamise tõenäosus (i=1,2; j=1,..., 25), μ on mudeli vabaliige, Si on i. soo mõju ja eij on mudeli viga.

Kui mudeli vabaliige ja soo mõjud on andmeist hinnatud, avaldub terveks mittesaamise tõenäosus kujul

.

Võttes isaseks olemise efekti parameetrite ühese hindamise tarvis võrdseks nulliga (isane olemine on sellisel juhul nö baastase ja mudeliga hinnatakse emaseks olemise efekti selle suhtes), tuleb mudeli vabaliikme hinnanguks -1,61 ja emaseks olemise mõju hinnanguks 2,42.

Terveks mittesaamise tõenäosused sõltuvalt koera soost avalduvad kujul

P(haige|sugu=E) = exp(-1,61 + 2,42)/[1 + exp(-1,61 + 2,42)] = 0,69

ja

P(haige|sugu=I) = exp(-1,61 + 0)/[1 + exp(-1,61 + 0)] = 0,17

ning võrduvad arvuliselt terveks mittesaanud koerte suhteliste sagedustega eraldi emaste ja isaste koerte hulgas (vt peatüki 2.2 näite esimene tabel).

Šansside suhe, mis avaldub sarnaselt logistilisele regressioonile mudeli parameetri eksponentfunktsioonina:

OR = exp(2,42) = 11,25,

näitab, et šanss mitte terveks saada on emastel koertel 11,25 korda kõrgem, kui isastel koertel. Ka selle, antud juhul logistilisest mudelist leitud parameetri väärtus, on identne peatükis 2.5 kahemõõtmelisest sagedustabelist leitud šansside suhte väärtusega.

 


< Eelmine

Creative Commons License Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License