Õpiobjektid -> Sissejuhatus üldiste lineaarsete mudelite teooriasse

SISSEJUHATUS ÜLDISTE LINEAARSETE MUDELITE TEOORIASSE


Õpiobjekti kirjeldus
Õpijuhis
 
Sissejuhatus
1. Põhimõisted
 
2. Üldiste lineaarsete mudelite ja faktorite liigitus
3. Üldise lineaarse mudeli esitused
4. Keskväärtused ja dispersioonid
5. Eeldused ja kitsendused
6. Fikseeritud efektide hindamine (BLUE)
7. Juhuslike faktorite realiseerunud väärtuste prognoosimine (BLUP)
 
8. Dispersioonikomponentide hindamine
9. Enesekontroll
Lisa
¤ Kogu materjal ühe pdf-failina: Yldine_lineaarne_mudel.pdf

Juhuslike faktorite realiseerunud väärtuste prognoosimine (BLUP)

Et juhuslikud efektid pole konstandid, nagu fikseeritud efektid, vaid kujutavad enesest mingist jaotusest pärinevaid juhusliku suuruse (juhusliku faktori) realiseerunud väärtusi, tuleb nende hindamisel arvestada ka selle jaotuse dispersiooniga (ehk teisiti väljendatuna, juhuslike efektide poolt määratud osaga uuritava tunnuse koguvarieeruvusest). Mudeli (4) korral tähendab see dispersioonimaatriksite (8) teadmist.

Juhul, kui dispersioonimaatriks (8) on teada, avaldub juhuslike faktorite realiseerunud väärtuste vektori u parim lineaarne nihketa prognoos (BLUP, best linear unbiased prediction) kujul

,
(19)

kus on fikseeritud efektide üldine vähimruutude hinnang. Seejuures tehakse siin inglisekeelses kirjanduses selget vahet sõnadel hinnang (estimate) ja prognoos (prediction) -- hinnatakse midagi fikseeritut, konstantset, prognoositakse aga midagi, mille ilmnemine sõltub juhusest.

Fikseeritud efektide hindamine ning juhuslike efektide prognoosimine valemite (17) ja (19) alusel nõuab vaatluste dispersioonimaatriksi V (8) pöördmaatriksi leidmist, milline operatsioon võib vähegi suurema andmestiku korral problemaatiliseks kujuneda. Üks 20. sajandi suurimaid segamudelite ja aretusteooria arendajaid C. Henderson pakkus 1950. aastal välja normaalvõrrandile (12) sarnase maatriksvõrduse, mis võimaldab korraga leida nii BLUE() kui ka BLUP(u) ja seda ilma vaatluste dispersioonimaatriksit pööramata. Tänapäeval tuntaksegi järgnevat maatriksvõrdust Hendersoni segamudeli võrrandina (või lihtsalt segamudeli võrrandina, inglisekeeles mixed model equation, MME):

.
(20)

Traditsioonilise segamudeli korral, kus vealiikmele ja juhuslikele efektidele vastavad disper-sioonimaatriksid R ja G esituvad kujul (9) ja (10), on võrrand (20) kirjutatav ka kujul

,
(21)

millest

.

Kuna praktikas sageli dispersioonimaatrikseid võrrandis (20) või dispersioonikomponente võrrandis (21) teada pole, tuleb need enne efektide prognoosimist andmetest hinnata, misjärel tehakse segamudeli võrrandis asendused ja (ehk ja ). On tõestatud, et juhul, kui uuritav tunnus on sümmeetrilise jaotusega (näiteks normaaljaotusega), on selliselt saadud fikseeritud efektide hinnangud ning juhuslike efektide prognoosid nihketa hinnangud BLUE()-le ja BLUP(u)-le.

Segamudeli võrrandis on juhuslikele efektidele vastavad read/veerud lineaarselt sõltumatud ega vaja hinnangu ühesuseks erinevalt fikseeritud efektidest lisakitsenduste rakendamist (lisakitsendused võivad olla endiselt vajalikud fikseeritud efektide hindamisel).

Andmaks pisut ettekujutust, mis vahe on faktori mõjude hinnanguil sõltuvalt sellest, kas käsitleda faktorit fikseerituna või juhuslikuna, vaatleme lihtsaimat dispersioonanalüüsi mudelit, mis sisaldab vaid vabaliiget ja üht diskreetset faktorit u:

.
(22)

Käsitledes faktorit u fikseerituna, võime parima lineaarse nihketa hinnangu [valem (13)] faktori u tasemele ui kirjutada kujul

,
(23)

kus ja ni tähistab vaatluste arvu faktori i. tasemel -- seega on vaid üht faktorit sisaldava dispersioonanalüüsi mudeli korral iga faktori mõju hinnanguks temale vastavate uuritava tunnuse väärtuste aritmeetilise keskmise erinevus üldkeskmisest .
Lugedes aga u juhuslikuks, avaldub tema i. taseme mõju ui parim lineaarne nihketa prognoos (19) seosena

.
(24)

Valemite (23) ja (24) võrdlemisel hakkab silma, et juhuslike efektide hinnangud on alati väiksemad, võrreldes fikseeritud efektide hinnangutega (sest ). Seejuures kehtib intuitiivselt mõistetav loogika -- mida tugevam on faktori mõju, seda sarnasemad on fikseeritud ja juhusliku mudeli eeldusel leitud efektide hinnangud (seda suurem on dispersioonikomponendi väärtus võrreldes jääkvarieeruvusega ). Samuti nähtub valemeist (23) ja (24), et faktori i. tasemel sooritatud mõõtmiste arvu ni suurenedes väheneb erinevus selle taseme mõju hinnangute ja (leituna vastavalt kas fikseeritud või juhuslikust mudelist) vahel.


Näide 12. Käsitleme nüüd mudeliga (1) kirjeldatud tallede võõrutusmassi näiteanalüüsis jäära mõju juhuslikuna (andmestikus oleva kahe jäära ja nende kokku üheksa järglase alusel hinnatavad isa mõjud esindavad vaid juhuslikku väljavõtet kõigist isalt järglasele päranduda võivatest geenikomplektidest). Mudeli fikseeritud ja juhuslikele efektidele vastavad plaanimaatriksid on

ja

ning hinnatavate parameetrite vektorid esituvad kujul

ja .

Üheste lahendite saamise huvides võrdsustame nulliga fikseeritud faktorite viimaste tasemete mõjud (, ) ning eemaldame neile vastavad veerud plaanimaatriksist X, saades maatrikstehete läbiviimisel kasutatava täisastakuga plaanimaatriksi

.

Et juhuslike efektide u ja e dispersioonimaatriksid on diagonaalsel kujul (11), on mudeli parameetrid hinnatavad segamudeli võrrandist (21). Viimase rakendamiseks vajaliku dispersioonikomponentide suhte saab avaldada tallede võõrutusmassi päritavusest h2, lugedes viimase teadaolevaks:

.

Võttes , saame .

Seega avaldub segamudeli võrrandi (21) kordajate maatriksi parem alumine nurk kujul

ning kogu segamudeli võrrand on peale plaanimaatriksite korrutamistehete sooritamist järgmine:

.

Selle võrrandi lahendina saame parameetrite hinnangute vektori

.

Võrreldes fikseeritud mudelist saadud hinnangutega (18)

on ootuspäraselt vähenenud jääradevaheline erinevus -- on ju jäära mõjuga seletatav võõrutusmasside erinevus 19 korda väiksem juhusliku vea arvele jäänud varieeruvusest (), mis, nagu nähtus valemeist (23) ja (24), toob kaasa väiksemad juhuslike isamõjude hinnangud. Loomulikult muutusid tänu mudeli muutmisele mingil määral ka fikseeritud efektide hinnangud, aga faktorite tasemete järjestus jäi endiseks -- jäär-tallede võõrutusmass on suurem; suurima võõrutusmassiga on üksiktalled, seejärel kaksik- ja kolmiktalled; võõrutusvanuse kasvades suureneb ka tallede võõrutusmass.


Eelnevas näites rakendatud mudelit, kus uuritava tunnuse geneetilist determineeritust väljendava juhusliku faktorina käsitletakse isa ning ülejäänud faktorid on fikseeritud ja kirjeldavad mitte aditiivgeneetilisi mõjusid, nimetatakse põllumajandusloomade aretuses isa mudeliks (inglise keeles sire model). Lähemalt isa mudelist ja ka teistest segamudeli rakendustest geneetiliste parameetrite hindamisel teistes õppematerjalides.

 


< Eelmine

Creative Commons License Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License