"Significant (P < 10e-12) improvements to this work resulted from the reviewers' comments."

Perez-Enciso M. In silico study of transcriptome genetic variation in outbred populations.
Genetics. 2004 Jan;166(1):547-54.

Loengukursused -> Matemaatiline statistika ja modelleerimine


Matemaatiline statistika ja modelleerimine
[Mathematical statistics and modelling]

(DK.0007; 5 EAP; kevad; E)
EMÜ Doktorikool


Üldinfo Loengud Praktikumid

Eksam

Lingid

NB! Iseseisvate tööde ja projekti esitamise tähtaeg: 22. mai 2011

Test toimub nädal peale loengute lõppu 5. mail kell 1415 loenguruumis Kr. 5 - 2A12.


Eksam koosneb kolmest osast: iseseisvad tööd (40% punktidest), projekt (40%) ja test (20%).

1. Iseseisvad tööd

DK_ylesanded_2011.pdf


2. Projekt

Suhteliselt lühike (1-2 lk) kirjutis (nö uurimistöö/artikli pisut laiendatud materjali ja metoodika osa), mis võiks sisaldada punkte nagu

  • uurimisvaldkond, püstitud küsimus(ed), hüpoteesid;

  • kuidas ja kas on plaanis (või on need plaanid juba teostatud) koguda andmeid, viia läbi katseid, küsitlusi, mõõta midagi, ...;

  • kui palju (katseid/uuritavaid objekte); miks sellisel hulgal; kuidas valitud; ...

  • mis tüüpi statistikameetodeid kasutatakse/võiks kasutada püstitatud küsimustele vastamiseks kogutud andmete alusel ja miks; või siis arutelu teemal, mida kogutud andmete analüüsid võiksid tulemuseks anda (et kui ei oska veel arvata, mis statistkameetodeid/tarkvara rakendada võiks).
  • ...

3. Test

Valikvastustega test

Toimub paberil ilma abimaterjale kasutamata nädal peale kursuse lõppu neljapäeval 5. mail kell 1415 loenguruumis Kr. 5 - 2A12.
Kellel ei ole sellel ajal võimalik testi sooritada, võtku ühendust ja lepime kokku sobiva aja.

Testi edukaks sooritamiseks peaks omama ülevaadet loengutel ja praktikumides käsitletust. Pisut täpsemalt öeldes peaks mõistma,

  • kuidas arvutatakse ja mille poolest erinevad olulisemad arvkarakteristikud (keskmine, mediaan, standardhälve, kvartiilid); millal kasutada keskmist, millal mediaani; milline on keskmise ja mediaani vahekord ebasümmeetrilise jaotuse korral;
  • mida näitab/mõõdab parameetri standardviga, usaldusintervall, olulisuse nivoo, olulisuse tõenäosus (p-väärtus), testi võimsus;
  • milline näeb välja ja millal tekib normaaljaotus;
  • millistele küsimustele vastamiseks sobib kasutada t-testi, Mann-Whitney e. Wilcoxoni testi, märgitesti, F-testi, Kolmogorov-Smirnovi testi, Hii-ruut testi, Fisheri täpset testi;
  • milleks kasutatakse ja milles seisneb Bonferroni korrektsioon/meetod;
  • milliste ülesannete lahendamiseks sobib kasutada kahemõõtmelist sagedustabelit, Pearsoni või Spearmani korrelatsioonikordajaid, lineaarset regressioonanalüüsi, dispersioonanalüüsi, üldisi lineaarseid mudeleid;
  • millal kasutatakse logistilisi mudeleid (logistilist regressiooni) ja probit-mudeleid (probit-regressiooni); mida näitab shasside suhe (odds ratio), kuidas on see seotud kahemõõtmelise sagedustabeliga ja logistilise regressiooniga;
  • mida näitab mudeli standardviga, mida mitmene korrelatsioonikordaja;
  • mida hindavad lineaarse mudeli parameetrid (regressioonikordaja, dispersioonanalüüsi mudeli parameetrid), mida kontrastid; mis vahe on fikseeritud ja juhuslikel faktoritel;
  • millisel juhul on sobilik kasutada mitmemõõtmelise analüüsi meetodeid nagu klasteranalüüsi, peakomponentanalüüsi, diskriminantanalüüsi.