"Significant (P < 10e-12) improvements to this work resulted from the reviewers' comments."

Perez-Enciso M. In silico study of transcriptome genetic variation in outbred populations.
Genetics. 2004 Jan;166(1):547-54.

Loengukursused -> Matemaatiline statistika ja modelleerimine


Matemaatiline statistika ja modelleerimine
[Mathematical statistics and modelling]

(DK.0007; 5 EAP; kevad; E)
EMÜ Doktorikool


Üldinfo Loengud Praktikumid

Eksam

Lingid

Eksam koosneb kolmest osast: iseseisvad tööd (40% punktidest), projekt (30%) ja test (30%).

1. Iseseisvad tööd

DK_ylesanded_2013.pdf .


2. Projekt

Suhteliselt lühike (1-2 lk) kirjutis (nö uurimistöö/artikli pisut laiendatud materjali ja metoodika osa), mis võiks sisaldada punkte nagu

  • uurimisvaldkond, püstitud küsimus(ed), hüpoteesid;

  • kuidas ja kas on plaanis (või on need plaanid juba teostatud) koguda andmeid, viia läbi katseid, küsitlusi, mõõta midagi, ...;

  • kui palju (katseid/uuritavaid objekte); miks sellisel hulgal; kuidas valitud; ...

  • mis tüüpi statistikameetodeid kasutatakse/võiks kasutada püstitatud küsimustele vastamiseks kogutud andmete alusel ja miks; või siis arutelu teemal, mida kogutud andmete analüüsid võiksid tulemuseks anda (et kui ei oska veel arvata, mis statistkameetodeid/tarkvara rakendada võiks).
  • ...

Hinnatakse stiilis on / ei ole (30 punkti / 0 punkti).

Asja mõte on püüda panna doktorante ükskõik kas siis reaalselt teostatava või lihtsalt fantaasia viljana sündinud uuringu erinevaid etappe läbi kirjutama
(minu senised kogemused on näidanud arvatust märksa suuremaid probleeme uuringu eesmärkide sõnastamisel, sellest lähtuval uurimis- ja analüüsimeetodite valikul ning tulemuste esitamisel - millest omakorda johtuvad probleemid uurimistulemuste publitseerimisel).

Mina püüan anda lühidalt tagasisidet oma mätta otsast ja võin soovi korral püüda konsulteerida ka suuliselt (sageli on see vähem töömahukas).

NB! Iseseisvate tööde ja projekti esitamise tähtaeg: 28. aprill 2013 (siis jõuan ma loodetavasti mai lõpuks kõik tööd ka üle vaadata :)


3. Test

Valikvastustega test, 30 küsimust.

Toimub paberil ilma abimaterjale kasutamata nädal peale kursuse lõppu esmaspäeval, 1. aprillil, kell 1015-12 loenguruumis Kr. 56 - A310.
Kellel ei ole sellel ajal võimalik testi sooritada, võtku ühendust ja lepime kokku sobiva aja.

Testi edukaks sooritamiseks peaks omama ülevaadet loengutel ja praktikumides käsitletust. Pisut täpsemalt öeldes peaks mõistma,

  • kuidas arvutatakse ja mille poolest erinevad olulisemad arvkarakteristikud (keskmine, mediaan, standardhälve, kvartiilid); millal kasutada keskmist, millal mediaani; milline on keskmise ja mediaani vahekord ebasümmeetrilise jaotuse korral;
  • mida näitab/mõõdab parameetri standardviga, usaldusintervall, olulisuse nivoo, olulisuse tõenäosus (p-väärtus), testi võimsus;
  • milline näeb välja ja millal tekib normaaljaotus;
  • millistele küsimustele vastamiseks sobib kasutada t-testi, Mann-Whitney e. Wilcoxoni testi, märgitesti, F-testi, Kolmogorov-Smirnovi testi, Hii-ruut testi, Fisheri täpset testi;
  • milleks kasutatakse ja milles seisneb Bonferroni korrektsioon/meetod;
  • milliste ülesannete lahendamiseks sobib kasutada kahemõõtmelist sagedustabelit, Pearsoni või Spearmani korrelatsioonikordajaid, lineaarset regressioonanalüüsi, dispersioonanalüüsi, üldisi lineaarseid mudeleid;
  • millal kasutatakse logistilisi mudeleid (logistilist regressiooni) ja probit-mudeleid (probit-regressiooni); mida näitab shasside suhe (odds ratio), kuidas on see seotud kahemõõtmelise sagedustabeliga ja logistilise regressiooniga;
  • mida näitab mudeli standardviga, mida mitmene korrelatsioonikordaja;
  • mida hindavad lineaarse mudeli parameetrid (regressioonikordaja, dispersioonanalüüsi mudeli parameetrid), mida kontrastid; mis vahe on fikseeritud ja juhuslikel faktoritel;
  • millisel juhul on sobilik kasutada mitmemõõtmelise analüüsi meetodeid nagu klasteranalüüsi, peakomponentanalüüsi, diskriminantanalüüsi.
     

Lõpphinne moodustub erinevate eksami osade eest saadud punktide summana.

"A" 90-100%
"B" 80-89,9%
"C" 70-79,9%
"D" 60-69,9%
"E" 51-59,9%
"F" alla 51%