"Significant (P < 10e-12) improvements to this work resulted from the reviewers' comments."

Perez-Enciso M. In silico study of transcriptome genetic variation in outbred populations.
Genetics. 2004 Jan;166(1):547-54.

Loengukursused -> Matemaatiline statistika ja modelleerimine


Matemaatiline statistika ja modelleerimine
[Mathematical statistics and modelling]

(DK.0007; 5 EAP; kevad 2010; E)
EMÜ Doktorikool


Üldjutt

Loengud & praktikumid

Eksam Lingid & kirjandus Tarkvara

   

  1. 4.-5. märts, 2010.

Loeng 1. Statistika olemus (andmed, tunnused jm). Populatsioon ja valim. Kirjeldav statistika (arvkarakteristikud, sagedustabelid, joonised).

DK_loeng11_2010.pdf
DK_loeng12_2010.pdf

Praktikum 1. Kirjeldav statistika, andmehaldus ja joonised MS Excel'i vahenditega.

DK_prax1_2010.pdf
Praktikumis analüüsitav andmestik: kalad.xls

Excel 2007 abi:

  1. 11.-12. märts, 2010.

Loeng 2. Teoreetilised jaotused. Hinnangute täpsus (usaldus- ja tolerantsipiirid, standardviga). Hüpoteeside kontrollimine. Keskmiste võrdlemine – t-testid ja nende mitteparameetrilised analoogid.

DK_loeng21_2010.pdf
DK_loeng22_2010.pdf

Praktikum 2. Sissejuhatus R-i. Kirjeldav statistika ja joonised R-s. Kahe grupi võrdlus R-s.

    R-programmist esmase ülevaate saamiseks soovitan lugeda materjali http://www.ms.ut.ee/mart/biomeetria2009/praks1.pdf (lehekülgedel 1-4 ja 10-11 kirjeldatud käske võiks püüda ka ise R-i skripti-aknasse sisestada ja käivitada).
    Analoogne info (ja kohati põhjalikumgi) on inglisekeelsena leitav antud kursuse eelmise aasta 2. praktikumi juhendi lehekülgedelt 1-13 (http://www.eau.ee/~ktanel/DK_0007/DK_prax22_2009.pdf). Soovitan ka seal kirjutatust silmad üle lasta ning püüda mõningaid käske R-s rakendada.

    Edasine praktikumijuhend: DK_prax2_2010.txt ,
    on tekstifail R-i skripti kujul, salvestage see ära ja avage otse R-s (Fail -> Open Script ...). Täitke sealseid käske järkjärgult, lisades soovi korral enesele täiendavaid kommentaare ja täiendades programmi lisaanalüüside jaoks vajalike käskudega.
    Peale töö lõppu on mõttekas täiendatud skript jälle ära salvestada.

    Praktikumis analüüsitav andmestik: studentsR.xls

  1. 18.-19. märts, 2010.

Loeng 3. Keskmiste võrdlemine – t-testid ja nende mitteparameetrilised analoogid. Seosekordajad (Pearsoni, Spearmani ja Kendalli korrelatsioonikordajad). Regressioonanalüüs.

DK_loeng22_2010.pdf
DK_loeng31_2010.pdf

Praktikum 3. R-i lisapakett Rcmdr. Kirjeldav statistika ja joonised; kahe grupi võrdlus.
Lisaks: kahe grupi võrdlus, korrelatsioon- ja regressioonanalüüs ning tingimusvormindamine MS Excel'is.

DK_prax3_2010.pdf
DK_prax3_2010_lisa.pdf
Praktikumis analüüsitavad andmestikud: studentsR.xls, sead.xls

Lisaks: Rcmdr_mooduli_install.pdf
http://socserv.socsci.mcmaster.ca/jfox/Misc/Rcmdr/Getting-Started-with-the-Rcmdr.pdf

  1. 25.-26. märts, 2010.

Loeng 4. Regressioonanalüüs. Sageduste võrdlus hii-ruut test, Fisheri täpne test. Shansside suhe.

(eelmisest korrast pooleli jäänud) DK_loeng31_2010.pdf
DK_loeng4_2010.pdf

Praktikum 4. Tunnuste vaheliste seoste analüüs R-s (sagedustabelid, korrelatsioon- ja regressioonanalüüs).

DK_prax4_2010.pdf
Praktikumis analüüsitav andmestik: studentsR.xls



  1. 8.-9. aprill, 2010.

Loeng 5. Dispersioonanalüüs. Üldised lineaarsed mudelid (mudelite esitus, kontrastid, vähimruutkeskmised, juhuslikud faktorid, segamudelid).

DK_loeng51_2010.pdf
DK_loeng52_2010.pdf

Praktikum 5. Dispersioonanalüüs. Testid ja lineaarsed mudelid R-s.

DK_prax5_2010.pdf
Praktikumis analüüsitavad andmestikud: studentsR.xls, kala.xls

  1. 15.-16. aprill, 2010.

Doktorantide ettekanded, diskussioon.

Praktikum 6. Segamudelid R-s.

DK_prax6_2010.pdf
Praktikumis analüüsitavad andmestikud: saagikus.rda, vasikas.xls

  1. 22.-23. aprill, 2010.

Doktorantide ettekanded, diskussioon.

Praktikum 7. Logistiline regressioon jmt.

DK_prax7_2010.pdf
Praktikumis analüüsitav andmestik: puud.rda

  1. 29.-30. aprill, 2010.

Loeng 6. (Binaarsete tunnuste analüüs, logistiline regressioon, ROC-kõverad.) Katsete planeerimine, valimi mahu määramine. Valik muid (doktorantide ettekannetest kõlama jäänud laiemale kuulajaskonnale kasulikuks osutuda võivaid) analüüsimeetodeid – klasteranalüüs, peakomponentide analüüs; tulemuste esitamine.

DK_loeng6_2010.pdf

Praktikum 8. Peakomponentanalüüs. Klasteranalüüs.

DK_prax8_2010.pdf
Praktikumis analüüsitav andmestik: puud.rda