Andmeanalüüs MS Exceli abil


Hüpoteeside kontroll


 

Üldine skeem
   
t-test
Keskväärtuste võrdlemine võrdse dispersiooniga üldkogumite korral Keskväärtuste võrdlemine mittevõrdse dispersiooniga üldkogumite korral Kahe üldkogumi keskväärtuste võrdlemine sõltuvate vaatluste korral
  
P
rotseduur
t-Test: Two Sample Assuming Equal Variances
  
Funktsioon TTEST
  
P
rotseduur
t-Test: Two Sample Assuming Unequal Variances
  
Funktsioon TTEST
  
Protseduur
t-Test: Paired Two Sample for Means
  
Funktsioon TTEST

  
Kahe üldkogumi keskväärtuste võrdlemine - t-test

Keskväärtuste võrdlemine võrdse dispersiooniga üldkogumite korral

Kui funktsiooni FTEST poolt väljastatud olulisuse tõenäosus p >= 0,05, oleme sunnitud jääma nullhüpoteesi juurde, st. et varieeruvus kahes võrreldavas üldkogumis on ühesugune. 
Sellisel juhul saame nende üldkogumite keskväärtusi võrrelda protseduuri t-Test: Two Sample Assuming Equal Variances abil.

Protseduuri tellimisaknas tuleb täita järgmised väljad:
   Variable 1 Range - suurema aritmeetilise keskmisega valimi andmete blokk;
   Variable 2 Range - väiksema aritmeetilise keskmisega valimi andmete blokk;
   Hypothesized Mean Difference - oletatav keskväärtuste erinevus (vaikimisi null);
   Labels - märgitakse nime või tähise olemasolul andmebloki esimeses reas;
   Alpha - olulisuse nivoo (vaikimisi 0,05);
   Output options - määratakse tulemuste väljastamise asukoht: samale töölehele (Output Range), uuele töölehele (New Worksheet Ply) või uude faili (New Workbook).

Rakendades seda protseduuri F-testi peatüki lõpus vaadeldud mannaputru armastavate ja mittearmastavate tudengite kaalude erinevuse selgitamiseks, täidame väljad tellimisaknas

ja saame tulemuseks järgmise tabeli:

t-Test: Two-Sample Assuming Equal Variances  
Variable 1 Variable 2
Mean  65.875 64.250
Variance  226.125 138.724
Observations  8 20
Pooled Variance 162,255
Hypothesized Mean Difference 0
df  11
t Stat 0.305
P(T<=t) one-tail 0.381
t Critical one-tail 1.796
P(T<=t) two-tail 0.762
t Critical two-tail 2.055
  
  
  
Aritmeetilised keskmised
Dispersioonid
Valimite mahud
Ühendatud valimi dispersioon
Oletatav keskmiste erinevus
Vabadusastmete arv
t-statistik
Olulisuse tõenäosus ühepoolse hüpoteesi korral
t-statistiku kriitiline (tabeli) väärtus etteantud olulisuse nivoo ja ühepoolse hüpoteesi korral
Olulisuse tõenäosus kahepoolse hüpoteesi korral
t-statistiku kriitiline (tabeli) väärtus etteantud olulisuse nivoo ja kahepoolse hüpoteesi korral

Saadud tulemuste põhjal veendume, et tudengite kehakaal ei sõltu nende mannapudrulembusest, sest vastav olulisuse tõenäosus p = 0,796 > 0,05. Samuti ei saa me väita, et mannaputru süüa armastavate tudengite kehakaal oleks oluliselt suurem (p = 0,381).
  


Üles


  
Keskväärtuste võrdlemine mittevõrdse dispersiooniga üldkogumite korral

Kui funktsiooni FTEST poolt väljastatud olulisuse tõenäosus p < 0,05, võime lugeda tõestatud sisuka hüpoteesi üldkogumite erinevast varieeruvusest. 
Sellisel juhul saame nende üldkogumite keskväärtusi võrrelda protseduuri 
 t-Test: Two Sample Assuming Unequal Variances abil.

Protseduuri sisend ja väljund on analoogsed eelneva (keskmiste võrdlemisel t-testiga võrdsete dispersioonide korral kasutatud) protseduuriga. Vaid väljundtabelis on üks rida vähem - et dispersioonid on erinevad, ei kasutata arvutamisel enam ühendatud valimi dispersiooni (Pooled Variance).
   


Üles


   
Kahe üldkogumi keskväärtuste võrdlemine sõltuvate vaatluste korral

Sõltuvate valimite (mõõdetud on ühtesid ja samu objekte, enne ja pärast teatavat "katset") keskväärtuste võrdlemiseks on kasutatav protseduur
 t-Test: Paired Two Sample for Means.

Protseduuri sisend ja väljund on jällegi analoogsed eelnevate (keskmiste võrdlemisel t-testiga võrdsete või mittevõrdsete dispersioonide korral kasutatud) protseduuridega. Vaid väljundtabelis on nimetuse Pearson Correlation taga ära toodud võrreldavate tunnuste vaheline Pearsoni seosekordaja.
   


Üles


  
Kahe üldkogumi keskväärtuste võrdlemine - t-test

Funktsioon TTEST(Array1,Array2,Tails,Type)

Kahe üldkogumi keskväärtuste võrdlemiseks nii sõltuvate kui ka sõltumatute vaatluste ning nii võrdsete kui ka mittevõrdsete dispersioonide korral on kasutatav ka funktsioon TTEST(Array1,Array2,Tails,Type).

Funktsiooni argumentidena tuleb sisestada:

   Array1 - esimese valimi andmete blokk;
   Array2 - teise valimi andmete blokk (mõlemad ilma tunnuse nimeta);
   Tails - hüpoteesi tüüp (1 - ühepoolne, 2 - kahepoolne hüpotees);
   Type - määratakse, millist tüüpi eeldusega on tegu: 1 - sõltuvad valimid, 
             2 - võrdsed dispersioonid, 3 - erinevad dispersioonid.

Kontrollides siin kahepoolset hüpoteesi (Tails = 2) tudengite kehakaalude erinevuse kohta sõltuvalt nende mannapudru lembusest ja arvestades eelnevat F-testi tulemust (dispersioonid on võrdsed - Type = 2), saame tulemuseks olulisuse tõenäosuse p = 0,76 (keskmised ei ole erinevad), mis langeb kokku eelnevalt protseduuriga t-Test: Two Sample Assuming Equal Variances saadud tulemustega.
   


Üles


 

ktanel@eau.ee
http://ph.eau.ee/~ktanel/kool_ja_too/
märts, 2000