Andmeanalüüs MS Exceli abil


Hüpoteeside kontroll


 

Üldine skeem
   
F-test
Kahe üldkogumi dispersioonide võrdlemine
  
       Kahepoolne hüpotees
  
Ühepoolne hüpotees
       

  
Kahe üldkogumi dispersioonide võrdlemine - F-test

Kahepoolne hüpotees

Et üldjuhul võrreldakse kahe üldkogumi keskväärtusi omavahel omamata mingit eelinformatsiooni dispersioonide kohta, tuleks hüpoteeside kontrolli alustada kahe üldkogumi dispersioonide erinevuse selgitamisega. St., enne t-testi juurde asumist tuleks kontrollida hüpoteeside paari

H0 :
H1 : ,

kus ja on vastavalt esimese ja teise uuritava tunnuse dispersioonid üldkogumil.

MS Excel võimaldab sellist kahepoolset hüpoteesi kontrollida funktsiooni
  FTEST(Array1, Array2)  abil.

Funktsiooni argumentidena tuleb määrata:
  Array1 - esimese valimi andmete blokk;
  Array2 - teise valimi andmete blokk (mõlemad ilma tunnuse nimeta).

Tulemuseks väljastatakse eelnevalt kursoriga määratud lahtrisse olulisuse tõenäosuse p väärtuse. Kui leitud p < 0,05, võib lugeda tõestatuks hüpoteesi H1, st. et varieeruvus kahes võrreldavas üldkogumis on erinev olulisuse nivool 0,05.

Võrreldes näiteks mannaputru armastavate ja seda mittearmastavate tudengite kehakaalude varieeruvust, saame olulisuse tõenäosuseks p = 0,37. Kuna 0,37 > 0,05, siis ei õnnestu meil tõestada kehakaalude varieeruvuse erinevust.

Mannapuder?

Kaal

ei

63

64

88

88

48

57

52

67

ja

54

55

57

62

85

70

60

46

69

55

71

60

85

66

62

52

90

55

60

71

     
    

Üles


  
Kahe üldkogumi dispersioonide võrdlemine - F-test

Ühepoolne hüpotees

Hüpoteesi esimese üldkogumi suuremast varieeruvusest (H1: ) võimaldab kontrollida protseduur F-Test: Two-Sample for Variances 
(Tools -> Data Analysis).

Protseduuri tellimisaknas tuleb täita järgmised väljad:
   Variable 1 Range - suurema aritmeetilise keskmisega valimi andmete blokk;
   Variable 2 Range - väiksema aritmeetilise keskmisega valimi andmete blokk;
   Hypothesized Mean Difference - oletatav keskväärtuste erinevus (vaikimisi null);
   Labels - märgitakse nime või tähise olemasolul andmebloki esimeses reas;
   Alpha - olulisuse nivoo (vaikimisi 0,05);
   Output options - määratakse tulemuste väljastamise asukoht: samale töölehele (Output Range), uuele töölehele (New Worksheet Ply) või uude faili (New Workbook).

Protseduur väljastab tabelina järgmised suurused

Mean Aritmeetiline keskmine
Variance Dispersioon
Observations Valimi maht
df Vabadusastmete arv
F F-statistik
P(F<=f) one-tail Olulisuse tõenäosus
F Critical one-tail F-statistiku kriitiline väärtus ette antud olulisuse nivoo korral

Juhul, kui arvuti poolt väljastatud olulisuse tõenäosus p < 0,05 (0,01; 0,001), võime vastaval olulisuse nivool väita, et varieeruvus esimeses kogumis on suurem kui teises, vastasel juhul oleme sunnitud konstateerima, et ei õnnestunud tõestada uuritava tunnuse suuremat varieeruvust esimeses grupis.
   


Üles


 

ktanel@eau.ee
http://ph.eau.ee/~ktanel/kool_ja_too/
märts, 2000