Õpiobjektid -> Andmeanalüüs MS Excelis (MS Excel 2010 baasil)

ANDMEANALÜÜS MS EXCELIS


Õpiobjekti kirjeldus
Õpijuhis
 
Sissejuhatus
 
Peamised andmeanalüüsi teostamise vahendid MS Excelis
Sagedustabelid
Arvkarakteristikud
Usalduspiirid
Hüpoteeside kontrollimine
(ühe ja kahe üldkogumi võrdlus)
Korrelatsioonanalüüs
Regressioonanalüüs
Kahemõõtmeline sagedustabel
Dispersioonanalüüs
Trikke ja nippe
Lisa
¤ Kogu materjal ühe pdf-failina: stat_excelis.pdf

Pearsoni e lineaarne korrelatsioonikordaja

Funktsioon CORREL

Lihtsaim viis arvtunnuste vahelise lineaarse seose kirjeldamiseks on korrelatsioonanalüüs.

Kahe tunnuse vaheline lineaarne e Pearsoni korrelatsioonikordaja on Exceli keskkonnas leitav funktsioonidega CORREL ja PEARSON, millele tuleb ühte moodi ette anda kahe uuritava tunnuse väärtused (Array1 ja Array2). Et ka mõlema funktsiooni tulemus on sama (sest arvutusvalem on sama ja minule on arusaamatu, miks neid funktsioone üldse kaks peab olema), on järgnevalt näidatud vaid funktsiooni CORREL rakendamist.

Joonisel 44 on kujutatud noormeeste pikkuse ja kehamassi vahelise korrelatsioonikordaja arvutamist Excelis. Tulemusena väljastatud lineaarse korrelatsioonikordaja väärtusest 0,46 järeldub, et noormeeste pikkuse ja kehamassi vahel on keskmise tugevusega positiivne seos - mida pikemad on noormehed, seda enam nad keskmiselt ka kaaluvad.
 

Joonis 44. Noormeeste pikkuse ja kehamassi vahelise lineaarse korrelatsioonikordaja arvutamine funktsiooniga CORREL.
 


Protseduur Correlation

Mitme tunnuse korral on paarikaupa korrelatsioonikordajate tabeli (korrelatsioonimaatriksi) arvutamiseks kasutatav protseduur Correlation (Joonis 45):

  1. Data-sakk -> Data Analysis -> Correlation,
     
  2. avanevas sisestusaknas tuleb määrata:
  • Input Range - algandmete blokk (tunnused peavad paiknema järjestikustes veergudes ja olema arvulised);
  • Grouped by - määratakse, kas tunnusvektorid on orienteeritud veerge (Columns, vaikimisi variant) või ridu pidi (Rows);
  • Labels in First Row - märgitakse nimede või tähiste olemasolu korral tunnuste bloki esimeses reas;
  • Output options - määratakse tulemuste väljastamise asukoht: samale töölehele (Output Range), uuele töölehele (New Worksheet Ply) või uude faili (New Workbook).

Tulemuseks on Exceli töölehele väljastatav kolmnurkse kujuga korrelatsioonikordajate maatriks.

Joonisel 45 esitatud korrelatsioonanalüüsi tulemustest ilmneb näiteks, et noormeeste pikkuse ja kehamassi vahel on keskmise tugevusega positiivne seos (r = 0,46) - mida pikemad on noormehed, seda enam nad keskmiselt ka kaaluvad, peaümbermõõdu ja matemaatika hinde vahel on aga nõrk positiivne ning jalanumbri ja matemaatika hinde vahel nõrk negatiivne seos - mida suurem on peaümbermõõt ja mida väiksem on jalanumber, seda kõrgem on keskmiselt matemaatika hinne.
 

Joonis 45. Noormeeste pikkuse, kehamassi, peaümbermõõdu, jalanumbri ja matemaatika hinde vaheliste lineaarsete korrelatsioonikordajate arvutamine protseduuriga Correlation.

 


< Eelmine

Creative Commons License Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License