Pearsoni
e lineaarne korrelatsioonikordaja
Funktsioon
CORREL
Lihtsaim
viis arvtunnuste vahelise lineaarse seose kirjeldamiseks
on korrelatsioonanalüüs.
Kahe
tunnuse vaheline lineaarne e Pearsoni korrelatsioonikordaja
on Exceli keskkonnas leitav funktsioonidega CORREL
ja PEARSON, millele tuleb ühte moodi ette anda
kahe uuritava tunnuse väärtused (Array1
ja Array2). Et ka mõlema funktsiooni
tulemus on sama (sest arvutusvalem on sama ja minule
on arusaamatu, miks neid funktsioone üldse kaks
peab olema), on järgnevalt näidatud vaid
funktsiooni CORREL rakendamist.
Joonisel
44 on kujutatud noormeeste pikkuse ja kehamassi vahelise
korrelatsioonikordaja arvutamist Excelis. Tulemusena
väljastatud lineaarse korrelatsioonikordaja väärtusest
0,46 järeldub, et noormeeste pikkuse ja kehamassi
vahel on keskmise tugevusega positiivne seos - mida
pikemad on noormehed, seda enam nad keskmiselt ka
kaaluvad.
Joonis
44. Noormeeste pikkuse ja kehamassi vahelise lineaarse
korrelatsioonikordaja arvutamine funktsiooniga CORREL.
Protseduur
Correlation
Mitme
tunnuse korral on paarikaupa korrelatsioonikordajate
tabeli (korrelatsioonimaatriksi) arvutamiseks kasutatav
protseduur Correlation (Joonis 45):
-
Data-sakk -> Data Analysis ->
Correlation,
- avanevas
sisestusaknas tuleb määrata:
- Input
Range - algandmete blokk (tunnused peavad paiknema
järjestikustes veergudes ja olema arvulised);
- Grouped
by - määratakse, kas tunnusvektorid
on orienteeritud veerge (Columns, vaikimisi
variant) või ridu pidi (Rows);
- Labels
in First Row - märgitakse nimede või
tähiste olemasolu korral tunnuste bloki esimeses
reas;
- Output
options - määratakse tulemuste väljastamise
asukoht: samale töölehele (Output Range),
uuele töölehele (New Worksheet Ply)
või uude faili (New Workbook).
Tulemuseks
on Exceli töölehele väljastatav kolmnurkse
kujuga korrelatsioonikordajate maatriks.
Joonisel
45 esitatud korrelatsioonanalüüsi tulemustest
ilmneb näiteks, et noormeeste pikkuse ja kehamassi
vahel on keskmise tugevusega positiivne seos (r
= 0,46) - mida pikemad on noormehed, seda enam nad
keskmiselt ka kaaluvad, peaümbermõõdu
ja matemaatika hinde vahel on aga nõrk positiivne
ning jalanumbri ja matemaatika hinde vahel nõrk
negatiivne seos - mida suurem on peaümbermõõt
ja mida väiksem on jalanumber, seda kõrgem
on keskmiselt matemaatika hinne.
Joonis
45. Noormeeste pikkuse, kehamassi, peaümbermõõdu,
jalanumbri ja matemaatika hinde vaheliste lineaarsete
korrelatsioonikordajate arvutamine protseduuriga Correlation.
|