Punktdiagrammide
maatriks
Mitmed
statistikapaketid võimaldavad enam kui kahe
arvtunnuse vaheliste seoste uurimisel konstrueerida
nö punktdiagrammide maatriksi, kus peadiagonaail
paiknevad erinevad tunnuste väärtuste jaotumist
kirjeldavad joonised.
Näiteks
R-i poolt käsuga scatterplot.matrix
vaikimisi konstrueeritav joonis kolmele tunnusele
on järgmine:
Muidugi
saab antud joonist R-s kujundada, tellides
diagonaalile muid joonised jmt. Joonise enam oma soovidele
vastavaks tegemiseks võib osutuda mõttekaks
konstrueerida ja kujundada kõik üheksa
joonist eraldi ning ühendada nad seejärel
ühte graafikaknasse
Huvi
pärast proovisin konstrueerida analoogse joonise
ka Exceli abil, kasutamata seejuures ühtki
joonistamisvahendit (tekstikasti, joonisele käsitsi
lisatavaid kaste/jooni jmt).
Täpsemalt
oli soov esitada iga tunnuste paari kohta punktdiagramm
koos regressioonisirgega ning peadiagonaalil tunnuste
histogrammid koos vastavate normaaljaotuse tihedusfunktsiooni
graafikutega.
Tulemus:
Põhimõtteliselt
saaks sellele joonisele lisada ka regressioonivõrrandid
vmt, aga need tuleks algandmetel eraldi välja
arvutada ja siis joonisele lisada (erinevalt R2-väärtustest,
mis ka antud joonise tarvis teisendatud andmete korral
algandmetega analoogsed tulevad ning mis seetõttu
ka Excelil automaatselt joonistele lisada on
lastud).
Samuti
saaks punktdiagrammide telgedele lisada ühikud
(lisades telgesid moodustavatele joontele aluseks
olevatesse abitabelitesse mõned koordinaadid
ka telgede otspunktide vahelt), aga algandmete skaalal
arvude saamiseks tuleb need ükshaaval telgedele
juurde kirjutada (või siis kasutada keerukamate
jooniste tegemisel väga kasulikku aadressilt
http://www.appspro.com/Utilities/ChartLabeler.htm
tasuta allalaaditavat lisamoodulit "XY Chart
Labeler").
Toodud
joonise tegemine võttis aega oma 10 tundi (mitte
järjest), esimesed kolm tundi oli huvitav, edasise
tegevuse juures oli suur roll jonnil ja põikpäisusel
(järgmine analoogne joonis saaks muidugi valmis
vaid mõne tunniga).
Seejuures
on väga oluline enne joonise aluseks olevate
abitabelite tegemist skitseerida soovitav joonis paberile
ning märkida sinna täpselt juurde iga alamjoonise
algus- ja lõpp-punkti koordinaadid tegelikus
teljestikus, et nende alusel arvutada väärtused
joonisele kantavatele andmeseeriatele.
Kokku
on sellele 9-st alamjoonisest koosnevale joonisele
kantud 17 andmeseeriat (vt kõrvalolevat joonist)
- kuus andmeseeriat punktdiagrammide tarvis pluss
kuus andmeseeriat punktdiagrammide telgede tarvis,
kolm andmeseeriat joonise diagonaalil paiknevate normaaljaotuse
kõverate tarvis ning kaks andmeseeriat histogrammide
tarvis (neist üks, joonisel nö läbipaistvaks
muudetu, määrab ära kõrguse,
kust joonisel näha olevad tulbad pihta hakkavad).
Kasutusel
on kaks horisontaalset ja kaks vertikaalset telge
(neist üks komplekt tulpdiagramme esitavate andmeseeriate
jaoks - sellisel juhul on x-telg diskreetne - ja teine
pideva x-teljega komplekt punktdiagrammide tarvis).
Lisaks
veel kuus trendijoont ja neile vastavat determinatsioonikordajat
(R2) ning kuue andmepunkti väärtused,
mis on muudetud alamjooniste telge nimetusteks.
Soovi
korral võib Exceli faili koos joonise
ja kõigi selle aluseks olevate abitabelite
ja arvutustega alla laadida siit:
scatterplot_matrix.xlsx
(ühilduvuspakett
Excel 2003 tarvis http://www.microsoft.com/downloads/en/details.aspx?familyid=941b3470-3ae9-4aee-8f43-c6bb74cd1466&displaylang=en).
|