Õpiobjektid -> Binaarsete tunnuste analüüsimeetodid

BINAARSETE TUNNUSTE ANALÜÜSIMEETODID


Õpiobjekti kirjeldus
Õpijuhis
 
1. Sissejuhatus
2. Binaarse tunnuse seos mittearvulise tunnusega või diskreetse arvtunnusega
3. Binaarse tunnuse seos pideva arvtunnusega
4. Enesekontroll
Lisa
¤ Kogu materjal ühe pdf-failina: bin_tunnuste_analyys.pdf

ROC-kõver

Juhul, kui uuritava sündmuse toimumise prognoosimine toimub mingi pideva argumendi/protsessi alusel, võib tundlikkuse ja spetsiifilisuse leida iga pideva argumendi väärtuse korral - võib ju klassifitseerimise aluseks olevaks piirväärtuseks (ingl. threshold, puntiirjoon järgneval joonsel) valida mistahes argumendi väärtuse ja lugeda iga kord kokku õigesti ja valesti prognoositud juhtude arvu ning arvutada ka tundlikkuse ja spetsiifilisuse.


Näiteks prognooside tudengi sugu nädalas keskmiselt tarbitava õllekoguse alusel, on võimalikeks õllekoguse piirväärtusteks, mille kohalt jagada tudengid meesteks ja naisteks, kõik andmestikus esinevad õllekogused. Õigesti ja valesti klassifitseeritud mees- ja naistudengite arvud ning tundlikkused ja spetsiifilisused sõltuvalt piirväärtuseks valitud õllekogusest on esitatud järgnevas tabelis.

Õlu (l)*
TP
TN
FP
FN
Tundlikkus
Spetsiifilisus
0
22
0
42
0
1
0
0,3
20
27
15
2
0,909
0,643
0,5
20
29
13
2
0,909
0,690
1
16
35
7
6
0,727
0,833
1,5
14
39
3
8
0,636
0,929
2
13
39
3
9
0,591
0,929
3
11
42
0
11
0,5
1
3,5
9
42
0
13
0,409
1
4
8
42
0
14
0,364
1
5
7
42
0
15
0,318
1
6
2
42
0
20
0,091
1
10
1
42
0
21
0,045
1

* Nädalas keskmiselt tarbitav õllekogus, millest alates klassifitseeritakse tudeng meheks.


ROC-kõver (ingl. receiver operating characteristic curve) või üldisemalt ROC-analüüs on erinevatele argumendi väärtustele vastavate tundlikkuse ja spetsiifilisuse paaride graafiline esitus hindamaks optimaalseimat piirväärtust ja prognoosi täpsust. Enamasti on sellel joonisel tundlikkuse väärtused y-teljel ning üks miinus spetsiifilisuse e valepositiivsete määra väärtused x-teljel. Joonise diagonaal vastab olukorrale, kus sõltumata argumendi väärtusest on tundlikkus ja spetsiifilisus võrdsed 0,5-ga, ehk mil uuritava sündmuse toimumine on juhuslik sõltumata argumendi väärtusest.


Tudengite näitele vastav ülaltoodud tabeli alusel joonistatud ROC-kõver on järgmine:

Kui iga tudengi puhul ennustada tema sugu näiteks kulli ja kirja viskamise teel, on ennustuse täpsus 0,5 (50%) ja sõltumata piirväärtuseks valitavast õllekogusest peaks ROC-kõvera punktid paiknema joonise diagonaalil.


Nimetus ROC-kõver (ingl. receiver operating characteristic curve) on pärit II Maailmasõja päevilt, mil Suurbritannia insenerid võtsid selle meetodi kasutusele hindamaks oma ja vaenlase lennukite jm sõjatehnika eristamise täpsust vastuvõetud radarisignaalide alusel.

Mõnikord tõlgendatakse lühendit ROC-kõver ka (testi/mudeli/algoritmi/tehnoloogia) suhtelise toimimise karakteristikute kõverana (ingl. relative operating characteristic curve), sest tegu on kahe nn toimimise karakteristiku (tõeselt positiivsete ja valepositiivsete määra) võrdluskõveraga.

 


< Eelmine

Creative Commons License Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License