93
VILNIAUS UNIVERSITETO KAUNO HUMANITARINIO FAKULTETO INFORMATIKOS KATEDRA Verslo informatikos studijų programa Kodas 62409P104 GEDIMINAS BŪZIUS MAGISTRO BAIGIAMASIS DARBAS BAJESO METODO TAIKYMAS KREDITO RIZIKOS VALDYME Kaunas 2010

VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

VILNIAUS UNIVERSITETO

KAUNO HUMANITARINIO FAKULTETO

INFORMATIKOS KATEDRA

Verslo informatikos studijų programa

Kodas 62409P104

GEDIMINAS BŪZIUS

MAGISTRO BAIGIAMASIS DARBAS

BAJESO METODO TAIKYMAS KREDITO RIZIKOS VALDYME

Kaunas 2010

Page 2: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

VILNIAUS UNIVERSITETO

KAUNO HUMANITARINIO FAKULTETO

INFORMATIKOS KATEDRA

GEDIMINAS BŪZIUS

MAGISTRO BAIGIAMASIS DARBAS

BAJESO METODO TAIKYMAS KREDITO RIZIKOS VALDYME

Leidţiama ginti __________________ Magistrantas _________________________________

(parašas)

Darbo vadovas _______________________________

(parašas)

dr. doc. Gintautas Garšva

Darbo įteikimo data ___________________________

Registracijos Nr. _____________________________

Kaunas 2010

Page 3: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

3

TURINYS

Iliustracijos ............................................................................................................................................... 4

Lentelės ..................................................................................................................................................... 4

Sutrumpinimai .......................................................................................................................................... 5

ĮVADAS ................................................................................................................................................... 6

MOKSLO TIRIAMOJO DARBO PLANAS ........................................................................................... 8

1. ANALITINĖ DARBO DALIS ......................................................................................................... 11

1.1. Kreditų rizikos vertinimo pagrindinės sąvokos ir principai .............................. 11

1.2. Pavienių kreditų rizikos vertinimas ................................................................... 16

1.3. Kredito suteikimo procesas ............................................................................... 16

1.4. Kredito rizikos valdymo ciklas .......................................................................... 18

1.5. Rizikos padengimas ........................................................................................... 22

1.6. Rizikos išmatavimas .......................................................................................... 23

1.7. VaR .................................................................................................................... 23

1.8. Scenarijaus technikos ........................................................................................ 23

1.9. Kredito rizikos vertinimo metodai ..................................................................... 24

1.10. Tiesinė diskriminantinė analizė ir kiti vertinimo balais metodai ...................... 24

1.11. Dirbtinis intelektas ir mašininis mokymas ........................................................ 26

1.12. Dirbtiniai neuroniniai tinklai ............................................................................. 31

1.13. Atramos vektorių mašinos (SVM) ..................................................................... 37

1.14. Bajeso metodas .................................................................................................. 40

1.15. KNN .................................................................................................................. 44

1.16. Medţių algoritmai ............................................................................................. 44

1.17. Evoliuciniai skaičiavimai .................................................................................. 45

1.18. Neraiškios aibės ir ekspertinės sistemos ............................................................ 47

1.19. Klasifikavimo metodų tarpusavyje palyginimas ............................................... 47

1.20. Analitinės dalies išvados ................................................................................... 58

2. BAJESO METODU PAREMTO EKSPERIMENTO APRAŠYMAS ............................................ 60

2.1. Naudojamų duomenų ir programinės įrangos aprašymas.................................. 60

2.2. Eksperimente naudojami metodai ..................................................................... 63

2.3. Eksperimentinio tyrimo metodikos aprašymas ................................................. 64

2.4. Eksperimentas ir jo rezultatas ............................................................................ 67

2.5. Gautų rezultatų apibendrinimas ......................................................................... 72

2.6. Tolimesnis eksperimentinis tyrimas (straipsnis) ............................................... 73

IŠVADOS IR PERSPEKTYVOS .......................................................................................................... 75

LITERATŪRA ....................................................................................................................................... 77

Priedai ..................................................................................................................................................... 80

1 priedas. Sistemoje naudojamų duomenų aprašymas ir duomenų bazės schema ................................. 80

2 priedas. Sektoriui priklausančios rinkos .............................................................................................. 84

3 priedas. Klasių priskyrimui atrinkti rodikliai naudojant genetinę paiešką .......................................... 86

4 priedas. Mokslinis tiriamasis straipsnis „Credit risk evaluation using SVM and Bayesian

Classifiers“ pristatytas IVUS15 konferencijoje ...................................................................................... 88

Page 4: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

4

ILIUSTRACIJOS

1 pav. Išduotų paskolų Lietuvoje augimo tendencijos ........................................................................ 15

2 pav. Kredito patvirtinimo proceso eiga ............................................................................................ 16

3 pav. Rizikos valdymo ciklas ............................................................................................................. 19

4 pav. Kreditų monitoringo procesas ................................................................................................... 21

5 pav. Kredito rizikos vertinimo bei monitoringo sąsaja..................................................................... 22

6 pav. Klasifikavimo ir klasterizavimo metodai .................................................................................. 29

7 pav. Biologinis (kairėje) ir dirbtinis neuronai .................................................................................. 31

8 pav. Neuronų perdavimo funkcijos .................................................................................................. 32

9 pav. Adaptyvios sistemos kūrimas ................................................................................................... 32

10 pav. Sluoksniuotas (kairėje) ir nesluoksniuotas neuroniniai tinklai ................................................. 33

11 pav. Radialinių bazinių (gausinių) funkcijų naudojimas .................................................................. 34

12 pav. Klasterizavimas naudojant Viscovery® SOMine ..................................................................... 35

13 pav. Tiesinis SVM ............................................................................................................................ 38

14 pav. Bajeso tinklas ............................................................................................................................ 43

15 pav. Kryţminimo (kairė) ir mutacijos operatorių, taikomų genetiniuose algoritmuose, iliustracija 45

16 pav. Genetinio programavimo pavyzdys .......................................................................................... 46

17 pav. 33 klasifikavimo algoritmų atliktų klaidų vidurkiai ................................................................. 48

18 pav. 15 geriausių klasifikavimo algoritmų vertinant tikslumą ir greitį ............................................ 49

19 pav. Testavimo duomenys ................................................................................................................ 51

20 pav. Eksperimento rezultatai pagal vertinimo kriterijus ................................................................... 52

21 pav. Eksperimento rezultatai pagal sprendimo problemas ............................................................... 53

22 pav. Eksperimento rezultatai (BNN ir SVM) ................................................................................... 56

23 pav. Klasifikavimo rezultatai (BNN ir SVM) .................................................................................. 57

24 pav. Sistemos duomenų srautų diagrama ......................................................................................... 61

25 pav. Galima modelio kūrimo veiksmų sekos diagrama .................................................................... 62

26 pav. Sistemos išvedami rezultatai ..................................................................................................... 69

27 pav. Duomenų uţkrovimo ir filtravimo langas sistemoje................................................................. 69

28 pav. Sistemos langas, kur parenkamas klasifikatorius, nurodomi parametrai bei pateikiami gauti

rezultatai ................................................................................................................................................. 70

29 pav. Eksperimento rezultatų suvestinė ............................................................................................. 73

30 pav. Klaidos Type 1 ir Type 2 ......................................................................................................... 74

LENTELĖS

Darbo atlikimo preliminari eiga ............................................................................................................. 10

Teiginiai apie kreditų monitoringą ......................................................................................................... 19

ANN taikymas kreditų rizikai vertinti .................................................................................................... 35

SVM taikymas kreditų rizikai vertinti pastaraisiais metais .................................................................... 39

Kompanijų skirstymas į 9 sektorius ....................................................................................................... 60

Eksperimento metu gautų rezultatų suvestinė lentelė ............................................................................ 71

Page 5: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

5

SUTRUMPINIMAI

AI/DI – angl. artificial intelligence/liet. dirbtinis intelektas

Branduolys (angl. Kernel) – funkcija, pagal duotus du taškus grąţinanti jų panašumą

BVP – bendrasis vidaus produktas

CPU – centrinis procesorius (kompiuterio)

DB – duomenų bazė

DNN/ANN – dirbtinis neuroninis tinklas (angl. Artificial Neural Network)

DT – sprendimų medis (angl., decision tree)

EAD – turto praradimo dydis įsipareigojimų neįvykdymo atveju (angl., Exposure at default)

EL, UL – numatytasis ir nenumatytasis nuostoliai, atitinkamai angl. expected ir unexcpected loss

Fuzzy logika – neraiškioji (angl. fuzzy) logika

GA – genetinis algoritmas (angl. Genetic Algorithm)

Ghz, Mhz – gigahercas, megahercas

KNN – artimiausio k kaimyno metodas (angl., k-nearest neighbor)

LGD – nuostolio ir pozicijos vertės santykis, išreikštas procentais (angl., Loss given default)

MCMC – Markov Chain Monte Carlo (paieškos metodas)

ML – mašininis mokymas (angl. Machine Learning)

NN –neuroninis tinklas (angl. Neural Network)

PD – įsipareigojimų neįvykdymo tikimybė (angl., Probability of default)

RAM - tiesioginės kreipties atmintis (angl., random-access memory)

RBF – radialinės bazės funkcija (angl. Radial Basis Function)

SOM – saveorganizuojantis ţemėlapis (angl. Self-Organizing Map)

SQL – uţklausų kūrimo kalba, naudojama duomenų bazėse (Structurized Query Language)

SV – atraminis vektorius (angl. Support vector)

SVM – atramos vektorių mašinos (angl. Support Vector Machines)

VaR – vertės pokyčio rizika (angl., Value-at-Risk)

VU KHF – Vilniaus universiteto Kauno humanitarinis fakultetas

Page 6: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

6

ĮVADAS

Kredito rizikos vertinimas yra viena svarbiausių sričių bankininkystėje, kreditų unijų

veikloje ir kitose finansų veiklose (pavyzdţiui, akcijų rinkose), kurios pagrindinis uţdavinys yra

rizikos, atsirandančios kreditoriui išduodant paskolą kuriam nors konkrečiam kredituojamam

fiziniam ar juridiniam asmeniui, nustatymas bei įvertinimas, tam naudojant įvairius matematinius

metodus bei modelius. Norint įvertinti rizikingumą, naudojami įvairūs modeliai, metodai bei

algoritmai, skirti tokių duomenų analizei bei organizacijų klasifikavimui bei rangavimui pagal

rizikos grupę. Išsivysčius dirbtinio intelekto sričiai (angl. Artificial Intelligence, sutr. AI), atsirado

galimybė šioje srityje naudoti ir AI metodus, tokius, kaip neuroniniai tinklai, genetiniai algoritmai,

saviorganizuojantys tinklai (self-organizing maps), neraiškioji (fuzzy) logika, Bajeso, medţių

algoritmai bei kiti, o taip pat ir hibridiniai (apimantys dvi ar daugiau paminėtų sričių) metodai.

Tyrimo tema aktuali tuo, kad kreditų rizikos analizė bei valdymas yra svarbūs klausimai

finansinėms institucijoms, teikiančioms paskolas tiek verslo objektams, tiek ir individualiems

asmenims. Bankų blogai įvertintos rizikos ilgalaikiams kreditams gali privesti jį prie bankroto, o

sėkminga bankų veikla parodo ekonominį šalies ar didesnio regiono stiprumą. Tyrimo sritis šiuo

metu gana plačiai nagrinėjama visame pasaulyje, galima paminėti tokius šaltinius, kaip

„defaultrisk.com“, „gloriamundi.org“, skirtus kredito bei finansinei rizikai, bei „CiteSeer“ ar IEEE

duomenų bazę, kurios moksliniai straipsniai glaudţiai siejasi su informacinėmis technologijomis.

Šiose mokslinėse duomenų bazėse galima rasti straipsnių, vienu ar kitu aspektu susijusiu su

nagrinėjama tema. Lietuvoje ši sritis nagrinėjama taip pat plačiai, taikant įprastinę metodiką.

Nagrinėjamos krypties kontekste galima išskirti Vilniaus universiteto Kauno Humanitarinio

fakulteto (VU KHF) mokslininkų įnašą. Pagrindinis tyrimo privalumas būtų tas, kad jo rezultatus

būtų galima pritaikyti ir praktiškai, kuriant ekspertinę sistemą, kurią būtų galima naudoti tiek

moksliniais tikslais, tiek ir praktikoje, realizuojant ją kaip konkretaus banko informacinės sistemos

atskirą modulį.

Darbo objektas – Bajeso metodo taikymas kredito rizikos valdyme.

Darbo tikslas – pritaikyti Bajeso metodą kredito rizikos valdyme.

Siekiant iškelto tikslo, yra apibrėţiami tokie darbo uždaviniai:

1. Atlikus informacijos šaltinių tyrimą, apibrėţti kredito rizikos valdymo esminius aspektus ir

problemines sritis bei aprašyti metodus šioms problemoms spręsti;

2. Pagal anksčiau atliktus tyrimus ir palyginamąsias analizes įvertinti Bajeso metodo tinkamumą

kredito rizikos vertinimui;

Page 7: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

7

3. Bajeso metodo panaudojimo kredito rizikos vertinime galimybių atvejų stebėjimas ir jų

analizavimas;

4. Praktiškai patikrinti atlikto tyrimo kokybinį įvertinimą:

Sumodeliuoti ir suprojektuoti AI Bajeso metodą, naudoti kredito rizikos vertinimui;

Realizuoti sumodeliuotą sistemą;

Ištirti ir įvertinti gautuosius empirinio tyrimo rezultatus, palyginti su alternatyvių

sistemų gautais rezultatais.

5. Patvirtinti arba paneigti ginamuosius teiginius (darbinę tyrimo hipotezę);

6. Pateikti pasiūlymus, susijusius su nagrinėjama tema.

Metodologiniai metodai naudoti darbe:

Visuotinio paţinimo metodas (darbo tikslų nustatymas, uţdavinių formulavimas, informacijos

apie dirbtinio intelekto metodus kredito rizikos vertinimui rinkimas ir analizė; duomenų

apibendrinimas; išvadų formulavimas).

Bendrieji mokslinio tyrimo metodai:

indukcijos metodas (darbo išvadų formulavimas);

dedukcijos metodas (naudotinas nuo bendro sprendimo prieiti prie atskirų dalių);

palyginimo metodas (metodų charakteristikų, panašumų ir skirtumų palyginimas).

Duomenų analizės metodas (esamos situacijos vertinimas).

Modeliavimo metodas (programinės realizacijos projektavimas ir modeliavimas).

Apibendrinimo metodas (naudojamas medţiagos grupavimui, apibendrinimui bei išdėstymui).

Abstrakcijos metodas – juo remiantis, daromos kiekvienos darbo dalies ir galutinės viso darbo

išvados.

Darbą sudaro trys pagrindinės dalys – analizės dalis, eksperimentinės sistemos tyrimo dalis bei

eksperimentinė dalis. Kiekvienoje iš šių dalių pateikiama atitinkama informacija apie atliekamą tyrimą

ir kuriamą informacinę sistemą:

Analizės dalyje aprašyta nagrinėjama problema, apţvelgtos pagrindinės su ja susijusios

sąvokos, klausimai bei ankstesni tyrimai, pasirinktas metodas, pagal kurį bus atliktas tyrimas.

Eksperimento dalyje iškelti techniniai reikalavimai būsimai sistemai, apibrėţtos funkcijos,

kurias ji turi atlikti, pateikiama jos koncepcinė schema ir aptariamos jos išplėtimo ateityje galimybės;

aprašomas su sukurta informacine sistema atliktas tyrimas, pateikiami jo rezultatai bei pasiūlymai

tolimesniam tyrimui.

Darbe naudota interneto medţiaga, moksliniai straipsniai, paskaitų konspektai apie kredito

riziką, finansus bei intelektinius metodus. Darbą sudaro x puslapių, x lentelių, x iliustracijų bei x priedų.

Page 8: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

8

VILNIAUS UNIVERSITETO KAUNO HUMANITARINIO FAKULTETO

INFORMATIKOS KATEDRA

VERSLO INFORMATIKOS MAGISTRANTŪROS PROGRAMOS

MOKSLO TIRIAMOJO DARBO PLANAS

Magistrantas: Gediminas Būzius, tel.: 863428301; 868611753

Magistrantūros trukmė nuo 2008m. iki 2010m.

TEMA: Bajeso metodo taikymas kreditų rizikos valdyme

Vadovas: Gintautas Garšva, daktaras, docentas, Vilniaus universiteto Kauno humanitarinio

fakulteto informatikos katedra, 8 37 750539

Darbo anotacija:

Tikslas: išnagrinėti dirbtinio intelekto taikymo kredito rizikos valdyme galimybes ir pritaikyti

Bajeso metodą.

Uţdaviniai: Atlikti informacijos šaltinių tyrimą; Rastų dirbtinio intelekto metodų, o svarbiausia

Bajeso tinklų, panaudojimo kredito rizikos vertinime galimybių atvejų stebėjimas ir jų

analizavimas; Pagal anksčiau atliktus tyrimus ir palyginamąsias analizes įvertinti geriausiai

tinkantį(-čius) kredito rizikos vertinimui dirbtinio intelekto metodą, įskaitant Bajeso metodą;

Praktiškai patikrinti atlikto tyrimo kokybinį įvertinimą; Patvirtinti arba paneigti ginamuosius

teiginius (darbinę tyrimo hipotezę); Pateikti pasiūlymus, susijusius su nagrinėjama tema.

Metodai, kuriuos ketinama ištirti ir panaudoti darbe: darbe bus tiriamas Bajeso metodas, o taip pat

kiti dirbtinio intelekto metodai, kurie jau buvo panaudoti kreditų rizikai valdyti ar panaudoti

analogiškai klasifikacijai.

Laukiami rezultatai: magistrinis mokslinio tiriamojo darbo aprašas ir Bajeso metodo principu

veikianti sistema kreditų rizikai vertinti.

Mokslo - tiriamojo darbo planas

Semestras (data) Užduotys

S1 2008

rudens

Preliminarios magistrinio darbo temos formulavimas. Literatūros šaltinių parinkimas ir

esamos padėties apţvalga, įvertinant, kas jau yra ištirta, kas ţinoma. Literatūros šaltinių

analizė, grupavimas, pagrindinių idėjų apţvalga. Tikslus darbo problemos formulavimas.

Darbo objekto, darbo tikslo ir uţdavinių numatymas. Magistrinio darbo preliminaraus

plano parengimas. Pirmojo darbo etapo ataskaitos paruošimas.

S2 2009

pavasario

Teorinės darbo problemos sprendimo medţiagos ruošimas. Išsami esančių metodų,

algoritmų, sprendimų analizė. Jų lyginamoji analizė: privalumai, trūkumai ir kritika.

Pasiūlyti naują programinį sprendimą (įgalinantį Bajeso metodą). Išsamus jų aprašymas,

preliminarus siūlomo sprendimo skyriaus parengimas.

S3 2009

rudens

Eksperimentinės tyrimo metodikos ruošimas. Eksperimentinės aplinkos formavimas

Bajeso metodui realizuoti. Duomenų eksperimentiniam tyrimui rinkimas, apdorojimas ir

įvertinimas. Eksperimentinio tyrimo atlikimas. Preliminarus eksperimentinio tyrimo

rezultatų įvertinimas. Preliminarių išvadų formulavimas.

S4 2010

pavasario

Teorinio skyriaus papildymas, remiantis atliktais eksperimentais ir naujausiais literatūros

šaltiniais. Išvados apie gautų rezultatų praktinį pritaikymą. Apibendrinančių išvadų,

pasiūlymų bei rekomendacijų rengimas. Magistrinio darbo įvado (galutinės redakcijos),

santraukos (uţsienio kalba), literatūros ir šaltinių sąrašo parengimas. Galutinis

magistrinio darbo sutvarkymas

Magistrantas ................................... Vadovas: .................................................. (parašas) (parašas)

Page 9: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

9

Visi darbo uţdaviniai bus atliekami iš eilės pateikta tvarka, arba, esant galimybei,

lygiagrečiai vienas su kitu (pavyzdţiui, sistemos kūrimas bei metodikos analizė; sistemos kūrimas ir

testavimas). Darbas turi būti atliktas per dvejus metus.

Pirmiausias ir svarbiausias uţdavinys yra išnagrinėti turimą informaciją bei tą jos dalį, kuri

iki šiol buvo praktiškai neprieinama. Tam bus atrenkami moksliniai straipsniai iš keleto minėtų

duomenų bazių ar paieškos sistemų. Visa literatūra kruopščiai atrenkama, grupuojama ir

sisteminama, jog tiktų kitiems tiriamojo darbo etapams.

Toliau, ištyrus iki šiol padarytus darbus, atrinkti labiausiai dėmesio vertus dirbtinio intelekto

metodus, kurie būtų taikomi kreditų rizikos vertinime, o tarp jų ir Bajeso tinklus. Išsiaiškinti kaip

sėkmingai naudojami dirbtinio intelekto metodai kreditų rizikos vertinimui, o tam didţiąja dalimi

bus remiamasi iki tol atliktais tyrimais ir jų rezultatais iš nagrinėtų straipsnių. Taip pat bus

atsiţvelgta į galimybę tuos metodus ir jų algoritmus realizuoti. Metodų efektyvumas turėtų būti

vertinamas pagal jų realizacijų eksperimentinius rezultatus, pavyzdţiui, atsiţvelgiant į tai, kiek

procentiškai kreditorių įvertino teisingai arba ne, taip pat, jei įmanoma palyginti metodų

realizavimo sudėtingumą, jų darbo laiką vertinant riziką ir kitus aspektus.

Po to, remiantis turimomis išvadomis, turėtų būti kuriama konkreti programinė realizacija

informacijos empiriniam patikrinimui atlikti (ji gali būti kuriama ir lygiagrečiai, jei tai bus

įmanoma) arba esamų ne komercinių atvirojo kodo programinių paketų pritaikymas. Projektavimui

ir modeliavimui bus panagrinėta jau sukurta nemokama programinė įranga, pvz., Weka aplinkoje, į

kurią bus integruota jau turima duomenų bazė su finansiniais organizacijų duomenimis.

Duomenys saugomi MySQL duomenų bazėje, kuri preliminariai jau sudaryta VU KHF

doktoranto P.Danėno, tik ji gali būti papildoma naujais duomenimis. Sukūrus sistemą, ją testuoti, o

vėliau atlikti lyginamąją analizę su kitomis realizacijomis, pvz., kad ir su minėta P.Danėno sukurta

realizacija JAVA kalboje, kuri remiasi SVM metodu kreditų rizikai vertinti pagal firmų finansinius

duomenis. Jei pavyks, šios sistemos gali būti apjungtos, o taip pat sukurta realizacija gali būti

palyginta su analogiškomis Bajeso tinklus įgalinančiomis laisvai prieinamomis atvirojo kodo

realizacijomis, kurių sąrašas ir nuorodos į juos pateikiamos:

www.kdnuggets.com/software/bayesian.html. Realizuota sistema, pateikiant jai įvedimo duomenis

(finansinius organizacijos duomenis) turėtų tą organizaciją tik priskirti prie mokios, vidutinės

rizikos arba nemokios.

Galutinis darbo ţingsnis – atlikti ginamųjų teiginių patvirtinimą arba atmetimą, be to,

pateikti konkrečius pasiūlymus, kokie tyrimo aspektai galėtų būti patvirtinti praktikoje.

Darbo atlikimo preliminari eiga pagal darbo uţdavinius pateikiama ir 1 lentelėje.

Page 10: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

10

1 lentelė

Darbo atlikimo preliminari eiga

Eil.

nr. Veikla/ Laiko intervalai 2008.11.01 2008.12.30 2009.04.30 2009.05.31 2009.09.30 2010.04.30 2010.05.31

1 Informacijos šaltinių tyrimas

2 Metodų stebėjimas ir analizė

3 Tarpusavio metodų palyginimas

4 Ekspertinės sistemos

modeliavimas ir projektavimas

5 Sistemos tyrimas ir įvertinimas

6 Ginamųjų teiginių patvirtinimas

arba paneigimas

Page 11: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

11

1. ANALITINĖ DARBO DALIS

Šiame skyriuje pateikiama literatūros apţvalga ir analizė, aprašant kreditų rizikos vertinimo

ir valdymo aspektus, išvardijant kreditų rizikos vertinimo matematinius ir dirbtinio intelekto

metodus bei juos aprašant, o taip pat pateikiant kai kurių iš jų panaudojimo atvejai šiai problemai

spręsti. Pabaigoje pateikiami įvairių autorių tyrimai metodų klasifikavimo galimybėms įvertinti ir

pateikiamos šios dalies išvados.

1.1. Kreditų rizikos vertinimo pagrindinės sąvokos ir principai

Finansinės organizacijos, prieš teikdamos paskolą, daţniausiai stengiasi surinkti apie savo

klientus visą įmanomą finansinę informaciją, kurią naudoja, norėdami įvertinti galimos rizikos lygį.

Ši informacija paprastai apima įvairius finansinius duomenis, tokius, kaip ketvirčių ar metų

galutiniai balansai, pelno ataskaitos ir kiti rodikliai, parodantys tuometinę bendrovės ar asmens

finansinę būklę.

Vertinant bet kokią riziką, svarbu atsiminti, kad kiekvienu atveju ji apima du pagrindinius

aspektus: nepatikimumą ir pavojų prarasti investuotas lėšas bei neapibrėţtumą. Kredito rizikos

atveju, ją vertindama finansinė institucija turi apsvarstyti tris klausimus [1]:

1. įsipareigojimų nevykdymo tikimybė (angl. probability default) – kokia galimybė,

kad kita šalis nevykdys savo įsipareigojimų jų gyvavimo metu arba tam tikru jų

laikotarpiu, pavyzdţiui, metais. Vienu metų laikotarpiu šis rodiklis gali būti

apibrėţiamas kaip tikėtinas įsipareigojimų nevykdymo dažnis;

2. kredito praradimas (angl. credit exposure) – kokio dydţio bus neapmokėta skola, kai

atsiras įsipareigojimų nevykdymas iš skolininko pusės;

3. atgavimo rodiklis (angl. recovery rate) – kokia prarasto kredito dalis įsipareigojimų

nevykdymo atveju gali būti susigrąţinta per bankroto procedūrą ar kitą atsiskaitymo

būdą.

Teikiant kai kuriuos kreditus, reikia atlikti papildomus veiksmus [11]:

kai paskolą teikia keli bankai kartu (sindikuota paskola), prieš sudarydamas

sutartį su kitais bankais kiekvienas bankas turi įvertinti kredito riziką,

numatyti paskolos teikimo sąlygas ir kt.;

kredituodamas investicinius ir panašius projektus, bankas įvertina ne tik

ekonominę projekto sėkmę, bet ir technines jo įgyvendinimo galimybes, taip

pat teisinius, aplinkosaugos ir kitus veiksnius, projekto plano laikymąsi. Jei

banko darbuotojams nepakanka ţinių, kad jie galėtų visapusiškai įvertinti

Page 12: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

12

projektą, bankas turėtų samdyti reikiamą kvalifikaciją turinčius

nepriklausomus ekspertus;

paskolų su banku susijusiems asmenims teikimo sąlygas ir tvarką patvirtina

banko stebėtojų taryba. Tokios paskolos neturėtų viršyti banko stebėtojų

tarybos nustatytų dydţių. Paskolų teikimo sąlygos šiems asmenims negali

būti palankesnės nei kitiems banko skolininkams;

banke turėtų būti numatytos procedūros susijusiems skolininkams nustatyti, o

paskolos jiems turėtų būti teikiamos pagal iš anksto nustatytą tvarką (Bazelio

bankų prieţiūros komiteto parengto dokumento (BCBS 2000c) 7 principas).

Kredito rizikoje taip pat naudojama ir sąvoka „kredito kokybė“, apibūdinanti skolininko

galimybę atsiskaityti uţ įsipareigojimą. Ji apima tiek skolininko įsipareigojimų nevykdymo

tikimybę, tiek ir atgavimo rodiklį [1].

Algoritminių metodų naudojimą kredito rizikos vertinimui galima apibrėţti sąvoka „kreditų

rizikos modeliavimas“, kuri apima tokias sritis, kaip tradicinė kreditų analizė, metodai ir modeliai,

naudojami įvertinti derivatyvas, bei portfelių kredito rizikos matavimus, naudojamus viso obligacijų

portfelio analizei [1]. Svarbu pabrėţti ir tai, kad kai kuriais atvejais kredito rizikos vertinimas yra

komplikuotas, unikalus, taip pat gali būti ir tokių atvejų, kai riziką geriau vertinti maţiau formaliu

metodu. Pats kreditų kokybės vertinimo procesas apibrėţiamas kaip kredito analizė ir apima kredito

rizikos vertinimą tiek algoritmiškai, tiek ir maţesnio formalumo metodais, o asmenys, atliekantys šį

procesą, įvardinami kaip kredito analitikai. Šie asmenys pagal gautą informaciją apie būsimą

skolininką įvertina kredito išdavimo galimybę, remdamiesi metiniais ir ketvirčių balansais, pajamų

ataskaitomis, verslo šakos, kurioje veikia tiriamas subjektas, galimybėmis, ekonomine šalies

situacija, įvairiais rodikliais ir kitais kriterijais, ir tuo remdamiesi sudaro kredito reitingą, kuriuo

skolininką priskiria vienai ar kitai grupei pagal jo galimybes grąţinti kreditą. Šiuo reitingu

remiantis, kreditorius gali atlikti kredito išdavimo sprendimus. Tokius reitingus kitoms įmonėms

kuria ir pasaulyje ţinomos bendrovės Fitch ratings, Moody‘s, Dunn & Bradstreet, Standard &

Poor‘s ir kt., kurių reitingai pasaulyje yra vertinami ir pripaţįstami įvairių finansinių institucijų,

teikiančių kreditavimo paslaugas.

Įprastai bankai labiausiai koncentruojasi į pavienių kreditų rizikos vertinimą, t.y., prieš

suteikiant kreditą įvertinamos skolininko galimybės jį grąţinti, suteikus kreditą stebima, kaip

skolininkas vykdo įsipareigojimus bankui ir kokia yra rizika bei galimas nuostolis bankui, jei

įsipareigojimai nebus tinkamai vykdomi. Bet egzistuoja ir viso kreditų portfelio rizika, kurią taip

pat privalu vertinti ir valdyti – tai kreditų koncentracijos rizika, kuri susidaro būtent dėl pavienių

kreditų koreliacijos. Kreditų koncentracijos rizika bankuose atsiranda dėl įvairių prieţasčių: kai

Page 13: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

13

kurie bankai specializuojasi tam tikrose veiklos srityse (kredituodami įmones, uţsiimančias

konkrečia ekonomine veikla), taip siekdami tapti rinkos lyderiais. Bankui pasirinkus tokią veiklos

strategiją, kreditų koncentracijos rizika neišvengiama. Dėl didelės konkurencijos, siekdami

neprarasti turimos rinkos dalies ar didesnio turto augimo, bankai gali būti priversti prisiimti didesnę

koncentracijos riziką. Kartais kreditų koncentracijos rizika susidaro dėl to, kad, atsiradus kokiai

nors sparčiai augančiai ekonominei veiklai, bankai labai teigiamai vertina jos perspektyvas ir tikisi

uţdirbti didesnį nei vidutinis pelnas (pavyzdţiui, iš turto kainų kilimo, didesnės kreditų marţos ar

mokesčių). Kredito koncentracijos rizika gali atsirasti ir nuo dėl banko nepriklausančių prieţasčių,

pavyzdţiui, rinkos, kurioje veikia bankas, maţumo. Šios rizikos egzistavimas – tai galimybė bankui

patirti santykinai didelį (palyginti su banko kapitalu, turtu, pajamomis ar, jei tai galima išmatuoti,

bendra banko prisiimta arba jam priimtina rizika) nuostolį iš kreditų, jog sutriktų normali banko

veikla.

Valdydamas kreditų portfelio riziką bankas siekia didţiausio pelno esant tam tikrai rizikai

arba maţiausios rizikos esant konkrečiam pelnui. Tai darydamas bankas gali būti pasyvus arba

aktyvus, t. y. pasirinkti vieną arba kitą strategiją [11]:

1. Pasyvi. Tai tradicinis poţiūris į paskolų portfelio rizikos valdymą: suteiktos paskolos

laikomos iki jų grąţinimo termino pabaigos, bankas nekeičia jau suteiktų paskolų

portfelio sudėties. Laikantis pasyvios strategijos, paskolų portfelio rizika iš esmės

valdoma tik taikant limitus, t. y. nesuteikiant per daug paskolų vienam skolininkui,

susijusiems ar ta pačia ekonomine veikla uţsiimantiems skolininkams. Pasyvios

strategijos laikosi dauguma bankų.

2. Aktyvi. Bankas, išlaikydamas dalį paskolų iki jų grąţinimo termino pabaigos,

aktyviai keičia paskolų portfelio sudėtį, kad gautų didţiausią pelną, esant priimtinai

rizikai. Taikomos tokios priemonės, kaip paskolų pardavimas, paskolų keitimas

vertybiniais popieriais (angl., securitisation), paskolų draudimas, taip pat išvestinės

finansinės priemonės. Banke, kuris pasirenka aktyvią strategiją, paprastai įsteigiamas

struktūrinis padalinys, atsakingas uţ paskolų portfelio rizikos valdymą.

Laikantis pasyvios strategijos, kreditų portfelio rizika daugiausia valdoma taikant limitus.

Kredito rizikos limitai gali būti klasifikuojami įvairiais būdais [12]:

riziką ribojantys ir informuojantys limitai. Nustatant kredito riziką ribojančius

limitus siekiama riboti prisiimamą riziką, tačiau tuo pat metu daroma įtaka veiklos

rezultatams, tiksliau jos apimčiai ir pelningumui.

apimties ir rizikos įvertinimu pagrįsti limitai. Toks limitų skirstymas pagrįstas

dvejopais kreditų koncentracijos rizikos mato vienetais. Apimties limitai nustatomi

Page 14: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

14

atsiţvelgiant į kreditų dydį, pavyzdţiui, limitas didţiausiam kreditui vienam

skolininkui nustatomas kaip tam tikras banko kapitalo procentas. Apimties limitai

pagrįsti prielaida, kad rizika tiesiogiai proporcinga kredito dydţiui, tačiau dėl kreditų

rizikos koreliacijos taip nėra. Nustatant rizikos įvertinimu pagrįstus limitus

atsiţvelgiama į kredito riziką lemiančius veiksnius: kredito dydį, įsipareigojimų

neįvykdymo tikimybę, nuostolį neįvykdţius įsipareigojimų, kredito trukmę.

absoliutūs ir santykiniai limitai. Dauguma limitų yra santykiniai, paprastai

skaičiuojami kaip tam tikras banko kapitalo procentas. Absoliutaus limito pavyzdys

yra ilgiausia kredito trukmė, didţiausia tam tikro kredito suma;

išankstiniai ir paskesni limitai. Limitai gali skirtis pagal tai, kada į juos

atsiţvelgiama, t. y. prieš suteikiant kreditą ar jį suteikus. Tačiau į daugumą, jei ne į

visus kreditui taikytinus limitus, turėtų būti atsiţvelgiama prieš suteikiant kreditą, t.

y. įvertinama, kaip pasikeis banko kreditų portfelis ir kreditų koncentracijos rizika,

jei bus suteiktas naujas kreditas.

Plačiau apie kreditų koncentracijos rizikos svarbą, vertinimą ir valdymą rašoma [12]

šaltinyje, o vystymosi raida ir populiariausi darbai iki 1998 metų paminėti [13]. Nors kreditoriams

svarbu vertinti ir valdyti abu minėtus rizikos aspektus (pavienius ir koncentracijos), šio tiriamojo

darbo objektas yra pavienių kreditų rizikos vertinimas ir valdymas. Apie paskolų portfelio riziką

daugiau aprašo V.Valvonis straipsnyje „Šiuolaikinis kredito rizikos vertinimas banke: paskolų

portfelio rizika ir ekonominio kapitalo paskirstymas“, Pinigų studijos 2006/2, apţvalginiai

straipsniai.

Vien Lietuvoje, kur pagal Statistikos departamento prie Lietuvos respublikos vyriausybės

pateiktus 2008 metų duomenis gyvena 3366400 ţmonių, kurių finansinius reikalus vienaip ar kitaip

sieja 11 bankų:

AB bankas „Snoras“

Danske Bank A/S Lietuvos filialas

AB DnB NORD bankas

UAB Medicinos bankas

Nordea Bank Finland Plc Lietuvos skyrius

AB Parex bankas

AB SEB bankas

AB „Swedbank“

AB Šiaulių bankas

Page 15: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

15

AS UniCredit Bank Lietuvos skyrius

AB Ūkio bankas

Šių bankų įvairios paskirties paskolų likučiai nominalia verte (pagal Bankų asociacijos

2009-06-09 pateiktus duomenis) fiziniams asmenims yra 28,03 milijardai litų, apytiksliai 8327 litų

vienam ţmogui. Juridiniams asmenims bankai yra išdavę maţdaug 40,25 milijardus litų.

Šaltinyje [14] pateiktos paskolų išdavimo tendencijos 2001-2007 metams (1 paveikslas).

Kreditų išdavimo tendencijos kiekvienais metais vis labiau augo iki pastarosios ekonominės

recesijos visame pasaulyje. Iš aukščiau pateiktų duomenų matoma, kad ir 2008 metais paskolų

dydis išaugo.

Šaltinis: [14]

1 pav. Išduotų paskolų Lietuvoje augimo tendencijos

Paskolų augimas paaiškinamas per bankinių struktūrų ir ekonomikos plėtojimąsi, kuris turi

taip vadinamą finansinio akseleratoriaus efektą, kuris cituojant [14]: „<...> sustiprina verslo ciklo

svyravimus. Pirmajame etape dėl bankų kredito didėjimo ekonomikos augimas būna ţenkliai

spartesnis. Antrajame etape, kai verslo ciklas pereina į lėtėjimo fazę, daţnai kreditą pradedama

normuoti, kyla palūkanų normos, stabilizuojasi arba ima maţėti turto kainos, tampa akivaizdi bankų

prisiimta kredito rizika (Ramanauskas, 2005). Tai neigiamai veikia ūkio plėtrą, gali sukelti

finansinę krizę.“, kas pasitvirtino vėliau 2008 metų pabaigoje. Ţlugo nemaţai bankų visame

pasaulyje, kaip pavyzdţiui, 2009 metų geguţę didţiausias bankrutavęs Amerikos bankas

BankUnited FSB, kuris jau buvo 34-as bankrutavęs Amerikos bankas (informacija pateikta

Amerikos bankų prieţiūros tarnybos), o daugeliui didţiųjų Jungtinių Amerikos ir kitų šalių bankų

reikėjo valstybės paramos, t.y., finansinių injekcijų be kurių bankai būtų kapituliavę. Šią finansinę

krizę kai kas vadina kreditų krize, kurią sukėlė didelės išduotų kreditų sumos su netinkamai

Page 16: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

16

įvertinta rizika. Pastarieji faktai tik dar labiau pabrėţia šios tiriamojo darbo ir kreditų rizikos

vertinimo srities aktualumą.

Apie dalies (šešių konkrečiai neįvardintų) Lietuvos bankų kreditų ir kreditų portfelių rizikos

valdymo principus, naudojamus metodus ir politiką galima rasti [11] šaltinyje.

1.2. Pavienių kreditų rizikos vertinimas

Kreditų (paskolų) teikimas – tai pagrindinė įprasto banko veikla. Jog paskolos būtų

sėkmingai teikiamos, bankui neuţtenka vien tik turėti finansinių išteklių, bet reikia ir informacijos

apie skolininkus, jų kredito riziką, t.y., finansiniai ištekliai yra būtina, bet ne vienintelė sąlyga,

norint gauti pelno iš paskolų teikimo. Sėkmę teikiant paskolas gali lemti įvairi informacija:

bendrieji duomenys apie skolininką, duomenys apie skolininko ankstesnių įsipareigojimų vykdymą,

skolininko finansiniai duomenys, skolininko veiklos efektyvumo, jo patikimumo, reputacijos

įvertinimas, rinkos ir šalies, kurioje veikia skolininkas, rizikos įvertinimas, informacija apie

paskolos grąţinimo uţtikrinimo priemones ir kita [15].

Finansinę riziką būtų galima skirstyti į tris grupes, t.y., riziką investuojant į valiutų birţas,

riziką investuojat į vertybinius popierius (akcijas, obligacijas ir pan.) ir kreditų rizika (įvairių

paskolų suteikimas), kuri šiuo atveju yra pagrindinis šio darbo objektas, o koncentruojamasi į

kreditų suteikimą įvairioms kompanijoms (įvairiems juridiniams asmenims), kredito teikėjas –

bankas, tačiau tai aktualu ir kitoms kreditus teikiančioms unijoms.

1.3. Kredito suteikimo procesas

Pagal Austrijos banką Oesterreichische Nationalbank (OeNB) ir Austrijos ministeriją [16]

įvairioms bendrovėms (įmonėms, organizacijoms) paskolos teikiamos daugiau ar maţiau panašiu

formaliu procesu, kuris suskaidytas ir pateiktas 2 paveiksle.

Kredito suteikimo sprendimo

įgyvendinimas

ApiforminimasRizikos analizavimas

PatvritinimasDokumentacijaĮkeičiamo turto ir rizikos

įvertinimas

Derybos

Paskolos

įvertinimas

Duomenų

surinkimas ir

peržiūra

Susipažinimas

su debitoriumi ir

jo veikla

- kontaktavimas

- pirmosios kliento

informacijos

įvertinimas

-susitikimai

-apklausa

- dokumentų

užklausos

- informacijos

surinkimas

- patikimumo

įvertinimas

- patikrinti valdžios

(autoriteto) sutikimą

- paruošti sutartis

- jas pasirašyti

- teikti apsaugą

- išmokų peržiūrėjimas

- išmokėjimas

- tolimesnis tyrimas

- sprendimo

priėmėjo

patvirtinimas

- užpildyti paskolos

paraišką

- parengti kredito

asignavimą

- perduoti kredito

bylą

(dokumentaciją)

- išnagrinėti objektą

- nustatyti paskolos vertę

- įvertinti galimus

nuostolius

- dokumentų peržiūra

- paskesnis paskolų

valdytojo tyrimas

-kredito reitingavimas

- su kreditu susijusių

faktorių

dokumentavimas

Šaltinis: sukurta autoriaus, remiantis [16]

2 pav. Kredito patvirtinimo proceso eiga

Page 17: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

17

Informacija apie debitorių gaunama įvairiais būdais ir šaltiniais, nes reikia įvertinti ne tik

ekonominę bendrovės būseną, bet ir kokybinę, o tai gali būti bendrovės apskaitos tikrinimas,

finansinių dokumentų ir informacijos rinkimas, mokesčių inspekcijos duomenys, jei bendrovė

prekiauja akcijomis, tai ir akciniai duomenys, kuriuos audituoja tam tikros organizacijos, galimas ir

bendrovės klientų bei partnerių apklausos, pokalbiai su eiliniais bendrovės darbuotojais, empirinis

paslaugų kokybės vertinimas (pvz., slaptieji pirkimo agentai), jei kreditas reikalingas kokio nors

projekto įgyvendinimui, tai ir to projekto dokumentacija, turimos įrangos ir technikos vertinimas ir

t.t.

Remiantis pastaruoju šaltiniu, kredito suteikimo proceso kokybė rizikos atţvilgiu yra

nustatoma svarbiausiais įmanomais identifikavimo ir įvertinimo būdais. Kredito rizika įvertinama

pagal Basel komiteto (Bazelio bankų prieţiūros komitetas) rekomendacijas, kurias didţiąja dalimi

adaptuoja Europos komisija ir yra įtraukta į Europos sąjungos direktyvas, todėl galioja visoms

Europos sąjungos narėms. Išskiriamos keturios rizikos komponentės:

1. Tikimybė, jog kreditorius neįvykdys įsipareigojimų (angl., Probability of default,

PD);

2. Dėl skolininko įsipareigojimų neįvykdymo atsiradusio nuostolio ir pozicijos vertės

santykis, išreikštas procentais (angl., Loss given default, LGD);

3. Turto praradimo dydis įsipareigojimų neįvykdymo metu (angl., Exposure at default,

EAD), kuris pagal Bazelio rekomendacijas daţniausiai skaičiuojamas vieneriems

metams: iš nesumokėtos skolos dydţio (įsipareigojimo nevykdymo metu) atimant

galimas pajamas iš įkeisto (uţstatyto) turo;

4. Kredito suteikimo terminas (angl., Maturity, M);

Pastarasis komponentas yra maţiausiai svarbus iš visų išvardytų ir labiausiai prisideda prie

reikalingo kapitalo skaičiavimo. Tuo tarpu pirmasis yra vertinamas pagal dabartinę ir ateities

galimybes padengti kreditą ir palūkanas uţ jį bei kitus įsipareigojimus. Ypač svarbu įvertinti

grynųjų pinigų srautus ir pajamas, kuriais ir turėtų būti padengti įsipareigojimai, o ne, tarkim, kitų

kreditų pagalba. Šiuo atveju turi būti perţiūrėta ne tik kredituojama bendrovė, bet ir visas verslo

modelis. Antrasis komponentas LGD vertinamas įkeisto turto pavidalu (kilnojamasis ir

nekilnojamasis turtas), kur reikia atsiţvelgti ne tik į įkeisto turto dabartinę vertę, bet ir vertę uţ kurią

jis būtų vėliau realizuotas, parduotas, taigi atsiţvelgiama į įkeisto turto tipą ir jo vertę. EAD atveju

reikia atsiţvelgti ne tik į skolininko tipą, grynųjų pinigų srautų šaltinį, įkeičiamo turto vertę ir tipą

bet ir į pretenduojamo įkeisto turto dydį bendrovės atţvilgiu (ar įkeičiama visa bendrovė, ar tik dalis

jos įrenginių, technikos, ţemių, pastatų ir t.t.).

Page 18: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

18

„Basel II“ skolintojo kapitalo įvertinimui siūlo du būdus, t.y., standartinį ir vidinio

reitingavimo įvertinimą (angl., internal ratings-based approach - IRB approach), kuris remiasi 7-

iomis turto klasėmis: priklausančio vien tik bendrovei, įkeisto bankui arba kitiems juridiniams ar

fiziniams asmenims, bendras/kolektyvinis turtas, parduodamas turtas, akcininkų turtas, vertybinių

popierių turtas, nekintantis turtas.

1.4. Kredito rizikos valdymo ciklas

Rizikos valdymas apima identifikavimą, įvertinimą, apjungimą, planavimą ir valdymą bei

monitoringą (3 iliustracija). Visų pirma rizikos yra identifikuojamos, numatomi įvairūs scenarijai.

Daţniausiai bankai išskiria į pačio kreditoriaus veiksmų riziką (netinkamų technologijų rizika,

naujų produktų ar paslaugų rizika), rinkos riziką (akcijų rinkų, valiutų, palūkanų normų, kapitalo,

likvidumo rizikos) ir operacinę riziką, o taip pat išskiria strategines bei reputacines rizikas, tačiau

jas sunkiau išmatuoti kiekybiškai. Šiuo atveju lengviausiai vertinama rinkos rizika, kuri turi

pakankamai istorinių duomenų. Kredito rizika skirstoma į numatytus nuostolius, kuriuos

daţniausiai jau nuo pat pradţių turi numatyti pats skolintojas, ir netikėtus nuostolius, kurie

daţniausiai būna didesni nukrypimai nuo numatytų nuostolių. Vėliau apjungiamos visos įmanomos

rizikos, atsiţvelgiama į jų tarpusavio koreliaciją ir įvertinama visa rizika kreditoriui. Kreditorius

planuoja ir valdo galimas rizikas, valdymas galimas kaip limitų nustatymas sudarant individualius

sandorius ar portfelius, garantijų, kredito draudimo naudojimas, kredito suteiktų lėšų vertimas

investicijomis, turto pirkimas ir pardavimas ir pan.

Page 19: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

19

Identifikuoti

Monitoringas

Planavimas ir kontrolė

Apjungti

Rizikos valdymo ciklas

Tiesiogiai susiję rizikos tipai:

- Rinkos rizika

- Kredito rizika

- Operacinė rizika

Matavimo instrumentai:

- Prognozė

- Streso testai

Bendros rizikos įvertinimas:

- Koreliacija

- Portfelio modeliai

Kontrolės instrumentai:

- Limitavimas

- Įkainiai pritaikyti rizikai

- Derivatyvos/paskolų vertimas investicijomis/pardavimai

Rizikos kontrolė ir ataskaitos:

- Paskirto limito stebėjimas

- Sugebėjimas valdyti rizikas

Išmatuoti (įvertinti)

Šaltinis: sukurta autoriaus, remiantis [16]

3 pav. Rizikos valdymo ciklas

Kreditų monitoringas (1 lentelė) apima įvairių kriterijų sekimą (pavyzdţiui, automatizuotai,

naudojant IT priemones) tam tikrais laiko periodais, pvz., banko suteikto kredito viršijimas,

nepakankamos kredito transakcijos sekamos kasdien, nauji įsipareigojimai, įmokų vėlavimas,

finansinės ataskaitos – kas mėnesį, o pramonės šakos informacija – kas metus, šie visi faktoriai yra

vieni iš pirmųjų skolininko nemokumo (rizikos) atsiradimo poţymių. Monitoringo esmė yra

pastebėti galimus debitoriaus nebesugebėjimus valdyti finansinės rizikos ir nebevykdyti

įsipareigojimų. E. Bernhardsen apie monitoringą teigia, kad svarbiausia pateikti reikiamą

informaciją apie kreditų sistemos funkcionavimą bei sekti, kaip laikui bėgant kinta kredituoto

asmens galimybės grąţinti kreditą.

2 lentelė

Teiginiai apie kreditų monitoringą

Autorius Metai Apibrėžimas

Ari Hyytinen, Otto Toivanen 2004 Kreditų monitoringas – tai efektyvi priemonė kreditavimo proceso valdymo

kokybei gerinti.

D.Jatkūnaitė, N.Stončiuvienė,

N.Ţaltauskienė

2000

Kreditų monitoringas prasideda iš karto po to, kai gaunama paraiška kreditui

gauti, uţtikrinanti savalaikį kredito grąţinimą bei palūkanų mokėjimą.

Maluis R., Salaski N. 1995 Kreditų monitoringas – tai nuolatinis kredituoto asmens stebėjimas,

informacijos apie jo ekonominę būseną rinkimas, ateities tendencijų

prognozė.

V. Valvonis 2004 Banko kreditų monitoringas – tai priemonė, padedanti įvertinti kreditų

portfelio riziką.

R. Rukuiţienė 1997

Kreditų monitoringas – tai kredito naudojimo sąlygų kontrolė, atsiţvelgiant į

faktinius kredito gavėjo ūkinės veiklos rodiklius, ir probleminių kreditų

pasireiškimo aplinkybių ir veiksmų išaiškinimas siekiant išvengti kreditinės

Page 20: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

20

rizikos tolesnių padarinių.

S. Taraila 2001

Kreditų monitoringas - kredito gavėjo veiklos kontrolės ir probleminių

kreditų, kuriems gresia nesavalaikis grąţinimas, ankstyvoje stadijoje

išaiškinimo procesas.

D.Lauskienė,V.Snieška 2003

Bankų kredito monitoringas - tai kredituojamų asmenų vertinimas prieš

išduodant kreditą, bei nuolatinė jų kontrolė iki kreditas grąţinamas.

Šaltinis: [15]

Remiantis [15] šaltiniu, bankų kredito monitoringas prasideda iš karto po to, kai gaunama

paraiška kreditui gauti, tad kreditų monitoringo procese galima išskirti du etapus – kreditų

monitoringas iki kredito išdavimo, ir kreditų monitoringas po kredito išdavimo, todėl banko kreditų

monitoringo procesą iki ir po kredito išdavimo siūlo skirstyti į šiuos etapus:

1) monitoringo tikslų ir uţdavinių nustatymas;

2) indikatorių sistemos kūrimas;

3) monitoringo plano sudarymas;

4) duomenų, informacijos apie kredito gavėjo ūkinę finansinę būklę, rinkimas ir analizė;

5) rezultatų įvertinimas.

Nurodytas pirmasis etapas yra svarbus, nes klaidos šiame etape gali padaryti nerezultatyvų

visą monitoringo procesą. Veiksmų vykdymas ir rezultatai stebimi ir vertinami tam tikrais

kiekybiniais rodikliais, todėl svarbus antrasis banko kreditų monitoringo organizavimo proceso

etapas, o siekiant maksimalaus efekto, kredito monitoringo pasiekimus apibūdinantys rodikliai

tūrėtų būti pasirenkami iš anksto, jų pasirinkimą lemia informacijos prieinamumas, t.y. turi būti

atsiţvelgta, ar stebėjimo metu galima gauti vienokius ar kitokius duomenis. Šių teiginių grafinė

interpretacija pateikiama 4 paveiksle.

Page 21: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

21

Šaltinis: [15]

4 pav. Kreditų monitoringo procesas

Pastarasis autorius bando apibrėţti kredito rizikos vertinimo bei monitoringo sąsają, o tai

siūlo padaryti per banko kreditų monitoringo tikslus ir uţdavinius, indikatorių sistemą, renkamą ir

apdorojamą informaciją, nukreiptą abiem atvejais į kredito rizikos maţinimą. Pagal anksčiau

išreikštus teiginius banko kreditų monitoringo proceso metu surinkta informacija yra panaudojama

kredito rizikos nustatymui.

Page 22: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

22

Šaltinis: [15]

5 pav. Kredito rizikos vertinimo bei monitoringo sąsaja

Kreditų monitoringo proceso metu iki kredito išdavimo nustatomas tikėtinas ir netikėtinas

nuostolis (atitinkamai angl., expected ir unexcpected loss – EL, UL), o tada priimamas sprendimas

– suteikti kreditą ar ne. Priklausomai nuo to, kokio dydţio nustatytas tikėtinas nuostolis, parenkama

atitinkama palūkanų norma. Kaip jau buvo minėta, vertinant kredito riziką, jo sudedamosios dalys:

įsipareigojimų nevykdymo tikimybė (PD), nuostolis įsipareigojimų nevykdymo atveju (LGD),

kredito pozicija įsipareigojimų nevykdymo atveju (EAD), pagal kuriuos galima apskaičiuoti EL ir

UL (5 pav.).

1.5. Rizikos padengimas

Rizikos padengimas (angl., Risk-bearing Capacity) šiuo atveju reiškia kreditoriaus

galimybes padengti rizikas iš savo turimų finansinių resursų (iš akcijų, valiutų kurso padidinimo,

rezervų, pelno). Visi resursai, kuriais gali kreditorius manipuliuoti rizikų padengimui laikomi

padengimo kapitalu (fondu, turtu). Šio kapitalo dydis apriboja skaičių derybų, kurios yra nesaugios

rizikos atţvilgiu ir į kurias turėtų leistis kreditorius. Šio kapitalo dydis svariai prisideda prie banko

verslo politikos ir rizikos valdymo politikos. Ţinoma, jei bankas turi didesnius piniginius resursus,

jis gali labiau plėtotis, skolinti rizikingesniems klientams, priimti didesnius nuostolius, jei rizika

visgi išsipildytų [16].

Page 23: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

23

1.6. Rizikos išmatavimas

Yra du pagrindiniai metodai, kuriais remiantis galima išmatuoti netikėtus nuostolius (UL):

- Vertės pokyčio rizika (Value-at-Risk, VaR), kuris yra portfelio galimų nuostolių

dėl rinkos kainos kitimo kiekybinis įvertinimas tam tikru laikotarpiu su tam tikra

tikimybe.

- Scenarijaus technikos (angl., scenario techniques).

Pirmasis iš jų yra tikslesnis, tačiau jį sudėtingiau apskaičiuoti, o antrasis daţniausiai

naudojamas tada, kai nėra galimybės apskaičiuoti VaR. Abu metodai aprašyti ţemiau.

1.7. VaR

VaR nurodo galimų nuostolių kiekybinį įvertinimą tam tikram laikotarpiui su tam tikra

neviršytina tikimybe. Tam nustatoma patikimumo riba, kuri daţniausiai yra tarp 95% ir 99,95%, o

tai reiškia, kad didesni nuostoliai yra įmanomi, tačiau tik su tikimybe tarp 5% ir 0,05%. VaR

apskaičiavimui reikia nustatyti potencialų galimų nuostolių pasiskirstymą, o tam yra daromos

prielaidos apie galimą (ateities) įsipareigojimų nevykdymą ir EAD (Exposure at default).

Šis rodiklis, deja, neturi jokio nuostolių dydţio nustatymo likusiems 5%, o be to

neatsiţvelgia į jokius staigius rinkos ar ekonomikos pokyčius (pvz., krizę), kurios metu staigiai

išauga įsipareigojimų nevykdymo tikimybė. Skirtingoms rizikoms vertinti skiriasi ir apskaičiavimo

sudėtingumas, kaip, tarkim, minėtoms rinkoms, operacinei ir kredito rizikos tipams. Dar vienas

neigiamas aspektas gali būti nepakankamas istorinių duomenų apie skolininką kiekis.

Smulkiau apie vertės pokyčio riziką, jos atsiradimą, pritaikymą ir kitus aspektus galima rasti

šaltinyje [17], o taip pat taikymą valiutų rinkoje, įskaitant ir CVaR (conditional VaR) šaltinyje [18].

1.8. Scenarijaus technikos

Šiai rizikos įvertinimo analizei taip pat reikia istorinių rinkos arba vidinių kreditoriaus

duomenų, taip kuriant tam tikrus galimus scenarijus apie galimus įsipareigojimų nevykdymus.

Kaip ir VaR atveju bandoma nuspėti „normalius atvejus“, kur tariama, kad analogiškų

nuostolių jau yra buvę tam tikruose istoriniuose duomenyse, ir blogiausius galimus atvejus, kur

bandoma nuspėti didţiausius įmanomus nuostolius. Šie du scenarijai naudojami nustatyti

svyravimus (nepastovumą). Tokie pasikeitimai gali atsirasti dėl eilės prieţasčių, pvz., pinigų vertės

kaita, įkeisto turto vertės keitimasis ir t.t. Dėl savo maţesnio parametrų, naudojamų rizikai nustatyti,

kiekio teikia prastesnius rezultatus nei VaR.

Taigi, aptarus įvairius su kreditų rizikos vertinimu ir valdymu susijusius aspektus,

pateikiami konkretūs vertinimo metodai, kurie skiriami į dvi dalis – matematinius statistinius ir

dirbtinio intelekto metodus, pastarieji dėl savo objektiškumo, lyginant su matematiniais metodais,

Page 24: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

24

yra šio tiriamojo darbo objektas, kai tuo tarpu matematiniams statistiniams metodams reikia taip

vadinamų ekspertinių ţinių, kurie, kaip jau buvo aprašyta aukščiau skyriuose, yra pagrindiniai,

kurie naudojami realiuose bankuose ar kitose kreditais uţsiimančiose kompanijose bei yra labai

plačiai ištirti.

1.9. Kredito rizikos vertinimo metodai

Remiantis [2, 13] šaltiniais, šiuo metu finansinei rizikai vertinti yra nagrinėti tokie

matematiniai statistiniai metodai ir sritys, kaip:

tiesinė tikimybių analizė (angl., the linear probability analysis);

tiesinė diskriminantinė analizė (angl., linear discriminant analysis);

logit analizė (angl., logit analysis);

probit analizė (angl., probit analysis);

tiesinis programavimas;

integer programavimas;

„risk of ruin“ ir option pricing (sutr. OPM) modeliai;

mortality default rate modeliai;

bei dirbtinio intelekto metodai ir sritys:

artimiausio k kaimyno metodas (angl., k-nearest neighbor, sutr. KNN);

klasifikavimo medis (angl., classification tree);

dirbtiniai neuroniniai tinklai (angl., artificial neural networks, sutr. ANN);

genetiniai algoritmai;

paramos vektorių mašinos (angl., support vector machines, sutr. SVM);

neuro-fuzzy sistemos;

Bajeso metodas;

hibridiniai ir kiti metodai.

Kitame skyriuje apţvelgiamas kreditų kokybės vertinimas balais ir aprašomas tiesinės

diskriminantinės analizės metodas ir jo veikimo principai, o taip pat paliečiama logit analizė. Toliau

skyriuose bus aptarti dirbtinio intelekto metodai.

1.10. Tiesinė diskriminantinė analizė ir kiti vertinimo balais metodai

Rizikos, atsirandančios išduodant paskolas individualiems asmenims ar maţoms

organizacijoms, vertinimo atveju kredito kokybė paprastai įvertinama kredito vertinimu balais

(angl., credit scoring): kreditorius iš turimos informacijos apie subjektą, kuriam išduodama paskola,

apskaičiuoja kredito įvertinimą balais, tam naudodamas tam tikrą standartizuotą formulę. Pagal šį

rodiklį kreditorius gali spręsti, ar jam verta suteikti kreditą konkrečiam subjektui, ar to daryti

Page 25: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

25

neverta. Kaip jau minėta, reitingavimą naudoja ir kredito reitingavimo agentūros, tam naudodamos

skirtingus rodiklius. Pavyzdţiui, „Standard & Poor‟s“ reitinguodama skaičiuoja bendrą

įsipareigotojo pajėgumą įvykdyti finansinį įsipareigojimą, ir tai atlieka apskaičiuodama

įsipareigojimų neįvykdymo rodiklį. Tuo tarpu „Moody„s“ į vertinimą įtraukia ir sprendimą apie

skolos atgavimą esant nuostoliams, todėl skaičiavimai artimi numatytų praradimų rodiklio

skaičiavimams. Šios bendrovės, reitinguodamos bendroves, vadovaujasi tokiais kriterijais, kaip

verslo šakos ar pramonės šakos rizika, subjekto vieta šioje šakoje, jo veiklos ir efektyvumo

rodikliai, finansinis pajėgumas bei lankstumas ir kt. Šių bendrovių reitingavimo algoritmai nėra

viešinami, todėl informacija apie juos prieinama tik šių bendrovių analitikams.

Kreditų rizikos vertinimas balais apima 4 aukščiau minėtus metodus: tiesinė tikimybių

analizė, tiesinė diskriminantinė analizė, logit analizė, probit analizė.

Populiariausias kreditų vertinimo metodas, kuris paremtas kreditų vertinimu balais, yra

diskriminantinė analizė (antra seka logit analizė, abu metodai teikia panašius efektyvumo rodiklius),

kuri remiantis kai kuriais tyrimais rodo geresnius rezultatus uţ ekspertines bankų sistemas, kurios

yra gana subjektyvios ir iš esmės remiasi keturiais kriterijais: skolininko reputacija, kapitalu,

finansiniu produktyvumu ir įkeičiamo turto verte, taip vadinamų 4 „Cs“ (angl., borrower character

(reputation), capital (leverage), capacity (volatility of earnings), collateral) [13]. E.I.Altman ko gero

yra ţinomiausias mokslininkas su savo straipsniais tradiciniame kreditų rizikos valdyme, o ypač

plėtojant diskriminantinę analizę, kuri jau 1968 metais buvo publikuota „Journal of Banking &

Finance“ [1], o vėliau plėtota dėl savo populiarumo eilę metų daugelio mokslininkų [13].

Diskriminantinės analizės principas – suskirstyti tam tikrus įvairius informacijos teikiamus

atributus į grupes, kurie vienaip ar kitaip gali prisidėti prie rizikos įvertinimo. Vėliau vertinamos tų

grubių reikšmingumas, daroma įtaka, paskiriant tam tikrus koeficientus. Iš esmės diskriminantinė

funkcija atrodo taip:

Z=v1x1+v2x2+…+vnxn, (1)

kur Z yra diskriminantinis įvertis (reikšmė), n – narių skaičius, v1,v2,…vn yra diskriminantiniai

koeficientai, o x1,x2,…xn yra nepriklausomi kintamieji. Vėliau šis vienai kompanijai skaičiuojamas

įvertis naudojamas kitam koeficientui apskaičiuoti, kuris vertina eilės kompanijų tarpusavio

tendencijas. Kitaip tariant, diskriminantinė analizė bando susieti apskaitos ir rinkos duomenis

tiesine priklausomybe su dvejomis skolininkų grupėmis – mokiais ir nemokiais. Tuo tarpu logit

metodas apima tik apskaitos duomenų analizę nustatyti tikimybę, kad skolininkas neįvykdys

įsipareigojimų, tariant, kad ta tikimybė yra pasiskirsčiusi logistiškai (angl., logistically distributed),

t.y., įgyja reikšmes tarp 0 ir 1. Logit modelio tikimybės radimo formulė (2) pateikta ţemiau:

Page 26: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

26

(2)

2 formulėje Φ(x) yra kumuliacinė pasiskirstymo funkcija (angl., cumulative distribution

function), kuri reiškia, kad su kiekvienu realiu x, galioja kas reiškia,

jog atsitiktinis X bus maţesnis arba lygus x. Analogiškai pateikiama probit modelio formulė (3)

tikimybei rasti, jog objektas priklauso vienai ar kitai grupei (pvz., 0 ir 1):

(3)

Ir logit ir probit modeliams kredito vertinimo balais formulė yra tokia pati kaip ir tiesinei

diskriminantinei analizei, t.y., formulė 1, o 2 ir 3 formulės atitinkamai parodo tikimybę, kad

skolininkas neįvykdys įsipareigojimų.

Kiekvienas kredito riziką vertinantis ekspertas pats nustatinėja ir nepriklausomų kintamųjų

skaičių, ir diskriminantinius koeficientus, tačiau E.I.Altman 1968 metais kaip optimaliausią variantą

siūlė 5 kintamuosius: likvidumas, pelningumas, svertinės sistemos (angl., leverage, pelningumo

įvertinimas), mokumas ir aktyvumas (tarkim, pardavimų). Šie kintamieji yra paprasčiausios grupės,

sudarytos iš 22 atributų, rodiklių, gaunamų iš įvairių finansinių duomenų. Atitinkamai šiems

kintamiesiems buvo siūlomos tokie diskriminantiniai koeficientai: 0.012, 0.014, 0.033, 0,006 ir

0.999. Jei Z koeficiento reikšmė yra maţesnė nei 2.675, ta kompanija skiriama prie bankrutuojančių

grupės. Vėliau (1977) tas pats autorius siūlė naudoti diskriminantinį modelį su 7 kintamaisiais, kuris

dar labiau buvo tobulinimas kitų autorių ir vienas iš tokių buvo Zeta modelis, kurį plėtojo viena

firma, o jos efektyvumą lyginant su kitais analogiškais sprendimais dar kartą patvirtino Scott (1981)

[13].

Nors esant tvirtoms ekspertinėms ţinioms diskriminantinis modelis gali rodyti gerus

rezultatus, tačiau šis metodas (kaip ir visi likę, paremti vertinimu balais) turi minusų, kurių

pagrindiniai – subjektyvus didelio finansinių rodiklių kiekio įvertinimas bei gana sudėtingas

tinkamos koreliacijos nustatymas, lėtas reagavimas į pokyčius rinkoje ir ekonomikoje ar pačios

firmos, kadangi vertinimas vyksta tam tikrais laiko intervalais, tuo pačiu visi vertinimo kriterijai

bandomi susieti tiesiškai, nors realus pasaulis toks nėra, o taip pat šiems metodams nėra konkretaus

vieningo teorinio modelio.

1.11. Dirbtinis intelektas ir mašininis mokymas

Dirbtinio intelekto sąvoka atsirado prieš pusę amţiaus (1956 m.). Šeštajame XX amţiaus

dešimtmetyje pradėti naudoti kompiuteriai šią sąvoką pavertė rimta teorine ir praktine disciplina,

kuri pasirodė gerokai sudėtingesnė nei manyta iki tol. Tuo metu buvo sukurtos pirmosios dirbtiniu

intelektu pagrįstos programos, Logic Theorist, General Problem Solver (GPS), leidusios panaudoti

Page 27: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

27

šios srities ţinias praktiniam problemų sprendimui. Dirbtinio intelekto sąvoka yra plati ir galbūt

todėl sunkiai apibrėţiama. Dėl šios prieţasties nėra vienareikšmio jos apibrėţimo, nes beveik

kiekvienas šaltinis pateikia savo apibrėţimą ar net kelis apibrėţimus. Ši sąvoka gali būti apibrėţta ir

kaip „AI – tai mokslas, kuris apima protinių sugebėjimų panaudojimą naudojantis kompiuteriniais

modeliais“ (Charniak and McDermott)[3] arba „Dirbtinis intelektas – tai mokslas kaip išmokyti

kompiuterius daryti kaţką, ką tuo momentu geriau daro ţmogus“ (Rich)[3], kas aprašo dirbtinį

intelektą kaip „protingų“ mašinų kūrimo procesą. Sistemų, kurios elgiasi kaip ţmonės, sąvoką

atspindi Tiuringo testas, kurio pagrindinis subjektas yra pripaţinimas, kad mašina gali mąstyti,

atsakydama į ţmogaus klausimus taip, kad jis nesupras, ar bendravo su kompiuteriu, ar su

ţmogumi. Tačiau dirbtinio intelekto sąvoką galima apibrėţti ir kaip „kompiuterių mokslo šaka, kuri

automatizuoja protingą elgesį“ (Luger and Stubblefield)[3], kas jau savaime apibrėţia AI kaip

atskirą mokslo šaką, nagrinėjančią įvairius sudėtingus skaičiavimus, kas leidţia šią sritį taikyti tiek

finansuose, tiek ir įvairiose kitose srityse.

Dirbtinis intelektas kredito rizikos vertinime taikyti pradėtas palyginti neseniai, nors

finansuose šios srities taikymas siekia IX dešimtmečio pradţią, kai buvo sukurta pirmoji finansinė

ekspertinė sistema FOLIO, skirta vertybinių popierių portfelio analizei[2]. Vėliau buvo kuriama vis

daugiau dirbtiniu intelektu pagrįstų sistemų, skirtų įvairiems finansiniams skaičiavimams bei

prognozėms, kaip TARA, INSPECTOR, ARMAX ir t.t. Šiuo atveju gali būti priimami tokie

sprendimai, kaip investavimas realiu laiku, akcijų kainų bei indeksų prognozavimas, vertybinių

popierių pasirinkimas ir pan. Į tokių sprendimų grupę galima įtraukti ir nagrinėjamą sritį, kadangi

tiek bankroto prognozavimą, tiek kredituojamų subjektų pasirinkimą galima priskirti prie tokio tipo

uţdavinių. Lietuvoje taip pat yra sukurta ekspertinė sistema akcijų rinkoms – STRASS [4]. Kaip

atskirą tokių modelių grupę galima įvardinti ir dirbtinio intelekto srities modelius bei metodus, IX-

ajame praėjusio amţiaus dešimtmetyje, atsiradus pirmosioms dirbtiniu intelektu paremtoms

sistemoms, į šią kompiuterių mokslo šaką buvo atkreiptas didesnis dėmesys ir ji buvo imta rimčiau

taikyti ekspertinių sistemų kūrimui. Problemų sprendimo laipsnis pagrįstas duomenų kokybiškumu

bei ţmogaus eksperto suformuluotomis taisyklėmis. Ekspertinės taisyklės sukurtos veikti ţmogaus

eksperto lygmenyje. Akivaizdu, kad tokio tipo sistemos gali būti labai naudingos ţmogui,

siekiančiam priimti svarbų sprendimą. Kaip jau buvo minėta, Amerikoje kai kurios finansinės

institucijos jau dabar linkusios pasikliauti ne tik ţmogiškąja išmintimi, bet ir programine įranga

(TARA, INSPECTOR, kt.), paremta dirbtinio intelekto metodais (neuroniniais tinklais, fuzzy

logika, saviorganizuojančiais tinklais ir kt.) [4].

Page 28: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

28

Ši sritis vis dar tiriama ir plėtojama, todėl ekspertinės sistemos gali būti naudojamos tik kaip

patariančios vartotojui, jų sprendimu negalima visiškai pasitikėti. Labiau ištobulėjus šiai sričiai,

galima tikėtis, kad ateityje bus sukurta ir sistemų, kurios galės pateikti optimalų sprendimą.

Laisvoji enciklopedija Vikipedija apibrėţia mašininį (sistemos) mokymą taip: tai dirbtinio

intelekto sritis, kuri apima metodų kūrimą, mokinančių kompiuterius „mąstyti“. Tiksliau kalbant, tai

yra programų kūrimo būdas, kai sukurta sistema prisitaiko prie duomenų („apsimoko“). Sistemos

mokymasis yra stipriai susijęs su statistika, nes sistemos mokymasis ir statistika nagrinėja duomenų

analizę, bet skirtingai nuo statistikos, sistemų mokymasis yra susijęs su skaičiavimams naudojamų

algoritmų sudėtingumais. Sistemos mokymosi algoritmai yra sistematizuoti pagal jų rezultatus.

Bendri algoritmų tipai:

priţiūrimas mokymasis (mokymasis su mokytoju) – algoritmas generuoja funkciją,

kuri sieja įvedamus duomenis su tinkamais išvedimo duomenimis. Viena iš

standartinių priţiūrimo mokymosi formuluočių yra klasifikavimo problema: sistema

turi išmokti (kad aproksimuotų funkcijos elgesį) funkciją, kuri susieja vektorių

su skirtingomis klasėmis, tikrinant kelis funkcijos įvedimo-išvedimo

rezultatus.

dalinai priţiūrimas mokymasis – apjungia paţymėtus ir nepaţymėtus pavyzdţius

atitinkamai funkcijai arba klasifikatoriui sugeneruoti.

nepriţiūrimas mokymasis – modeliuoja aibę įvedimų: paţymėti pavyzdţiai

neprieinami.

mokymasis su paskatinimu - algoritmas keičia elgsenos strategiją, priklausomai nuo

pateiktų ţinių apie pasaulį. Kiekvienas veiksmas turi įtakos aplinkai, o aplinka

graţina informaciją, pagal kuria vadovaujasi besimokantis algoritmas.

signalo keitimas – algoritmas panašus į priţiūrimą mokymąsi, bet skirtingai nuo jo

nesiekia sukonstruoti tikslią funkciją. Bando nuspėti naujus išvedimus pagrįstus

bandymų įvedimais, bandymų išvedimais ir naujais įvedimais.

mokymasis mokytis – algoritmas nagrinėja savo induktyvų tendencingumą, pagrįstą

ankstesne patirtimi.

Ţemiau pateikiami vieni populiariausių klasifikavimo ir klasterizavimo metodai ().

Page 29: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

29

Šaltinis: [19]

6 pav. Klasifikavimo ir klasterizavimo metodai

Pagal [20], mašininio mokymosi (angl., machine learning) tikslas yra kompiuterinės

sistemos, kurios pačios galėtų mokytis save tobulinant su įgaunama patirtimi veikimo metu. Tokių

sistemų sėkmingas kūrimas pagelbėtų daugelyje kompiuterių mokslo sričių ir ne tik: (namų) robotų

taikymas, kalbos atpaţinimo srityje, kur tokios sistemos galėtų prisitaikyti prie naujų kalbančiųjų ar

aplinkos poveikio, ţiniomis grindţiamų (angl., knowledge-based) sistemų bendradarbiaujant su

ekspertais taikymas įvairiose sudėtingose sistemose ar net kompiuterinės programos, sugebančios

skaityti ir vėliau pagal tai atlikti matematinius ar fizikos skaičiavimo veiksmus.

Ţinoma, tai nėra vien tik tikslai ir svajonės, jau yra atlikta nemaţai sėkmingų mašininio

mokymo programų, kaip ţymiai spartesnis skaičiavimų atlikimas išmokstant reikalingas taisykles,

taisyklių įsisavinimas medicinoje – ligų nustatymas pagal turimus simptomus, kalbų atpaţinimai ir

pan., pateikiami keletas iš jų:

Medţių algoritmais besiremianti ID3 sistema, kuri 99% tikslumu atpaţįsta

skydliaukės ligas ir yra gretinama ekspertinėms sistemoms. Panašius rezultatus

pateikia analogiškos sistemos geltai ir limfinėms ligoms nustatyti.

Soar paieškos sistema, kuri vietoje reikalingų 1731 ţingsnių panaudoja 7 paieškos

ţingsnius ir yra tapatinama ţmogaus programuotoms paieškos sistemoms.

Mašininio mokymo metodai

Klasifikavimas Klasterizavimas

Neuroniniai tinklai

(perceptronas)

Genetinis algoritmas

(daţniausiai kartu su kitais

metodais)

Bajeso metodas(Naive Bayes ir

Bayes Net algoritmai)

Regresija

Winnow Atraminių vektorių mašinų

metodas

KStar ID3

Sprendimų medis (Decision

Tree)

Medţių algoritmai (ADTree,

BFTree, REPTree ir kt.)

Asociatyvinės taisyklės

CobWeb

DBSCAN

KMeans

XMeans

Neuroniniai tinklai (Kohoneno

ţemėlapis)

Page 30: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

30

Klasifikavimo programos (daţniausiai naudojančios statistinius metodus),

apdorojančios didelius kiekius informacijos, kaip tarkim astronomijoje atpaţįstant

naujus objektus.

Tai tik keletas iš įvairių įgyvendintų sprendinių ir dalis jų yra įgyvendinta jau iki 1990, todėl

šiuo metu tikėtina yra efektyvesnių analogiškų realizacijų.

Gana lėtas šios srities vystymasis susijęs su daugeliu objektyvių prieţasčių, kaip kelerių

mokslo sričių apjungimas ir suderinimas, generalizavimo savybių neefektyvumas, kai apmokytas

objektas patenka į naują aplinką ir nebegali atlikti analogiškų uţdavinių ir t.t. Ţemiau pateikiami

keletas pavyzdţių, perteikiančių įvairias kylančias problemas sėkmingam mašininiui mokymui.

Taigi kaip pavyzdys aptariamas besimokantis namų robotas, kuris tarkim vykdytų iš

paţiūros paprastą veiksmą: namų šeimininkui liepus atnešti akinius ar telefoną, jis tai ir padarytų,

bet tokiai uţduočiai reikia įgyvendinti daug aspektų, kaip kelio radimas, kliūčių išvengimas,

suvokimas ir manipuliacijas. Ţinoma, uţprogramuoti robotą daryti keletą uţduočių viename ar

keleriuose namuose vienam ar keliems šeimininkams yra įgyvendinama uţduotis, tačiau bendru

atveju jis turi suprasti kiekvieną komandą, nors tai kiekvieną kartą pasakytų kitas ţmogus su savo

akcentu ir pan., atpaţinti įvairius objektus įvairiomis apšvietimo sąlygomis, sugebėti skirtingų

išmatavimų daiktą (pvz., stiklinę vandens, grandinėlę, laikraštį ir t.t.) paimti ir juo manipuliuoti.

Tokioms uţduotims įvykdyti robotas turėtų sugebėti mokytis iš besikeičiančios aplinkos ir įvairių

variantų kaip galima įgyvendinti problemą toje aplinkoje, tarkim, kur daţniausiai būna akiniai,

kurios durys daţniausiai uţrakintos ir t.t. To galėtų mokytis keleriais būdais, kaip tiesioginiu

aplinkos tyrinėjimu, gaunant nurodymus ir patarimus iš ţmogaus, aktyvaus eksperimentavimo toje

aplinkoje. Taigi iš paţiūros paprastai uţduočiai įgyvendinti reikia eliminuoti eilę problemų.

Kitu pavyzdţiu galėtų būti įvairių sistemų gebėjimas bendrauti su ţmogumi, t.y., ne tik

atpaţinti ţmogaus kalbą, tačiau ją ir suprasti, suvokti, tada būtų galimas dialogas bei tam tikri

veiksmai (pvz., mašinų remonto darbai, automatinis klientų aptarnavimas ir pan.), bet tam

įgyvendinti kyla eilė problemų: atpaţinti skirtingų kalbančiųjų šnekas, akcentus, dialektus ar jau

įsisavintus kalbančiuosius naujoje aplinkoje, gebėti mokytis naują ţodyną ir gramatiką, o taip pat

gramatinius natūralios kalbos aspektus. Taip pat kyla problemos ne tik su kalbos atpaţinimu, bet ir

suvokimu ko nori ţmogus, kokio tipo problemą reikia spręsti bei naujų problemų įsisavinimas [20].

Taigi įvairiose mašininio mokymo srityse egzistuoja aibės skirtingų problemų, kurias

išsprendus po vieną būtų galima jungti į skirtingų kompleksinių uţduočių sprendimus įvairiose

gyvenimo srityse kaip ekonomikoje, medicinoje, kariuomenėje, švietime ir t.t.

Page 31: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

31

1.12. Dirbtiniai neuroniniai tinklai

Toliau aprašant dirbtinius neuroninius tinklus (angl., artifiacial neural netwok, sutr. ANN)

remiamasi R.Simučio paskaitų medţiaga [4], kuri parengta pagal (A. Verikas ir kt., 2002).

Dirbtiniai neuroniniai tinklai pradėti nagrinėti šeštajame dešimtmetyje, tačiau iki devintojo

dešimtmečio vidurio jie nebuvo plačiai naudojami. Tik išradus greitus ir galingus apmokymo

mechanizmus, dirbtiniai neuroniniai tinklai galėjo spręsti realius uţdavinius. Šiuo metu neuroniniai

tinklai naudojami signalų apdorojimui, triukšmo eliminavimui, duomenų klasifikavimui, sistemų

modeliavimui, identifikavimui, prognozei ir kontrolei.

Biologinio neurono ir dirbtinio neurono sandaros pateiktos ţemiau esančiame paveiksle (6

pav.), kur neurono įėjimai paţymėti x1…xn, svoriai paţymėti w1…wn, w0 – slenksčio reikšmė, f() –

perdavimo funkcija, y – neurono išėjimas.

xn

x2

x1

n

iii xw

1

y

w1

w2

wn

w0

f( )

Šaltinis: [4]

7 pav. Biologinis (kairėje) ir dirbtinis neuronai

Neurono veikimas: neuronas gauna keletą įėjimo reikšmių, kiekviena įėjimo jungtis turi

savo perdavimo koeficientą (svorį w), šie svoriai atitinka biologinio neurono sinapsių efektyvumą.

Kiekvienas neuronas turi savo slenksčio reikšmę. Neurono suţadinimo reikšmė formuojama

skaičiuojant svorinę įėjimo signalų sumą ir atimant slenksčio reikšmę. Pagal suţadinimo signalą,

naudojant neurono perdavimo funkciją skaičiuojama neurono išėjimo reikšmė. Jeigu naudojama

šuolinė neurono perdavimo funkcija (neurono išėjimas lygus 0, jei aktyvacijos reikšmė maţiau uţ

nulį, ir lygus 1, jei reikšmė didesnė ar lygi nuliui), neuronas veikia kaip biologinis neuronas.

Neurono svoriai gali būti neigiami. Neigiamas svoris reiškia, kad jungtis turi slopinantį efektą, tokie

neuronai egzistuoja ir biologinėse sistemose

Page 32: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

32

1

-1

f( wixi)

wixi

Šaltinis: [4]

8 pav. Neuronų perdavimo funkcijos

7 paveiksle parodyta keletas neurono perdavimo funkcijų. Kai kurios funkcijos būdingos

tam tikro tipo neuroniniams tinklams, kitos sąlygojamos mokymo taisyklių arba parenkamos pagal

sprendţiamą uţdavinį, tačiau daţniausiai naudojama hiperbolinio tangento funkcija.

Neuroninių tinklų adaptyvumas (8 pav.) yra geriausioji jų savybė. Neuroninės sistemos kaip

ir matematiniai metodai, tokie kaip diskriminantinė analizė, siekia susieti įėjimo parametrus

(kintamuosius), tačiau skirtingai nuo diskriminantinės analizės, įėjimai siejami ne tiesiškai, taigi

šios sistemos nėra sudaromos naudojant išankstines ţinias pagal specifikaciją, formules ar

aprašymą. Vietoje to, sistema naudoja išorinius duomenis savo parametrų nustatymui. Kaip jau

buvo minėta, neuroniniai tinklai apmokomi ţinant įėjimo ir atitinkamas išėjimo reikšmes (uţduoties

reikšmės), grąţinamas per ryšį, kuriame naudojama klaidos funkcija.

Įėjimas Išėjimas

Norima

reikšmė

Klaidos

funkcijaKlaida

Mokymo

algoritmas

Adaptyvi

sistema (w)

Šaltinis: [4]

9 pav. Adaptyvios sistemos kūrimas

Klaidos funkcija labai daţnai yra skirtumo funkcija tarp neuroninio tinklo išėjimo ir

uţduoties reikšmės. Neuroninio tinklo atsako tikslumas tiesiogiai naudojamas parametrų (tinklo

svorių) keitimui. Mokymo metu svoriai keičiami taip, kad sistemos išėjimo reikšmės artėtų prie

norimų reikšmių (maţėtų klaida).

Aukščiau aprašyti pavieniai neuronai jungiami į tinklus. Bet kokios paskirties neuroninis

tinklas turi įėjimus, perduodančius kintamųjų reikšmes iš išorės, ir išėjimus, formuojančius tinklo

Page 33: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

33

atsaką. Daţnai egzistuoja ir tarpiniai (paslėpti) neuronai atliekantys vidinį vaidmenį tinkle. Įėjimo,

paslėpti ir išėjimo neuronai jungiami vieni su kitais. Galimi du jų jungimo variantai: jungiant juos į

sluoksnius ir nejungiant (9 pav.)

Įėjimo

sluoksnis

Paslėpti

sluoksniai

Išėjimo

sluoksnis

X Y

X Y

Šaltinis: [4]

10 pav. Sluoksniuotas (kairėje) ir nesluoksniuotas neuroniniai tinklai

Piešinyje (kairėje) parodytas įėjimo sluoksnis nėra skaičiuojančių neuronų sluoksnis. Šio

sluoksnio paskirtis tėra įvesti į tinklą įėjimo kintamųjų reikšmes. Toks pirmojo sluoksnio tinkle

vaizdavimas yra įprastas, kadangi prieš duomenų apdorojimą neuroniniu tinklu daţnai seka

pirminio duomenų apdorojimo etapas (pavyzdţiui, normavimas, centravimas). Pavyzdyje paslėptų

ir išėjimo sluoksnių neuronai sujungti su visais prieš tai esančio sluoksnio neuronais, bet neuronai

gali būti sujungiami ne su visais gretimų sluoksnių neuronais. Vieno sluoksnio neuronai daţniausiai

turi tą pačią perdavimo funkciją.

Įėjimo reikšmės patenka į įėjimo sluoksnį, vėliau paeiliui skaičiuojamos paslėptų sluoksnių

neuronų išėjimo reikšmės, po to išėjimo sluoksnio neuronų išėjimo reikšmės. Kiekvienas neuronas

skaičiuoja svorinę prieš tai esančio sluoksnio neuronų išėjimų sumą ir atima slenksčio reikšmę, taip

gaudamas suţadinimo lygį. Pagal gautąją suţadinimo reikšmę skaičiuojama neurono perdavimo

funkcijos (išėjimo) reikšmė. Išėjimo sluoksnio neuronų išėjimo reikšmės laikomos neuroninio

tinklo išėjimo reikšmėmis.

Kita populiari neuroninių skaičiavimų funkcija – radialinė bazinė funkcija. Naudojamos

kelios bazinių funkcijų formos, kaip sinusoidės, bangelės, tačiau labiausiai paplitusi Gausinė,

pavyzdys pateiktas 10 paveiksle [4].

Page 34: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

34

Bazinės funkcijos

Duomenų taškai

Aproksimuojanti

funkcija

Šaltinis: [4]

11 pav. Radialinių bazinių (gausinių) funkcijų naudojimas

Įvairūs neuroninių tinklų tipai naudoja skirtingus mokymo metodus. Egzistuoja du

pagrindiniai neuroninių tinklų apmokymo tipai: mokymas su mokytoju (neuroninis tinklas turi

išmokti neţinomą funkciją iš pavyzdţių, kurie yra mokymo imties įėjimo ir išėjimo vektorių

rinkiniai X ir Y) ir mokymas be mokytojo (turima tik įėjimo duomenų imtis X), iš kurių labiau

paplitęs yra mokymas su mokytoju (egzistuoja ir trečias mokymo tipas: reinforcement learning).

Mokymas be mokytojo daţniausiai naudojamas atpaţinimui arba klasifikacijai. Populiariausi

mokymosi be mokytojo principai Hebbo ir Kohoneno, kitaip dar vadinami save-organizuojančiais

tinklais (angl., self-organizing maps, sutr. SOM) [4]. Pastarojo principais remiasi Viscovery®

SOMine produktas, skirtas duomenų klasterizavimui, palaikantis įprastus *.txt ar *.xls failų

formatus. Ţemiau pateiktas šio produkto naudojimo pavyzdys (11 pav.), kur kompanijos

suskirstytos į klasterius pagal skirtingus parametrus, kurie skirtingai įtakojo klasterių atsiradimą.

Šiuo metu ţinomi tokie mokymo (svorių nustatymo) algoritmai: gradientinis nusileidimas

(įtraukiant ir momentum narį bei mokymosi greičio keitimą), tyrimas tiesėje (vienparametrinė

paieška), jungtinis gradientas (keičiant svorių paieškos kryptį, gradientas senąja kryptimi nekinta),

Niutono (paremtas antros eilės išvestinių taikymu) ir Kvazi-Niutono metodai.

Page 35: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

35

Šaltinis: sukurta autoriaus

12 pav. Klasterizavimas naudojant Viscovery® SOMine

Reiktų atkreipti dėmesį, kad SOM tyrimai buvo atlikti ir Vilniaus universitete, Kauno

humanitariniame fakultete (Merkevičius, Garšva, Simutis, 2004; „Forecasting Of Credit Classes

With The Self-Organizing Maps“), kur bandyta suskirstyti kreditus 5 „gerus“ ir „blogus“. R.Simutis

yra prisidėjęs ir daugiau prie dirbtinių neuroninių tinklų panaudojimo atvejų tyrimų, galima

paminėti keletą iš jo darbų: „Estimation of biomass concentrations in fermentation processes for

recombinant protein production“, „New Methods and Technologies for Deflection Yoke Tuning“,

„Discrete Eye Tracking Based on PCA and Neural Classifier“, „Cash Demand Forecasting for ATM

Using Neural Networks and Support Vector Regression Algorithms“, „Intelligent Cash

Management System for an ATM network“, „Application of Particle Swarm Optimization

Algorithm in Stock Markets“, „Development and Evaluation of Decision-Making Model for Stock

Markets“. Taip pat reiktų paminėti E.Merkevičiaus daktaro disertaciją „Savitvarkių neuroninių

tinklų-diskriminantinio modelio tyrimai kredito rizikos vertinimo sprendimų paramos sistemoje“.

Dirbtinių neuroninių tinklų pritaikymų yra be galo daug, tarp jų nemaţai finansų rinkoje,

įskaitant kreditų rizikos valdyme, kai kurie iš jų pateikiami ţemiau esančioje lentelėje.

3 lentelė

ANN taikymas kreditų rizikai vertinti

Autoriai Metai Aprašymas

Glorfeld, Hardgrave 1996 Naudoti ANN su Gauso maksimalaus tinkamumo klasifikatoriais.

Deng 1993 Sinergetinis naujų faktų gavimo iš esamų atmintyje (Memory-Based Reasoning)

Page 36: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

36

Autoriai Metai Aprašymas

bei taisyklėmis paremto induktyvaus mokymosi (Rule-Based Inductive

Learning) metodų integravimas su neuroniniais tinklais į ekspertinę sistemą.

Williamson 1995 Genetinio algoritmo, automatiškai parenkančio optimalią konfigūraciją bei

rezultatus, panaudojimas.

Arminger, Enache,

Bonne

1997 Klasifikavimo metodų apjungimas.

Handzic,

Tjandrawibawa, Yeo

2003 Naudotas daugiasluoksnio perceptrono neuroninio tinklo tipas kartu su

vidurkinimu (Ensemble Averaging) bei pagreitinimu filtruojant (Boosting by

Filtering), kas leido gauti tikslius rezultatus (paskutiniu atveju procentinė klaida

siekė 1.32 %).

di Tollo 2006 Naudota mokymo su mokytoju paradigma.

Besens, Van Gestel,

Stepanova, Van den Poel

2004 Naudota “išlikimo analizės“ paradigma, paremta tam tikros populiacijos

išlikimo rodikliu.

Keung Lai, Yu, Wang,

Zhou

2006 Naudojamas trijų fazių neuroninių tinklų metodas blogų ir gerų kreditorių

atskyrimui. Jame naudojama daug skirtingų neuroninių tinklų modelių, kuriuos

sukūrus, taikomas iškoreliavimo maksimizavimo algoritmas tinkamų aibės narių

išrinkimui; čia klasifikavimui naudojamas ir patikimumu paremtas metodas.

Kaip teigia patys autoriai, atlikę eksperimentą, jie gavo gerus klasifikavimo

rezultatus.

Keung Lai, Yu, Wang,

Zhou

2006 Šis darbas traktuoja neuroninius tinklus kaip metamokymo metodą, kurio esmė

yra skirtingų neuroninių tinklų pagal skirtingus apsimokymo duomenų rinkinius

su skirtingomis pradinėmis sąlygomis bei apsimokymo algoritmais apmokymas

skirtingų kredito vertinimo modelių (bazinių modelių) formulavimui. Iš šių

bazinių modelių gali būti generuojamas metamodelis, kas leidţia pagerinti

patikimumą, t.y., tikslumą prognozuojant praradimus.

B.M.M. Dissananayake,

C. H. Hendahewa, A. S.

Karunananda

2007 ANN taikymas atskiroms pramonės šakoms, šiuo atveju buvo pasirinkta

viešbučių (turizmo) rinka, įvertinant finansinius ir ekonominius faktorius,

naudojant du neuroninius tinklus: vieną grynųjų pinigų cirkuliacijai numatyti,

kitą skolų numatymui, abejiems naudojant sklidimo atgal apmokymą (angl.,

backpropagation), suderinant neuroninių tinklų modelius su web aplikacijomis

duomenims gauti.

Lean Yu, Shouyang

Wang and Kin Keung

Lai

2007 Daugiafazio (6 fazės) neuroninio modelio taikymas kreditų rizikai vertinti.

Pirmame etape vykdomas duomenų generavimas, jų prastinimas, vidurkinimas

ir t.t., antrame – sukuriama keletas skirtingų neuroninių tinklų su skirtingais

treniravimosi duomenų rinkiniais, tinklai treniruojami, gaunami klasifikavimo ir

patikimumo įvertinimai, dekoreliacijos maksimizavimo algoritmo naudojimas

tinkamų bendrų narių parinkimui, penktame – pastarųjų narių sudarytų

neuroninių tinklų patikimumo įvertinimų skirstymas į intervalus, šeštame –

sudaromas galutinis modelis ir vertinamas jo patikimumas. Galiausiai modelis

testuojamas su realiais duomenimis.

Eliana Angelini,

Giacomo di Tollo and

Andrea Roli

2008 Atsiţvelgta į Bazelio II rekomendacijas kapitalo reikalavimams bankų

knygoms, atsiţvelgiant į kreditų riziką. Sukurtos dvi neuroninės sistemos (viena

įprasta feedforward, kur neuronai turi vienos krypties ir neturi grįţtamųjų ryšių).

Parodyta, kad dirbant su realiais duomenimis gauti neblogi skolininko galimų

įsipareigojimo nevykdymo nuspėjimo rezultatai.

Maximilian J.B. Hall,

Dadang Muljawan,

Suprayogi, Lolita

Moorena

2008 ANN naudojimas bankų kreditų portfelių rizikai vertinti, naudojant

makroekonominius kriterijus. Įtrauktos Bajeso reguliacijos technikos, jog

duomenys nepersimokytų (per daug neprisitaikytų prie apmokymo duomenų).

Parodyta, jog iš naudotų parametrų (BVP augimas, akcijų kainosinfliacijos

dydis, valiutų kursai ir pinigų apyvarta) didţiausią įtaką daro akcijų kainos.

Ping Yao, Chong Wu,

Minghui Yao

2009 Šešių lygių fuzzy neuroniniais tinklas su 4 faktorių įėjimais. Parodyti, autorių

teigimu, ţymiai geresni rezultatai nei naudojant įprastą ANN modelį.

Šaltinis: [19], papildyta autoriaus

Apibendrinant neuroninius tinklus, galima pasakyti, kad neuroninis tinklas negali padaryti

nieko, kas negali būti padaroma tradiciniais skaičiavimo metodais. Tačiau neuroniniu tinklu galima

Page 37: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

37

padaryti tai, ką kitais metodais išgauti kartais labai sunku. Neuroninis tinklas gali formuoti modelį

iš pavyzdţių. Tai ypač naudinga apdorojant daviklių duomenis arba duomenis iš sudėtingų

(cheminių, gamybos, komercinių) procesų. Galbūt, daugeliu atvejų ir egzistuoja duomenų

apdorojimo algoritmas, bet daţnai jis nėra ţinomas arba turi pernelyg daug kintamųjų, todėl

paprasčiau, naudojant turimus duomenų pavyzdţius, apmokyti neuroninį tinklą. Akcentuojamos

problemos su ANN yra šios: neaiškus rezultatų gavimas (angl., ad hoc theoretical foundation),

neaiškus koreliacijos tarp įvedamų kintamųjų tarpusavyje ir su išėjimais nustatymas, tų koreliacijų

ar principų iš modelio išgavimas, lokalių minimumų sprendimas, neuroninio tinklo optimalus dydis

nors yra įrodyta (Hecht-Nielsen ir Kolmogorov teoremos) kad su dideliais techniniais ištekliais

visas problemas galima spręsti su dviem paslėptais neuroniniais sluoksniais, o taip pat neuroniniai

modeliai nenumatytai elgiasi atvejais, kai gauti duomenys visiškai neatitinka apmokymo duomenų.

1.13. Atramos vektorių mašinos (SVM)

Atramos vektorių mašinos (engl., support vector machines) yra vienas iš populiarių

mašininio mokymosi klasifikavimo metodų. Kaip ir ANN, SVM pagrįstas mokymusi iš duotų

pavyzdţių, kurie šiuo atveju skiriami į du vektorius n-dimensinėje erdvėje, kur SVM sukuria

hiperplokštumą, kuri atskiria pastaruosius du įėjimo duomenų rinkinius. Daţniausiai klasifikuojama

į dvi klases, sąlyginai vieną ţymint kaip teigiamą, kitą kaip neigiamą, analogiškai 1 ir -1. Vizualiai

SVM principas pateiktas 12 paveiksle, kur w – tai normalinis vektorius (angl., normal vector),

išraiška {x: wx+b = +1} – tai “teigiama” plokštuma, o “neigiama” plokštuma ţymima kaip {x:

wx+b = -1}, klasifikatoriaus riba – {x: wx+b = 0}. Parametras yra renkamas toks, kad atstumas

tarp teigiamų ir neigiamų plokštumų būtų kuo didesnis, taip gaunamos maţesnės generalizavimo

klaidos [19, 21, 22].

Page 38: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

38

Šaltinis: http://upload.wikimedia.org/wikipedia/commons/2/2a/Svm_max_sep_hyperplane_with_margin.png

13 pav. Tiesinis SVM

Įprastai SVM metodas aprašomas [21]: duotos apmokymo duomenų poros (xi,yi), i=1,...,l,

kur xi Rl, o , tada SVM optimizavimo formuluotė atrodo taip (4):

(4)

Pateiktoje išraiškoje C>0 yra baudos parametras klaidos atţvilgiu. Funkcija Φ treniravimosi

duomenis xi ţymi (angl., mapping) į aukštesnės dimensijos erdvę. yra

branduolio, kitaip vadinama kernel, funkcija. Yra keturios pagrindinės kernel funkcijos[21]:

tiesinė: ;

polinominė: ;

radialinė bazinė funkcija (RBF): ;

sigmoidinė: ;

Šiose funkcijose , r ir d yra kernel parametrai. Polinominės dar būna homogeninės ir

nehomogeninės, atitinkamai kai r=0 ir r=1 [22].

Šaltinis [21] siūlo tokią SVM modelių kūrimo eigą, ypatingai tiems, kurie nėra itin patyrę

šioje srityje:

Page 39: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

39

Eksperimentinius duomenis transformuoti į SVM formatą. Visi duomenys SVM

metodui privalo būti transformuojami į realių skaičių vektorius, tarkim yra trijų

kategorijų (reikšmių) atributas {atmestas, tikrinamas, patvirtintas}, tada jį būtų

tikslinga (0,0,1), (0,1,0) ir (1,0,0), tačiau jei atributas turi daug reikšmių, tada

tikslinga tik vieną kategoriją laikyti lygią 1, o kitas kaip 0.

Atlikti duomenų normavimą į reikšmes nuo -1 iki 1 arba nuo 0 iki 1. Tai svarbus

etapas, kuris naudojamas ne tik SVM metode, jo esmė yra ta, kad didelės arba

stipriai aptriukšmintos reikšmės nebūtų dominuojančios visų kitų atţvilgiu, o taip pat

šis etapas palengvina aritmetinius skaičiavimus, ypač naudojant polinominius ir

tiesinius branduolius.

Pradiniu branduoliu pasirinkti RBF, kur . RBF yra turi

pranašumą prieš tiesinį branduolį būtent dėl tiesinių ir netiesinių ryšių tarp klasių ir

atributų. Tiesinis branduolys yra specialus RBF atvejis, o tinkamų parametrų

parametrų parinkimas atsiremia į vienodų rezultatų gavimą. Be to, sigmoidinis

branduolys su atitinkamais parametrais rodo panašius rezultatus kaip ir RBF. Tačiau,

jei funkcijų skaičius yra didelis, RBF gali taip pat netikti, tada geriau rinktis tiesinį

kernel.

Naudoti kryţminį C ir parametrų patvirtinimą (atrinkimą, angl., cross-

validation), tai daroma atsiţvelgiant į generalizavimo savybes, o ne tik į apmokymo

tikslumą, t.y., treniravimo duomenis padalinti į dvi dalis, kurių vienos dėka ţiūrima

kaip tiksliai klasifikuojami ţinomi įėjimo duomenys, o kita – nematyti duomenys

(generalizavimo įvertinimas). Siekiama, jog generalizavimo savybės būtų kuo

geresnės. Tai apsaugo nuo modelio prisitaikymo prie apmokymo duomenų.

Parametrų nustatymui rekomenduojama naudoti įprastą gridinę paiešką (pvz.,

keičiant C ir eksponentiškai didėjimo tvarka, angl., grid-search), nors galimi ir

kiti įvairūs euristiniai metodai, kurie gali būti kur kas spartesni.

Naudoti geriausius gautus C ir parametrus visam treniravimo duomenų rinkiniui.

Testuoti;

4 lentelė

SVM taikymas kreditų rizikai vertinti pastaraisiais metais

Autoriai Metai Aprašymas

Liwei Wei, Jianping Li,

Zhenyu Chen

2007 Kredito rizikos vertinimas naudojant SVM metodą su sumaišytais branduoliais,

skirstant kreditus į „gerus“ ir „blogus“ ir, autorių teigimu, sėkmingai išbandyta su

realaus JAV banko duomenimis.

Page 40: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

40

Yanwen Dong 2007 SVM pritaikymas skolininkų rizikai vertinti. Pritaikyta maţoms kompanijoms

vertinti, kurių finansiniai duomenys yra sunkiai gaunami, todėl vertinama

naudojantis kasdienių operacijų duomenimis, tokiais kaip pardavimai, klientų

mokėjimai, vėluojančių mokėjimų sumos ir kt. Pasak autorių, gauti geri rezultatai,

o taip pat buvo palyginta su LDA metodu.

Härdle Wolfgang, Moro

Rouslan A., Schäfer

Dorothea

2008 SVM metodas taikytas kreditų rizikai įvertinti realiais Deutsche Bundesbank

duomenimis. Gauti rezultatai palyginti su tradiciniais diskriminantinės analizės ir

logit regresijos metodais, SVM metodas pasirodė geriau visais testuotais

kintamaisiais.

Pei-Yi Hao, Min-Shiu

Lin, Lung-Biao Tsai

2008 SVM metodas apjungiamas su Fuzzy teorija, kuri naudojama įėjimo duomenims ir

optimizavimo problemai spręsti, taip kad kiekvienas įėjimo taškas turėtų įtakos

sprendimų paviršiui. Parametrai taip pat parenkami Fuzzy nariais.

Leilei Zhang,

Xiaofeng Hui

2009 Sukurtos kelios aplikacijos (SVM ir BNN - backpropagation neural network),

kurių nuspėjimo tikslumas siekia 80% su tikrais Australijos ir Vokietijos duomenų

rinkiniais.

Ligang Zhou,

Kin Keung Lai, Lean Yu

2009 Orientuojamasi į paieškos metodus SVM optimaliausiems parametrams nustatyti,

epicentre tiesioginis paieškos metodas, lyginant su gridine paieška, genetine

paieška ir eksperimentiniu dizainu. Testai atlikti su dvejais realaus pasaulio

duomenų rinkiniais.

Šaltinis: sukurta autoriaus

Aukščiau pateiktoje lentelėje pateikta tik keletas iš daugelio SVM metodo taikymo kreditų

rizikai vertinti darbų, taigi SVM kreditų rizikoje yra itin plačiai naudojamas ir plėtojamas šiai

problemai spręsti. Daugelyje straipsnių sprendţiama problema yra parametrų optimizavimas,

taisyklių išgavimas, apjungimas su kitais metodais geresniems rezultatams gauti, tačiau reikia

paminėti vieną iš didţiausių šio metodo trūkumų – tai praleistų, tuščių duomenų netoleravimas.

1.14. Bajeso metodas

Pirmą kartą Bajeso metodo sąvoka paminėta Pearl (1985), nors Bajeso teorema jau ţinoma

nuo 1763, kai savo moksliniame rašte („An Essay towards solving a Problem in the Doctrine of

Chances. <…>“) ją aprašė Thomas Bayes, kurio vardu ši tikimybių teorema ir pavadinta. Dabar

Bajeso metodas yra labai plačiai naudojamas įvairiems sprendimo priėmimo uţdaviniams spręsti,

tarp jų ir finansinio sektoriaus problemoms spręsti.

Bajeso metodas tampa vis svarbesniu objektu dirbtiniame intelekte. Pirmiausia Bajeso

tinklai atsirado ir išsivystė siekiant įvesti tikimybes į ekspertines sistemas ir tai vis dar yra vienas iš

labiausiai naudojamų metodų. Ţymus pavyzdys yra ekspertinė sistema sukurta medicininiais tikslais

– QMR-DT (a decision-theoretic reformulation of the Quick Medical Reference (QMR) model),

kurios tikslas – kuo tiksliau nustatyti kiekvienos ligos tikimybę, ţinant tam tikrus simptomus, o kai

kurių neţinant [9].

Bajeso tinklai labai plačiai naudojami buvo Microsoft produktuose, tokiuose, kaip Answer

Wizard of Office 95 (pradėtas kurti 93 metais), Office Assistant of Office 97, virš 30 Technical

Support Troubleshooters [9, 10].

Dar vienas ţymus realizavimas yra Eric Horvitz kurtoje programoje „Vista“, kuri yra

sprendimų teorijos sistema, naudota NASA misijų kontrolės centre keletą metų (plačiau:

Page 41: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

41

http://www.research.microsoft.com/research/dtg/horvitz/vista.htm) [9]. NASA į Bajeso

panaudojimo tyrimus yra investavusi gana didelius pinigus, pvz., ji naudota kuriant sistemas

pilotavimui, kurios pagalba pilotui būtų suteikiama kuo daugiau informacijos apie objektus, į

kuriuos tuo metu jis kreipia didţiausią dėmesį (akių ţvilgsniai, galvos pasukimo trajektorija ir pan.).

Esmė – šio metodo pagalba atskirti, suklasifikuoti visiškai „ţalią“ informaciją (neįsikišant į

sistemos darbą) [10].

Specializuoti Bajeso tinklų variantai nepriklausomai naudojami daugelyje sričių, kaip pvz.,

genetikoje (ryšių analizėse), kalbos atpaţinime (angl., speech recognition), sekime, stebėjime

(Kalman fitering), duomenų suspaudimui ir kodavimui, ţaidimuose, kur įtraukiama tikimybė,

įvairių duomenų bazių naršymui, robotikos kūrimui ir t.t., o šio tiriamojo mokslinio darbo tikslas –

panaudoti Bajeso metodą finansų srityje.

Visgi reiktų apibrėţti kai kuriuos aspektus, kaip, pavyzdţiui, kas yra Bajeso teorema, o kas

Bajeso tinklas, Naivus Bajesas ir Bajeso optimalus klasifikatorius, kurie yra tarpusavyje koreliuoti.

Toliau pateikiamas Bajeso teoremos pavyzdys-apibrėţimas: tarkim, jog turime du įvykius –

A ir B. Šie įvykiai yra tarpusavyje susiję, ir tarkim, jog B kaip nors įtakoja įvykio A atsiradimą ar

buvimą. Norime suţinoti įvykio A tikimybę (P), ţinant, jog įvykis B įvyko ar vyksta (t.y., B

egzistavimas, buvimas) yra tiesa. Tai ţymima taip – P(A|B), taigi tai parodoma 5 formulėje:

P(B)

A) P(B, B)|P(A

(5)

P(A|B) yra lygi bendrai įvykių B ir A įvykimo tikimybei padalintai iš įvykio B tikimybės.

Ši formulė šiuo atveju yra labai paprasta, ji gali būti kur kas sudėtingesnės formos, pvz.,

įvykį A gali įtakoti ne vien tik įvykis B, bet ir C, D, E ir t.t. Kitas variantas: įtakojamieji įvykiai yra

ne tik A, bet ir daugiau. Kaip paprastą pavyzdį galima apibūdinti taip: jeigu ţmogus viršija greitį

naktį, tikimybė, kad jis padarys avariją yra palyginti maţa, bet jei jis vairuoja naktį ir yra ką tik

vartojęs nemaţai alkoholio, tai tikimybė, kad jis padarys avariją yra labai didelė, o jei dar pridėtume

trečią įvykį, jog jis kurį tai laiką bando vaţiuoti uţsimerkęs, tai avarijos tikimybė bus arti 100%.

Analogiškai galima šią teoremą pritaikyti kreditų rizikos vertinime: tikslas nustatyti ar kreditorius

yra mokus, tai tarkim, jei jis turi nedaug likvidaus kapitalo, tai tikimybė, kad jis nemokus bus maţa,

bet jei jo pelno vienai akcijai augimas per paskutinius 3 metus yra labai maţas ar net nuostolingas,

tai tikimybė didėja, jei dar pridėsime, kad jo ilgalaikių paskolų ir turto santykis yra labai didelis

(tarkim, kad dvigubai ar trigubai) bei grynojo pelno ir akcinio kapitalo santykis bus labai maţas, tai

toks kreditorius gali būti skiriamas, prie rizikingų, o tų kintamųjų gali būti dar daugiau. Kita vertus,

jei rodikliai atvirkščiai yra geri, jį galima priskirti prie maţos rizikos grupės.

Page 42: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

42

Mašininiame mokyme 5 formulė perrašoma taip:

(6)

čia h yra hipotezė (tarkim, kreditorius skiriamas į rizikingųjų grupę), o D šiuo atveju yra

apmokymo duomenys (pvz., istoriniai finansiniai skolininko duomenys). P(h|D) yra vadinama h

posterior tikimybe, nes skaitoma, jog hipotezės patvirtinimas (arba paneigimas) yra nustatomas tik

po to, kai treniravimo duomenys D yra jau ţinomi, kai tuo tarpu pati P(h) tikimybė yra prior [9, 29].

Bajeso optimalaus klasifikatoriaus (angl., Bayesian optimal classifier, kitaip dar vadinami

BayesNet arba Bajeso tinklais) esmė yra nustatyti kokia labiausiai tikėtina klasė priklauso naujam

atvejui, ţinant treniravimo duomenis. Naujam atvejui vj teisingo klasifikavimo tikimybės P(vj|D)

išraiška yra pateikta kaip 7 formulė:

(7)

Bajeso optimalaus klasifikatoriaus išraiška pateikiama ţemiau (8 formulė):

(8)

Bajeso optimalus klasifikatorius naują atvejį skiria į vieną ar kitą klasę apjungdamas visas

galimas hipotezių prognozes, atsiţvelgiant (kaip svorių priskyrimas) į jų posterior tikimybes.

Naivaus Bajeso klasifikatorius (angl., naive Bayes classifier) remiasi atvejų atributais (ai),

pagal kuriuos atvejis yra skiriamas į vieną ar kitą klasę, o patys atributai tarpusavyje laikoma, jog

nėra koreliuoti, todėl šis metodas ir vadinamas „naiviu“. Šio klasifikatoriaus formulė (9) pateikiama

ţemiau:

(9)

kur vNB yra naivaus Bajeso klasifikatoriaus siekiama nustatyti reikšmė (angl., target value). Formulė

aiškinama taip: imama didţiausia gauta reikšmė, dauginant atvejo tikimybę su visų atributų

sąlyginių tikimybių su atveju sandauga. Pastarosios reikšmės P(vj) ir P(ai| vj) gaunamos iš jų

daţnumo treniravimo duomenyse [29].

Skirtingai nuo naivaus Bajeso klasifikatoriaus, bajeso tinklai atsiţvelgia į atributų tarpusavio

priklausomybę ir tam kuria kryptinius grafus su mazgų įtakojimu kitų buvimui [9, 30]. Taigi

naivaus Bajeso metodas yra paprastesnė Bajeso tinklų atmaina. Pagal pirmąjį pavyzdį, apibrėţiantį

5 formulę, galima sudaryti maţą Bajeso tinklą, kuris atvaizduotų pateiktą situaciją, tai tarkim, kad

Page 43: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

43

yra du įvykiai E1 ir E2, atitinkamai {smarkiai viršija greitį blaivus} ir {vairuoja dieną}. Ir tarkime,

kad vairuotojas jau padarė avariją, tada tikimybė, jog padaryta avarija todėl, kad smarkiai viršijo

greitį blaivus yra 1 iš 10, t.y, 10%, analogiškai, jog neblaivus bus 90 % ir šį įvykį ţymėsime

priešingu įvykiui E1, t.y., !E1. Toliau, jei tikimybė, kad jis vaţiavo naktį, ţinant, kad padarė avariją,

viršydamas greitį neblaivus, yra 75% ir ţymima P(!E2|E1), tai Bajeso tinklas atrodys kaip

pavaizduota 1 paveiksle.

Šaltinis: sukurta autoriaus, remiantis [10]

14 pav. Bajeso tinklas

Iš paveikslėlio matome, kad didţiausia tikimybė, jog avarija padaryta yra dėl to, kad

vairuotojas viršijo greitį išgėręs naktį, o maţiausia, jog viršijo greitį blaivus dieną, atitinkamai

67,5% ir 2,5%. Ţinoma, šis pavyzdys yra labai elementarus, tačiau prieţastinių, įtakojančių įvykių

gali būti ţymiai daugiau ir vieni gali įtakoti arba visus likusius įvykius ar tik dalį jų, taip susidaro

didelis ir painus tinklas su daug prieţastinių ryšių.

Bajeso metodas taip pat kaip ir kiti minėti metodai yra taikyti kreditų rizikai vertinti, keletas

iš jų pateikiama toliau: autoriai A. C. Antonakis ir M. E. Sfakianakis (2009) lygino naivaus Bajeso

metodą su kitais penkiais metodais, naudojant realių bankų duomenis, parodyta, kad šis metodas

nerodo geriausių rezultatų lyginant su kitais ir pateikiamos prieţastys dėl ko taip yra. Kiti autoriai

Sanjiv R . Das , Rong Fan ir Gary Geng savo darbe (2002) Bajeso metodą taikė PD dinamikos

atţvilgiu. Gunter Loffler, Peter N. Posch, Christiane Schone (2005) parodė, kad Bajeso metodas

gali būti sėkmingai taikomas bankinėse sistemose, kur daţniausiai naudojamos tradicinės rizikos

vertinimo metodologijos, kaip diskriminantinė ar logit analizės; autoriai parodė, jog naudojant

Bajeso metodą logit analizės vertinimo tikslumas gali būti pagerintas kartu naudojant ir Bajeso

Suma lygi 1

Page 44: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

44

metodą nuo 2 iki 9 %, įskaitant atvejus, kai duomenų rinkiniuose trūksta tam tikrų duomenų. Bajeso

tinklų taikymas kreditų įvertinimui taip pat buvo aprašyti autorių B. Baesens, M. Egmont-Petersen,

R. Castelo, J. Vanthienen (2002), kurie taip šį metodą apjungė su Markov Chain Monte Carlo

paieška geresniems rezultatams gauti. 1993 metais Terence C. Fogarty ir Neil S. Ireson Bajeso

metodą kreditų rizikai vertinti taikė apjungiant jį su genetiniais algoritmais. Egzistuoja ir hibridinių

Bajeso metodo taikymų, pvz., Gerhard Paass ir Jörg Kindermann (1998) kreditų vertinimui apjungė

du metodus: Bajeso ir klasifikavimo medţių. Taigi Bajeso metodas tinkamas ir sėkmingai

pritaikytas analizuojamai problemai spręsti, t.y., kreditų rizikai vertinti.

Toliau glaustai apibrėţiami ţinomi klasifikavimui tinkantys metodai, nesigilinant į jų

specifines savybes, pritaikymą realiems uţdaviniams ir pan., aptariant tik jų veikimo principus.

1.15. KNN

Šio metodo esmė yra atskirti duomenis į tam tikras klases pagal tų klasių bruoţų skirtumus,

ieškant jų pateiktų duomenų masyvuose. Kiekvienas duomenų vienetas yra skirstomas erdvėje, ir

matuojami atstumai tarp jų kiekvieną porą ţymint kaip (x,y). Tada skaičiuojamas euklidinis

atstumas tarp dviejų porų pagal formulę [30]:

(10)

Naudojant šiuos atstumus sudaroma atstumų matrica tarp visų įmanomų duomenų porų,

kiekvienas duomenų atvejis (vienetas, taškas) turi klasės atributą C={c1,...,cn}. Kiekvienam

duomenų atvejui k yra kaimyninių atvejų skaičius, kuriuos randama pagal sukurtąją atstumų

matricą. Tada analizuojant kaimyninius duomenų vienetus nustatoma kokioms klasėms jie priklauso

ir tam analizuojamam atvejui tada taip pat skiriama ta klasė, kurią daugiausia turi kaimyniniai

duomenų atvejai. Jei pasitaiko toks atvejis, jog yra dvi ar daugiau klasių, turinčių tą patį didţiausią

skaičių artimų kaimynų, tada atmetamas vienas iš kaimynų ir tikrinama priklausomybė likusiems

duomenų vienetams (k-1), reikiant ir (k-2), ir t.t., analizuojamam duomenų vienetui klasė

priskiriama tik tada, kai tik viena gretimų vienetų klasė dominuoja [31, 32].

1.16. Medžių algoritmai

Sprendimų medţiai arba kitaip klasifikavimo medţiai remiasi sprendimų išdėstymu

medţiais, kur egzistuoja mazgai „lapai“, kurie daugiau neturi jokių atsišakojimų ir yra klasės

reikšmė arba dar yra „sprendinių“ mazgai, kurie nusako tam tikrą „testą“ atributui-reikšmei

nustatyti. Visi klasifikavimo medţio mazgai, išskyrus aukščiausiąjį, kuris neturi tėvinio mazgo, turi

tik vieną tėvinį mazgą. Sprendimui priimti naudojant medţių metodą, einama nuo medţio šaknies į

Page 45: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

45

ţemesnius mazgus, kurie tenkina tam tikrą sąlygą (išlaiko testą), tada jau nuo tenkinančio sąlygą

mazgo einama į dar ţemesnius mazgus, kur vėl ţiūrima, kuris tenkina norimą sąlygą ir taip iki

paskutinio mazgo – lapo, kuris nusako į kokią klasę patenka testuojamas atributas. Kaip ir daugeliui

kitų metodų, šiam taip pat atributai ir klasės turi būti diskrečių reikšmių (tolydţius išėjimus duoda

regresijos metodai), o apmokymo duomenų turi būti kuo daugiau [33].

1.17. Evoliuciniai skaičiavimai

Evoliucinius skaičiavimus apima 4 populiariausi algoritmai, kurie daţniausiai naudojami

realioms problemoms spręsti: genetiniai algoritmai, genetinis programavimas, evoliucinės

strategijos, evoliucinis programavimas. Pastarieji algoritmai turi tą pačią metodologinę bazę,

skiriasi tik tam tikri komponentai jų veikimo schemose, reprodukcijos bei mutacijos operatoriuose,

bei populiacijos individų atrankos mechanizmuose [4]. Bendros jų savybės pateikiamos ţemiau:

1) Suformuojama pradinė individų populiacija;

2) Įvertinama kiekvieno populiacijos nario kokybės funkcija;

3) Geriausios kokybės individai atrenkami sekančiai generacijai;

4) Atliekamas kryţminimas tarp atrinktų populiacijos narių ir suformuojama nauja individų

generacija;

5) Atliekama naujos generacijos individų mutacija;

6) Apskaičiuojama naujos generacijos individų kokybės funkcijos. Jei geriausio populiacijos

nario kokybės funkcija atitinka uţsiduotą reikšmę arba viršijamas skaičiavimų limitas,

skaičiavimai nutraukiami. Priešingu atveju grįţtama į trečią procedūros ţingsnį.

Ţingsniai 4 ir 5 gali būti naudojami kartu arba tik vienas iš jų.

Genetiniai algoritmai iš kitų evoliucinių skaičiavimų išsiskiria trimis poţymiais:

- Individų savybės genetiniuose algoritmuose atvaizduojamos bitų eilutėmis (angl.,

bitstrings);

- Individų atrinkimui į sekančią generaciją taikomas proporcinės selekcijos metodas;

- Pagrindinis individų variacijos kūrimo instrumentas yra individų kryţminimas, tačiau

naudojamas ir mutacijos būdas (15 pav.).

Šaltinis: [4]

15 pav. Kryžminimo (kairė) ir mutacijos operatorių, taikomų genetiniuose algoritmuose,

iliustracija

Page 46: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

46

Reikia paminėti, kad toks operatorius kaip kryţminimas, neįneša jokios naujos informacijos,

kai tuo tarpu mutacijos operatorius įneša į populiaciją naują informaciją.

Genetinis programavimas yra speciali genetinių algoritmų rūšis, kurių tikslas yra rasti ne

optimalias tam tikrai problemai spręsti bitų eilutes, bet rasti optimalų programos kodą ar optimalią

analitinę funkciją, kuri leistų efektyviai išspręsti analizuojamą problemą. Kaip pavyzdys

pateikiamas 16 pav., kur vaizduojamas funkcijos )()sin()( 2 yxxxf medis.

Šaltinis: [4]

16 pav. Genetinio programavimo pavyzdys

Kiekvienas medţio (16 pav.) lapas yra tam tikra reikšmė, pasirenkama iš galimų reikšmių

rinkinio. Kiekvienas vidinis medţio mazgas yra tam tikra funkcija, kuri atrenkama iš galimų

funkcijų sąrašo. Visas medis atitinka vieną sudėtingą funkciją, kuri savyje gali apimti eilę

elementarių funkcijų ir jų reikšmių. Šios funkcijos reikšmę galima apskaičiuoti atitinkamai

apskaičiuojant viso medţio mazgų ir lapų reikšmes. Paprastai medis pradedamas skaičiuoti nuo

kairiosios ţemiausios šakos. Genetiniame programavime daţniausiai naudojamas medţio šakų

kryţminimo operatorius.

Evoliucinio programavimo ir evoliucinių strategijų metodai, skirtingai nuo genetinių

algoritmų, objekto savybių aprašymui vietoje fiksuoto ilgio bitų eilučių naudoja fiksuoto ilgio realių

skaičių vektorius. Pagrindinis pastarųjų dvejų metodų skirtumas yra tame, kad evoliucinio

programavimo metoduose daţniausiai pagrindinis populiacijos keitimo operatorius yra mutacija, o

tuo tarpu evoliucinių strategijų metodai populiacijos keitimui taiko tiek individų kryţminimo, tiek

mutacijos operatorius. Šiuo atveju kryţminimas yra dvejopas: paprastas (kaip ir genetiniuose

algoritmuose) ir aritmetinis, išvedant aritmetinį vidurkį tam tikroms reikšmėms.

Taigi evoliuciniai skaičiavimai naudojami daugelyje sričių, įskaitant ir klasifikavimą, o taip

pat paieškos optimizavimui, naudojant geriausiųjų galimų variantų vystymą tolimesnei raidai.

Page 47: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

47

1.18. Neraiškios aibės ir ekspertinės sistemos

Įprastose aibėse objektas priklauso aibei arba ne. Neraiškios aibės turi priklausomybės aibei

funkciją (priklausomumo funkciją). Tarkime, norima skolininkus skirstyti į rizikingus ir ne, knygas

į storas ir plonas…ir t.t. Neraiškios aibės padeda operuoti sąvokomis, tokiomis kaip „nelabai

didelis‟, „labai aukštas‟.

Neraiškios aibės tinkamos atvaizduoti nepatikimai informacijai ar nepatikimumo lygiui.

Neraiškios aibės aprašomos poromis:

xxA A, , (11)

kur x yra dalis visos įmanomos X reikšmių srities, x X ir 0 A 1 Priklausomumo funkcija

(x) nusako x priklausomybės aibei A laipsnį. (x)=0 reiškia, jog x nepriklauso aibei A, ir

(x)=1 reiškia pilną priklausomybę. Operacijos su neraiškiomis aibėmis atliekamos panašios kaip

ir įprastoms aibėms (sankirta, sąjunga, priklausomybė) [4].

Pati fuzzy logika viena retai kur taikoma. Daţniausiai ji taikoma kartu su neuroniniais

tinklais, genetiniais algoritmais, nes apjungus keletą metodų, galima gauti geresnius rezultatus

įnešant į juos ekspertų ar specialistų ţinias.

Klasikinės ekspertinės sistemos neturi apsimokymo savybių, tačiau jos sugeba paaiškinti

savo daromus sprendimus, o kiti metodai, kaip dirbtiniai neuroniniai tinklai gali apsimokyti iš

pavyzdţių, tačiau jie funkcionuoja „juodos dėţės“ principu ir negali paaiškinti savo pateikiamų

sprendimų. Hibridinė sistema, vadinama neuro-ekspertinė sistema, apjungia abiejų technikų

gerąsias savybes [4]. Šioje sistemoje ţinių bazė yra formuojama neuroninio tinklo pagalba.

Taisyklių formavimo blokas analizuoja neuroninio tinklo įėjimus ir išėjimus ir pagal juos

suformuoja „JEI ... TAI“ taisykles. Fuzzy logika yra bandoma taikyti kartu su įvairiais metodais,

įskaitant Bajeso, medţių, KNN ar SVM.

1.19. Klasifikavimo metodų tarpusavyje palyginimas

Šio skyriaus eigoje pateikiama eilė tyrimų, atliktų lyginant įvairius mašininio mokymo

algoritmus (metodus) ir įvertinant įvairius jų aspektus, kriterijus ir pan., juos aprašant ir įvardijant

gautus rezultatus.

1997 m. buvo atliktas vienas iš platesnių klasifikavimo algoritmų testų, kur pagrindinis

dėmesys buvo skirtas algoritmo klasifikavimo tikslumui, sudėtingumui ir treniravimosi laikui, o iš

viso buvo ištestuoti 33 algoritmai, nors kai kurie iš jų buvo tiesiog vieno metodo atmainos,

pavyzdţiui, buvo testuojami keturi Bajeso metodu paremti algoritmai: bayes, bayes opt, mml ir mml

opt (atitinkamai sutrumpinimai IB, IBO, IM ir IMO). Iš esmės tai du Bajeso metodai (be „opt“), o

Page 48: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

48

kiti du yra jų išplėtimai, kurie yra šiek tiek sudėtingesni, dirba ilgiau ir dėl papildomų sukuriamų

tinklų (medţių) skaičiaus uţima daugiau vietos, tačiau jų klasifikavimo tikslumas yra didesnis. Visi

33 algoritmai suskirstyti pagal savo savybes į 3 grupes: 22 medţiais ir taisyklėmis paremti

algoritmai, 9 statistiniai algoritmai ir 2 neuroniniais tinklais paremti algoritmai.

Algoritmams testuoti buvo pasirinkta 16 testinių originalių duomenų grupių (problemų, kaip

krūtinės vėţio atpaţinimas, paveikslėlių segmentacija, diabeto atpaţinimas, DNR sekos ir t.t.) ir 16

aptriukšmintų tų pačių duomenų grupių, kurių egzemplioriai turi nuo 5 iki 60 atributų, o grupėje

esančių egzempliorių skaičiai svyruoja nuo 151 iki 4435. Kadangi ne visi algoritmai pritaikyti

įprastiems kategoriniams atributams, jie buvo paversti į vektorinius atributus, t.y., į 0 ir 1. Testai

buvo atlikti trimis skirtingais kompiuteriais Unix platformoje.

Šaltinis: [23]

17 pav. 33 klasifikavimo algoritmų atliktų klaidų vidurkiai

Atlikus visus testus rezultatai (17 pav.) parodė, kad daugelio algoritmų statistinis teisingo

klasifikavimo efektyvumas yra gana panašus, tačiau geriausiai pasirodė POL (POLYCLASS)

algoritmas, kuris yra iš statistinės grupės ir remiasi LOG (angl., logistic discriminant analysis)

algoritmu bei pateikia tikimybinius rezultatus, tačiau šis metodas yra vienas iš pačių lėčiausių

(ilgiau nei 3 valandos apsitreniravimui).

Page 49: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

49

Šaltinis: [23]

18 pav. 15 geriausių klasifikavimo algoritmų vertinant tikslumą ir greitį

Pagal autorių išvadas, nors POL algoritmas klasifikuoja tiksliausiai, visgi, jei reikalingas

greitesnis algoritmas didelėms sistemoms spręsti didesnius uţdavinius, geriau rinktis kitus, kaip

LOG ar QL0 (vienas iš klasifikavimo medţių QUEST metodų, paremtas tiesiniu diskriminantiniu

metodu LDA, angl., linear discriminant analysis), o iš viso tokių algoritmų yra 15, kurie panašius

rezultatus pasiekia per maţiau nei 10 minučių (18 pav.), tarp kurių yra ir vienas iš Bajeso metodu

paremtas algoritmas.

Vienas iš paskutinių platesnių besimokančių algoritmų palyginimas atliktas autorių Rich

Caruana, Alexandru Niculescu-Mizil, kurie savo eksperimente tarpusavyje lygino 10 metodų: SVM,

neuroniniai tinklai, mechaninė regresija (logistic regression), naivus Bajeso metodas (naive bayes,

t.y., nemodifikuotas, neapjungtas su kitais metodais), atmintimi grindţiamas mokymas (memory-

based learning, KNN), atsitiktinio išsišakojimo (random forests), sprendimo medţių (decision

trees), plėstų medţių (bagged trees), paskatintų medţių (boosted trees), paskatinto kapojimo

(boosted stums). Taip pat šie visi metodai buvo apjungti su Platt Scaling ir Isotonic Regression

modeliais geresnių rezultatų gavimui. Šie du modeliai iš esmės skirti metodams neteikiantiems

tikimybinių skirstymo į tam tikras klases reikšmių. Pirmasis iš jų paremtas transformuojamą metodą

perkelti į sigmoidę, o antrasis pasiţymi apribojimais, kad ţymėjimas „ţemėlapyje“ yra

monotoniškai augantis.

Metodų testavimui buvo pasirinkti įvairūs jau realizuoti klasifikatoriai:

Page 50: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

50

SVM – SVMLight (Joachims, 1999) su įvairiais kriterijais ir tipais (radialinių

bazinių funkcijų, tiesinis, polinominis);

ANN – neuroniniai tinklai su gradientiniu nusileidimu atgal, skirtingais paslėptais

neuronų sluoksniais, skirtingais „momentum“, skirtingu treniravimo iteracijų (angl.,

epochs) skaičiumi;

Logistic Regression (LOGREG) – naudoti ir „regulized“ (su skirtingais

apribojimais), ir „unregulized“ modeliai;

Naive Bayes (NB) – naudotas Weka (Witten & Frank, 2005) klasifikatorius

išbandant visus tris siūlomus variantus: su normalizavimu, kernel nustatymais ir

diskretizacija;

KNN – naudoja keletą svorių parinkimo variantų ir skirtingas kernel reikšmes;

Random Forests (RF) – bandyti du klasifikatoriai: Breiman- Cutler ir Weka, bet

geriau pasirodė pirmasis su 1024 medţiais, tad jis ir naudotas, poţymių reikšmės taip

pat skirtingos;

Decision trees (DT) – naudotas Buntine's IND paketas (Buntine & Caruana, 1991) su

visais siūlomais modeliais BAYES, ID3, CART, CART0, C4, MML, SMML bei

tipais C44LS, C44BS ir MMLLS;

Bagged trees (BAG-DT) – tas pats kaip ir DT , tik skirtingas medţių skaičius bei

parenkami kriterijai;

Boosted trees (BST-DT) – tas pats kaip ir DT , tik skirtingas medţių skaičius bei

parenkami kriterijai;

Boosted stumps (BST-STMP) – tas pats kaip ir DT , tik skirtingas medţių skaičius

bei parenkami kriterijai;

Paveiksle 19 pateikti testavimo duomenys, kurių yra 11 grupių (sprendimo problemų),

kiekvienas iš jų yra paimtas iš jau anksčiau kitų autorių vykdytų eksperimentų kaip, pavyzdţiui,

raidţių, medicininių ar nominalių duomenų atskyrimas. Paveiksle pateikta 11 klasifikavimo

problemų, kur stulpeliai paeiliui reiškia: pavadinimas, treniravimo ir testavimo duomenų kiekiai.

Page 51: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

51

Šaltinis: [24]

19 pav. Testavimo duomenys

Testuotojai metodų efektyvumą vertino aštuoniais kriterijais suskirstytais į tris grupes:

Slenkstis (angl., threshold), kurį sudaro trys kriterijai – tikslumas (ACC), F-score

(FSC) bei lift (LFT) kreivės. Jei metodo reikšmės yra aukščiau slenksčio, jis turės

teigiamą vertinimą, jei ţemiau – neigiamą, čia neatsiţvelgiama kaip arti slenksčio

yra reikšmės.

Tvarkos (angl., ordering/rank), kur ţiūrima kaip tiksliai išsidėsčiusios reikšmės

tarpusavyje neatsiţvelgiant į pačių reikšmių skaitinį tikslumą, kaip gerai atskiriamos

teigiamos nuo neigiamų reikšmių, vienos klasės nuo kitos. Šią grupę sudaro ROC

kreivė, vidutinis tikslumas (APR) bei BEP (angl., precision/recall break even pint),

kurių kreivių plote turi būti metodų reikšmės.

Tikimybių, kuri nusako tikimybę, jog reikšmės patenka į vieną ar kitą klasę. Šią

grupę sudaro kvadratinė klaida (RMS) ir susikertanti entropija (angl., cross-entropy,

MXE).

Pagal pateiktus vertinimo kriterijus pateikti testavimo rezultatai (Pav. 20), kurie yra

nominalių reikšmių (nuo -1 iki 1, kur neigiamas, jei netenkino slenksčio). Eilutėse yra metodų

pavadinimai, o stulpeliuose paeiliui: modelio apjungimas su Platt ar Isotonic modeliais (atitinkamai

PLT ir ISO, o brūkšnelis reiškia neapjuntą metodą), toliau rikiuojasi 8 aukščiau išvardyti kriterijai,

priešpaskutinis stulpelis rodo vidurkį, o paskutinis stulpelis rodo vidurkį su optimaliausiais metodo

nustatymais, kuriuos jau keičia po pirmojo testo.

Page 52: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

52

Šaltinis: [24]

20 pav. Eksperimento rezultatai pagal vertinimo kriterijus

Pagal problemas rezultatai atrodo taip, kaip pateikta 21 paveiksle ţemiau, kur laukų

reikšmės tokios pačios kaip 19 paveiksle, tik vietoje vertinimo kriterijų yra sprendţiamų problemų

sutrumpinimai (pav. 21)

Page 53: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

53

Šaltinis: [24]

21 pav. Eksperimento rezultatai pagal sprendimo problemas

Apibendrinant atliktą eksperimentą, galima teigti jog klasifikavimo medţių principais

veikiantys metodai „boosting“, „random forests“, „bagging“ ir SVM metodas visuose problemų

sprendimuose atrodo efektyviausiai. Apjungus metodus su Platt ir Isotonic regresijos modeliais

pagerėja daugelio metodų rezultatai, o didţiausią įtaką daro „boosted trees“, SVM, „boosted

stumps“ ir „Naive Bayes“ metodams. Autoriai pranašiausiu metodu pripaţino „boosted trees“, o

antras seka „random forests“. Pasak [24], kadangi vieni metodai geriau sprendţia vienas

klasifikavimo problemas, kiti kitas, analogiškuose testuose, naudojant skirtingas problemas galima

gauti skirtingus rezultatus, nors jie neturėtų labai skirtis.

Darbe [25] buvo atliktas eksperimentas kaip teigiama trijų populiariausių klasifikavimo

metodų, t.y., SVM (Support Vector Machines), Bajeso ir kNN (k-Nearest Neighbors), paveikslėlių

turiniui atstatyti, o šie metodai pasirinkti būtent paveikslėlių turinio atstatymo kontekste (angl.,

Content-Based Image Retrieval, CBIR). kNN metodas pasirinktas todėl, kad ankstesniuose CBIR

tesuose, kur buvo klasifikuoti paveikslėlių pikseliai, jis jau parodė geresnius rezultatus nei

neuroniniai tinklai ir tiesinės diskriminantinės analizės bei kiti metodai.

Page 54: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

54

Tikslas buvo išbandyti naują autorių strategiją RETIN AL (RETIN Active Learning), kuri

tinkama įvairiems metodams ir šiame eksperimente pateisino autorių lūkesčius pasirodydama geriau

nei įprasti klasifikavimo metodai ir viena išskirta SVM strategija – Tong. Eksperimentas atliktas

naudojant COREL duomenų bazę su 50000 paveikslėlių, iš kurių pasirinkta 6000 eksperimentui.

Kaip teigia autoriai, eksperimentui buvo pasirinkti sunkiausiai klasifikuojami paveikslėliai su maţai

treniruojamų duomenų. Šie paveikslėliai buvo suskirstyti į vienuolika klasių, kurių pasiskirstymas

atrodo taip:

Klasė Dydis Pastaba

birds 219 Įvairūs viso pasaulio paukščiai

castles 191 Modernios ir viduramţių pilys

caverns 121 Urvai ir uolos iš vidaus

dogs 111 Įvairių veislių šunys

doors 199 Paryţiaus ir San Francisko durys

Europe 627 Europos miestai ir gamtovaizdţiai

flowers 506 Įvairios viso pasaulio gėlės

food 315 Indai ir vaisiai

mountains 265 Kalnai

objects 116 Įvairūs pavieniai objektai nesikeičiančiame fone

savannah 408 Afrikos dykumų gyvūnai

Šaltinis: sukurta autoriaus, remiantis [25]

Pagal gautus eksperimento rezultatus, geriausiai pasirodė SVM metodas, o Bajeso ir kNN

metodai klasifikavo prasčiau ir gana panašiai (šiek tiek geriau pasirodė kNN) su įprastomis ir

RETIN AL strategijomis.

2006 m. šaltinyje [26] tirtas penkių mašininio mokymo algoritmų gebėjimas sparčiai

klasifikuoti IP transportavimo srautus (pagal paketų dydţius, atvykimo laiką ir pan.). Tirti šie

metodai: Naive Bayes (naivaus Bajeso, kuris tiria priklausomybę tarp atributų ir klasės bei sieja su

kiekvienu atveju, o taip pat teikia tikimybes priklausomumui klasėms), C4.5 (medţių metodo

algoritmas), Bajeso tinklai (tinklai iš kryptinių neciklinių grafų, sudarytų iš mazgų, reiškiančių

funkcijas arba klases, ir ryšių bei iš sąlyginių tikimybių sudarytos lentelės, nurodančios ryšių

stiprumą), Naive Bayes Tree (medţių algoritmas apjungtas su naivaus Bajeso algoritmu) ir kreiptas

dėmesys ne į tikslumą, o į efektyvumą (skaičiavimo greitį, angl., performance), nes, pasak autorių,

algoritmų tikslumas yra daugmaţ panašus.

Atlikus testus pasitvirtino teiginiai, kad visų algoritmų tikslumas yra labai panašus, tačiau

greičio atţvilgiu jie rodo skirtingus rezultatus. Vienos iš išvadų yra, jog įvairių funkcijų

nenaudojimas menkai paveikia klasifikavimo tikslumą, tačiau ţymiai paspartina skaičiavimo greitį.

Greičiausias metodas klasifikuojant buvo C4.5, po jo seka Naive Bayes, Bajeso tinklų ir Naive

Bayes Tree algoritmai. Naive Bayes Tree tiksliausiai klasifikavo, tačiau vienas šio metodo

trūkumas, jog jis ilgiausiai uţtrunka kol sukuria savo struktūrą (apsimoko), tuo tarpu šiuo poţiūriu

greičiausi paeiliui Naive Bayes, Bajeso tinklai ir C4.5.

Page 55: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

55

Vienas iš palyginimų yra darbe [27], kur buvo pateikiamas naujas (2003 m.) Bajeso

neuroninio tinklo klasifikatorius (angl., Bayesian Neural Network Classifier, BNN) ir lyginami jo

rezultatai su iki tol buvusiais analogiškais klasifikatoriais bei su SVM klasifikavimo metodu, kuris,

pasak autorių, pasirinktas dėl to, jog įvairiuose eksperimentuose rodė geresnius klasifikavimo

rezultatus uţ kitus analogiškus metodus, kaip artimiausio kaimyno (angl., nearest neighbor),

diskriminantinės analizės (angl., discriminant analysis) bei neuroninius tinklus (angl., neural

networks), o taip pat yra efektyviai naudojamas realiose aplikacijose.

Nepaisant teigiamų SVM metodo savybių: praktiškumas naudojant realiose aplikacijose,

išplėtota teorinė bazė, sąlyginai paprasti skaičiavimai ir geri rezultatai, jis turi keletą minusų – tai

jautrumas dideliems triukšmams bei netoleravimas neapibrėţtoms reikšmėms, kas lemia prastesnes

generalizavimo savybes, t.y., prastesni rezultatai dirbant su testuojamais duomenimis nei su

apmokymo.

Kalbant apie neuroninius tinklus, jie turi geras vidines savybes, bet jas sunkiau realizuoti,

todėl neuroniniai tinklai klasifikuojant rodo prastesnę kokybę lyginant su SVM ar BNN.

Pagrindinės dvi prieţastys kodėl sudėtinga sėkmingai realizuoti neuroninius tinklus yra vis dar

neaiški neuroninio tinklo optimali struktūra specifinei uţduočiai spręsti bei reikalingų duomenų

kiekiai apsimokyti, todėl jie arba per daug pritampa prie mokymosi duomenų arba per maţai ir tai

lemia prastas generalizavimo savybes. Kita NN (neuroninių tinklų) problema – treniravimo

algoritmų efektyvumas, nes deterministiniai treniravimo algoritmai, kaip skleidimo atgal (angl.,

backpropagation) ir jungtinio gradiento (angl., conjugate gradient) bei jų įvairios variacijos yra

linkusios patekti į lokalius funkcijos minimumus ir ši problema opesnė su sudėtingesnės struktūros

NN. Šias problemas padeda spręsti Bajeso neuroniniai tinklai: pradinė tinklo struktūra ir svorių

jungtys veikia reguliacija tinklo apmokymams, kontroliuojant įėjimo kintamųjų, paslėpto sluoksnio

neuronų skaičiaus ir svorių srities parinkimą; Monte Karlo Markovo grandinės (angl., Markov chain

Monte Carlo, MCMC) metodas leidţia išvengti patekimo į lokalius minimumus, kur jungtinės

posterior tinklų struktūros ir svorių jungtys yra atrenkami, o trečia – galimas duomenų

neapibrėţtumas, kur praleistiems duomenims naudojamas vidurkinimas.

Pastarajame [27] darbe buvo įvykdyti du eksperimentai, kurių viename buvo testuojamas tik

BNN, o kitame visi trys aukščiau minėti metodai. Kiekviename eksperimente daryta po 10 testų ir

imamos vidurkinės reikšmės, kiekviename teste buvo parinkta po 6000 iteracijų, o kiti nustatymai

buvo keičiami. Naujajam BNN metodui buvo naudojamas autorių sukurtas produktas, o tuo tarpu

senesniam BNN buvo pasirinktas jau sukurtas produktas, kurio autorius R.M.Neal ir jį galima

parsisiųsti iš http://www.cs.toronto.edu/. Šiam klasifikatoriui taip pat atlikta 10 testų, tačiau

iteracijų skaičius buvo 30, bet jis yra adekvatus naujajam BNN metodui su 6000 iteracijų, nes jis

Page 56: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

56

turi įvairių po-ţingsnių (angl., substeps), o taip pat naudoja įvairius atrankos metodus, skiriasi ir

paslėptų neuronų skaičius, kurių tikslūs duomenys pateikti ţemiau esančiame paveiksle (pav. 22).

Abejų metodų CPU sunaudojamas laikas yra panašus. SVM klasifikatorius (LIBSVM) buvo taip pat

parsisiųstas iš http://www.csie.ntu.edu.tw/»cjlin, kurio autoriai Chang and Lin. Pastarajam

branduolio (angl., kernel) reikšmės C buvo parinktos nuo 0.001 iki 10, o rezultatai taip pat pateikti

paveiksle 22, o kadangi SVM metodai yra kur kas greitesni skaičiavimo atţvilgiu jų CPU

sunaudotas laikas nebuvo įtrauktas ir buvo atliktas po 1 testą kiekvienam C, be to testavimo klaidos

standartinių nuokrypų vidurkiai laikomi artimais nuliui. Eksperimentui pasirinktas tiesinis

branduolys, nes prieš tai išbandyti radialinių bazinių funkcijų bei polinominiai branduoliai ir jų

generalizavimo savybės buvo prastesnės uţ tiesinę funkciją.

Šaltinis: [27]

22 pav. Eksperimento rezultatai (BNN ir SVM)

Paveiksle 22 grafoje CPU nurodyti CPU apkrovimo laikai sekundėmis dešimčiai testų, o

stulpeliai pavadinimais treniravimas ir testavimas rodo suvidurkintas klaidas ir šalia skliausteliuose

standartinės nuokrypos. Reziumuojant 22 paveikslą, matoma, kad naujasis BNN turi geresnes

generalizavimo savybes uţ ankstesnįjį BNN, nors jis ir darė maţiau klaidų apmokant, tai sąlygoja

per didelį prisitaikymą prie apmokymo duomenų. SVM šiuo atveju rodo panašius rezultatus į

naująjį BNN, bet, sprendţiant labiau komplikuotas uţduotis, SVM rezultatai rodo prastesnius

rezultatus. Vizualiai šie duomenys pateikti kitame paveiksle (23), kur paimti du skirtingi duomenų

rinkiniai ir stulpeliais paeiliui parodyta naujojo BNN, ankstesniojo BNN ir SVM metodų gebėjimas

Page 57: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

57

klasifikuoti. Tuščiaviduriai ir pilnaviduriai kvadratukai rodo dvi skirtingas klases, o linijos parodo

realų klasių pasiskirstymą, kai tuo tarpu metodų gebėjimas klasifikuoti vaizduojamas pilkame fone.

Šaltinis: [27]

23 pav. Klasifikavimo rezultatai (BNN ir SVM)

Pastarajame eksperimente, BNN klasifikavimo tikslumas buvo apie 96%. Tame pačiame

darbe buvo atlikti dar keletas eksperimentų, kurie buvo kur kas sudėtingesni, jų metu klasifikuoti

krūties vėţio atvejai bei proteino struktūros, tačiau smulkiau šie eksperimentai šiame darbe nebus

aptariami, tik galima paţymėti, jog visuose geriausiai generalizavimo savybėmis pasiţymėjo

naujasis BNN metodas, o taip pat buvo įtrauktas SVM paremtas radialinėmis bazinėmis funkcijomis

krūties vėţio eksperimente ir paliktas tik jis proteino struktūros klasifikavimui, nes pasirodė geriau

nei tiesinio branduolio atveju.

Taigi šio darbo metu empiriškai parodyta, kad Bajeso neuroniniai tinklai gali būti efektyviai

naudojami klasifikavimui ir pristatytas naujas metodas, kuris turi geresnes generalizavimo savybes

nei prieš tai naudotas metodas bei SVM metodų variacijos, o tai lėmė dvi prieţastys: nauja

Page 58: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

58

tikimybinė funkcija ir globalios duomenų informacijos naudojimas sprendimų riboms (angl.,

decision boundary) nustatyti, kai tuo tarpu SVM naudoja lokalią informaciją. BNN sėkmingai

klasifikuoja tiek tiesinius tiek netiesinius duomenis.

Dar kitame darbe [28] parodyta, kad neraiškių aibių (angl., Fuzzy sets) ir tikimybinio Bajeso

metodais ekspertų ţiniomis sumodeliuotos sistemos gali būti efektyviai naudojamos

spektroskopiniuose tyrimuose. Šio eksperimento tikslas – turint pradinius duomenis sumodeliuoti

galimą vibracijos daţnių informaciją. Galiausiai prieita išvadų, jog abu metodai rodo panašius

rezultatus.

1.20. Analitinės dalies išvados

1. Aptartos pagrindinės kredito rizikos sąvokos, valdymo bei vertinimo būdai. Kredito rizikos

vertinimas gali apimti ir kitų rizikų vertinimą (pvz., viso portfelio rizika), atkreiptas dėmesys ir į

rizikos išmatavimo būdus, kaip VaR bei scenarijų technikos. Šiame darbe apsiribojama pavienio

kredito rizikos vertinimu.

2. Apţvelgti pagrindiniai klasikiniai kredito rizikos vertinimo metodai, tiek matematiniai-

statistiniai, tiek ir modernūs, aptarti jų naudojimo privalumai ir trūkumai, įvertintos dirbtinio

intelekto metodų (skirtų klasifikavimui bei klasterizavimui) panaudojimo su jais galimybės.

3. Atlikus klasikinių ir DI metodų taikymo kredito rizikos vertinimui lyginamąją analizę, išryškinti

dirbtinio intelekto metodų privalumai, todėl buvo atlikta jų platesnė analizė.

4. Išskirti pagrindiniai ir plačiausiai naudojami mašininio mokymo metodai (neuroniniai tinklai,

atramos vektorių mašinos, Bajeso metodas), apţvelgti jų ankstesni taikymai nagrinėjamai

problemai bei jų privalumai ir trūkumai, o taip pat aptarti kiti ţinomi dirbtinio intelekto

metodai: evoliuciniai skaičiavimai, fuzzy logika, k-artimiausio kaimyno ir klasifikavimo medţių

metodai).

5. Aptarta eilė išsamių tyrimų atliktų įvairių autorių su skirtingais klasifikavimo metodais. Galima

daryti išvadas, kad vieni geriausių ir plačiausiai naudojamų yra SVM, neuroninių tinklų ir

medţių bei KNN metodai, kurie rodo tikslesnius klasifikavimo rezultatus, nuo jų kiekybiškai ir

kokybiškai šiek tiek atsilieka Bajeso metodas, tačiau parodyta, jog specifinėms problemoms

spręsti jis rodo geresnius rezultatus uţ visus paminėtus metodus bei bendru poţiūriu turi

pranašumo greičio ir paprastumo atţvilgiu, todėl vėlesniems tyrimams pasirinktas Bajeso

metodas.

6. Pasirinkto metodo tinkamumu analizuojamai problemai spręsti galimi daugelis įvairių kriterijų

ir vieni iš jų – klasifikavimo tikslumas ir klaidų skaičius. Iš pateiktų metodų tarpusavio analizių

matyti, kad tikslumas svyruoja nuo 10% iki beveik 100% (klasifikuojant į dvi klases), tačiau

Page 59: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

59

daugeliu atveju įvairūs metodai klasifikuoja nuo 50% iki 90%, todėl pasiekus bent 70%

tikslumą būtų galima tvirtinti, kad lyginant su kitais metodais Bajeso metodas yra tinkamas.

Klaidų svyravimas šaltiniuose nuo 0.195 iki beveik 0.4. Ţinoma, reiktų atsiţvelgti ir į faktą, kad

šio eksperimento metu bus klasifikuojama ne į dvi, o tris klases, sudarant sudėtingesnes sąlygas

klasifikatoriui.

7. Taigi šio darbo metu planuojama panaudoti Bajeso metodą kredito rizikai valdyti, t.y, turint

kompanijų finansinius duomenis, pagal juos suskirstyti jas į mokias ir nemokias. Duomenys bus

paimti iš ankstesnio VU KHF doktoranto P.Danėno daryto magistrinio darbo, taikant SVM

metodą tokiam pačiam tikslui, tik galbūt juos papildant, o galiausiai, esant galimybei palyginti

gautus rezultatus. Prieš tai tuos pačius duomenis savo daktaro laipsnio disertacijai naudojo ir

kitas VU KHF doktorantas E.Merkevičius. Visiems tyrimams vadovavo dr. doc. Gintautas

Garšva.

Page 60: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

60

2. BAJESO METODU PAREMTO EKSPERIMENTO APRAŠYMAS

Šiame skyriuje aprašomas siūlomas eksperimentinis sprendimas, jo prototipas ir įvairūs

veiklos aspektai. Aptariama, kaip šią sistemą vėliau būtų galima patobulinti bei išplėsti.

2.1. Naudojamų duomenų ir programinės įrangos aprašymas

Sistemos realizacijai pasirinktas moksliniuose tyrimuose plačiai naudojamas JAVA

programavimo kalba sukurtas Weka 3.6.2 programinis atvirojo kodo įrankis, kuris leidţia realizuoti

jo aplinkoje įvairius specifinius modulius (tokius, kaip duomenų importavimas, duomenų įvedimas

ir pan.) bei sąveiką su duomenų bazėmis ir įvairių formatų duomenų failais. Šis paketas naudojamas

daugelyje įvairių tyrimų susijusių su klasifikavimu, klasterizavimu, prognozavimu ir t.t., dalis jų

pateikiama literatūros sąraše [19, 24, 26, 35, 37, 38, 39, 40, 41].

Weka paketas leidţia jungtis tiek prie duomenų bazių, tiek importuoti duomenis iš failų,

todėl pasirinktas antrasis variantas, eksportuojant duomenis iš SQL į CSV failo formatą. Duomenų

saugojimui pasirinkta Firebird duomenų bazė, nors galimas variantas ir atvirojo kodo MySQL

duomenų bazė, nes abi jos leidţia greitai apdoroti didelius duomenų kiekius bei pasiţymi

patikimumu, o taip pat yra daugiaplatformės (Windows, Linux, kitos operacinės sistemos), abi gali

eksportuoti duomenis į įvairius failo formatus.

Eksperimentui naudojami EDGAR tarptautinės duomenų bazės 1999 – 2003 m. duomenys,

kurie apima beveik 10000 tarptautinių įmonių įvairius finansinius duomenis, o pagrindą sudaro

metinių ir ketvirtinių balansų bei pelno ataskaitų duomenys. Visi duomenys suskirstyti į 9

stambesnius sektorius, kurie pateikti ţemiau esančioje lentelėje. Kokių veiklų firmos patenka į šiuos

sektorius pateikta 2 priede.

5 lentelė

Kompanijų skirstymas į 9 sektorius

Iš viso naudoti 79 pirminiai ir išvestiniai rodikliai (1 priedas). Išeigos reikšmėms naudotas

Altmano modelis, gamybinėms kompanijoms - vienas, kitoms - kitas (standartinis). Naudotas

atributų (rodiklių) atrinkimas pagal reikšmingumą, naudojant genetinį algoritmą (feature selection),

Sektoriaus kodas Pavadinimas Kompanijų skaičius

01-09 Agriculture, Forestry, And Fishing 33

10-14 Mining 469

15-17 Construction 83

20-39 Manufacturing 3027

40-49 Transportation, Communications, Electric, Gas, And Sanitary Services 786

50-51 Wholesale Trade 287

52-59 Retail Trade 405

60-67 Finance, Insurance, And Real Estate 1853

70-89 Services 1712

Page 61: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

61

taip sumaţinant sugeneruoto modelio apimtį, tai atliko tyrimo kuratorius P. Danėnas, o atrinkti

atributai pateikiami 3 priede. Modelio parametrai imti "pagal nutylėjimą“.

Informacijos srautai iliustruojami duomenų srautų diagrama (24 pav.). Duomenų srautų nėra

itin daug, tačiau kai kurie jų apima didelį parametrų arba informacijos kiekį.

Analitikas

Saugomi

modeliai

Saugomos

ataskaitos

Saugomi

kompanijų

duomenys

Duomenų

įvedimas arba

modifikavimas

Įmonių duomenys

Nauji arba modifikuoti įmonių duomenys

Duomenų bazė

Duomenų papildymas

rizikos įvertinimo

duomenimis

Finansiniai duomenys įvertinus riziką

Įmonių duomenys

Matematinis modelis rizikai vertinti

Nustatymai

Klasifikavimas

Klasifikavimo programinė įranga

Finansiniai duomenys įvertinus riziką

Nustatymai

Finansinių duomenų

importavimas

Finansinių duomenų

eksportavimas

Finansiniai duomenys įvertinus riziką

Modifikuoti duomenys

Ataskaita

Ataskaita

Šaltinis: sudaryta autoriaus

24 pav. Sistemos duomenų srautų diagrama

Sistemos veikimą galima iliustruoti sekos diagrama (25 pav.). Ši diagrama apima visą

veiksmų seką nuo modelio pasirinkimo iki jo išsaugojimo. Galima pastebėti, kad į šią diagramą

įtrauktas klasterizavimas; tai irgi viena iš galimybių plėsti sistemą, įdiegiant ir modernius

klasterizavimo metodus bei juos pritaikant kredito rizikos vertinimo sričiai. Svarbu atsiţvelgti į tai,

kad šiuo atveju nebus sukuriamas ir išsaugojamas joks modelis; klasterizavimo proceso metu

duomenys tik suskirstomi į klasterius pagal ryšius tarp jų [19].

Page 62: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

62

Šaltinis: Danėnas P., Merkevičius E., Garšva G. Sistemos modulio, skirto intelektualių modelių kredito rizikos

vertinimui kūrimui, koncepcinė struktūra [43]

25 pav. Galima modelio kūrimo veiksmų sekos diagrama

Sistema ateityje gali būti ir plečiama, integruojant naujus modelius bei metodus. Tam gali

būti panaudotos įvairios bibliotekos bei programiniai komponentai, realizuojantys vieną ar daugiau

mašininio mokymo algoritmų. Kadangi Weka mašininio mokymo sistemoje realizuoti beveik visi

populiariausi modernūs mašininio mokymo algoritmai, tokie, kaip Bajeso tinklai, neuroniniai

tinklai, sprendimų medţio ir kiti metodai, integravus šiuos algoritmus, sistema gali būti išplėsta iki

sistemos, kuri galėtų netgi palyginti dviejų ar daugiau skirtingų algoritmų rezultatus (Danėnas,

Merkevičius, Garšva, 2008).

Lygiai taip pat galimas ir kitų atvirojo kodo bibliotekų integravimas (Danėnas, Merkevičius,

Garšva, 2008):

daug mašininio kodo algoritmų realizacijų Java kalba galima rasti SourceForge portale,

platinančiame atvirojo kodo programas bei bibliotekas, be to, daug bibliotekų ir realizacijų Java ir

kitomis programavimo kalbomis galima rasti ir kituose Interneto tinklalapiuose;

yra ir galimybė naudoti MATLAB skaičiavimų variklį, tam naudojant JMatLink biblioteką –

galimas sistemos komunikavimas su MATLAB sistema bei tikėtina (bet dar netirta) galimybė

modelių rezultatus išsaugoti sistemos DB;

galimybė integruoti kitos atvirojo kodo sistemų algoritmus, juos adaptuojant sprendţiamai

Page 63: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

63

problemai. Iš jų galima išskirti kompanijos Rapid-I YALE1 duomenų gavybos sistemą bei Java

duomenų gavybos standartą ir jo realizaciją JDM2;

integravus ekspertinį posistemį (naudojant jFuzzyLogic3, Jess

4 ar kitas JAVA ekspertinių

sistemų kūrimo priemones), galima sukurti ir galimybę klasifikavimo ir klasterizavimo procesuose

naudoti ekspertines ţinias bei kurti ir neraiškių aibių modelius.

2.2. Eksperimente naudojami metodai

Eksperimente naudojamas vienas iš populiariausių ir plačiausiai taikomų duomenų gavybos

ir statistikos metodų – klasifikavimas, kurio pagrindinė uţduotis yra suskirstyti atributų vertes pagal

galimas klases. Šis metodas svarbus įvertinant tiek dabartines, tiek ir prognozuojamas vertes;

prognozavimas gali būti traktuojamas kaip atributo vertės klasifikavimas į vieną iš galimų klasių

(Dunham, 2003, cit. pagal šaltinį [19]).

Pati klasifikavimo problema formaliai apibrėţiama taip (Dunham, 2003, cit. pagal šaltinį

[19]): turint duomenų bazę su D = {t1, t2, …., tn} įrašų (vienetų) ir klasių aibę C = {C1, C2, …., Cn},

klasifikavimo problema yra susiejimo CDf : , kurioje kiekvienas ti yra priskirtas kuriai nors

klasei. Klasėje Cj yra tiksliai tik tie įrašai, kurie su ja susieti, t.y., DtniCtftC ijiij ,1,)(| .

Šios problemos sprendimui gali būti naudojami trys pagrindiniai metodai (Dunham, 2003):

1. Ribų apibrėžimas – klasifikacija atliekama padalijant galimų įeigos įrašų erdvę į

regionus, kur kiekvienas regionas susietas su viena klase;

2. Tikimybių pasiskirstymo naudojimas – kiekvienai duotai klasei Cj, P(ti | Cj) yra

tikimybių pasiskirstymo funkcija (probability distribution function, sutr. PDF) klasei, vertinamai

taške ti;

3. Vėlesnių (posterior) tikimybių panaudojimas – turint duomenų reikšmę ti, reikia

apibrėţti tikimybę, kad ti yra klasėje Cj. Tai ţymima P(Cj|ti) ir vadinama vėlesne tikimybe. Vienas

iš tokios klasifikacijos poţiūrių būtų apibrėţti vėlesnę tikimybę kiekvienai klasei ir tada priskirti ti

klasei su didţiausia tikimybe.

Pastaruoju metodu remiamasi ir šiame darbe.

1 Rapid-I [interaktyvus]. Adresas Internete: http://rapid-i.com/content/blogcategory/10/69/lang,en/.

2 JSR-000073 Data Mining API (Final Release). Adresas Internete:

http://jcp.org/aboutJava/communityprocess/final/jsr073/index.html 3 jFuzzyLogic: Open Source Fuzzy Logic (Java). Adresas Internete: http://jfuzzylogic.sourceforge.net/html/index.html

4Jess, the Rule Engine for the Java Platform[interaktyvus]. Adresas Internete: http://herzberg.ca.sandia.gov/

Page 64: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

2.3. Eksperimentinio tyrimo metodikos aprašymas

Siūlomas sprendimas apimtų klasikinių diskriminantinių modelių ir Bajeso metodo

integravimą. Šiuo atveju diskriminantinis modelis būtų naudojamas suskaičiuoti išeigos reikšmes,

t.y., įvertinant įmonės rizikingumą, priskirti ją prie vienos iš trijų klasių (rizikinga, vidutinio

rizikingumo ar nerizikinga). Bajeso metodas naudojamas modelio gavimui, t.y., apskaičiuojami jo

koeficientai, kuriuos naudojant, būtų gaunama duomenų be išeigos reikšmių tiksliausia

klasifikacija. Šios problemos sprendimas apima ne binarinį klasifikavimą (į dvi klases – „rizikinga“

ir „nerizikinga“), o skirsto jas į tris klases. Kiti tyrimo ţingsniai apimtų šiam tinkamiausių

diskriminantinių modelių nustatymą bei geriausių Bajeso metodo parametrų ir paieškos algoritmų

parinkimą.

Nustatant tinkamiausius diskriminantinius modelius, atliekamas apmokymas, naudojant

visus rodiklių (iš viso 79). Šiuo atveju kuriami modeliai, naudojant kurį nors iš taikomų

diskriminantinių modelių (Altman, Springate, Zmijewski) bei vieną iš Bajeso metodų. Vėliau

naudojamas indukcinis principas, kai laikoma, kad modelis, su standartinėmis metodo reikšmėmis

parodęs geriausius rezultatus, yra geriausias ir ieškoma būdų, kaip su geriausia kombinacija pasiekti

dar geresnių rezultatų.

Šiame etape bus tiriami du Bajeso tinklų klasifikatoriai, tai Naivaus Bajeso ir BayesNet

metodai (po 2 abiejų), o vėliau atrenkami du geriau pasirodę ir tiriami kartu su analogišku SVM

metodu. Kaip jau buvo minėta, Bajeso tinklai yra tikimybiniai kryptiniai necikliniai grafai, sudaryti

iš kintamųjų (mazgų, angl., nodes) ir kryptinių briaunų (angl., arcs), jungiančių kintamuosius.

Kiekvienas kintamasis turi baigtinį skaičių jiems priskirtų būsenų ir kiekvienas kintamasis Ak su

tėviniais mazgais B1; ...;Bn turi priskirtą tikimybių pasiskirstymo lentelę P(Ak| B1; ...;Bn). Šiame

tinkle kiekvienas mazgas reiškia atributą, o kiekviena briauna reiškia prieţastinius ryšius tarp jų.

Kiekvienas mazgas turi savo tikimybių lentelę, kuri kaupia informaciją apie visų įmanomų atributo

būsenų jungtinį tikimybių pasiskirstymą, kai ţinomi visi jo tėviniai mazgai. Šios lentelės vėliau

naudojamos nuspėti klasės tikimybę bet kokiam duotam atvejui. Tikimybių pasiskirstymas

skaičiuojamas pagal formulę:

(9),

kur n yra bendras atributo būsenų skaičius, Xi yra X atributo būsena, o parent(Xi) reiškia

būsenos Xi tėvinius mazgus.

Page 65: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

65

Minėtiems Bajeso tinklų sudėtingumas didėja, kai kintamasis turi kuo daugiau atributų ir

klasių, nes susidaro didţiuliai kiekiai būsenų, kurias reikia apskaičiuoti.

Naivaus Bajeso metodas, kaip jau minėta anksčiau, pasiţymi tuo, kad jis kiekvieną atributą

laiko vienodai reikšmingu priskiriant vienai ar kitai klasei, o taip pat daroma prielaida, jog jie

tarpusavyje yra nekoreliuoti. Šio metodo principu tikimybių pasiskirstymas skaičiuojamas šia

formule:

(10)

Iš gautų reikšmių tinkamiausio sprendinio parinkimui naudojama 8 formulė.

Bajeso tinklų klasifikatoriai (šiuo atveju BayesNet) naudoja skirtingus paieškos algoritmus,

jog surastų optimaliausią duomenų pateikimą. Skirtingiems paieškos algoritmams gali skirtis

klasifikavimo tikslumas ir greitis. Populiariausi paieškos algoritmai yra šie [42]:

K2 – tai įvertinimais paremtos godţios paieškos (angl., score-based greedy search) algoritmas,

skirtas Bajeso tinklams apsimokyti iš duotų duomenų. Šis algoritmas maksimizuoja optimalaus

grafo topologijos tikimybę naudojant Bajeso įverčius, jog išdėstytų pagal eiliškumą (angl.,

ranking) skirtingus grafus. Algoritmas yra apribotas kintamųjų išdėstymo tvarka.

Genetinė paieška – remiasi natūralioje gamtoje būdingu populiacijos principu, kur vyrauja

natūrali atranka ir laimi stipriausieji. Etapais atrenkamas geriausias galimas sprendimas

atrenkant geriausiai pasirodţiusius sprendinius, proporcinės atrankos arba selekcijos taikymas

reiškia, kad individai tolesnėms generacijoms parenkami proporcingai jų kokybės funkcijai.

Genetiniuose algoritmuose pagrindinis reprodukcijos operatorius yra bitų eilutės kryţminimas.

Jo metu imamos dvi bitų eilutės kurios reprezentuoja „tėvus“ ir sukuriami du nauji individai.

Bitų eilutės pjūvio taškas pasirenkamas atsitiktinai. Kryţminimo metu pjūvio taške atskirtos

tėvų dalys sukeičiamos vietomis ir suformuojamos naujos bitų eilutės. Kryţminimas taip pat

atliekamas naudojant kelis pjūvio taškus vienu metu. Kitas populiarus genetinių algoritmų

operatorius yra mutacija. Mutacijos metu tėvinėje bitų eilutėje yra pakeičiamas (paprastai

invertuojamas) vienas atsitiktinai pasirinktas bitas ir tokiu būdu gaunamas naujas palikuonis.

Skirtumas tas, kad kryţminimas, neįneša jokios naujos informacijos, kai tuo tarpu mutacijos

operatorius įneša į populiaciją naują informaciją. [4, 42]

Dirbtinis atkaitinimas – procedūra yra atsitiktiniu ieškojimu grindţiamas procesas, efektyvus

ieškant globalinio funkcijos ekstremumo (minimumo ar maksimumo). Idėja paimta iš

metalurginio šaldymo ar skysčių uţšalimo ir kristalizavimosi procesų. Atomai skysčiuose juda

Page 66: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

66

labai greitai, esant aukštoms temperatūroms, ir lėčiau, temperatūrai krintant. Lėto aušinimo

metu išnyksta gardelių dislokacijos ir įtempimai. Globalinė sistemos energija tokiu atveju

pasiekia absoliutų minimumą. Greito aušinimo metu atomams nelieka laiko išsirikiuoti, ir

sistema lieka aukštoje energetinėje būsenoje. Per greitai maţinant temperatūrą įtempimai

esantys metale ir uţšąlančiame ar besikristalizuojančiame skystyje “įšąla”. Matematiniai

įrodymai, kad algoritmas randa globalinį funkcijos minimumą remiasi tuo, kad patikrinama be

galo daug w pakeitimų. Jei po tam tikro laiko nebus priiminėjami blogi sprendimai, atsitiktinai

ieškant kada nors bus surastas geriausias. Tačiau praktiniai rezultatai rodo, kad jau per baigtinį

iteracijų skaičių pasiekiami neblogi rezultatai. Labai daţnai į globalinį minimumą papuolama

gana greitai. [4, 42]

Greedy (godus) Hill Climber (HC) – šiuo atveju reikia įsivaizduoti, kad visi galimi

klasifikavimo problemos sprendimai yra atvaizduojami „trimatėje plokštumoje“ (angl., three-

dimensional landscape). HC eis grafu iš mazgo įmazgą didinant sprendimo įvertinimą tol, kol

nepasieks lokalaus minimumo. Šis Bajeso tinklų apsimokymo algoritmas naudoja HC pridedant,

išmetant ar perrikiuojant grafo briaunas. Skirtingai nuo K2 algoritmo, paieška nėra apribojama

kintamųjų išsidėstymu.

Repeated (pakartotinis) Hill Climber (RHC) – šis algoritmas tinkamiausios Bajeso tinklo

struktūros ieško pakartotinai generuojant atsitiktinius tinklus ir pritaikant aukščiau minėta HC

algoritmą. Šio algoritmo privalumas yra tas, jog kai HC uţstringa kuriame nors mazge,

pasirenkamas naujas atsitiktinis mazgas ir HC algoritmas pradedamas iš naujo. Ši procedūra

kartojama k kartų, o sprendiniu pateikiamas geriausias rastas maksimumas.

Kai kurie galimi naudojami parametrai pateikti ţemiau:

UseKernelEstimator (k). Kai šis parametras nustatytas, tinklas labiau tinkamas skaitiniams

atributams nei normaliniam išsidėstymui, t.y., efektyvumas turėtų matytis kintant skaitinių reikšmių

kiekiui tarp atributų.

UseSupervisedDiscretisation (Sd). Naudojama skaitines reikšmes konvertuoti į nominalias.

initAsNaiveBayes (iNb). Pagal nutylėjimą ši reikšmė būna parinkta, ji reiškia, kad pradinė

struktūra apsimokymui yra naivus Bajeso tinklas, kitu atveju pradedama nuo tuščio tinklo.

markovBlanketClassifier (Mb). Kai tinklo struktūra yra išmokta, korekcijos atliekamos pagal

Markov blanket kiekvienam mazgui, t.y., kiekvienas mazgas kaupia savyje informaciją ir yra

susietas ne tik su savo tėviniais ir vaikiniai mazgais, bet ir su tėvų tėvais ir vaikų vaikais.

RandomOrder (R). Atsitiktinai sukeičia kintamųjų atributus, pakeičiant juos vietomis nuo

pradinių įkeltų vietų importuojant duomenis.

Page 67: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

67

useArcReversal (Ar). Kai ši reikšmė pasirenkama, briauna tarp dviejų mazgų yra pakeičiama

atitinkmai priskiriant tėvinę briauną.

useTournamentSelection (Ts). Šis parametras nusako populiacijos parinkimą genetiniame

paieškos algoritme. Kai ši reikšmė teigiama, parenkami du skirtingi tinklai ir geresnis iš jų

praleidţiamas toliau, priešingu atveju tikrinami visi tinklai ir geriausią įvertinimą turintys

parenkami tolesniam ţingsniui.

Šiame darbe paieškos algoritmu buvo pasirinktas K2, tačiau ateityje galima eksperimentą

praplėsti ir panaudoti kitus paminėtus algoritmus. Naiviam Bajesui buvo panaudoti šie parametrai:

UseKernelEstimator, UseSupervisedDiscretisation, initAsNaiveBayes. Ateityje galimi ir kiti

parametrų išbandymai.

2.4. Eksperimentas ir jo rezultatas

Siekiant įsitikinti šiame darbe atliktu analizės teisingumu, buvo atliktas tyrimas, kurio

tikslas – išsiaiškinti Bajeso metodo tinkamumą kredito rizikos vertinimui. Kaip jau buvo minėta,

pasirinkta mašinininio mokymo sistema Weka, kuri integruota su Firebird duomenų bazėje

saugomais duomenimis. Pagal analogišką tyrimą SVM metodui testuoti [19] iš trijų modelių

Altman, Zmijewski bei Springate pasirinktas Altman: gamybinėms kompanijoms - vienas, kitoms -

kitas (standartinis). Eksperimento metu buvo nustatyta kuris iš keturių Bajeso metodų variantų

teikia geriausius rezultatus (BayesNet ir Naive Bayes su reikšmėmis pagal nutylėjimą, su parametru

KernelEstimator ar su SupervisedDiscretization). Eksperimentui naudojami visi galimi rodikliai (iš

viso 79 atribudai; jų sąrašas pateikiamas 1 priede).

Įvertinimui naudojama standartinė įvertinimo metodika, dar ţinoma kaip maišos matrica5

(angl., confusion matrix), bei pagrindiniai rodikliai, apskaičiuojami iš jos verčių.

Esant atvejams, kai galimi tik du sprendiniai, o ne trys, kaip šio darbo atveju, maišos matrica

apibrėţiama kaip matrica, turinti tokias reikšmes [19, 45]:

a yra teisingų spėjimų skaičius, kad atvejis yra neigiamas;

b yra neteisingų spėjimų skaičius, kad atvejis yra teigiamas;

c yra neteisingų spėjimų skaičius kad atvejis yra neigiamas;

d yra teisingų spėjimų skaičius, kad atvejis yra teigiamas.

5 Maišos matrica gali būti apibrėţta bet kuriam klasių skaičiui; čia ji apibrėţiama tik sprendţiamos problemos atveju

(binariniam kalsifikavimui)

Page 68: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

68

Prognozė

Neigiamas Teigiamas

Sistema Neigiamas a b

Teigiamas c d

Iš šios jos gaunami parametrai, kurie gali būti naudojami tikslumo ir efektyvumo vertinimui:

Teisingumas (accuracy) AC yra teisingų spėjimų skaičiaus ir bendro spėjimų skaičiaus

proporcija. Ji apskaičiuojama taip: a dAC

a b c d

Recall arba teisingų teigiamų rodiklis (true positive rate) arba TP yra teigiamų atvejų,

kurie buvo teisingai identifikuoti, proporcija, apskaičiuojama taip: dTP

c d

Neteisingų teigiamų rodiklis (the false positive rate) arba FP yra neigiamų atvejų, kurie

buvo neteisingai suklasifikuoti kaip teigiami, proporcija, apskaičiuojama taip: bFP

a b

Teisingų neigiamų rodiklis (the true negative rate) arba TN apibrėţiamas kaip neigiamų

atvejų, kurie buvo teisingai suklasifikuoti, proporcija, apskaičiuojamam taip: a

TNa b

Neteisingų neigiamų rodiklis (the false negative rate) arba FN apibrėţiamas kaip

teigiamų atvejų, kurie buvo neteisingai suklasifikuoti kaip neigiami, propocija: cFN

c d

Tikslumas (precision) P yra prognozuojamų teigiamų teisingų atvejų propocija,

apskaičiuojama taip: dP

b d

Teisingumo įvertis gali būti neadekvatus našumo matavimas, kai neigiamų atvejų

skaičius yra daug didesnis nei teigiamų atvejų skaičius. Šiuo atveju apbrėţiamas geometrinis

vidurkis (g-mean) ir F-Measure rodiklis:

1 *g mean TP P ; 2 *g mean TP TN

F1 rodiklis (F-Measure) yra harmoninis tikslumo ir recall įverčiųvidurkis:

12*Precision*Recall 2

F = =1 1Precision+Recall

+Precision Recall

Šiame darbe naudojami tik teisingumo, tikslumo ir recall parametrai, tačiau realizacijoje

taip pat skaičiuojama ir visa maišos matrica bei kiti rodikliai (26 pav.).

Page 69: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

69

Šaltinis: sukurta autoriaus

26 pav. Sistemos išvedami rezultatai

Visų pirma, paprastumo ir patogumo dėlei iš duomenų bazės buvo išeksportuoti visi

duomenys į CSV formato failus, iš viso jų išeksportuota 18. Po to kiekvienas iš jų importuojamas į

Weka aplinką bei pritaikomas filtras NumericToNominal klasės atributui, kuris būtinas naudojant

bet kurį iš Bajeso metodų (27 pav.).

Šaltinis: sukurta autoriaus

27 pav. Duomenų užkrovimo ir filtravimo langas sistemoje

Page 70: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

70

Suimportavus duomenis ir pritaikius filtrą, pasirenkamas klasifikatorius bei nustatomi

atitinkami parametrai pasirinktam Bajeso metodui (28 pav.), t.y., kiekvienam iš 18 duomenų

rinkinių išbandomi keturi minėti Bajeso metodai: BayesNet, Naive Bayes su reikšmėmis pagal

nutylėjimą, su parametru KernelEstimator ir su SupervisedDiscretization. Taigi, iš viso buvo atlikti

72 bandymai, o jų rezultatas matomas 6 lentelėje.

Šaltinis: sukurta autoriaus

28 pav. Sistemos langas, kur parenkamas klasifikatorius, nurodomi parametrai bei

pateikiami gauti rezultatai

Kiekvienam eksperimentiniam bandymui duomenys pagal Weka sistemos rekomendacijas

buvo skaldyti santykiu 1:2, t.y., 2/3 duomenų skirta apsimokymui, o 1/3 testavimui.

Page 71: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

6 lentelė

Eksperimento metu gautų rezultatų suvestinė lentelė

Duomenys Visų duom. % mokymui

Mokymo įrašų

skaičius

Testav.įrašų skaičius

Baysnet Naïve Bayes Naïve Bayes Kernel Naïve Bayes discret.

Tikslumas Type1 klaida

Tikslumas

Type1 klaida

Tikslumas

Type1 klaida

Tikslumas

Type1 klaida

Ketvirčių duomenys

01-09 59.055 150 104 89.2875 0.037 70.2381 0.104 73.8095 0.075 89.2857 0.037

10-14 59.744 2054 1384 74.8828 0.063 39.5501 0.114 36.5511 0.115 74.8828 0.063

15-17 61.180 394 250 77.7778 0.107 60.6481 0.117 66.6667 0.115 77.3148 0.113

20-39 60.203 13972 9236 72.5337 0.153 31.6980 0.107 35.1494 0.115 72.4412 0.151

40-49 60.048 3526 2346 71.0779 0.126 40.6083 0.202 45.7844 0.193 70.8111 0.126

50-51 59.764 1319 888 80.8067 0.073 74.2698 0.210 74.4089 0.254 80.6676 0.075

52-59 60.185 1888 1249 81.7739 0.074 36.0624 0.145 38.3041 0.129 81.6764 0.072

60-67 61.003 7784 4976 80.7081 0.070 26.9509 0.148 26.5173 0.135 80.3468 0.071

70-89 60.306 7777 5119 77.1723 0.095 42.3428 0.265 45.6313 0.247 77.1723 0.096

Visi duomenys 63.115 44179 25819 71.848 0.15

1 65.688 0.011 61.822 0.006 71.843 0.151

Metiniai duomenys

01-09 59.556 134 91 81.9444 0.126 66.6667 0.191 68.0556 0.158 81.9444 0.126

10-14 59.777 1660 1117 71.8104 0.077 32.3208 0.164 34.3864 0.163 71.9320 0.077

15-17 60.674 324 210 71.7791 0.147 51.5337 0.176 61.3497 0.166 71.7791 0.147

20-39 60.104 11641 7727 68.5059 0.155 30.6964 0.170 24.7299 0.173 68.4394 0.155

40-49 59.634 2838 1921 68.5956 0.133 55.8222 0.358 55.6810 0.371 68.4545 0.133

50-51 59.803 1095 736 77.1020 0.101 65.4741 0.294 64.4007 0.351 76.3864 0.107

52-59 60.199 1570 1038 81.7043 0.056 45.3634 0.121 71.9298 0.147 81.7043 0.056

60-67 61.181 6413 4069 78.5940 0.086 27.0741 0.139 28.5624 0.128 78.5307 0.086

70-89 60.224 6241 4122 74.0741 0.121 38.4665 0.309 39.8635 0.299 74.0741 0.122

Visi duomenys 63.529 36674 21054 70.909 0.169 57.148 0.011 55.472 0.002 70.904 0.169

Svorinis ketvirčių duomenų vidurkis (testavimo įrašų aspektu): 75.907 0.110 36.282 0.161 38.605 0.158 75.765 0.110 Svorinis metinių duomenų vidurkis (testavimo įrašų aspektu): 72.776 0.122 36.204 0.210 36.049 0.211 72.708 0.122

Page 72: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

72

2.5. Gautų rezultatų apibendrinimas

Taigi, visa atlikto eksperimento suvestinė matosi 6 lentelėje. Duomenys, kaip jau buvo aptarta,

suskaidyti į 9 sektorius, o taip pat į dvi grupes – pagal metinius ir ketvirčio duomenis, todėl atitinkamai

skiriasi ir duomenų (angl., instances) kiekiai tam pačiam sektoriui, ketvirčio duomenų yra daugiau. Iš

viso eksperimento metu atlikti ir pateikti 72 bandymai.

Pagal gautus rezultatus galima pastebėti, kad panašiausiai, atsiţvelgiant tiek į tikslumą, tiek į

false positive (FP) klaidas, klasifikuoja Naivus Bajesas su reikšmėm pagal nutylėjimą ir Naivus Bajesas

su pasirinktu parametru KernelEstimator, ir analogiškai BayesNet su Naiviu Bajesu, kai parinktas

parametras SupervisedDiscretization. False positive išskirtas todėl, kad jis svarbesnis kredito rizikos

atveju, nes jis reiškia, kad kompanija, kuri turėtų būti priskirta rizikos grupei, bus priskirta prie

nerizikingų arba vidutiniškai rizikingų, kas itin aktualu.

Atlikus tyrimą paaiškėjo, kad savo klasifikavimo tikslumu BayesNet ir Naivus bajesas su

parinktu parametru SupervisedDiscretization klasifikuoja ţymiai tiksliau, tai matoma tiek po ketvirčių,

tiek po metinių duomenų klasifikavimo bei jų svorinio vidurkio, o be to, jų FP yra kur kas maţesni nei

likusių dviejų klasifikatorių. Iš šių dviejų šiek tiek tiksliau klasifikuoja BayesNet klasifikatorius.

Tyrimo metu pastebėta, kad duomenų klasifikavimo efektyvumas kinta nuo duomenų kiekio:

esant didesniems kiekiams duomenų BayesNet ir Naivus bajesas su parinktu parametru

SupervisedDiscretization klasifikuoja tiksliau ir daro maţesnes FP klaidas, kai tuo tarpu likę du

klasifikatoriai veikia atvirkščiai – pasirodė geriausiai tuomet, kai tų duomenų maţai ir itin maţai, pvz,

kai jų buvo tik 10, jų tikslumas pašoko iki 100%, o kituose bandymuose kiti du klasifikatoriai pasirodė

blogiau. Analogiškai visi iki vieno klasifikatoriai ketvirčio duomenis klasifikavo geriau ir klydo maţiau.

Kadangi Naivus Bajesas su nutylėtom reikšmėm ir Naivus Bajesas su KernelEstimator geriau

klasifikuoja prie maţesnių duomenų kiekių, buvo išbandyta ir pakeisti treniravimo ir testavimo duomenų

santykį ir rezultatas toks, kad ţenkliai sumaţinus apmokymo duomenis šių klasifikatorių tikslumas

pakilo apie 10 procentų.

Kadangi klasifikuojant geriausiai tikslumo atţvilgiu pasirodė BayesNet metodas, galima daryti

prielaidas, jog su kitais paieškos algoritmais ir kitais parametrais, kaip estimator būtų galima išgauti

geresnį klasifikavimo tikslumą.

Page 73: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

73

2.6. Tolimesnis eksperimentinis tyrimas (straipsnis)

Atlikus minėtą eksperimentinį tyrimą buvo atkitas jo tęsinys, lyginant du geriau pasirodţiusius

metodus, t.y., BayesNet ir Naive Bayes discr. su analogiškais dvejais SVM metodais: LibSVM ir

LIBLINEAR [45]. Šio tyrimo smulkus aprašymas pateiktas 6 priede, kuris yra straipsnio pavidalu,

pristatytu konferencijoje IVUS15 2010 m. geguţės 13 d.

Eksperimentas, kaip ir ankstesnis atliktas su tais pačiais duomenimis Weka aplinkoje, tačiau

skiriasi duomenų paruošimas ir padalinimas apmokymui bei testavimui. Glaustai modelio eiga

pateikiama taip:

1.Duomenys vertinami diskriminantiniu Altmano metodu priskiriant jiems rizikingumo klases;

2.Pašalinami “tušti” įrašai, kurie negali būti įvertinti 1 ţingsnyje (pvz., dalyba iš 0);

3.Tušti atributai pakeičiami tos kompanijos atributo vidurkio reikšme;

4.Padalinamos kompanijos į dvi dalis – apmokymo ir testavimo duomenis: (kompanijų sąrašas C

= C_train ∪ C_test bei|C_train| > |C_test|);

5.Paskaičiuojama kaip procentiškai dalinami duomenys į treniravimo ir testavimo (svarbu dėl

skirtingų pagal diskriminantinį modelį įvertintų kompanijų įrašų skaičių);

6.Sukuriami treniravimo ir apmokymo duomenys pagal 5 ţingsnį (CD = CD_train ∪ CD_test ir |

CD_train| > | CD_test|);

7.Naudojant genetinį algoritmą, atrenkami reikšmingiausi atributai;

8.Naudojant vieną iš klasifikavimo metodų, sukuriamas modelis, kuris yra testuojamas ir

įvertinamas.

Gauti metiniai rezultatai pateikti ţemiau esančiame paveiksle (29 pav.)

Šaltinis: sukurta autoriaus

29 pav. Eksperimento rezultatų suvestinė

Page 74: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

74

Iš pateiktų rezultatų suvestinės galima pastebėti, kad, nors ir pasikeitė duomenų paruošimo

principas, rezultatai labai panašūs į pirminio eksperimento gautus rezultatus.

Lyginant su SVM metodais, Bajeso metodai lyginant svertinius tikslumo vidurkius klasifikavo

prasčiau ir geriau pasirodė tik ten, kur apmokymo ir testavimo duomenų buvo gerokai maţiau nei kitose

pozicijose (Agriculture, Forestry, And Fishing; Mining; Construction) ir Finance, Insurance, And Real

Estate, kur duomenų kiekis nebuvo sąlyginai maţas. Klasifikuojant visus duomenis, neskirstant juos į

veiklos sektorius, Bajeso metodai klasifikavo iki 1.84% tiksliau.

Šiame darbe taip pat atkreiptas didesnis dėmesys į klaidas Type 1 ir Type 2, kurių rezultatai

pateikti ţemiau esančioje iliustracijoje (30 pav.), atitinkmai klasėms rizikinga, vidutinio rizikingumo ir

nerizikinga.

Šaltinis: sukurta autoriaus

30 pav. Klaidos Type 1 ir Type 2

Pagal pateiktus rezultatus galima pastebėti, kad Bajeso metodai pasiţymėjo stabiliais klaidų

dydţiais, kai tuo tarpu SVM metodai turėjo didesnes klaidų reikšmes, tačiau jos pasiţymėjo tuo, kad 2

atvejais (nerizikinga ir rizikinga klasėms) nerizikingą kompaniją priskyrė prie didesnės rizikos

kompanijų, t.y., darė didesnę Type 2 klaidą, kuri yra maţiau svarbi nei Type 1, nes ji blogiausiu atveju

įtakoja galimas prarastas pajamas, kai tuo tarpu Type 1 siejama su tiesioginiais nuostoliais prarandant

skolininkui išduoto kredito dalį. Platesnė visų gautų rezultatų analizė ir aprašymas pateiktas priede.

Page 75: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

75

IŠVADOS IR PERSPEKTYVOS

Darbo eigoje buvo atlikta:

1. Surinkus eilę literatūros šaltinių, susijusių su kreditų rizikos valdymu, dirbtiniu intelektu,

įvairiais mašininio mokymo metodais, tinkančiais klasifikavimui, ši literatūra buvo

susisteminta ir apţvelgta. Pateikti svarbiausi kreditų rizikos valdymo aspektai, siejami su

šio darbo tematika, o taip pat pateikti metodų naudojamų kreditų rizikai valdyti

aprašymai, aprašyti įvairūs lyginamieji metodų straipsniai, kur parodyta, jog Bajeso

metodas tinka įvairiems klasifikavimo uţdaviniams taikyti. Apibrėţtas Bajeso metodo

veikimo principas ir jo panaudojimo atvejai kreditų rizikai vertinti.

2. Vertinant juridinio asmens finansinį pajėgumą, svarbu atsiţvelgti ne tik į finansinius

rodiklius, bet ir kitus aspektus, t.y., vertinant kredito riziką, svarbu įvertinti ir kitas

rizikas. Kai kurios iš šių rizikų gali būti vertinamos ekspertiniu būdu, t.y., jų įvertinimui

gali būti naudojami kokybiniai įverčiai; taip pat daugumoje jų naudojama techninė

analizė bei matematiniai/ekonometriniai metodai. Tai sudaro prielaidas taikyti DI

modelius ir ekspertines sistemas.

3. Apibrėţtas eksperimentinis modelis, naudojami įrankiai, metodai ir vykdoma eiga;

Paruošti duomenys bandymams atlikti, o vėliau su Weka 3.6.2 sistema atlikti tyrimai su

keturiais Bajeso klasifikatoriais;

4. Atlikus eksperimentą, gauti rezultatai rodo, kad galimas gana sėkmingas klasifikavimas,

kur tam tikriems veiklos sektoriams pasiektas didesnis nei 89% tikslumas, tuo tarpu

imant svorinius vidurkius du metodai rodė gana neblogus rezultatus, siekiančius beveik

76% tikslumą ketvirčių duomenims ir beveik 73% metiniams duomenims. Analitinės

dalies išvadose iškelta tikslumo kartelė metodo tinkamumui vertinti (lyginant su kitų

metodų rodomais rezultatais įvairiuose šaltiniuose), 70% šiuo atveju, yra pasiekta ir

viršyta. Klaidų dydis neviršijo 0.25 ir vidurkis daugmaţ 0.2, o tai lyginant su įvairiais

metodais yra gana maţas klaidų dydis.

5. Geriausias Bajeso klasifikatorius nagrinėjamai problemai – BayesNet su iki 76% svoriniu

vidurkiu, nuo kurio neţymiai (dešimtosiomis ar net šimtosiomis procento skirtingiems

duomenims) atsiliko Naivus Bajesas su parinktu parametru SupervisedDiscretization.

6. Atliktas eksperimentinis tyrimas lyginant Bajeso metodus su SVM metodais neţymiai

pasikeitusiom sąlygom, kaip duomenų paruošimas apmokymams ir testavimams,

pasirinktas kitas paieškos algoritmas BayesNet metodui (vietoje K2 pasirinktas

Page 76: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

76

HillClimbing). Tyrimo rezultatai parodė, kad Bajeso metodo klasifikavimo tikslumas ir

klaidų dydis pakito labai neţymiai, tikslumas sumaţėjo tik šimtosiomis procento dalimis.

7. Lyginant Bajeso ir SVM metodus, pastarasis parodė geresnius rezultatus 7 iš 9 veiklos

sektorių (visus, išskyrus 10-14 ir 60-67 sektorius) ir todėl rodė klasifikavimo tikslesnius

svorinius vidurkius. Neskirstant duomenų į veiklos sektorius, tikslesni buvo Bajeso

metodai, rodantys iki 1.84% didesnį tikslumą.

8. Vertinant klaidų dydţius Type 1 ir Type 2, Bajeso metodai rodė panašius ir lyginant su

SVM gana maţus klaidos dydţius, o taip pat jie visų klasių atţvilgiu rodė stabilesnį

klaidų dydį.

9. Atlikus įvairių literatūros šaltinių analizę ir eksperimentinius tyrimus, galima teigti, kad

Bajeso metodas (BaysNet ir Naivus Bajesas su pasirinktu parametru

SupervisedDiscretization) gali būti sėkmingai naudojamas kreditų rizikos valdyme,

kadangi rodo sąlyginai aukštus tikslumo ir gana maţus klaidos rodiklius lyginant su kitais

šiuo metu naudojamais metodais (tiek matematiniais, tiek mašininio mokymo).

10. Ateities perspektyvoje geresniems klasifikavimo rezultatams išgauti būtų galima

paieškoti įvairių parametrų optimizavimo (pvz.: apmokymo/testavimo duomenų santykis,

vietoje procentinio dalinimo naudoti ţingsninį, angl. fold), duomenų apdorojimo metodų

(vietoje genetinės paieškos naudoti kitas reikšmingiems atributams atrinkti tinkančias

sistemas), pritaikant įvairius duomenų filtrus duomenų įvedimo į sistemą etapuose (angl.:

normalize, remove, discretize, cernelfilter ir t.t.) ar apjungiant keletą klasifikavimo

metodų (pvz., Bajeso su ANN, Bajeso su SVM, kt.).

Page 77: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

77

LITERATŪRA

1. Edward I. Altman. Financial Ratios, Discriminant Analysis And The Prediction of Corporate

Bancruptcy. The Journal of Finance, Vol. 23, No. 4 (Sep., 1968), 589-609. Adresas Internete:

http://www.defaultrisk.com/_pdf6j4/Financial_Ratios_Discriminant_Anlss_n_Prdctn_o_Crprt_Bnkr

ptc.pdf, Prieiga 2008.11.19

2. Kin Keung Lai, Lean Yu, Shouyang Wang, and Ligang Zhou. Credit Risk Analysis Using a

Reliability-Based Neural Network Ensemble Model. 2006.09.16. Adresas Internete:

http://madis1.iss.ac.cn/madis.files/pub-papers/2006/41320682.pdf. Prieiga 2009.01.15

3. Graham Kendall, History of AI, Introduction to Artificial Intelligence, The University of

Nottingham within the School of Computer Science & IT, Adresas Internete:

http://www.cs.nott.ac.uk/~gxk/courses/g5aiai/ Prieiga 2008.11.19

4. Rimvydas Simutis, Dirbtiniai neuroniniai tinklai, Intelektinės sistemos finansų rinkose, Vilniaus

Universitetas, Kauno humanitarinis fakultetas, Informatikos katedra. Adresas Internete:

ftp.vukhf.lt/aulay/Informatikos_katedra/Simutis(/IF_2008/ ir /KHF_ANN2009)(jungiantis iš išorės,

reikia vartotojo vardo ir slaptaţodţio), Prieiga 2009.06.03

5. E. Charniak, Bayesian Networks without Tears, AI magazine 1991. Adresas Internete:

http://www.cs.ubc.ca/~murphyk/Bayes/Charniak_91.pdf. Prieiga 2008.11.19

6. D. Heckerman, A tutorial on learning with Bayesian networks, Microsoft Research tech. report,

MSR-TR-95-06, 1996 Adresas Internete: ftp://ftp.research.microsoft.com/pub/tr/TR-95-06.PS

Prieiga 2008.11.19

7. Ingrida Šarkiūnaitė, Dalia Krikščiūnienė, Rimvydas Simutis, Magistro baigiamojo darbo rengimo

tvarka, Metodiniai nurodymai (VU KHF informatikos katedros verslo informatikos (62109P101) ir

verslo informacijos sistemų (62103S138) studijų programų studentams), Kaunas, 2007

8. Kin Keung Lai, Lean Yu, Shouyang Wang, and Ligang Zhou. Credit Risk Analysis Using a

Reliability-Based Neural Network Ensemble Model, 2006.09.16. Adresas Internete:

http://madis1.iss.ac.cn/madis.files/pub-papers/2006/41320682.pdf. Prieiga prie Interneto 2008-12-01

9. An Introduction to Bayesian Networks and their Contemporary Applications [interaktyvus] Prieiga

internetu: http://www.niedermayer.ca/papers/bayesian/bayes.html#table , [ţiūrėta 2009.01.18]

10. A Brief Introduction to Graphical Models and Bayesian Networks [interaktyvus] Prieiga internetu:

http://www.cs.ubc.ca/~murphyk/Bayes/bayes.html, [ţiūrėta 2009.01.18]

11. Vytautas Valvonis, Kredito rizikos valdymas banke, Lietuvos bankas, Pinigų studijos, Apţvalginiai

straipsniai, 2004, p. 57-82

12. Vytautas Valvonis, Kreditų koncentracijos rizikos vertinimas ir valdymas, ISSN 1392–1258.

EKONOMIKA, 2007, p. 94-113

13. Edward I. Altman, Anthony Saunders, Credit risk measurement: Developments over the last 20

years, Journal of Banking & Finance 21, 1998, p. 1721-1742

Page 78: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

78

14. Nijolė Ţaltauskienė, Graţina Masionytė, Finansinių institucijų paskolų kitimo tendencijos Lietuvoje,

atitinkamai Vytauto Didţiojo universitetas, Lietuvos ţemės ūkio universitetas, 2008, p. 183-191,

[interaktyvus] Adresas Internete: http://www.lzuu.lt/vadyb/lt/18196, Prieiga 2009.12.17

15. Saulius Nainys, Kreditų monitoringas – kredito rizikos valdymo priemonė, Lietuvos ţemės ūkio

universitetas, 2004, [interaktyvus] Adresas Internete:

http://www.lzuu.lt/jaunasis_mokslininkas/smk_2006/menu_finansai.html, Prieiga 2009.12.17

16. Oesterreichische Nationalbank (OeNB), Austrian Financial Market Authority (FMA), Credit

Approval Process and Credit Risk Management, Guidelines on Credit Risk Management, DVR

0031577, 2004

17. Virgilijus Sakalauskas, Trumpalaikių investicijų rizikos tyrimas finansinėse rinkose, ISSN 1392–

0561. Informacijos mokslai, 2005

18. Virgilijus Sakalauskas, Dalia Kriksciuniene, Short-Term Investment Risk Measurement using VaR

and CVaR, Lecture notes in computer science, 2006, vol. 3994. p. 316-323. ISSN 0302-9743

19. Paulius Danėnas, Dirbtinio intelekto metodų taikymas kredito rizikos vertinime, magistrinis darbas,

Vilniaus universiteto Kauno humanitarinis fakultetas, Informatikos katedra, 2008

20. Tom Mitchell, Bruce Buchanan, Gerald DeJong, Thomas Dietterich, Paul Rosenbloom, Alex

Waibel, Machine Learning, Annual Reviews Inc., Computer Science, 1990.4:417-433, 1990, p. 417-

433

21. Chih-Wei Hsu, Chih-Chung Chang, Chih-Jen Lin, A Practical Guide to Support Vector

Classification, Department of Computer Science National Taiwan University, Taipei 106, Taiwan,

2009

22. Laisvoji internetinė enciklopedija Wikipedia, raktiniai ţodţiai: „SVM“ [interaktyvus] Adresas

Internete: http://en.wikipedia.org/wiki/SVM, Prieiga 2009.06.13

23. Tjen-Sien Lim, Wei-Yin Loh, Yu-Shan Shih, A Comparison of Prediction Accuracy, Complexity,

and Training Time of Thirty-Three Old and New Classification Algorithms, Machine Learning, 40,

2000, p. 203–228

24. Rich Caruana, Alexandru Niculescu-Mizil, An Empirical Comparison of Supervised Learning

Algorithms, Department of Computer Science, Cornell University, Ithaca, NY 14853 USA,

Proceedings of the 23 rd International Conference on Machine Learning, Pittsburgh, PA, 2006

25. Philippe H. Gosselin, Matthieu Cord, A Comparison of Active Classification Methods for Content-

Based Image Retrieval, France, ACM 1581139179/04/06, 2004

26. Nigel Williams, Sebastian Zander, Grenville Armitage, A Preliminary Performance Comparison of

Five Machine Learning Algorithms for Practical IP Traffic Flow Classification, ACM SIGCOMM

Computer Communication Review, Volume 36, Number 5, October 2006

27. Faming Liang, An Effective Bayesian Neural Network Classifier with a Comparison Study to

Support Vector Machine, Neural Computation 15, 2003, p. 1959–1989

28. M. Kudra, H. Bohlig, E. Geide1, Fuzzy and Probabilistic Interpretation of Spectral Information,

Proceedings of ISUMA-NAFIPS '95, 0-8186-7126-2/95, 1995, p. 662-667

Page 79: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

79

29. Tom Mitchel, McGraw Hill, Machine learning, Bayesian Learning, Chapter 6, ISBN 0070428077,

1997, p. 154-211

30. David Heckermen, A Tutorial on Learning With Bayesian Networks, Microsoft Research, Advanced

Technology Division, Microsoft Corporation, Technical Report, MSR-TR-95-06, 1996

31. Pagrindiniai KNN metodo principai ir realūs pavyzdţiai, [interaktyvus] Adresas Internete:

http://www.cra.org/Activities/craw_archive/dmp/awards/2003/Mower/KNN.html, Prieiga

2009.06.22

32. Laisvoji internetinė enciklopedija Wikipedia, raktiniai ţodţiai: „KNN“ [interaktyvus] Adresas

Internete: http://en.wikipedia.org/wiki/K-nearest_neighbor_algorithm, Prieiga 2009.06.22

33. Laisvoji internetinė enciklopedija Wikipedia, raktiniai ţodţiai: „Decision tree“ [interaktyvus]

Adresas Internete: http://en.wikipedia.org/wiki/Decision_tree, Prieiga 2009.06.22

34. Weka: Practical Machine Learning Tools and Techniques with Java Implementations Ian H. Witten,

Eibe Frank, Len Trigg, Mark Hall, Geoffrey Holmes, and Sally Jo Cunningham, Department of

Computer Science, University of Waikato, New Zealand. 2000

35. Remco R. Bouckaert, Bayesian Network Classifiers in Weka for Version 3-5-8, University of

Waikato, 2008

36. Ashraf M. Kibriya and Eibe Frank, An Empirical Comparison of Exact Nearest Neighbour

Algorithms, Department of Computer Science, University of Waikato, 2008

37. Luc De Raedt, Integrating Naive Bayes and FOIL, Journal of Machine Learning Research 8 (2007)

481-507

38. John Wiley & Sons, Inc., Naive Bayes Estimation And Bayesian Networks, Data Mining Methods

and Models By Daniel T. Larose, 2006.

39. Jorge Jambeiro Filho, Jacques Wainer, HPB: A Model for Handling BN Nodes with High Cardinality

Parents, Journal of Machine Learning Research 9 (2008) 2141-2170

40. Jiang Su, Harry Zhang, Full Bayesian Network Classifiers, Faculty of Computer Science,

University of New Brunswick, Canada, 2008

41. Remco R. Bouckaert, Practical Bias Variance Decomposition, University of Waikato, 2008

42. Stuart Moran, Yulan Hey, Kecheng Liu, Choosing the Best Bayesian Classifier: An Empirical Study,

IAENG International Journal of Computer Science, 36:4, IJCS_36_4_09, 19 November 2009

43. E. Merkevicius, G. Garsva, and S. Girdzijauskas, "A hybrid SOM-Altman model for bankruptcy

prediction," Lecture Notes in Computer Science, vol. 3994, 2006, pp. 364-371.

44. Evaluation of models (discovered knowledge) [interaktyvus] Adresas Internete:

http://dms.irb.hr/tutorial/tut_mod_eval_1.php, Prieiga 2010.01.18

45. Gediminas Būzius, Paulius Danėnas, Gintautas Garšva, Credit risk evaluation using SVM and

Bayesian classifiers, IVUS 15 conference, 2010

Page 80: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

80

PRIEDAI

1 priedas. Sistemoje naudojamų duomenų aprašymas ir duomenų bazės schema .................................80

2 priedas. Sektoriui priklausančios rinkos ..............................................................................................84

3 priedas. Klasių priskyrimui atrinkti rodikliai naudojant genetinę paiešką ..........................................86

4 priedas. Mokslinis tiriamasis straipsnis „Credit risk evaluation using SVM and Bayesian Classifiers“

pristatytas IVUS15 konferencijoje ..........................................................................................................88

1 priedas. Sistemoje naudojamų duomenų aprašymas ir duomenų bazės schema

Ataskaita Santrumpa Aprašymas

Pelno ataskaita salesinc Pajamos iš pardavimų

Sales income

otherinc Kitos pajamos

Other income

grossinc Bendrosios įplaukos

Gross income

costofg Parduotų prekių ar paslaugų kaina

Cost of goods sold

randd Tyrimai ir plėtra

Research and development

deprec Nuvertėjimas

Depreciation

totalop Bendros veiklos išlaidos

Total operation expenses

nonrecc Neperiodinės lėšos balanse

Nonrecurring items

interest Išlaidos palūkanoms

Interest expenses

totalint Bendros išlaidos palūkanoms

Total interest expenses

grossop Bendrosios veiklos pajamos

Gross operating expenses

unusual Netikėtos pajamos

Unusual income

pretax Pajamos prieš mokesčius

Pre-tax income

adjust Pajamų patikslinimai

Adjustments to income

inctax Pajamų mokestis

Ingome tax

netincome Grynasis pelnas

Net income

sharesav Vidutinė akcijos kaina

Shares average

eps EPS

EPS

epscont Dabartinis (continued) EPS

Continued EPS

epsdilut EPS Diluted

DilutedEPS

Page 81: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

81

Ataskaita Santrumpa Aprašymas

dividend Dividendai

Dividend

Balansas cash Grynieji pinigai

Cash

shorti Trumpalaikės investicijos

Short-term investments

receive Debitorinės sąskaitos

Receivables

inventory Prekių atsargos

Inventory

assetcur Trumpalaikis turtas

Other Current Assets

assettot Bendras dabartinis turtas

Total Current Assets

netprop Grynoji gamybinių fondų nuosavybė

Net property plant and equipment

longinv Ilgalaikės investicijos

Long-term investments

assetlong Kiti ilgalaikiai aktyvai

Other long-term assets

goodwill Prestiţo vertė ir nematerialiosios vertybės

Goodwill and intangibles

totassets Bendrieji aktyvai

Total assets

accpay Tiekėjų įsiskolinimas

Accounts payable

debshort Trumpalaikiai įsiskolinimai

Short-term debt

liabcurr Kiti dabartiniai įsipareigojimai

Other current liabilities

debtlong Ilgalaikiai įsiskolinimai

Long-term debt

liablong Kiti ilgalaikiai įsipareigojimai

Other long-term liabilities

liabtotal Bendri įsipareigojimai

Total liabilities

stockpref Privilegijuotosios akcijos

Stocks preferred

equity Bendrasis kapitalas

Common equity

liabshare Bendri įsipareigojimai ir akcininkų kapitalas

Total liabilities and shareholder's equity

average Vidutiniškai emituotų akcijų

Average shares outstanding

marketcap Rinkos kapitalizacija

Market capitalization

pricetoshare Kainos ir akcijų skaičiaus santykis periodo gale

Price to share (end of period)

Nežinomi

parametrai

(tyrimuose

Whoknows_1 Whoknows_1

Whoknows_2 Whoknows_2

whoknows_3 Whoknows_3

Page 82: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

82

Ataskaita Santrumpa Aprašymas

nenaudojami) whoknows_4 Whoknows_4

Išvestiniai

rodikliai

likvid Trumpalaikis/likvidumo koeficientas

Current ratio

Trumpalaikis turtas / Trumpalaikiai įsipareigojimai

assetcur/debshort

liabinventory Trumpalaikių įsipareigojimų ir inventoriaus santykis

Current liabilities to inventory ratio

Trumpalaikės skolos/inventorius

liabcurr/inventory

totalliab Visi įsiskolinimai grynai vertei

Total liabilities to net worth ratio

Visi įsiskolinimai / gryna vertė

Liabtotal/assetlong

collection Surenkimo periodo koeficientas

Collection period ratio

Gaunamos pajamos / pardavimai x 365 dienos

salesinc/ costofg*365

salesinventory Pardavimų ir inventoriaus koeficientas

Sales to inventory ratio

Grynieji metiniai pardavimai /inventorius

Sales/inventory

assetssales Turto ir pardavimų koeficientas

Assets to sales ratio

Bendras turtas / Grynieji pardavimai

assettot/salesinc

salescapital Pardavimai ir grynasis įstatinis kapitalas

Sales to net working capital

Pardavimai / grynasis įstatinis kapitalas

salesinc/equity

accountssales Mokėjimų ir pardavimų koeficientas

Accounts payable to sales ratio

Mokėjimai / Grynieji pardavimai

accpay/salesinc

quickratio Greitas koeficientas

Quick ratio

(Gryni pinigai + gautinos_pajamos) / trumpalaikiai įsipareigojimai

(cash+salesinc)/debshort

ros Pardavimų grąţa

Return on sales ratio

Grynasis pelnas atskaičius mokesčius / Grynieji pardavimai

netincome/salesinc

roa Turto grąţa

Return on assets (ROA) ratio

Grynasis pelnas atskaičius mokesčius / Visas turtas

netincome/assettot

ronw Grynosios vertės grąţa

Return on net worth ratio

Grynasis pelnas atskaičius mokesčius /Grynoji vertė

netincome/equity

Page 83: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

83

models

PK id INTEGER

date DATETIME

I1 mid TINYINT

mtext LONGVARCHAR

name VARCHAR(255)

description LONGVARCHAR

attributes LONGVARCHAR

rmodel VARCHAR(20)

10q_data

PK id INTEGER

I2 tickerID INTEGER

I1 quarter TINYINT

salesinc DECIMAL(8,2)

otherinc DECIMAL(8,2)

grossinc DECIMAL(8,2)

costofg DECIMAL(8,2)

randd DECIMAL(8,2)

deprec DECIMAL(8,2)

totalop DECIMAL(8,2)

nonrecc DECIMAL(8,2)

interest DECIMAL(8,2)

totalint DECIMAL(8,2)

grossop DECIMAL(8,2)

unusual DECIMAL(8,2)

pretax DECIMAL(8,2)

adjust DECIMAL(8,2)

inctax DECIMAL(8,2)

netincome DECIMAL(8,2)

sharesav DECIMAL(8,2)

eps DECIMAL(8,2)

epscont DECIMAL(8,2)

epsdilut DECIMAL(8,2)

dividend DECIMAL(8,2)

cash DECIMAL(8,2)

shorti DECIMAL(8,2)

receive DECIMAL(8,2)

inventory DECIMAL(8,2)

assetcur DECIMAL(8,2)

assettot DECIMAL(8,2)

netprop DECIMAL(8,2)

longinv DECIMAL(8,2)

assetlong DECIMAL(8,2)

goodwill DECIMAL(8,2)

totassets DECIMAL(8,2)

accpay DECIMAL(8,2)

debshort DECIMAL(8,2)

liabcurr DECIMAL(8,2)

Whoknows_1 DECIMAL(8,2)

debtlong DECIMAL(8,2)

liablong DECIMAL(8,2)

liabtotal DECIMAL(8,2)

stockpref DECIMAL(8,2)

equity DECIMAL(8,2)

liabshare DECIMAL(8,2)

average DECIMAL(8,2)

Whoknows_2 DECIMAL(8,2)

marketcap DECIMAL(8,2)

pricetoshare DECIMAL(8,2)

I3 balancedata DATE

I4 incomedata DATE

whoknows_3 DECIMAL(8,2)

whoknows_4 DECIMAL(8,2)

I5 year_qtr TINYINT

tickers

PK,FK1 id INTEGER

I1 ticker VARCHAR(5)

company VARCHAR(100)

I2 siccode VARCHAR(10)

I3 industry TINYINT

I4 lith TINYINT

Page 84: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

84

2 priedas. Sektoriui priklausančios rinkos

CODE TITLE DIVISION 01 Agricultural Production - Crops 01-09 02 Agricultural Production - Livestock and Animal Specialties 01-09 07 Agricultural Services 01-09 08 Forestry 01-09 09 Fishing, Hunting and Trapping 01-09 10 Metal Mining 10-14 12 Coal Mining 10-14 13 Oil and Gas Extraction 10-14 14 Mining and Quarrying of Nonmetallic Minerals, Except Fuels 10-14 15 Building Construction - General Contractors & Operative Builders 15-17 16 Heavy Construction, Except Building Construction - Contractors 15-17 17 Construction - Special Trade Contractors 15-17 20 Food and Kindred Products 20-39 21 Tobacco Products 20-39 22 Textile Mill Products 20-39 23 Apparel, Finished Products from Fabrics & Similar Materials 20-39 24 Lumber and Wood Products, Except Furniture 20-39 25 Furniture and Fixtures 20-39 26 Paper and Allied Products 20-39 27 Printing, Publishing and Allied Industries 20-39 28 Chemicals and Allied Products 20-39 29 Petroleum Refining and Related Industries 20-39 30 Rubber and Miscellaneous Plastic Products 20-39 31 Leather and Leather Products 20-39 32 Stone, Clay, Glass, and Concrete Products 20-39 33 Primary Metal Industries 20-39 34 Fabricated Metal Products, Except Machinery & Transport Equipment 20-39 35 Industrial and Commercial Machinery and Computer Equipment 20-39 36 Electronic, Electrical Equipment & Components, Except Computer Equipment 20-39 37 Transportation Equipment 20-39 38 Measure/Analyze/Control Instruments; Photo/Med/Opt Gds; Watches/Clocks 20-39 39 Miscellaneous Manufacturing Industries 20-39 40 Railroad Transportation 40-49 41 Local, Suburban Transit & Interurban Highway Passenger Transport 40-49 42 Motor Freight Transportation 40-49 43 United States Postal Service 40-49 44 Water Transportation 40-49 45 Transportation by Air 40-49 46 Pipelines, Except Natural Gas 40-49 47 Transportation Services 40-49 48 Communications 40-49 49 Electric, Gas and Sanitary Services 40-49 50 Wholesale Trade - Durable Goods 50-51 51 Wholesale Trade - Nondurable Goods 50-51 52 Building Materials, Hardware, Garden Supply & Mobile Home Dealers 52-59 53 General Merchandise Stores 52-59 54 Food Stores 52-59 55 Automotive Dealers and Gasoline Service Stations 52-59

Page 85: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

85

56 Apparel and Accessory Stores 52-59 57 Home Furniture, Furnishings and Equipment Stores 52-59 58 Eating and Drinking Places 52-59 59 Miscellaneous Retail 52-59 60 Depository Institutions 60-67 61 Non-depository Credit Institutions 60-67 62 Security & Commodity Brokers, Dealers, Exchanges & Services 60-67 63 Insurance Carriers 60-67 64 Insurance Agents, Brokers and Service 60-67 65 Real Estate 60-67 67 Holding and Other Investment Offices 60-67 70 Hotels, Rooming Houses, Camps, and Other Lodging Places 70-89 72 Personal Services 70-89 73 Business Services 70-89 75 Automotive Repair, Services and Parking 70-89 76 Miscellaneous Repair Services 70-89 78 Motion Pictures 70-89 79 Amusement and Recreation Services 70-89 80 Health Services 70-89 81 Legal Services 70-89 83 Social Services 70-89 84 Museums, Art Galleries and Botanical and Zoological Gardens 70-89 86 Membership Organizations 70-89 87 Engineering, Accounting, Research, Management & Related Services 70-89 88 Private Households 70-89 89 Services, Not Elsewhere Classified 70-89 91 Executive, Legislative & General Government, Except Finance 91-99 92 Justice, Public Order and Safety 91-99 93 Public Finance, Taxation and Monetary Policy 91-99 94 Administration of Human Resource Programs 91-99 95 Administration of Environmental Quality and Housing Programs 91-99 96 Administration of Economic Programs 91-99 97 National Security and International Affairs 91-99 99 Nonclassifiable Establishments 91-99

Page 86: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

86

3 priedas. Klasių priskyrimui atrinkti rodikliai naudojant genetinę paiešką

Sektorius Atrinkti rodikliai

Ketvirčių duomenys

Agriculture, Forestry, And Fishing

EPSCONT, SHORTI, LONGINV, GOODWILL, TOTASSETS, LIABCURR, EQUITY, PRICETOSHARE, CAPITALCONST, ACCOUNTSSALES, TA, VTAK, ITAK, IMTG, BTMK, PPK, PKTMK, BSR, SPKK, ISAK

Mining INTEREST, ASSETTOT, STOCKPREF, EQUITY, LIABSHARE, PRICETOSHARE, CAPITALCONST, PP, ACCOUNTSSALES, SALESTOINVENTORY, PKA, ITAK, GTMK, PKTMK, IIR, BSR, SPKK, ISAK, ISAITK

Construction SHARESAV, RECEIVE, INVENTORY, LONGINV, TOTASSETS, DEBTLONG, LIABLONG, EQUITY, PRICETOSHARE, PPS, TOTALLIAB, SALESTOCAPITAL, PKP, DIAK, DIE, PKTMK, IIR, BSR, SPKK, ISAK, SAGPK

Manufacturing DEPREC, INTEREST, INCTAX, EPS, EPSCONT, EPSDILUT, DIVIDEND, ACCOUNTSSALES, LIABTOINVENTORY, QUICKRATIO, ITAK, TTAK, KIAK, ASSETSTOSALES, DIE, GTMK, PPK, IIR, BSR, SPKK, ISAK, ISAITK

Transportation, Communications, Electric, Gas, And Sanitary Services

SALESINC, NONRECC, UNUSUAL, INCTAX, EPSCONT, EPSDILUT, NETPROP, GOODWILL, LIABLONG, STOCKPREF, EQUITY, LIABSHARE, PRICETOSHARE, ASSETFIXED, TOTALLIAB, QUICKRATIO, SALESTOCAPITAL, PKP, PKA, ITAK, TTAK, DEPRCOEF, DIE, PKTMK, IIR, BSR, SPKK, ISAK

Wholesale Trade OTHERINC, INTEREST, EPS, EPSCONT, INVENTORY, LONGINV, STOCKPREF, EQUITY, LIABSHARE, MARKETCAP, PP, ACCOUNTSSALES, LIABTOINVENTORY, PKP, PKA, VTAK, PPK, IIR, BSR, SPKK, ISAK

Retail Trade GROSSINC, DEPREC, NONRECC, GROSSOP, ADJUST, INCTAX, SHARESAV, EPS, SHORTI, RECEIVE, INVENTORY, LIABCURR, EQUITY, LIABSHARE, PPS, PP, ACCOUNTSSALES, TOTALLIAB, QUICKRATIO, SALESTOCAPITAL, PKP, PKA, VTAK, ITAK, IMTG, PPK, PKTMK, IIR, BSR, SPKK, ISAK, SAGPK

Finance, Insurance, And Real Estate

OTHERINC, GROSSINC, INTEREST, INCTAX, DIVIDEND, CASH, SHORTI, RECEIVE, ASSETCUR, ASSETTOT, NETPROP, ASSETLONG, LIABTOTAL, MARKETCAP, LIQUIDITY, PPS, PP, LIABTOINVENTORY, QUICKRATIO, SALESTOCAPITAL, TA, PKP, PKA, ITAK, DIAK, KIAK, ASSETSTOSALES, DEPRCOEF, DIE, PKTMK, IIR, BSR

Services OTHERINC, RANDD, INTEREST, EPS, LONGINV, TOTASSETS, DEBTLONG, STOCKPREF, EQUITY, MARKETCAP, PRICETOSHARE, ACCOUNTSSALES, LIABTOINVENTORY, TOTALLIAB, QUICKRATIO, SALESTOCAPITAL, PKP, VTAK, ITAK, DEPRCOEF, BTMK, GTMK, PPK, PKTMK, IIR, BSR, SPKK, ISAK, SAGPK

Metiniai duomenys

Agriculture, Forestry, And Fishing

SALESINC, GROSSINC, TOTALOP, PRETAX, EPS, DIVIDEND, RECEIVE, NETPROP, TOTASSETS, ACCPAY, LIABSHARE, PRICETOSHARE, CAPITALCONST, PP, SALESTOCAPITAL, DIAK, VS, PPK, PKTMK, IIR, BSR

Mining INTEREST, GROSSOP, ADJUST, INCTAX, EPS, EPSDILUT, LONGINV, EQUITY, PP, QUICKRATIO, SALESTOCAPITAL, PKP, PKA, VTAK, BTMK, PPK, PKTMK, IIR, BSR, SPKK, ISAK

Construction COSTOFG, UNUSUAL, NETINCOME, EPS, EPSCONT, EPSDILUT, CASH, RECEIVE, NETPROP, TOTASSETS, DEBTLONG, PRICETOSHARE, PPS, PP, SALESTOCAPITAL, PKP, DIAK, VS, IMTG, PKTMK, BSR, SPKK, ISAK, SAGPK

Manufacturing NONRECC, INTEREST, TOTALINT, PRETAX, INCTAX, EPS, EPSCONT, EPSDILUT, EQUITY, LIABSHARE, PRICETOSHARE, PP, ACCOUNTSSALES, QUICKRATIO, SALESTOCAPITAL, TA, PKP, VTAK, ITAK, TTAK, KIAK, PPK, SPKK, ISAK, ISAITK

Transportation, Communications, Electric,

RANDD, TOTALINT, GROSSOP, PRETAX, INCTAX, EPS, EQUITY, PRICETOSHARE, ASSETFIXED, PPS, PP, ACCOUNTSSALES, LIABTOINVENTORY,

Page 87: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

87

Gas, And Sanitary Services SALESTOINVENTORY, SALESTOCAPITAL, ITAK, PPK, PKTMK, IIR, BSR, SPKK, ISAK, ISAITK

Wholesale Trade SALESINC, TOTALINT, GROSSOP, EPS, EPSCONT, EPSDILUT, DIVIDEND, ASSETCUR, STOCKPREF, EQUITY, AVERAGE, PRICETOSHARE, CAPITALCONST, PPS, PP, ACCOUNTSSALES, SALESTOCAPITAL, TA, PKP, GTMK, PKTMK, IIR, BSR, SPKK, ISAK, ISAITK, SAGPK

Retail Trade COSTOFG, RANDD, PRETAX, INCTAX, EPS, EPSCONT, EPSDILUT, SHORTI, NETPROP, LONGINV, ASSETLONG, TOTASSETS, LIABSHARE, PRICETOSHARE, PP, ACCOUNTSSALES, PKP, PKA, VTAK, ITAK, DIAK, VS, DEPRCOEF, IMTG, PPK, IIR, BSR, SPKK, ISAK, ISAITK, SAGPK

Finance, Insurance, And Real Estate

OTHERINC, DEPREC, TOTALOP, NONRECC, DIVIDEND, CASH, RECEIVE, LONGINV, ACCPAY, LIABTOTAL, LIABSHARE, PRICETOSHARE, CAPITALCONST, PPS, PP, ACCOUNTSSALES, LIABTOINVENTORY, SALESTOCAPITAL, TA, PKP, PKA, ITAK, KIAK, DEPRCOEF, DIE, PKTMK, BSR, ISAK, SAGPK

Services RANDD, TOTALINT, GROSSOP, PRETAX, INCTAX, EPS, EQUITY, PRICETOSHARE, ASSETFIXED, PPS, PP, ACCOUNTSSALES, LIABTOINVENTORY, SALESTOINVENTORY, SALESTOCAPITAL, ITAK, PPK, PKTMK, IIR, BSR, SPKK, ISAK, ISAITK

Šaltinis: P. Danėnas, VU KHF.

Page 88: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

88

4 priedas. Mokslinis tiriamasis straipsnis „Credit risk evaluation using SVM and Bayesian Classifiers“

pristatytas IVUS15 konferencijoje

Credit risk evaluation using SVM and Bayesian

classifiers

Gediminas Buzius, MSc Student

Kaunas Faculty of Humanit ies

Vilnius University

Muitines St. 8, Kaunas, Lithuania

[email protected]

Paulius Danenas, PhD Student

Kaunas Faculty of Humanit ies

Vilnius University

Muitines St. 8, Kaunas, Lithuania

[email protected]

Gintautas Garsva, Assoc. Prof.

Kaunas Faculty of Humanit ies

Vilnius University

Muitines St. 8, Kaunas, Lithuania

[email protected]

Abstract— This article presents a method combining popular

machine learning technique for classification, genetic search as a

feature selection method for relevant attribute selection and

Altman Z-Score discriminant technique for credit risk evaluation. Support Vector Machines implementations

(LIBLINEAR, LibSVM) and Bayesian method based classifiers

(Naïve Bayes, Bayesian Networks) were explored and used in this

article to train classifiers. This method was applied to different

sectors in service and industry. Its performance was evaluated using weighted mean accuracy and weighted mean error

techniques.

Keywords- Support Vector Machines, SVM, Bayes, Naïve

Bayes, Bayesian Networks, machine learning, credit risk,

evaluation, bankruptcy, forecasting

I. INTRODUCTION

Credit risk evaluation and bankruptcy prediction are one of

the most important problems in finance because they are directly related to possibility of losing money given as a credit

to a customer. Many researchers are trying to construct methods that are based on various data mining and machine

learning techniques such as Neural Networks (NN), Genetic Algorithms (GA), Swarm Intelligence (SI) and others as they

show promising results. Support Vector Machines (SVM) is widely researched and applied in various industrial solutions

and can be used as an effective solution to many various

classification, regression and forecasting problems. Bayesian classifiers are one of oldest classification techniques based on

Bayesian inference; they are widely applied for solution to many problems, including credit risk. These methods are often

applied as standalone or complementary techniques.

II. RELATED WORK

Many statistical and data mining techniques were used for classifier creation in various studies. Early researches were

based on discriminant analysis which was used by Altman [1], Springate [2]. Novel techniques such as Neural Networks (NN)

were applied later for this problem together with other natural

computing methods, mostly evolutionary techniques for their optimization [3][4][5] to solve classification or clustering tasks

with self-organizing maps commonly referred to as Kohonen maps [6][7][8].

There are numerous examples where Naïve Bayes or

Bayesian Networks (further referred as BayesNet) classifiers are used to evaluate credit risk. It was shown in [9] that

Bayesian classifier may successfully increase prediction from 2 to 9% including the cases where some data are missing

compared to traditional discriminant or logit analysis. Ranjan

et. al. [10] used Bayesian method to estimate probability of default while [11] used Bayesian method for credit risk scoring

combining it together with genetic algorithms. Antonakis et. al. [12] compared Naïve Bayes method with five other

classification methods using real banks‘ data. Baesens et. al. [12] integrated Bayesian network together with Markov Chain

Monte Carlo search. Gossl [14] used Bayesian approach to the modeling of credit risky portfolios by forming Bayesian

portfolio model which allows describing default frequencies

and intra-portfolio correlations.

Support Vector Machines (abbr. as SVM) has been proved

as an efficient technique possible to obtain results comparable to Neural Networks and is often used to solve classification or

forecasting tasks in finance and other fields. They were also successfully applied for company failure prediction [15],

bankruptcy analysis [16], to estimate probability of default

[17], to study credit rating systems [18], capital risk assessment [19]. Lai et. al. applied SVM using ensemble learning approach

to identify high-risk customers in customer relationship management [20]. Van Gestel et. al. used SVM and Bayesian

combination to develop Bayesian evidence framework [21] [22]. Many previous researches based on SVM and related to

credit risk evaluation were analyzed in [23]; it showed that best

results were achieved by using optimization techniques such as genetic algorithms or swarm intelligence and fuzzy logic

together with SVM.

III. RESEARCH METHOD

A. Description of classification algorithms used in this

experiment

Naïve Bayes and Bayesian Networks. These classifiers perform the classification in a way that min imizes decision risk

and therefore some optimum decision variables are derived by

which the input-signal space is mapped into the decision space with the most distant classes. Probability distribution for Naïve

Bayes is calculated using

Page 89: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

89

with the most distant classes. Probability distribution for

Naïve Bayes is calculated using

))(|()()|()(),(1

d

n

d

d XparentXPyPyXPyPyXP

where Xd is the same as Xi above [24]. The main difference between these two methods is that

Naïve Bayes method assumes attributes of case being unrelated

among them and so is called ―naive‖ while Bayesian Networks

are directional acyclic networks (graphs) that contain nodes representing attributes and directional arcs (causal relations)

between nodes where nodes are variables which have a finite number of states. Every node Ak given parent nodes B1,...,Bn

has a distribution table of probabilities P(Ak| B1; ...;Bn) which contains information about joint probability distribution of all

possible attribute‘s states when all its parent nodes are known.

These tables are used to predict the probability of class to any given case. Probability distribution is calculated using this

formula:

n

i

iin XparentXPXXP1

1 ))(|(),...,(

where n the number of states of the attribute, Xi is X state of

attribute and parent(Xi) is state‗s Xi parent node [25]. The

complexity increases with the number of classes and

attributes. BayesNet also has an ability to use different search

algorithms for finding the best decision as K2, Hill Climbing,

Genetic search, etc. [32] C-SVC (LibSVM). The main idea in SVM is identification

of special data points (support vectors) that are used to separate the provided cases by defining the binary class boundaries.

Generally SVM uses a linear model to implement nonlinear class boundaries by nonlinear mapping of the input vectors xi

into the high-dimensional feature space by using the kernel

function ( , ) ( ) ( )Ti ji jK x x x x .A linear model giving maximum

separation, maximum margin hyperplane, is constructed in the new space. Support vectors are the training vectors clos est to

this hyperplane. C-SVC is a classical implementation of SVM first described in [26]. It is formulated as follows [27]: given

training vectors , 1,..,iX R i l , two classes and a vector

ly R such as [ 1;1]iy C-SVC solves the following primal

problem

l

i

i

T

bw

Cww1,, 2

1min

subject to?

Nibxwy iii

T

i ,..,1 ,0 ,1))((

A detailed description of this algorithm can be found in

[27][28].

LIBLINEAR. LIBLINEAR is a family of linear SVM

classifiers for large sparse data with a huge number of

instances and features. It supports logistic regression and linear support vector machines and can be very efficient for training

large-scale problems. In our experiment we apply L2-loss

linear support vector machines for classification task. It solves the following optimization problem; a detailed description can

be found in [29]:

2

1

))1,0max(2

1min i

Tl

i

i

T

wxwyCww (4)

where training vectors xi ? Rn, i =1,..,l in two class, vector y ?

Rl such that yi = {1,? 1}, w is a weight vector that a linear

classifier generates as the model. The decision function is

sgn(wTx).

Genetic algorithm (GA). It is the most widely used

evolutionary computing technique which is often applied to solve various optimization problems. Application of GA leads

to evolutionary process as the solutions generated from one population are used to form a new population hoping that this

one would be better. The better solutions are obtained with this population the more chances they have for recombination. This

method uses concepts of population initialization, crossover, mutation, fitness selection similar to these concepts in biology

to search for the best solutions in the search space by taking

best individuals and forming new populations until a particular limit is reached. There are many various sources of information

which can give more informat ion on this technique, i.e. [30]

A. Proposed method

This section describes a method based on genetic search, machine learning technique for classification and discriminant

analysis. The main steps are as follows:

1. Results of every instance are calculated using

discriminant analysis and are converted to bankruptcy

classes;

2. Data preprocessing:

a. Instances with empty outputs (records, which

couldn‘t be evaluated in Step 1 because of lack of

data or division by zero) are eliminated;

b. Data imputation to eliminate empty values; here

missing values are replaced with company‘s average

of the attribute with missing data (for dataset D with

attributes X and its subset DC as financial records

(instances) related to company C, if DCij = {} then

DCij = average(Xi), i=1..,m, j=1,..,n; here m is the

number of attributes, n – length of DC);

c. Companies are divided to the ones whose data will

be used for training and whose data will be used for

testing. These sets are disjoint (for company list C =

C_train ? C_test, and |C_train| > |C_test|);

d. Calculate train ing and testing data split percentage;

e. Create training and testing data by splitting data of

selected companies in the sector by a percentage

Page 90: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

90

a. selected companies in the sector by a percentage

calculated in Step 5. These sets are also disjoint (CD

= CD_train ? CD_test and | CD_train| > | CD_test|);

2. A genetic algorithm for feature selection is used to select

the most relevant ratios. Evaluation uses correlation-based

feature subset selection based on consideration of

individual predictive ability of each feature along with the

degree of redundancy between them [32] [33]

3. Model is trained using one of machine learn ing

algorithms for classification (SVM and Bayes ian

classifiers are selected for this experiment in order to

compare their performance);

4. The created model is tested using testing (holdout) data

and results are evaluated.

A. Methods for evaluation of instances and results

Altman's Z-Score was chosen for evaluation and forming of

dependant variable as a popular and widely used evaluation technique. It predicts whether or not a company is likely to

enter into bankruptcy within one or two years. Companies from Manufacturing sector (20-39) were evaluated using original

Altman Z-Score, other – by using Z-Score for non-manufacturing companies [31]. Z-Score for non-manufacturing

companies was used for full dataset evaluation. These models

are presented in Table I.

TABLE I. ALTMAN MODELS USED IN EXPERIMENTS

Altman (original) Altman for non-manufacturing companies

w1 1.2 6.56

x1 Working capital/Total assets Working capital/Total assets

w2 1.4 3.26

x2 Retained earnings/Total assets Retained earnings/Total assets

w3 3.3 6.72 x3 Earnings before interest and

taxes/ Total assets Earnings before interest and

taxes/Total assets

w4 0.6 1.05

x4 Book value of Equity/ Book value of total liabilit ies

Book value of Equity/ Book value of total liabilit ies

w5 0.999 -

x5 Net sales/Total assets -

Eval Z>3 – healthy; 2.7<Z<2.99 – non-bankrupt; Z <1.79 - bankrupt

Algorithms described in section 3.1 were used in this experiment to train models. The test results are evaluated by

using accuracy together with Type 1 and Type 2 errors. If one

would define define companies that have high or low value of risk evaluation in terms of "bad" and "good". Type I error will

show the accuracy with which the model didn't identify "bad" debtors, and Type II error will show the accuracy with which

the model identified "good" debtors as bad. Type 1 error is considered as more important in credit risk evaluation as the

inability to identify a failing company will cost a lender far more than rejecting a healthy company.

Weighted mean was used as following to properly evaluate

overall performance:

n

i

i

n

i

ii

r

er

e

1

1

where n is the number of sectors, ei is the value of error for

sector i, ri – the number of records in sector i used for testing.

It should be noted that the here r is the number of test records;

it was chosen because the test results represent the accuracy

better. Here we evaluated only the weighted mean according

to amounts of testing instances; however, if the proportion of

training and testing instances varies significantly, it might be

useful to evaluate weighted mean with both training and

testing instances.

II. THE EXPERIMENT

A. Research data

The experiments were made by using data from EDGA R database of over 8600 companies from the year 1999-2006. It

consists of yearly financial records with 79 financial rat ios and indices used in financial analysis. This data was split into

sectors according to SIC classification. We used 3:2 split in our experiment (60% percent of companies of each sector were

selected for training). The sectors and company splits are given in Table II.

TABLE II. THE SECTORS USED IN EXPERIMENTS

B. Experiment configuration

The experiment was run using implementations of SVM and Bayesian classifiers in described in Section 3.1 in Weka

[32] framework. Weka integrates both LibSVM [27] and LIBLINEAR [29] as its SVM implementations . The algorithm

in Section 3.2 was applied for every sector.

Genetic search used for attribute selection was run using

the following parameters: crossover probability equal to 0.6, number of generations equal to 20, mutation probability of

0.033 and population size of 20. Polynomial kernel K(x,z)

=(?x? z? + θ)d

was used with SMO and LibSVM (C-SVC)

classifiers, using parameters C = 4 for SMO; C = 7 and γ = 7

for C-SVC. LIBLINEAR was run with C = 20. Naïve Bayes

Sector

code

Sector name Total no.

of

companies

No. of

compan

ies for training

No. of

compan

ies for testing

01-09 Agriculture, Forestry, And Fishing 33 20 13

10-14 Mining 469 281 188

15-17 Construction 83 50 33

20-39 Manufacturing 3027 1816 1211

40-49 Transportation, Communications,

Electric, Gas, And Sanitary Services

786 472 314

50-51 Wholesale Trade 287 172 115

52-59 Retail Trade 405 243 162

60-67 Finance, Insurance, And Real Estate 1853 1112 741

70-89 Services 1712 1027 685

All data 8665 5199 3466

Page 91: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

91

for C-SVC. LIBLINEAR was run with C = 20. Naïve

Bayes classifier was run using supervised discretization. BayesNet was used with the following parameters: estimator –

SimpleEstimator algorithm for finding the conditional probability tables of the Bayes ian Network with α = 0.5. Hill

climbing was used as search algorithm for adding, deleting and reversing arcs as the search is not restricted by an o rder on the

variables. These parameters were selected experimentally.

A. Experiment results

The results of these experiments are presented in Table III, which includes weighted accuracies together with weighted

Type 1 errors. LibSVM performed with highest accuracy as

well as with highest weighted accuracy but it had higher weighted Type 1 error than Bayesian classifiers. Very similar

results by both weighted accuracy and weighted error were obtained by using Naïve Bayes and BayesNet classifiers ;

although accuracy in most cases (especially in cases of higher number of instances for training) they obtained significantly

lower results than SVM, but weighted errors and weighted

mean errors were the smallest.

TABLE I. EXPERIMENT RESULTS

SVM

(LIBLINEAR)

SVM (LibSVM) Naïve Bayes BayesNet

Sector

Tra

inin

g

percenta

ge,

%

No

of

tra

inin

g

inst

an

ces

No

o

f te

stin

g

inst

an

ces

Accu

racy

Ty

pe1

Erro

r

Accu

racy

Ty

pe1

Erro

r

Accu

racy

Ty

pe1

Erro

r

Accu

racy

Ty

pe1

Erro

r

01-09 59,556 134 91 85,71 0,3 75,82 0,561 83,52 0,105 84,62 0,079

10-14 59,777 1660 1117 71,17 0,612 77,17 0,408 77,35 0,174 77,17 0,174 15-17 60,674 324 210 84,76 0,534 72,38 0,596 77,14 0,091 75,24 0,109

20-39 60,104 11641 7727 88,92 0,523 90,86 0,336 68,10 0,097 68,12 0,098 40-49 59,634 2838 1921 70,85 0,666 81,05 0,294 69,91 0,123 69,91 0,124

50-51 59,803 1095 736 91,58 0,555 90,08 0,363 75,00 0,127 75,14 0,127

52-59 60,199 1570 1038 95,38 0,775 95,09 0,586 79,87 0,082 79,77 0,080 60-67 61,181 6413 4069 68,86 0,512 82,13 0,206 77,02 0,088 77,17 0,088

70-89 60,224 6241 4122 80,81 0,524 85,30 0,286 74,31 0,173 74,36 0,173

All data 63,529 36674 21054 70,45 0,667 71,67 0,635 72,26 0,174 72,29 0,174

Weighted mean 81,21 0,552 86,39 0,318 72,68 0,117 72,70 0,117

For more accurate evaluation Type 1 and Type 2 errors for separate classes (―bankrupt‖, ―average‖ and ―healthy‖) were

also evaluated. Table IV and Table V represent these results; they show that Type 1 Error was relatively small for

―bankrupt‖ companies in cases of SVM based classifiers,

except Finance, Insurance and Real Estate sector where it was very high (0.811). Naïve Bayesian and BayesNet performed

with errors under 0.1; similar result was also in the Finance, Insurance and Real Estate sector.

TABLE II. TYPE 1 ERROR VALUES FOR DIFFERENT CLASSES (―BANKRUPT‖ (B), ‖AVERAGE‖ (A), ‖HEALTHY‖ (H))

LIBLINEAR LibSVM Naïve Bayes BayesNet B A H B A H B A H B A H

01-09 0,026 0,036 0,381 0,064 0,024 0,714 0,105 0,036 0,182 0,079 0,048 0,182

10-14 0,012 0,000 0,889 0,050 0,006 0,580 0,174 0,081 0,048 0,174 0,081 0,054

15-17 0,010 0,051 0,625 0,021 0,164 0,688 0,091 0,155 0,090 0,109 0,155 0,100

20-39 0,015 0,000 0,618 0,033 0,001 0,394 0,097 0,235 0,136 0,098 0,234 0,136

40-49 0,008 0,002 0,948 0,032 0,051 0,401 0,123 0,215 0,092 0,124 0,214 0,091

50-51 0,009 0,003 0,628 0,031 0,024 0,407 0,127 0,160 0,050 0,127 0,158 0,050

52-59 0,003 0,000 0,818 0,007 0,010 0,618 0,082 0,136 0,052 0,080 0,137 0,055

60-67 0,811 0,000 0,012 0,303 0,030 0,052 0,088 0,148 0,092 0,088 0,147 0,090

70-89 0,014 0,000 0,702 0,059 0,005 0,369 0,173 0,118 0,095 0,173 0,118 0,094

All data 0,001 0,000 0,962 0,003 0,000 0,914 0,174 0,153 0,064 0,174 0,153 0,064

Table III shows that in most of the sectors LIBLINEAR and LibSVM performed with smaller Type 1 errors for

―bankrupt‖ and ―average‖ companies than Naïve Bayes and BayesNet; however, the latter two showed better results for

―healthy‖ companies‘ recognition. Usage of Bayesian method based resulted in much more balanced Type 1 and Type 2

errors. These results indicate that SVM usage might effectively predict ―bankrupt‖ and ―average‖ companies but Bayesian

classifiers might be more suitable for general classification.

Table V shows that the possibility to identify ―healthy‖ debtors as bankrupt is significantly high for SVM based

classifiers compared to the possibility to select ―bankrupt‖ company as ―healthy‖; conversely, the case of Finance,

Insurance and Financial Services showed a high possibility to identify ‖healthy‖ companies rather than ―bankrupt‖.

Respectively, Bayesian classifiers performed with this error respectively below 0.25 for both ―bankrupt‖ and ―healthy‖

company incorrect identification.

Page 92: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

92

Page 93: VILNIAUS UNIVERSITETO2080843/2080843.pdf · vilniaus universiteto kauno humanitarinio fakulteto informatikos katedra gediminas bŪzius magistro baigiamasis darbas bajeso metodo taikymas

93

I. CONCLUSIONS AND FURTHER RESEARCH

This article presents a research on credit risk evaluation that

uses evaluation by widely applied discriminant analysis models, such as Z-Score, genetic search for feature selection to

select best financial ratios, and model training using popular

machine learn ing techniques. SVM implementations (LIBLINEAR, C-SVC from LibSVM) and methods which use

Bayesian inference (Naïve Bayes, BayesNet) were used to train classifiers. The experiment results show that LibSVM (C-SVC)

in many cases outperformed other classifiers; however, LIBLINEAR performed best while identifying particularly

―bankrupt‖ companies. The experiment results show that in

most of the cases this method gives promising results for ―bankrupt‖ and ―average‖ company identification. Naïve Bayes

and BayesNet performed with more balanced errors, together with the smallest weighted Type 1 errors. Further research

might be concentrated on optimizing these classifiers by best parameter selection or integration of other machine learning

techniques.

REFERENCES

[1] E. Altman, "Financial ratios, discriminant analysis and the prediction of

corporate bankruptcy," The Journal of Finance, vol. 23, 1968, pp. 589–609.

[2] G. L. V. Springate, ―Predicting the Possibility of Failure in a Canadian Firm‖. Unpublished M.B.A. Research Project, Simon Fraser University, 1978 .

[3] Y. Wu and Z. Si, "Application of RBF Neural Network Based on Ant Colony Algorithm in Credit Risk Evaluation of Construction Enterprises," 2008 International Conference on Risk Management & Engineering Management, 2008, pp. 653-658.

[4] F. Huang, "A Particle Swarm Optimized Fuzzy Neural Network for Credit Risk Evaluation," Genetic and Evolutionary Computing. 2008 Second International Conference on, 2008, pp. 153-157.

[5] E. Lacerda, A.C. Carvalho, A.n. Braga, and T.B. Ludermir, "Evolutionary Radial Basis Functions for Credit Assessment," Applied Intelligence, vol. 22, 2005, pp. 167-181.

[6] E. Merkevicius, G. Garsva, and R. Simutis, "Neuro-discriminate Model for the Forecasting of Changes of Companies Financial Standings on the Basis of Self-organizing Maps," Lecture Notes In Computer Science, Y. Shi, G. Albada, J. Dongarra, and P. Sloot, Berlin, Heidelberg: Springer-Verlag, 2007, pp. 439-446.

[7] E. Merkevicius, G. Garsva, and S. Girdzijauskas, "A hybrid SOM-Altman model for bankruptcy prediction," Lecture Notes in Computer Science, vol. 3994, 2006, pp. 364-371.

[8] Y. Xiao, "Research on comparison of credit risk evaluation models based on SOM and LVQ neural network," 2008 7th World Congress on Intelligent Control and Automation, 2008, pp. 2230-2235.

[9] P.N. Posch, G. Loffler, C. Schone, "Bayesian Methods for Improving Credit Scoring Models," Finance, 2005, pp. 1-26.

[10] S. Ranjan, R. Fan, G. Geng, ―Bayesian Migration in Credit Ratings Based on Probabilities of Default‖. The Journal of Fixed Income, Vol. 12, No. 3, 2002, pp. 17-23.

[11] T.C. Fogarty, N.S. Ireson, ―Evolving Bayesian classifiers for credit control-a comparison with other machine-learning methods‖, IMA J Management Math, vol. 5, no. 1, 1993, pp. 63-75.

[12] A. C. Antonakis, M. E. Sfakianakis, ―Assessing naive Bayesian as a method for screening credit applicants‖. Journal of Applied Statistics, vol. 36, Issue 5, 2009, pp. 537 - 545

[13] B. Baesens, M. Egmont-Petersen, R. Castelo, J. Vanthienen, "Learning Bayesian Network Classifiers for Credit Scoring Using Markov Chain Monte Carlo Search," ICPR, 16th International Conference on Pattern Recognition, vol. 3, 2002, pp. 49-52

[14] C. Gössl, "Predictions Based on Certain Uncertainties—A Bayesian Credit Portfolio Approach," HypoVereinsbank AG, London, 2005, preprint.

[15] Z.R. Yang, "Support vector machines for company failure prediction," 2003 IEEE International Conference on Computational Intelligence for Financial Engineering Proceedings, 2003, pp. 47-54.

[16] W. Hardle, R. Moro, D. Schafer, "Bankruptcy Analysis with Support Vector Machines", European Finance Association, 33rd Annual Meeting, 2006, pp. 1-20.

[17] W. Hardle, R. Moro, D. Schafer, "Estimating probabilities of default with support vector machines", SFB 649 Discussion Papers SFB649DP2007-035, Sonderforschungsbereich 649, Humboldt University, Berlin, Germany, 2007.

[18] W. Chen and J. Shih, "A study of Taiwan‘s issuer credit rating systems using support vector machines," Expert Systems with Applications, vol. 30, 2006, pp. 427-435.

[19] W. Chong, G. Yingjian, and W. Dong, "Study on Capital Risk Assessment Model of Real Estate Enterprises Based on Support Vector Machines and Fuzzy Integral," Control and Decision Conference, 2008, pp. 2317 - 2320.

[20] K. Lai, L. Yu, S. Wang, and W. Huang, "An Intelligent CRM System for Identifying High-Risk Customers: An Ensemble Data Mining Approach," Lecture Notes in Computer Science, vol. 4488, 2007, pp. 486-489.

[21] T. Van Gestel, B. Baesens, J. Suykens, D. Van Den Poel, D. Baestaens, and M. Willekens, "Bayesian kernel based classification for financial distress detection," European Journal of Operational Research, vol. 172, 2006, pp. 979–1003.

[22] T. Van Gestel, J. Suykens, G. Lanckriet, A. Lambrechts, B. De Moor, and J. Vandewalle, "Bayesian framework for least-squares support vector machine classifiers, gaussian processes, and kernel Fisher discriminant analysis.," Neural computation, vol. 14, 2002, pp. 1115-1147.

[23] P. Danenas, G. Garsva, ―Support Vector Machines and their Application in Credit Risk Evaluation‖, Transformations in Business & Economics, vol. 8, No. 3 (18), 2009, pp. 46-58

[24] I. Rish, ―An empirical study of the naive Bayes classifier‖, IBM Research Report, IBM Research Division, 2001, pp. 1-2

[25] F. Ruggeri, F. Faltin, R. Kenett , ―Encyclopedia of Statistics in Quality & Reliability‖, Wiley & Sons, 2007.

[26] C. Cortes and V. Vapnik, "Support -vector networks," Machine learning, vol. 20, 1995, pp. 273–297.

[27] C. Chang and C. Lin, ―LIBSVM: a library for support vector machines‖, 2001.

[28] V. Vapnik, ―The Nature of Statistical Learning Theory‖, Springer-Verlag, 2000

[29] R. Fan, K. Chang, C. Hsieh, X. Wang, and C. Lin, "LIBLINEAR: A library for large linear classification," The Journal of Machine Learning Research, vol. 9, 2008, pp. 1871–1874.

[30] S. E. Haupt, R. L. Haupt, ―Practical genetic algorithms‖, Wiley-IEEE, 2004

[31] E.I. Altman, "Predicting financial distress of companies: Revisiting the Z-score and Zeta models," 2000, unpublished manuscript .

[32] Weka 3: Data Mining Software in Java, http://www.cs.waikato.ac.nz/ml/weka/

[33] M.A. Hall, ―Correlation-based Feature Subset Selection for Machine Learning‖, Hamilton, New Zealand, 1998.