18
PODATKOVNO SKLADIŠČE KOT OSNOVA ZA ODKRIVANJE NOVEGA ZNANJA 18. dnevi slovenskega zavarovalništva Avtor: mag. Janez Kralj Portorož, 9. in 10. junij 2011

PODATKOVNO SKLADIŠČE KOT OSNOVA ZA ODKRIVANJE … · Naivni Bayesov klasifikator rezultate vizualiziramo z uporabo nomograma, za posamezne razrede, če je informacijski prispevek

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • PODATKOVNO SKLADIŠČE KOT OSNOVA ZA ODKRIVANJE NOVEGA ZNANJA

    18. dnevi slovenskega zavarovalništva

    Avtor: mag. Janez Kralj Portorož, 9. in 10. junij 2011

  • 18. dnevi slovenskega zavarovalništva

    Podatkovna skladiPodatkovna skladiššččaa

    Več virov

    Več uporabnikov

    Iz enega mesta

  • 18. dnevi slovenskega zavarovalništva

    Podatkovna skladiPodatkovna skladiššččaa

    -- namen je popolnoma druganamen je popolnoma drugaččen kot pri transakcijskih sistemihen kot pri transakcijskih sistemih

    -- prilagojena zasnova s preprilagojena zasnova s preččiiššččenimi in integriranimi podatkienimi in integriranimi podatki

    -- zasnovana so za zasnovana so za adad--hochoc poizvedovanja in analizepoizvedovanja in analize

    -- vsebujejo veliko koristnih informacij, ki jih je potrebno izbrsvsebujejo veliko koristnih informacij, ki jih je potrebno izbrskati kati

  • 18. dnevi slovenskega zavarovalništva

    Iz podatkov lahko pridobimo znanje. ? ali !Iz podatkov lahko pridobimo znanje. ? ali !

  • 18. dnevi slovenskega zavarovalništva

    Klasifikacija Klasifikacija –– razred je diskretna spremenljivkarazred je diskretna spremenljivka

  • 18. dnevi slovenskega zavarovalništva

    Regresija Regresija –– razred je zvezna spremenljivkarazred je zvezna spremenljivka

  • VpraVpraššanje:anje:““KakKakššno osebno zavarovanje bo sklenila stranka, ki no osebno zavarovanje bo sklenila stranka, ki žželi plaeli plaččati nizko ati nizko zavarovalno premijo?zavarovalno premijo?””

    VpraVpraššanje:anje:““Katere stranke nagovoriti k nakupu doloKatere stranke nagovoriti k nakupu določčenega zavarovanja, da bo trenega zavarovanja, da bo tržžna na akcija uspeakcija uspeššnejnejšša?a?””

    Odgovor:Odgovor:

    ““Nove stranke, ki Nove stranke, ki žželijo nizko letno zavarovalno premijo bodo elijo nizko letno zavarovalno premijo bodo najverjetneje kupile zdravstveno zavarovanje!najverjetneje kupile zdravstveno zavarovanje!”” ((ChienChien--HsingHsing etet alal., 2005).., 2005).

    18. dnevi slovenskega zavarovalništva

    Odgovor:Odgovor:

    ??????

  • Problem = poslovna priložnost

    • Uporabimo metode strojnega učenja.

    • Podatke iz podatkovnega skladišča lahko uporabimo za pridobivanje odgovorov na zastavljeno vprašanje.

    • Poiščemo lastnosti strank, ki so do sedaj sklenile zavarovanja, ki jih želimo tržiti.

    • Na osnovi ugotovljenih lastnosti poiščemo stranke, ki so najbolj podobne.

    18. dnevi slovenskega zavarovalništva

  • Faze raziskaveFaze raziskave

    18. dnevi slovenskega zavarovalništva

  • Priprava, izbiranje in Priprava, izbiranje in ččiiššččenje podatkovenje podatkov

    Pripravljen je bil vzorec s 380.000 zapisiPripravljen je bil vzorec s 380.000 zapisi

    Podatke smo zajeli iz podatkovnega skladiPodatke smo zajeli iz podatkovnega skladiššččaa

    18. dnevi slovenskega zavarovalništva

  • StatistiStatističčne analizene analize

    7,6 :143.500333.000

    6,9 :12.60018.0009-Mursko Soboška

    10 :12.40024.0008-Novomeška

    9,5 :14.00038.0006-Koprska

    8 :13.00024.0005-Novo Goriška

    6,3 :16.00038.0004-Kranjska

    5,8 :16.00035.0003-Celjska

    5,9 :19.50056.0002-Mariborska

    10 :110.000100.0001-Ljubljanska

    RazmerjeŠtevilo razširjenihŠtevilo osnovnihRegija

    18. dnevi slovenskega zavarovalništva

  • Strojno uStrojno uččenje 1/2enje 1/2Orange

    je modularno delovno okolje za podatkovno rudarjenje,

    omogoča vizualno reševanje problemov,

    razvito je v Laboratoriju za umetno inteligenco Fakultete za računalništvo in informatiko v Ljubljani, Slovenija,

    je prosto dostopno orodje.

    18. dnevi slovenskega zavarovalništva

  • Strojno uStrojno uččenje 2/2enje 2/2

    Odločitveno drevo

    predstavlja transformacijo podatkov v neko preglednejšo obliko.

    Naivni Bayesovklasifikator

    rezultate vizualiziramo z uporabo nomograma,

    za posamezne razrede, če je informacijski prispevekpozitiven,

    proti posameznim razredom, če je informacijski prispevek negativen.

    Pravila “ČE-POTEM”

    sestavljena so iz pogojnega in sklepnega dela,

    pravilo pravilno pokriva učni primer, če pravilo za dani primer pravilno napove razred.

    18. dnevi slovenskega zavarovalništva

  • RezultatRezultat

    0&...&&

    21

    CCCCliii⇒

    Na osnovi pravil, pridobljenih iz odločitvenega drevesa:"Plačana premija skupaj" je v znesku med 800,00€ in 1.000,00€"Število aktivnih polic" je med 1 in 3"Število vseh polic" je med 3 in 10

    in"Plačana premija skupaj" je v znesku med 800,00€ in 1.000,00€"Število aktivnih polic" je več od 3"Število vseh polic" je med 9 in 11

    Na osnovi pravil, pridobljenih z naivnim Bayesovim klasifikatorjem:"Plačana premija skupaj" je več od 800,00€"Število let od sklenitve prve police" je med 9 in 13 let"Starost" je med 35 in 65 let"Število vseh polic" je več od 5"Število aktivnih polic" je več od 1

    smo pridobili seznam s 5.600 strankami.

    smo pridobili seznam z 28.500 strankami.

    18. dnevi slovenskega zavarovalništva

  • Uporaba rezultatov v praksi 1/2Uporaba rezultatov v praksi 1/2

    0&...&&

    21

    CCCCliii⇒

    18. dnevi slovenskega zavarovalništva

  • Uporaba rezultatov v praksi 2/2Uporaba rezultatov v praksi 2/2

    Bistveno zmanjšanje stroškov akcije, ker bi nagovarjali bistveno manjšo množicozavarovancev.

    Za isto višino stroškov bi lahko izvedli bistveno več ciljno usmerjenih tržnih akcij in s tem predvidoma pridobili večje število zavarovanj.

    Ob boljšem deležu uspešnosti ponudb bi bistveno izboljšali donosnost posamezne akcije.

    18. dnevi slovenskega zavarovalništva

  • ZakljuZaključčkiki

    18. dnevi slovenskega zavarovalništva

    Podatki zbrani v podatkovnih skladiPodatki zbrani v podatkovnih skladiššččih vsebujejo veliko znanja, tudi novega.ih vsebujejo veliko znanja, tudi novega.

    PodatkiPodatki so v so v poslovanjuposlovanju neuporabnineuporabni, , ččee jihjih ne ne uporabimouporabimo zaza izboljizboljšševanjeevanjelastnihlastnih odloodloččitevitev aliali poslovnihposlovnih odloodloččitevitev podjetjapodjetja..

    MetodeMetode pridobivanjapridobivanja znanjaznanja iziz podatkovpodatkov imajoimajo ššee velikoveliko momožžnostinosti zazauveljavitevuveljavitev..

    UvajanjeUvajanje novihnovih programskihprogramskih rereššitevitev v v obstojeobstoječčee informacijskeinformacijske sistemesisteme, je , je stratestratešškegakega pomenapomena pripri razvojurazvoju poslovanjaposlovanja podjetjapodjetja in in pripri zagotavljanjuzagotavljanjukonkurenkonkurenččnene prednostiprednosti podjetjapodjetja..

  • VpraVpraššanjaanja

    18. dnevi slovenskega zavarovalništva

    ???