28
[email protected] Klasifikacija v WEKI 16.3.2007 Petra Kralj [email protected]

Klasifikacija v WEKIkt.ijs.si/PetraKralj/UNGKnowledgeDiscovery/... · – Naivni Bayesov klasifikator – Razumevanje rezultatov. [email protected] Naloga • V Weki z algoritmom

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • [email protected]

    Klasifikacija v WEKI16.3.2007

    Petra [email protected]

  • [email protected]

    Vaje z Weko• Ponovimo primer s kontaktnimi lečami z

    algoritmom ID3, testiranje:– Z ločeno testno množico

    • Klasifikacija na CAR dataset– Priprava in branje podatkov– Gradnja odločitvenih dreves– Naivni Bayesov klasifikator– Razumevanje rezultatov

  • [email protected]

    Naloga

    • V Weki z algoritmom ID3 zgradi odločitveno drevo na učni množici in izračunaj njegovo klasifikacijsko točnost na testni množici

    • Podatki– LeceBinUcna.arff– LeceBinTestna.arff

    • Primerjaj z rezultati, ki smo jih dobili pri ročnem računanju

  • [email protected]

    Program WEKA

    download

    Prosto dostopen program za rudarjenje podatkov http://www.cs.waikato.ac.nz/ml/weka/

  • [email protected]

    Zagon programa Weka

    Izberemo Explorer

  • [email protected]

    Okno za branje podatkov

  • [email protected]

    Naložimo datoteko

    LeceBinUcna.arff

  • [email protected]

    Pokažejo se nam podatki

    Ciljna spremenljivka

    Izberemo

    zavihek

    “Classify”

  • [email protected]

    Izberemo algoritem

  • [email protected]

    trees

    Id3

  • [email protected]

    LeceBinTestna.arff

    1 2

    3

    4

    5

  • [email protected]

    Odločitveno drevo

  • [email protected]

    Klasifikacijska točnost

    Kontingenčna tabela

  • [email protected]

    CAR dataset

    • 1728 primerov• 6 atributov

    – 6 nominalnih– 0 numeričnih

    • Nominalna ciljna spremenljivka– 4 vrednosti: unacc, acc, good, v-good– Distribucija vrednosti

    • unacc (70%), acc (22%), good (4%), v-good (4%)• Brez manjkajočih vrednosti

  • [email protected]

    Priprava podatkov za WEKO - 1

    Podatki v tabeli (npr. MS Excel)

    - Vrstice so primeri- Stolpci so atributi- Zadnji stolpec je ciljna

    spremenljivka

  • [email protected]

    Priprava podatkov za WEKO - 2

    Shrani kot “.csv”- Pazljivo s pikami,

    vejicami in podpičji!

  • [email protected]

    Load the data

    Ciljna spremenljivka

    Car.csv

  • [email protected]

    Izberemo algoritem J48

  • [email protected]

    Gradnja in evalvacija drevesa

  • [email protected]

    Napoved modela

    Resnične vrednosti

    Klasifikacijska točnost

  • [email protected]

    Desni klik na miški

  • [email protected]

    Rezanje dreves

    Nastavimo minimalno število primerov v

    listu na 15

    Parametri algoritma (desni

    klik na miški)

  • [email protected]

    Število vozlišč in listov je manjše

    Lažja interpretacija,

    manjša klasifikacijska

    točnost

  • [email protected]

  • [email protected]

    Naivni Bayesov klasifikator

  • [email protected]

  • [email protected]

  • [email protected]

    Za doma

    Na datoteki • LeceBin.csvZgradite odločitveno drevo z ID3 algoritmom

    in J48 algoritmom, za evalvacijo uporabite prečno preverjanje.

    Klasifikacija v WEKI �16.3.2007Vaje z WekoNalogaProgram WEKA Zagon programa WekaOkno za branje podatkovNaložimo datotekoPokažejo se nam podatkiIzberemo algoritemCAR datasetPriprava podatkov za WEKO - 1Priprava podatkov za WEKO - 2Load the dataIzberemo algoritem J48Gradnja in evalvacija drevesaRezanje drevesNaivni Bayesov klasifikatorZa doma