Absen Jurnal Johan 2010 Ok

Embed Size (px)

DESCRIPTION

Absen

Citation preview

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    1/14

    2010 - Johan Page 1

    Analisa Keranjang Pasar dengan Algoritma Apriori pada Data Transaksi

    Mini Market Lima Bintang

    JohanE-mail : [email protected]

    ABSTRAK

    Algoritma apriori termasuk jenis aturan asosiasi pada data mining. Algoritma apriori atau

    association rule miningadalah teknik data mininguntuk menemukan aturan asosiatif antara satu

    kombinasi item, dari analisa pembelian di suatu pasar swalayan dapat diketahuinya berapa besar

    kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan

    tersebut, pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye

    pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu. Berdasarkan uji coba

    Nilai Support dapat diambil kesimpulan bahwa semakin kecil nilai support maka jumlah itemsetyang dihasilkan semakin banyak, dan jumlah kaidah asosiasi yang dibentuk semakin banyak pula.

    Kata kunci : Data Mining, Association Rules, AlgoritmaApriori

    ABSTRACT

    Apriori is an algorithm provided in association rules in data mining. Apriori or association rule

    mining is data mining techniques to discover the associative rules between one combination of

    items, from analysis of the purchase in a supermarket can know how likely a customer buys bread

    with milk. With this knowledge, a supermarket owner can manage the placement of merchandise or

    designing marketing campaigns using a combination of discount coupons for certain items. Based

    on the experimental value of Support can be concluded that the smaller the value of support then

    the number of itemset generated more and more, and the number of association rules established

    more and more also.

    Keyword :Data Mining, Association Rules, Apriori Algorithm

    I. PENDAHULUANI.1 LATAR BELAKANG

    Data mining adalah kombinasisecara logis antara pengetahuan data, dan

    analisa statistik yang dikembangkan

    dalam pengetahuan bisnis atau suatu

    proses yang menggunakan teknikstatistik, matematika, kecerdasan buatan,

    tiruan dan machine-learning untuk

    mengekstraksi dan mengidentifikasiinformasi yang bermanfaat bagi

    pengetahuan yang terkait dari berbagai

    database besar.

    Algoritma apriori adalahalgoritma analisis keranjang pasar yang

    digunakan untuk menghasilkan aturan

    asosiasi, dengan pola if-then. Algoritma

    apriori menggunakan pendekatan iteratifyang dikenal dengan level-wise search,

    dimana k-kelompok produk digunakan

    untuk mengeksplorasi (k+1)-kelompok

    produk atau (k+1)-itemset.

    Dalam penelitian ini peneliti mencoba

    menganalisa data transaksi penjualan

    pada toko Mini Market Lima BintangPekanbaru. Data yang diambil sebagai

    contoh kasus adalah data transaksi

    penjualan di mini market. Melalui

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    2/14

    2010 - Johan Page 2

    penelitian ini diharapkan dapat ditemukanlangkah-langkah dan masalah (sebagai

    model) dalam menerapkan algoritma

    apriori ini dan diketahui apakah data

    transaksi penjualan mini market cukup

    berharga untuk ditambang dengan teknikanalisis data market. Penelitian ini

    membahas algoritma apriori, analisis ,

    imp

    Implementasi sistem analisis

    keranjang pasar dengan algoritmaapriori, dan eksperimen penggunaan

    sistem dengan data transaksi penjualan

    toko Mini Market Lima Bintang

    Pekanbaru.

    I.2 PERUMUSAN MASALAH

    Berdasarkan latar belakang di atas, dapat

    dirumuskan masalahnya, sebagai berikut :

    1. Bagaimana menganalisa data untukkeperluan strategi pemasaran, desain

    katalog dan proses pembuatankeputusan bisnis ?

    2. Bagaimana menemukan pola-polahimpunan data yang sifatnyatersembunyi ?

    3. Bagaimana menerapkan algoritmaapriori dalam data market ?

    Tujuan analisis keranjang pasar padatransaksi penjualan adalah untuk

    merancang strategi penjualan atau

    pemasaran yang efektif denganmemanfaatkan data transaksi penjualan

    yang telah tersedia di perusahaan.

    Dengan menggunakan teknologi datamining, orang tidak perlu melakukan

    analisis data secara manual, melainkan

    dapat menggunakan teknik data mining

    untuk ini.

    I.3 TUJUAN PENELITITAN

    Tujuan analisis keranjang pasar pada

    transaksi penjualan adalah untukmerancang strategi penjualan atau

    pemasaran yang efektif dengan

    memanfaatkan data transaksi penjualanyang telah tersedia di mini market.

    Dengan menggunakan teknologi data

    mining, orang tidak perlu melakukan

    analisis data secara manual, melainkandapat menggunakan teknik data mining

    untuk ini. Teknik analisis keranjang pasar

    bertujuan untuk menemukan pola yang

    berupa produk-produk yang sering dibelibersamaan (atau cenderung muncul

    bersama dalam sebuah transaksi) dari

    data transaksi yang pada umumnya

    berukuran sangat besar. Perusahaan laludapat menggunakan pola ini untuk

    menempatkan produk yang sering dibeli

    bersamaan ke dalam sebuah area yangberdekatan, merancang tampilan produk

    di katalog, merancang kupon diskon(untuk diberikan kepada pelanggan yangmembeli produk tertentu), merancang

    penjualan paket produk, dll. Penelitian ini

    bertujuan untuk mengaplikasikanalgoritma apriori yang merupakan hasil

    penelitian yang baru, sebagai teknik

    analisis keranjang pasar. Data yang

    diambil sebagai contoh kasus adalah datatransaksi mini market. Melalui penelitian

    ini diharapkan dapat ditemukan langkah-

    langkah dan masalah (sebagai model)dalam menerapkan algoritma ini dan

    diketahui apakah data mini market cukup

    berharga untuk ditambang dengan teknik

    analisis keranjang pasar.

    II. TINJAUAN PUSTAKAKnowledge Discovery and Data

    Mining(KDD)adalah proses yang dibantuoleh komputer untuk menggali dan

    menganalisis sejumlah besar himpunan

    data dan mengekstrak informasi danpengetahuan yang berguna. Data mining

    tools memperkirakan perilaku dan tren

    masa depan, memungkinkan bisnis untukmembuat keputusan yang proaktif dan

    berdasarkan pengetahuan.

    Data mining tools mampu menjawabpermasalahan bisnis yang secara

    tradisional terlalu lama untuk

    diselesaikan. Data mining tools

    menjelajah database untuk mencari pola

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    3/14

    2010 - Johan Page 3

    tersembunyi, menemukan infomasi yangprediktif yang mungkin dilewatkan para

    pakar karena berada di luar ekspektasi

    mereka.

    Proses dalam KDD adalah prosesyang digambarkan pada dan terdiri dari

    rangkaian proses iteratif sebagai berikut:

    1. Data cleaning, menghilangkan noise

    dan data yang inkonsisten.

    2. Data integration, menggabungkan

    data dari berbagai sumber data yangberbeda

    3. Data selection, mengambil data yang

    relevan dengan tugas analisis dari

    database

    4. Data transformation,

    Mentransformasi atau menggabungkandata ke dalam bentuk yang sesuai untuk

    penggalian lewat operasi summary atau

    aggregation.

    5. Data mining, proses esensial untuk

    mengekstrak pola dari data dengan

    metode cerdas.

    6.

    Pattern evaluation,mengidentifikasikan pola yang menarik

    dan merepresentasikan pengetahuan

    berdasarkan interestingness measures.

    7. Knowledge presentation, penyajian

    pengetahuan yang digali kepada

    pengguna dengan menggunakanvisualisasi dan teknik representasi

    pengetahuan.

    Gambar 2.1 Tahap-tahap Data Mining

    Algoritma apriori adalah algoritmaanalisis keranjang pasar yang digunakan

    untuk menghasilkan aturan asosiasi,

    dengan pola if-then. Algoritma apriori

    menggunakan pendekatan iteratif yangdikenal dengan level-wise search, dimana

    k-kelompok produk digunakan untukmengeksplorasi (k+1)-kelompok produk

    atau (k+1)-itemset.

    Beberapa istilah yang digunakan dalam

    algoritma apriori antara lain:a. Support (dukungan): probabilitas

    pelanggan membeli beberapa produk

    secara bersamaan dari seluruhtransaksi. Support untuk aturan

    X=>Y adalah probabilitas atributatau kumpulan atribut X dan Y yangterjadi bersamaan.

    b. Confidence (tingkat kepercayaan):

    probabilitas kejadian beberapa produkdibeli bersamaan dimana salah satu

    produk sudah pasti dibeli. Contoh: jika

    ada n transaksi dimana X dibeli, dan

    ada m transaksi dimana X dan Y dibelibersamaan, maka confidence dari

    aturan if X then Y adalah m/n.

    c. Minimum support: parameter yangdigunakan sebagai batasan frekuensi

    kejadian atausupport count yang harus

    dipenuhi suatu kelompok data untukdapat dijadikan aturan.

    d. Minimum confidence: parameter yang

    mendefinisikan minimum level dari

    confidence yang harus dipenuhi olehaturan yang berkualitas.

    e. Itemset: kelompok produk.

    f. Support count: frekuensi kejadianuntuk sebuah kelompok produk atau

    itemset dari seluruh transaksi.

    g. Kandidat itemset: itemset-itemset yangakan dihitungsupport count-nya.

    h.Large itemset: itemset yang sering

    terjadi, atau itemset-itemset yangsudah melewati batas minimum

    support yang telah diberikan.

    Sedangkan notasi-notasi yang digunakan

    dalam algoritma apriori antara lain:

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    4/14

    2010 - Johan Page 4

    a. Ck

    adalah kandidat k-itemset, dimana k

    menunjukkan jumlah pasangan item.

    b. Lkadalah large k-itemset.

    c. D adalah basis data transaksi penjualan

    dimana |D| adalah banyaknya

    transaksi di tabel basis data.

    Ada dua proses utama yang dilakukan

    algoritma apriori, yaitu:

    1. Join (penggabungan): untuk

    menemukan Lk, C

    kdibangkitkan dengan

    melakukan proses join Lk-1

    dengan

    dirinya sendiri, Ck

    =Lk-1

    *Lk-1,

    lalu anggota

    Ck

    diambil hanya yang terdapat didalam

    Lk-1

    .

    2. Prune (pemangkasan): menghilangkan

    anggota Ck

    yang memiliki support count

    lebih kecil dari minimum support agar

    tidak dimasukkan ke dalam Lk.

    Tahapan yang dilakukan algoritma aprioriuntuk membangkitkan large itemset

    adalah sebagai berikut:

    1. Menelusuri seluruh record dibasis data transaksi dan menghitungsupport count dari tiap item. Ini adalah

    kandidat 1-itemset, C1.

    2. Large 1-itemset L1

    dibangun dengan

    menyaring C1

    dengansupport count yang

    lebih besar sama dengan minimum

    support untuk dimasukkan kedalam L1.

    3. Untuk membangun L2, algoritmaapriori menggunakan proses join untuk

    menghasilkan C2.

    4. Dari C2, 2-itemset yang memiliki

    support count yang lebih besar samadengan minimum support akan disimpan

    ke dalam L2.

    5. Proses ini diulang sampai tidak ada

    lagi kemungkinan k-itemset.

    Contoh tahapan pembangkitan C1, L

    1, C

    2,

    L2, C

    3, L

    3ditunjukkan pada Gambar 2.

    Pembangkitan aturan asosiasi dari largeitemset:

    Gambar 2.2 Ilustrasi Algoritma Apriori

    Dari beberapa large itemset yang

    telah ditemukan, dapat dibangkitkan

    aturan-aturan asosiasi yang berkualitas.

    Syarat aturan asosiasi yang adalah harusmemenuhi minimum support dan

    minimum confidence yang telah

    ditentukan. Confidence dari setiap aturanyang dibangkitkan dapat dihitung dengan

    menggunakan rumus peluang

    Confidence(A=>B) = P(B|A) =support_count(AB)/support_count(A)

    dengan support_count (AB) adalah

    jumlah transaksi yang berisi itemset A

    dan B, dan support_count(A) adalahjumlah transaksi yang berisi itemset A.

    Berdasarkan rumusan diatas, aturan

    asosiasi dapat dibangkitkan denganlangkah:

    1. Untuk setiap itemset l, bangkitkan

    seluruh subset l yang tidak kosong.

    2. Untuk setiap subset s dari l yang tidakkosong, buat aturan s => (l- s) jika

    support_count(l)/support_count(s) >=minimum confidence.

    Algoritma apriori memiliki

    masalah yaitu harus membangkitkan

    kandidat itemset, Ck,

    dalam jumlah besar.

    (Banyaknya Ck

    yang dibangkitkan adalah

    kombinasi k dari jumlah itemset Lk-1

    atau

    k

    C( itemset Lk-1)

    .) Setelah Ck

    terbentuk,

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    5/14

    2010 - Johan Page 5

    apriori melakukan penelusuran seluruhrecord di basis data untuk menghitung

    support count masing-masing itemset

    sehingga waktu komputasinya lama.

    (Semakin besar jumlah kandidat itemsetsemakin besar komputasinya.)

    Bentuk Dasar Aturan Asosiatif

    Penting tidaknya suatu aturanassosiatif dapat diketahui dengan dua

    parameter, support (nilai penunjang)

    yaitu persentase kombinasi item tsb.

    dalam database dan confidence(nilaikepastian) yaitu kuatnya hubungan antar

    item dalam aturan assosiatif. Aturan

    assosiatif biasanya dinyatakan dalam

    bentuk :{roti,mentega} -> {susu} (support =

    40%, confidence = 50%)Yang artinya : 50% dari transaksi di

    database yang memuat item roti dan

    mentega juga memuat item susu.

    Sedangkan 40% dari seluruh transaksiyang ada di database memuat ketiga item

    itu.

    Dapat juga diartikan : "Seorangkonsumen yang membeli roti dan

    mentega punya kemungkinan 50% untukjuga membeli susu. Aturan ini cukupsignifikan karena mewakili 40% dari

    catatan transaksi selama ini."

    Analisis asosiasi didefinisikan suatuproses untuk menemukan semua aturan

    assosiatif yang memenuhi syarat

    minimum untuk support (minimum

    support) dan syarat minimum untuk

    confidence (minimum confidence).

    Metodologi dasar analisis asosiasi terbagimenjadi dua tahap :

    1. Analisa pola frekuensi tinggiTahap ini mencari kombinasi item

    yang memenuhi syarat minimum dari

    nilai support dalam database. Sebagaicontoh, ada database dari transaksi

    belanja pasar swalayan seperti berikut :

    ID

    Transaksi

    item terjual

    1 Pena, roti, mentega

    2 Roti, mentega, telur,

    susu3 Buncis, telur, susu

    4 Roti, mentega

    5 Roti, mentega, kecap,

    telur, susu

    Syarat minimum dari nilai support untuk

    pola frekuensi tinggi dalam contoh iniadalah 30%.

    Diketahui bahwa jumlah transaksi yang

    memuat {roti,mentega} ada 4 (support

    80%), sedangkan jumlah transaksi yangmemuat {roti,mentega,susu} ada 2

    (support 40%), transaksi yang memuat

    {buncis} hanya 1 (support 20%) dsb.Sehingga diperoleh pola frekuensi tinggi

    yang memenuhi syarat minimum nilai

    support adalah :

    Kombinasi item Support

    {roti} 80%

    {mentega} 80%

    {telur} 60%{susu} 60%

    {roti,mentega} 80%

    {telur,susu} 60%

    {roti,susu} 40%

    {mentega,susu} 40%

    {roti,telur} 40%

    {mentega,telur} 40%

    {roti,mentega,susu} 40%

    {roti,mentega,telur,susu} 40%

    2. Pembentukan aturan assosiatifSetelah semua pola frekuensi

    tinggi ditemukan, barulah dicari aturanassosiatif yang memenuhi syarat

    minimum untuk confidence dengan

    menghitung confidence aturan assosiatifA->B. Dari support pola frekuensi tinggi

    A dan B dengan menggunakan rumus

    berikut : confidence(A->B) = support(B)

    / support (A U B)Disini A U B adalah union dari pola A

    dan B

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    6/14

    2010 - Johan Page 6

    Bila syarat minimum untuk confidencedari contoh diatas adalah 50% maka salah

    satu aturan assosiatif yang dapat

    ditemukan adalah :

    {telur,susu} -> {roti,mentega} dengannilai confidence 66.6% karena

    support({roti,mentega})/support({roti,mentega,telur,susu}) = 40%/60% = 66.6%

    Aturan assosiatif lain yang dapat

    ditemukan diantaranya adalah :aturan assosiatif support confidence

    {telur,susu} -> {roti,mentega} 40% 66.6%

    {roti,mentega} -> {susu} 40% 50%

    {mentega,susu} -> {roti} 40% 100%

    Perlu dicatat bahwa tahap pertama untuk

    mencari pola frekuensi tinggi biasanyapaling banyak menghabiskan waktu

    III.METODE PENELITIAN3.1. Kerangka Kerja Penelitian

    Kerangka kerja adalah merupakan

    prosedur kegiatan, mulai dari awalsampai akhir dari tulisan tesis ini.

    Kerangka kerja tersebut digambarkan

    seperti berikut ini gambar 3 :

    Gambar 3.1 Kerangka Kerja Penelitian

    3.2. Data Generation

    Metode pengumpulan dataadalah cara-cara dan prosedur yang

    dilakukan dalam penelitian untuk

    memperoleh data yang dibutuhkan.

    Beberapa metode pengumpulan data yang

    dilakukan dalam penelitian ini adalah

    sebagai berikut :

    a.Melakukan observasi dan kajiantentang data transaksi penjualan

    toko mini market Lima Bintang.Kajian lapangan ini untuk

    mengetahui secara langsung

    permasalahan yang ada, sehinggadiharapkan penerapan disain dan

    konsep analisa data market

    menggunakan algoritma apriori

    dapat dilakukan dengan tepat.b. Library Research (tinjauan

    kepustakaan)

    Library research (tinjauan

    kepustakaan) dilakukan untukmengumpulkan informasi tentang

    literature dan pedoman dalampenentuan hasil analisa data market

    menggunakan algoritma apriori.

    c. Laboratory Research(Penelitian Laboratorium)Penelitian laboratorium adalah

    untuk pengujian data penentuan

    hasil analisa data market yang telahdidapatkan dengan menggunakan

    algoritma apriori

    3.3. Penentuan Tujuan

    Yang menjadi tujuan pada tesis iniuntuk menentukan hasil analisa data

    market menggunakan algoritma apriori.

    Setelah melakukan kajian, maka sasaranterakhir dari tesis ini adalah sebagai

    berikut :

    a. Mendisain suatu konsep penentuanhasil analisa data market denganmenggunakan algoritma apriori,sehingga dapat menemukan pola dari

    data yang tersembunyi.

    b. Memberikan kemudahan atau solusibagi pengambil keputusan dalam

    menemukan produk-produk yang

    sering dibeli bersamaan dari datatransaksi sehingga dapat

    menempatkan produk yang sering

    dibeli bersamaan kedalam suatu area

    yang berdekatan, merancang tampilan

    Data Generation

    Literatur

    Penentuan Tujuan

    Analisa Data

    Analisa data dengan algoritma apriori

    Implementasi

    Pembahasan Hasil

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    7/14

    2010 - Johan Page 7

    produk dikatalog, merancang kupondiskon dan lain-lain.

    c. Hasil dari penelitian yang dilakukanini nantinya dapat diuji dengan

    menggunakan software associationrule.

    3.4. LiteraturLiteratur yang dimaksud disini

    adalah literatur yang digunakan untuk

    mendapatkan suatu cara atau proseduryang akan digunakan untuk menganalisa

    data market menggunakan algoritma

    apriori agar nantinya dapat diterima oleh

    semua pihak yang membutuhkan.

    Sumber literatur didapatkan daribuku-buku yang membahas tentang

    teknik data mining, analisa data market,algoritma apriori dan jurnal-jurnal dari

    web site (internet). Judul buku dan

    alamat situs di internet yang dijadikan

    sebagai sumber literatur, nantinyadilampirkan pada daftar pustaka di akhir

    tesis ini.

    Dari hasil studi literatur diketahui ada

    penerapan apriori di bidang mini marketuntuk mengelompokkan barang

    berdasarkan kecenderungan kemunculan

    bersama dalam satu transaksi, juga datamining pada tabel absensi elektronik

    untuk mendeteksi kecurangan absensi,

    dan analisa keranjang pasar denganalgoritma hash-based pada data transaksi

    penjualan apotek.

    3.5. Analisa DataData-data yang sudah diperoleh padatahap pengumpulan data, akan dianalisis

    pada bagian ini. Berdasarkan hasil kajian

    literatur dan observasi lapangan, data

    disusun dan dikelompokkan dalambentuk tabel multikriteria sederhana. Hal

    ini dimaksudkan untuk mempermudah

    dalam analisa dan proses penentuan hasilanalisa data market menggunakan

    algoritma apriori.

    3.6. Pengolahan Data DenganAlgoritma Apriori

    Pada tahap ini akan dilakukan analisa

    yaitu; analisa terhadap algoritma apriori

    pada data market dari data transaksipenjualan untuk menentukan alternatif

    yang terbaik dari sekumpulan alternatifyang ada melalui suatu proses seperti

    yang terjadi pada proses yang terstruktur.

    3.7. Implementasi

    Pada penelitian ini penulis

    mengimplementasikan pengujian modeldari hasil analisa data menggunakan

    algoritma apriori dengan menggunakan

    alat bantu komputer dengan operating

    system windows dan menggunakansoftware shoping cart analyzer. Model

    yang dirancang ini akan dibuat sebagai

    sebuah aplikasi yang siap pakai.

    3.8. Pembahasan Hasil

    Evaluasi sistem yang telah di uji perlu

    dilakukan, dengan tujuan untuk

    mengetahui apakah sistem yang diujitersebut sudah sesuai dengan yang

    diharapkan. Evaluasi dilakukan dengan

    cara membandingkan hasil yangdidapatkan pada tahap implementasi

    sistem dengan hasil yang dibuat secara

    manual.

    IV.ANALISA DAN PERANCANGANTahapan yang cukup penting pada

    data mining adalah tahapan data

    preparation atau tahapan persiapan data.

    Dimana nantinya data yang didapatkanakan dipergunakan pada tahapan

    selanjutnya yaitu modelling. Apabiladata yang didapatkan tidak benar makanantinya model yang dihasilkan tidak

    akan maksimal hasilnya.

    4.1 Data Preparation

    Data yang didapatkan merupakandata primer yaitu data yang didapatkan

    langsung dari data transaksi penjualan

    toko mini market lima bintang pekanbaru,berupa data transaksi penjualan dalam

    beberapa bulan.

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    8/14

    2010 - Johan Page 8

    Terdapat delapan(8) atribut yangharus diisi yang ada pada transaksi

    penjualan toko mini market lima bintang

    pekanbaru yaitu :

    1.

    TanggalKegiatan kapan terjadinya transaksi

    2. No_NotaNomor kegiatan transaksi yang harus

    diisi disaat transaksi terjadi

    3. KonsumenNama pelanggan yang membeli itembarang

    4. Nama_BarangPendefinisian item-item barang untukmembedakan item barang yang satu

    dengan item barang yang lain.5. QTY6. Jumlah item barang yang dimasukkan

    pelanggan ke dalam keranjang

    belanjaanya.

    7. SatuanBentuk item barang

    8. Harga_Satuan(@)Harga per item barang yang dibeli

    pelanggan9. JumlahHarga yang harus dibayar oleh

    pelanggan

    4.1.1 Select Data

    Dari 8 atribut yang ada pada data

    transaksi penjualan yang dapat dijadikan

    parameter pada penelitian ini hanyaNo_Nota dan Nama_Barang. Dimana kita

    hanya melihat item barang mana yang

    sering dibeli oleh pelanggan.

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    9/14

    2010 - Johan Page 9

    Tabel 4.1 Data Transaksi Mini Market

    Tanggal No_Nota Konsumen Nama Barang Qty Satuan Harga_Satuan(@) Jumlah

    2-Jan-10 1704 Caf Bintang Indomie Goreng

    Special

    1 Dus Rp 49,000 Rp 49,000

    2-Jan-10 1704 Caf Bintang Indomie Kari Ayam 5 Dus Rp 50,000 Rp 250,000

    2-Jan-10

    1704 Caf Bintang

    Indomie Ayam

    Bawang

    2 Dus Rp 47,000 Rp 94,000

    2-Jan-10 1704 Caf Bintang Indomie Soto Medan 2 Dus Rp 46,000 Rp 92,000

    2-Jan-10 1704 Caf Bintang Indomie Kaldu Ayam 1 Dus Rp 46,000 Rp 46,000

    2-Jan-10 1704 Caf Bintang Indomie Goreng Sate 1 Dus Rp 48,000 Rp 48,000

    2-Jan-10 1704 Caf Bintang Indomie Goreng

    Pedas

    2 Dus Rp 48,000 Rp 96,000

    2-Jan-10 1705Warung Restu Tepung Terigu

    Tepung Terigu 2 Kg Rp 6,000 Rp 12,000

    2-Jan-10 1705Warung Restu Tepung Terigu

    Tepung Kanji 3 Kg Rp 5,500 Rp 16,500

    2-Jan-10 1705Warung Restu Tepung Terigu

    Super Bubur Rasa Sapi 1 Dus Rp 40,000 Rp 40,000

    2-Jan-10 1705Warung Restu Tepung Terigu

    ABC Mie Semur Pedas 2 Dus Rp 49,000 Rp 98,000

    2-Jan-10 1705 Warung Restu Tepung TeriguRoyco Ayam Sachet2 Renceng Rp 6,000 Rp 12,000

    2-Jan-10 1705 Warung Restu Tepung TeriguRoyco Sapi Sachet 2 Renceng Rp 6,000 Rp 12,000

    2-Jan-10 1705 Warung Restu Tepung TeriguTelor Ayam2 Papan Rp 22,000 Rp 44,000

    2-Jan-10 1706 Salon Van Beauty Air Galon SPA 1 Galon Rp 9,500 Rp 9,500

    2-Jan-10 1706 Salon Van Beauty Aqua Cup 5 Dus Rp 15,000 Rp 75,000

    2-Jan-10 1706 Salon Van Beauty Beras Belida 20Kg 5 Bgks Rp 80,000 Rp 400,000

    2-Jan-10 1706 Salon Van Beauty Indomie Goreng

    Pedas

    5 Bgks Rp 48,000 Rp 240,000

    2-Jan-10 1706 Salon Van Beauty Lifebuoy Cair 450ml 5 Bgks Rp 2,000 Rp 10,000

    3-Jan-10 1707 Warung Wiwi Milo Sachet 10 Bgks Rp 2,500 Rp 25,000

    3-Jan-10 1707 Warung Wiwi Kecap Manis Bango

    Refill 85ml

    5 Bgks Rp 8,000 Rp 40,000

    3-Jan-10 1707 Warung Wiwi Roti Bobo 10 Bgks Rp 1,000 Rp 10,000

    3-Jan-10 1707 Warung Wiwi Sampoerna Mild 16 5 Bgks Rp 10,000 Rp 50,000

    3-Jan-10 1707 Warung Wiwi Lucky Strike Black 3 Bgks Rp 11,000 Rp 33,000

    3-Jan-10 1708 Ridho Jaya Indomilk Susu Kental

    Manis Coklat Kaleng

    2 klg Rp 5,600 Rp 11,200

    3-Jan-10 1708 Ridho Jaya Teh Celup Sari Wangi

    @50sch

    3 Bgks Rp 6,000 Rp 18,000

    3-Jan-10 1708 Ridho Jaya Ajinomoto @500 2 Bgks Rp 7,500 Rp 15,000

    3-Jan-10 1708 Ridho Jaya Rinso 900gr 2 Pack Rp 7,500 Rp 15,000

    3-Jan-10 1708 Ridho Jaya Telor Ayam 1 Papan Rp 22,000 Rp 22,000

    3-Jan-10 1709 MM Masakan

    Medan

    Roti Bobo 12 Bgks Rp 1,000 Rp 12,000

    3-Jan-10 1709 MM Masakan

    Medan

    Daia Putih 1Kg 1 Kg Rp 18,000 Rp 18,000

    3-Jan-10 1709 MM Masakan

    Medan

    Indomie Kari Ayam 2 Dus Rp 50,000 Rp 100,000

    3-Jan-10 1709 MM Masakan

    Medan

    Indomie Goreng

    Special

    1 Dus Rp 49,000 Rp 49,000

    3-Jan-10 1709 MM Masakan

    Medan

    Indomie Goreng

    Pedas

    1 Dus Rp 48,000 Rp 48,000

    3-Jan-10 1710 Kedai Kopi Lin's ABC Mie Semur Pedas 2 Dus Rp 49,000 Rp 98,000

    3-Jan-10 1710 Kedai Kopi Lin's Telor Ayam 3 Papan Rp 22,000 Rp 66,000

    3-Jan-10 1710 Kedai Kopi Lin's Milo Sachet 6 Bgks Rp 2,500 Rp 15,000

    3-Jan-10 1710 Kedai Kopi Lin's Indomie Soto Medan 3 Dus Rp 46,000 Rp 138,000

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    10/14

    2010 - Johan Page 10

    Support

    4.1.2 Pembersihan Data

    Pembersihan data biasanya

    dipergunakan untuk mengisi data-data

    yang masih kosong atau ada kesalahan

    pengisian. Pada data mining ada teknik-teknik yang dapat dipergunakan untuk

    melakukan pembersihan data. Akan tetapiuntuk penelitian ini, penulis tidak

    mempergunakan teknik-teknik pada data

    mining tersebut. Karena parameter-

    parameter yang ada, dibutuhkan datayang sebenarnya, bukan data yang dibuat

    berdasarkan rata-rata yang ada.

    4.1.3 Integrasi Data

    Data-data yang dikumpulkan

    dalam proses transaksi seringkaliditempatkan pada lokasi yang berbeda-

    beda. Maka dari itu dibutuhkankemampuan dari sistem untuk dapat

    mengumpulkan data dengan cepat.

    Tabel 4.2 Contoh Database

    Transaksional

    No_Fak

    tur

    Item Bought

    1704 Indomie Goreng Special,Indomie Kari Ayam, Indomie

    Ayam Bawang, Indomie Soto

    Medan, Indomie Kaldu Ayam,Indomie Goreng Sate, Indomie

    Goreng Pedas

    1705 Tepung Terigu, Tepung Kanji,

    Super Bubur Rasa Sapi, ABCMie Semur Pedas, Royco Ayam

    Sachet, Royco Sapi Sachet,

    Telor Ayam

    1706 Air Galon SPA, Aqua Cup,Beras Belida 20Kg, IndomieGoreng Pedas, Lifebuoy Cair

    450ml

    1707 Milo Sachet, Kecap Manis

    Bango Refill 85ml, Roti Bobo,

    Sampoerna Mild 16, LuckyStrike Black

    1708 Indomilk Susu Kental Manis

    Coklat Kaleng, Teh Celup Sari

    Wangi @50sch, Ajinomoto

    @500, Rinso 900gr, Telor Ayam

    1709 Roti Bobo, Daia Putih 1Kg,

    Indomie Kari Ayam, Indomie

    Goreng Special, Indomie Goreng

    Pedas1710 ABC Mie Semur Pedas, Telor

    Ayam, Milo Sachet, Indomie

    Soto Medan

    Dengan menggunakan tabel transaksi

    diatas, akan ditunjukkan bagaimana carakerja dari algoritma apriori. Minimum

    support(minsupp) yang ditetapkan untuk

    menjalankan algoritma ini adalah sebesar20% , dikarenakan akan terjadi transaksi

    dengan banyak item sehinggasupportnya

    di kecilkan.

    Langkah 1 : menelusuri seluruh recorddi basis data transaksi dan menghitung

    support count dari tiap item. Ini adalah

    kandidat 1-itemset, C1

    Tabel 4.3 Candidat 1-itemsetC1

    Candidate 1-i temsetSupport Frequen

    t

    Indomie Goreng

    Special

    2/7 (28,6%) Ya

    Indomie Kari

    Ayam

    2/7 (28,6%) Ya

    Indomie Soto

    Medan

    2/7 (28,6%) Ya

    Roti Bobo 2/7 (28,6%) Ya

    ABC Mie Semur

    Pedas

    2/7 (28,6%) Ya

    Milo Sachet 2/7 (28,6%) Ya

    Indomie GorengPedas

    3/7 (42,8%) Ya

    Telor Ayam 3/7 (42,8%) Ya

    Indomie AyamBawang

    1/7 (14,3%) Tidak

    Indomie Kaldu

    Ayam

    1/7 (14,3%) Tidak

    Indomie Goreng

    Sate

    1/7 (14,3%) Tidak

    Jumlah Transaksi Mengandung A

    Total Transaksi

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    11/14

    2010 - Johan Page 11

    Support

    Support

    Support =

    Support =

    Support =

    Support =

    Support =

    Support =

    Tepung Terigu 1/7 (14,3%) Tidak

    Tepung Kanji 1/7 (14,3%) Tidak

    Super Bubur Rasa

    Sapi

    1/7 (14,3%) Tidak

    Royco AyamSachet

    1/7 (14,3%) Tidak

    Royco Sapi Sachet 1/7 (14,3%) Tidak

    Air Galon SPA 1/7 (14,3%) Tidak

    Aqua Cup 1/7 (14,3%) Tidak

    Beras Belida 20Kg 1/7 (14,3%) Tidak

    Lifebuoy Cair

    450ml

    1/7 (14,3%) Tidak

    Kecap Manis

    Bango Refill 85ml

    1/7 (14,3%) Tidak

    Sampoerna Mild

    16

    1/7 (14,3%) Tidak

    Lucky Strike Black 1/7 (14,3%) Tidak

    Indomilk Susu

    Kental ManisCoklat Kaleng

    1/7 (14,3%) Tidak

    Teh Celup Sari

    Wangi @50sch

    1/7 (14,3%) Tidak

    Ajinomoto @500 1/7 (14,3%) Tidak

    Rinso 900gr 1/7 (14,3%) Tidak

    Daia Putih 1Kg 1/7 (14,3%) Tidak

    Adapun keterangan dari tabel 4.4 adalah

    sebagai berikut.

    Nilai Support Indomie Goreng Special

    dapat dihitung dengan menggunakan

    rumus, yaitu :

    Support = 2 / 7 = 28,6 %

    Nilai Support Indomie Kari Ayam

    dapat dihitung dengan menggunakan

    rumus, yaitu :

    Support = 2 / 7 = 28,6 %

    Nilai Support Indomie Soto Medan

    dapat dihitung dengan menggunakan

    rumus, yaitu :

    Support = 2 / 7 = 28,6 %

    Nilai Support Telor Ayam dapatdihitung dengan menggunakan rumus,

    yaitu :

    Support = 3 / 7 = 42,8 %

    Langkah 2: large1_itemset L1 dibangundengan menyaring C1 (tabel 4.4) dengan

    supportcountyang lebih besar atau samadengan minimum support untuk

    dimasukkan ke dalam L1

    Tabel 4.4 Frequent 1-i temset

    L1

    Frequent 1-I temset

    Indomie Goreng Special 28,6 %

    Indomie Kari Ayam 28,6 %

    Indomie Soto Medan 28,6 %

    Roti Bobo 28,6 %

    ABC Mie Semur Pedas 28,6 %

    Milo Sachet 28,6 %

    Indomie Goreng Pedas 42,8 %

    Telor Ayam 42,8 %

    Jumlah Indomie Goreng Special

    Total Transaksi

    2

    7

    Jumlah Indomie Kari Ayam

    Total Transaksi

    2

    7

    Jumlah Indomie Soto Medan

    Total Transaksi

    2

    7

    Jumlah Telor Ayam

    Total Transaksi

    3

    7

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    12/14

    2010 - Johan Page 12

    Support A,B,C = P(A BC)

    Support =

    Langkah 3 : untuk membangun L2,algoritma apriori menggunakan proses

    join untuk menghasilkan C2.

    Untuk candidat 2-itemset, dari 8 item

    dapat menghasilkan kombinasi 2-itemset

    yang memungkinkan sebanyak :

    C82= = 28 kombinasi

    Langkah 4 : dari C2 (tabel 4.6), 2-

    itemset yang memiliki support count

    yang lebih besar atau sama denganminimum support akan disimpan ke

    dalam L2.

    Tabel 4.5 Frequent 2-itemset

    L2

    Frequent 2-itemset

    Indomie Goreng Special,Indomie Kari Ayam

    28,6 %

    Indomie Goreng Special,

    Indomie Goreng Pedas

    28,6 %

    Indomie Kari Ayam, Indomie

    Goreng Pedas

    28,6 %

    ABC Mie Semur Pedas, Telor

    Ayam

    28,6 %

    Langkah 5 : proses ini diulang sampai

    tidak ada lagi kemungkinan k-itemset

    Untuk candidat 3-itemset, dari 4 item

    dapat menghasilkan kombinasi 3-itemset

    yang memungkinkan sebanyak :

    C43= = 4kombinasi

    Tabel 4.6 Candidat 3-itemset

    C3

    Candidate 3- itemset

    Support Frequent

    Indomie Goreng Special,

    Indomie Kari Ayam,

    2/7

    (28,6%)

    Ya

    Indomie Goreng Pedas

    Indomie Goreng Special,

    Indomie Kari Ayam, ABC

    Ayam Semur

    0/7 (0%) Tidak

    Indomie Goreng Special,

    Indomie Kari Ayam, Telor

    Ayam

    0/7 (0%) Tidak

    Indomie Kari Ayam,

    Indomie Goreng Pedas,

    Telor Ayam

    0/7 (0%) Tidak

    Adapun keterangan dari tabel 4.8 adalah

    sebagai berikut.

    Nilai Support Indomie Goreng Special,

    Indomie Kari Ayam, Indomie Goreng

    Pedas dapat dihitung dengan

    menggunakan rumus, yaitu :

    Support = 2 / 7 = 28,6 %

    Tabel 4.7 frequent 3-itemset

    Frequent 3-itemset

    Indomie Goreng Special, Indomie

    Kari Ayam, Indomie Goreng Pedas

    28,6 %

    Karena tidak memungkinkan lagi

    dibentuk frequent4-itemset dari frequent

    3-itemset, maka proses pencariandihentikan dan maximalfrequentitemset-

    nya adalah {Indomie Goreng Special,

    Indomie Kari Ayam, Indomie GorengPedas}. Untuk pembangkitan aturan

    asosiasi dari Large itemset, harus

    memenuhi minimum support danminimum confidence yang telah

    ditentukan. Confidence dari setiap aturan

    Jumlah transaksi Indomie Goreng Special AND

    Indomie Kari Ayam AND Indomie Goreng Pedas

    Total Transaksi

    27

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    13/14

    2010 - Johan Page 13

    yang dibangkitkan dapat dihitung dengan

    menggunakan rumus peluang :

    Confidence (A B) = P (B/A) =support

    count(A B)/supportcount (A), dengan

    support count (A B) adalah jumlahtransaksi yang berisi itemset A dan B,

    dan support count (A) adalah jumlah

    transaksi yang berisi itemset A.Berdasarkan rumus diatas, aturan asosiasi

    dapat dibangkitkan dengan langkah :

    support count(l)/support count(s) =

    minimum confidence.

    4.2Pembangkitan Association RuleSetelah proses penghitungan

    confidence selesai dilakukan maka kitadapat menghasilkan association rule

    berdasarkan data yang ada. Sebagaicontoh akan dihasilkan association rule

    dari 2 itemset seperti yang diperlihatkan

    pada tabel 4.10 maka association rule

    yang dihasilkan adalah sebagai berikut.

    1. Jika konsumen membeli IndomieGoreng Special juga akan membeli

    Indomie Kari Ayam , maka nilai

    support = 28,6% dan nilai confidence= 100%

    - item A dan B dibeli bersamaansebesar 28,6% dari keseluruhandata transaksi yang dianalisis dan

    100% dari semua konsumen yang

    membeli item A juga membeliitemB.

    2. Jika konsumen membeli Roti Bobojuga akan membeli Indomie Goreng

    Special, maka nilai support = 14,3%

    dan nilai confidence = 50%3. Jika konsumen membeli Indomie

    Soto Medan juga akan membeliIndomie Goreng Special, maka nilai

    support = 14,3% dan nilai confidence

    = 50%4. Jika konsumen membeli Indomie

    Goreng Special juga akan membeli

    Indomie Goreng Pedas, maka nilai

    support = 14,3% dan nilai confidence= 100%

    5. Jika konsumen membeli IndomieGoreng Pedas juga akan membeli

    Indomie Goreng Special, maka nilai

    support = 14,3% dan nilai confidence

    = 66,7%6. Jika konsumen membeli IndomieKari Ayam juga akan membeliIndomie Goreng Pedas, maka nilai

    support = 14,3% dan nilai confidence

    = 66,7%

    7. Jika konsumen membeli IndomieKari Ayam juga akan membeli

    Indomie Soto Medan, maka nilai

    support = 14,3% dan nilai confidence= 50%

    8.

    Jika konsumen membeli Roti Bobojuga akan membeli Indomie KariAyam, maka nilai support = 14,3%

    dan nilai confidence = 50%

    9. Jika konsumen membeli Telor Ayamjuga akan membeli Indomie Soto

    Medan, maka nilai support = 14,3%

    dan nilai confidence = 33,3%

    10.Jika konsumen membeli Milo Sachetjuga akan membeli Telor Ayam,

    maka nilai support = 14,3% dan nilai

    confidence = 50%Sebagai contoh akan dihasilkan

    association rule dari 3 itemset seperti

    yang diperlihatkan pada tabel 4.8 makaassociation rule yang dihasilkan adalah

    sebagai berikut.

    - Jika Konsumen membeli IndomieGoreng Special juga akanmembeli Indomie Kari Ayam dan

    juga akan membeli Indomie

    Goreng Pedas, maka nilaisupport= 28,6% dan nilai confidence =

    100%

    ArtinyaitemA,B dan C dibeli bersamaansebesar 28,6% dari keseluruhan data

    transaksi yang dianalisis dan 100% dari

    semua konsumen yang membeli item Adan itemB juga membeli itemC.

  • 5/27/2018 Absen Jurnal Johan 2010 Ok

    14/14

    2010 - Johan Page 14

    V. KESIMPULAN DAN SARAN

    5.1 Kesimpulan

    Berdasarkan penelitian yang penulis

    lakukan pada Toko Mini Market LimaBintang Pekanbaru, maka penulis dapat

    menarik kesimpulan bahwa data transaksi

    penjualan toko mini market Lima Bintang

    Pekanbaru dapat ditambang dengan teknik

    association rule dan menghasilkan rule-rule

    yang bermanfaat bagi perusahaan.

    Atas analisis dan pembahasan yangpenulis lakukan pada system analisa data

    market maka penulis dapat mengambil

    kesimpulan sebagai berikut:

    1. Berdasarkan uji coba Nilai Supportdengan nilai support 0.25%, 0.5%.0.75%

    dan 1 % dapat diambil kesimpulan bahwa

    semakin kecil nilai support maka jumlah

    itemset yang dihasilkan semakin banyak,

    dan jumlah kaidah asosiasi yang dibentuk

    semakin banyak pula.

    2. Data transaksi sebaiknya diambil pada

    periode-periode tertentu (misalnya awal

    tahun, pertengahan tahun, akhir tahun),

    sebab aturan-aturan yang dibangkitkan

    pola pembelian pelanggan dapat berbedadari satu periode ke periode lainnya.

    Aturan-aturan asosiasi yang dihasilkan

    tidak selalu mengandung informasi yang

    penting (karena sudah umum diketahui),

    dan aturan yang berharga adalah yang

    berupa informasi baru yang dapat

    dimanfaatkan untuk meningkatkan

    penjualan.

    5.2 Saran

    Dari hasil pembahasan ini, makapenulis dapat menyampaikan saran-saran

    sebagai berikut:

    1. Agar perusahaan dapat memanfaatkan

    gudang data mereka untuk informasi

    dalam dunia bisnis,

    2. Informasi yang ditemukan sebaiknya dapat

    diaplikasikan untuk aplikasi manajemen

    dan pengambilan keputusan.

    DAFTAR PUSTAKA

    [1] Gregorius Satia Budhi; Felicia Soedjianto

    (2007) APLIKASI DATA MINING

    MARKET BASKET ANALYSIS PADA

    TABEL DATA ABSENSI

    ELEKTRONIK UNTUK MENDETEKSI

    KECURANGAN ABSENSI (CHECK-LOCK) KARYAWAN DI

    PERUSAHAAN. Jurnal Teknik

    Informatika, Fakultas Teknologi Industri,

    Universitas Kristen Petra, Surabaya.

    [2] Gregorius S. Budhi, Resmana Lim (2005)

    PENGGUNAAN METODE FUZZY c-

    COVERING UNTUK ANALISA

    MARKET BASKET PADASUPERMARKET. Jurnal Teknik

    Informatika, Universitas Kristen Petra,Surabaya.

    [3] Hwung Su J., Yang Lin W. 2004, CBW:

    An Efficient Algorithm for Frequent

    Itemset Mining. Proceedings of the 37th

    Hawaii International Conference on

    System Sciences.[4] Iko Pramudiono (2003), Pengantar Data

    Mining Menambang Permata

    Pengetahuan di Gunung Data. Ilmu

    komputer.com1-4

    [5] Marsela Yulitadan Veronica S. Moertini

    (2004) ANALISIS KERANJANGPASAR DENGAN ALGORITMA

    HASH-BASED PADA DATATRANSAKSI PENJUALAN APOTEK.

    Jurnal Ilmu Komputer, Universitas

    Katolik Parahyangan, Bandung.

    [6] Mewati Ayub (2007) Proses Data

    Mining dalam Sistem Pembelajaran

    Berbantuan Komputer. Jurnal Sistem

    Informasi Vol. 2 No.1.[7] Philips Kokoh Prasetyo (2006) Data

    Mining & Knowledge Discovery.

    https://philips.wordpress.com/2006/06/22/association-rule-mining.

    [8] Ravindra Patel, D. K. Swami and K. R.

    Pardasani (2006) Lattice Based

    Algorithm for Incremental Mining of

    Association Rules. InternationalJournal of Theoretical and Applied

    Computer Sciences.

    [9] Veronika S. Moertini (2002) DATAMINING SEBAGAI SOLUSI

    BISNIS. vol. 7 no.1.