40
7 BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Data dan Informasi M enurut Inmon (2005, p493) data adalah rekaman fakta, konsep, atau instruksi pada media penyimpanan untuk komunikasi, pengambilan, dan pengolahan dengan cara otomatis dan presentasi sebagai informasi yang dimengerti oleh manusia. Menurut Laudon (2006, p13), data adalah kumpulan fakta yang masih mentah yang merepresentasikan peristiwa-peristiwa yang terjadi dalam organisasi atau lingkungan fisikal, sebelum diorganisir dan dimodifikasi menjadi bentuk yang dapat dimengerti dan digunakan oleh manusia. M enurut Inmon (2005, p498), Informasi adalah data yang diasimilasi dan dievaluasi oleh manusia untuk memecahkan masalah atau untuk membuat keputusan. Sehingga dapat disimpulkan, data adalah fakta-fakta yang berisi kejadian, tempat dan subyek yang dapat diolah kembali untuk dimengerti oleh manusia. Sedangkan informasi adalah data yang telah diolah sedemikian rupa sehingga menjadi dapat berguna bagi manusia untuk memecahkan suatu masalah. 2.1.2 Database M enurut Connoly (2005, p14), database adalah suatu kumpulan data yang terhubung secara logikal, dan deskripsi dari data-data tersebut, yang dirancan g untuk memenuhi kebutuhan informasi dari sebuah organisasi. Database bersifat tunggal, yang merupakan tempat penyimpanan data dalam jumlah yang besar

BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

Embed Size (px)

Citation preview

Page 1: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

7  

BAB 2

LANDASAN TEORI

2.1 Teori Umum

2.1.1 Data dan Informasi

Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep, atau

instruksi pada media penyimpanan untuk komunikasi, pengambilan, dan

pengolahan dengan cara otomatis dan presentasi sebagai informasi yang

dimengerti oleh manusia.

Menurut Laudon (2006, p13), data adalah kumpulan fakta yang masih

mentah yang merepresentasikan peristiwa-peristiwa yang terjadi dalam organisas i

atau lingkungan fisikal, sebelum diorganisir dan dimodifikasi menjadi bentuk yang

dapat dimengerti dan digunakan oleh manusia.

Menurut Inmon (2005, p498), Informasi adalah data yang diasimilasi dan

dievaluasi oleh manusia untuk memecahkan masalah atau untuk membuat

keputusan. Sehingga dapat disimpulkan, data adalah fakta-fakta yang berisi

kejadian, tempat dan subyek yang dapat diolah kembali untuk dimengerti oleh

manusia. Sedangkan informasi adalah data yang telah diolah sedemikian rupa

sehingga menjadi dapat berguna bagi manusia untuk memecahkan suatu masalah.

2.1.2 Database

Menurut Connoly (2005, p14), database adalah suatu kumpulan data yang

terhubung secara logikal, dan deskripsi dari data-data tersebut, yang dirancan g

untuk memenuhi kebutuhan informasi dari sebuah organisasi. Database bersifat

tunggal, yang merupakan tempat penyimpanan data dalam jumlah yang besar

Page 2: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

8  

dimana dapat digunakan secara bersama-sama oleh banyak departemen dan

pengguna.

Menurut Inmon (2005, p493), database adalah sekumpulan penyimpanan

data yang berhubungan (sering dengan pengontrolan, redudansi yang terbatas)

yang berdasarkan pada suatu skema.

Berdasarkan definisi diatas, dapat disimpulkan bahwa database merupakan

suatu kumpulan data yang saling berhubungan dan terintegrasi, yang dirancan g

untuk kebutuhan informasi perusahaan.

2.1.3 Database Management System

Menurut Connoly dan Begg (2005, p16), DBMS adalah sebuah sistem

perangkat lunak yang memperbolehkan pengguna untuk mendefinisikan,

membuat, dan memelihara serta mengontrol akses ke database.

Menurut Ramakrishnan dan Gehrke (2003, p4), DBMS adalah perangkat

lunak yang dirancang untuk membantu dalam mempertahankan dan memanfaatkan

koleksi data yang besar. Kebutuhan akan penggunaan untuk sistem tersebut sedang

berkembang pesat.

2.1.3.1 Kelebihan DBMS (Database Management System)

Menurut Connolly dan Begg (2005, p26), DBMS memberikan

banyak kegunaan yaitu :

a. Kontrol redudansi data

b. Kemandirian data atau kekonsistensian data

c. Lebih banyak informasi dari sejumlah data yang sama

d. Penggunaan data yang bersamaan (sharing)

Page 3: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

9  

e. Meningkatkan integritas data

f. Meningkatkan keamanan

g. Menghemat biaya dalam penanganan data

h. Menyeimbangkan permasalahan kebutuhan pengguna

i. Meningkatkan pengaksesan dan respon data

j. Meningkatkan produktivitas

k. Memudahkan pemeliharaan dengan data yang bebas(independence)

l. Memberikan layanan untuk back-up dan recovery data

2.1.3.2 Kekurangan DBMS (Database Management System)

Sedangkan kekurangan penggunaan DBMS menurut Connolly dan

Begg (2005, p29), yaitu :

a. Kompleks

b. Membutuhkan disk space yang besar dan juga memori yang cukup

besar untuk menjalankan DBMS

c. Biaya yang mahal untuk pembelian DBMS

d. Membutuhkan tambahan biaya untuk perangkat keras

e. Membutuhkan biaya untuk peralihan

f. Peforma kecepatan yang menurun dibanding file-based

g. Besarnya dampak jika terjadi kegagalan / failure

2.1.4 OLTP

Menurut Inmon (2005, p500) OLTP adalah lingkungan pemrosesan

transaksi tingkat tinggi. OLTP (On-Line Transaction Processing) menggambarkan

Page 4: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

10  

kebutuhan sistem dalam ruang lingkup operasional dan merupakan proses yang

mendukung operasi bisnis sehari-hari.

OLTP dibentuk untuk memungkinkan adanya pengaksesan secara

bersamaan oleh beberapa pengguna terhadap suatu sumber data dan mengatur

proses yang diperlukan. Sesuai dengan namanya, OLTP menyediakan transaksi

untuk mengakses langsung database. Transaksi yang dilakukan termasuk proses

insert, update, dan delete. Dababase OLTP biasanya bersifat relasional dan dalam

bentuk normalisasi tahap ketiga, serta yang terpenting database OLTP dirancan g

untuk mampu melakukan banyak transaksi dengan performa tingkat tinggi.

Jadi dapat disimpulkan, bahwa OLTP memungkinkan banyak pengguna

untuk mengakses secara bersamaan terhadap sumber database yang sama, dimana

datanya bersifat relational dan sudah ternomalisasi.

2.1.5 OLAP

Menurut Connolly dan Begg (2005, p1205), OLAP (Online Analytical

Processing) adalah pembuatan, analisis, dan konsolidasi yang dinamis dari data

multidimensi yang berukuran besar.

Menurut Inmon (2005, p178), multidimensional DBMS (OLAP) adalah

sebuah teknologi, dimana data warehouse adalah sebuah arsitektur

infrastrukturnya, dan adanya sebuah relasi yang simbiotik antara keduanya. Dalam

kasus normal, data warehouse menyediakan sebuah fondasi untuk data yang akan

masuk ke dalam OLAP. Data yang dimasukan ke dalam OLAP bersifat ringkasan

atau hasil agregasi.

Page 5: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

11  

Menurut Turban et al (2005, p76), OLAP menggambarkan suatu proses

analisis dari data segera setelah terjadi transaksi. Kelebihan OLAP adalah

kemampuannya untuk menciptakan struktur bisnis seperti wilayah penjualan,

kategori produk, kalender fiskal, dan sebagainya. OLAP juga menggabungkan

struktur tersebut dengan cara tertentu sehingga pengguna dapat dengan cepat

menjawab pertanyaan-pertanyaan bisnis yang ada.

Maka dapat disimpulkan bahwa OLAP adalah sebuah teknologi dengan

perpaduan dan pemrosesan analitis data multidimensi untuk membantu pengguna

menjawab pertanyaan-pertanyaan bisnis.

2.1.6 Data Warehouse

2.1.6.1 Pengertian Data Warehouse

Menurut Inmon (2005, p29) sebuah data warehouse adalah “

kumpulan data yang berorientasi subjek, terintegrasi, non-volatile, dan

time-variant yang mendukung keputusan manajemen.”

Menurut Kimball dan Caserta(2004,p23), data warehouse adalah

sebuah sistem yang mengesktrak, membersihkan, menyesuaikan dan

mengirim data sumber ke dalam penyimpanan data dimensional dan

kemudian mendukung dan mengimplementasikan proses query dan analisis

untuk tujuan pengambilan keputusan.

2.1.6.2 Karakteristik Data Warehouse

Menurut Inmon(2005, p29) sebuah data warehouse memiliki

karakteristik-karakteristik utama, antara lain sebagai berikut:

Page 6: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

12  

‐ Subject oriented

Dalam sistem operasional klasik, data berpusat pada aplikasi

fungsional perusahaan (kontrol stok, penjualan produk, tagihan pelanggan),

sedangkan pada data warehouse, datanya berpusat pada subjek utama dari

perusahaan (pelanggan, produk, dan penjualan).

Gambar 2.1 Subject Orientation

‐ Integrated

Dari semua aspek pada data warehouse, integrasi merupakan hal yang

terpenting. Data diambil dari berbagai sumber yang berbeda ke dalam data

warehouse. Setelah data diambil, data tersebut dikonversi, diformat

kembali, disusun, diringkas, dan sebagainya.

Page 7: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

13  

Gambar 2.2 Integration

Pada Gambar 2.2 dapat dilihat bahwa integrasi terjadi ketika data

melewati lingkungan operasional berbasis aplikasi ke data warehouse.

‐ Non-volatile

Gambar 2.3 Non Volatility

Page 8: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

14  

Pada Gambar 2.3 dilihat bahwa data operasional dapat diakses dan

dimanipulasi, sedangkan data yang ada pada data warehouse dapat

dimuat/diambil dan diakses, tapi data tersebut tidak diperbaharui. Ketika

data pada data warehouse diambil, data tersebut berupa snapshot, format

statik. Maka ketika data operasional berubah, baris snapshot baru akan

ditulis. Untuk melakukan itu, maka histori dari setiap baris data harus

disimpan di dalam data warehouse.

‐ Time-variant

Time-Variant menyiratkan bahwa setiap unit dari data di dalam data

warehouse akurat pada beberapa saat dalam waktu tertentu. Secara umum,

sebuah record memiliki suatu bentuk penandaan waktu untuk

menunjukkan saat dimana record tersebut akurat. sebuah record dapat

diberi penanda waktu, dan dapat juga menggunakan tanggal transaksi pada

record tersebut.

Gambar 2.4 Time Variancy

Page 9: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

15  

2.1.6.3 Arsitektur Data Warehouse

Menurut Connolly (2005, p1156), Arsitektur data warehouse

terdiri dari struktur dan komponen-komponen yang saling menunjang satu

sama lain dalam membangun sebuah data warehouse.

Gambar 2.5 Arsitektur Data Warehouse(Connolly dan Begg, 2005, p1157)

Di dalam arsitektur data warehouse terdapat sepuluh komponen

antara lain:

1 Operational Data Source, merupakan data operasional sekarang yang

akan menjadi sumber data dalam proses perancangan data warehouse.

2 Operational Data Store, merupakan tempat penyimpanan data

operasional saat ini yang terintegrasi yang dimana struktur dari

operational data store ini mirip dengan data warehouse sehingga

memungkinkan untuk memindahkan data dari operational data store

ke data warehouse secara sederhana.

Page 10: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

16  

3 Load Manager, merupakan sebuah komponen front-end, yang bertugas

untuk menangani operasi ekstraksi dan juga loading ke dalam data

warehouse

4 Warehouse Manager, merupakan sebuah komponen yang menangani

operasi transformasi data, kekonsistenan data, pembuatan indeks,

denormalisasi bila diperlukan, back-up dan juga penyimpanan data

5 Query Manager, merupakan komponen backend, yang menangani

semua operasi yang berhubungan dengan manajemen query data

6 Detailed Data, merupakan komponen yang menjadi tempat

penyimpanan detail semua data dalam skema database.

7 Lightly dan Highly Summarized Data¸merupakan komponen yang

menjadi tempat penyimpanan data baik yang highly summarized

maupun lightly summarized. Yang bertujuan untuk meningkatkan

kecepatan performa dari query.

8 Archive / Back-up Data, merupakan komponen yang menjadi tempat

penyimpanan data-data back-up terhadap data-data yang ada di dalam

data warehouse.

9 Metadata, merupakan komponen yang menjadi tempat peyimpanan

metadata atau data tentang data di dalam data warehouse baik tentang

proses penarikan atau penyimpanan data, proses query yang terjadi dan

sebagainya.

10 End-user Access Tools, merupakan komponen yang bertugas untuk

menyediakan informasi dari data warehouse yang ada bagi user dalam

membantu mengambil keputusan. Komponen dibagi menjadi 5

Page 11: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

17  

kelompok yaitu Executive Information System (EIS), Online

Analytical Processing (OLAP) Tools, Data Mining Tools, Reporting

Query Tools, Pengembangan Aplikasi.

Dari arsitektur data warehouse terdapat beberapa aliran data yang

terjadi antara lain yaitu,

− Inflow

Yaitu aliran data dari penarikan data operasional ke dalam data

warehouse.

− Upflow

Yaitu aliran data dimana terdapat proses penambahan nilai ke data di

dalam data warehouse seperti perangkuman dari detail ke lightly

kemudian ke highly summarized data

− Downflow

Yaitu aliran data pada saat melakukan penyimpanan atau back-up data

dalam data warehouse.

− Outflow

Yaitu aliran data pada saat data dalam data warehouse digunakan oleh

end-user untuk keperluan bisnis.

− Metaflow

Yaitu aliran data pada operasi yang berkaitan dengan manajemen

metadata.

Page 12: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

18  

2.1.6.4 Struktur Data Warehouse

Menurut Inmon (2005, p33), Lingkungan data warehouse

memiliki detail yang berbeda level. Terdapat sebuah older detail (biasanya

sebagai alternatif, penyimpanan yang besar), sebuah current detail, dan

sebuah level lightly dan juga highly dari summarized data. Data mengalir

ke dalam data warehouse dari lingkungan operasional.

Gambar 2.6 Struktur Data Warehouse(Inmon 2005, p34)

Pada gambar Gambar 2.6 dapat dilihat struktur data warehouse yang

memiliki 4 level yang berbeda.

• Current detail data

Current detail data adalah data yang sedang berjalan pada saat ini

yang menampilkan keadaan yang sedang berjalan dan merupakan tingkatan

yang paling rendah pada data warehouse. Jumlah data yang terdapat pada

Page 13: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

19  

current detail data sangat besar sehingga sering menimbulkan kesulitan

dalam mengatur data dan menyebabkan meningkatnya biaya.

• Older detail data

Older detail data adalah data historikal dari current detail data yang

dapat merupakan hasil data cadangan atau arsip data yang disimpan secara

terpisah dalam tempat penyimpanan. Data pada older detail data biasanya

memiliki tingkat frekuensi akses yang rendah.

• Lightly summarized data

Lightly summarized data merupakan ringkasan atau rangkuman dari

current detail data. Data ini dirangkum berdasarkan periode atau dimensi-

dimensi sesuai dengan kebutuhan. Hasil dari ringkasan data ini belum

bersifat sangat ringkas, sehingga detil tingkatan pada data ini lebih tinggi.

Tingkatan data ini disebut data mart.

• Highly summarized data

Highly summarized data merupakan tingkatan lanjutan dari lightly

summarized data dimana data ini bersifat totalitas. Data pada highly

summarized data dapat diakses misal dengan melakukan analisis

perbandingan data berdasarkan urutan waktu tertentu dan analisis

menggunakan data multidimensi.

2.1.6.5 Bentuk Data Warehouse

Sebelum merancang suatu data warehouse, kita harus menentukan

terlebih dahulu bentuk data warehouse yang akan kita gunakan. Bentuk

Page 14: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

20  

data warehouse yang akan kita gunakan untuk merancang suatu data

warehouse tergantung kebutuhan yang kita perlukan di dalam menjalankan

aplikasi yang akan kita rancang. Berikut terdapat 3 bentuk umum yang

sering digunakan dalam data warehouse, yaitu :

1. Functional Data Warehouse

Functional data warehouse diperoleh dari hasil operasional

perusahaan sehari-hari. Pada bentuk ini data warehouse dibuat lebih

dari satu dan dikelompokan menurut fungsi-fungsi yang ada pada

perusahaan, misal fungsi keuangan, penjualan, marketing, dan lain-

lainnya. Bentuk ini memiliki keuntungan yaitu mudah dibangun

dengan biaya yang relatif murah, namun kerugian pada bentuk ini

adalah adanya resiko kehilangan konsistensi data dan terbatasnya

kemampuan dalam pengumpulan data bagi pengguna.

2. Centralized Data Warehouse

Centralized data warehouse hampir memiliki bentuk yang sama

dengan functional data warehouse. Perbedaan pada bentuk ini adalah

sumber data terlebih dahulu akan dikumpulkan dan diintegrasikan pada

suatu tempat terpusat, kemudian data tersebut dibagi-bagi menurut

fungsi-fungsi yang dibutuhkan oleh perusahaan. Bentuk ini sering

digunakan oleh perusahaan-perusahaan yang belum memiliki jaringan

eksternal. Bentuk ini memiliki keuntungan yaitu data benar-benar

terpadu karena konsistensi data yang tinggi, namun kerugian pada

bentuk ini adalah biaya yang relatif mahal dan membutuhkan waktu

yang lebih lama dalam membangun bentuk ini.

Page 15: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

21  

3. Distributed Data Warehouse

Distributed data warehouse merupakan bentuk data warehouse yang

menggunakan gateway untuk menjembatani antar lokasi data

warehouse dengan workstation yang memiliki sistem yang beraneka

ragam, sehingga pada bentuk ini, kita dapat mengakses sumber data

yang berada di luar lokasi perusahaan atau external perusahaan.

Bentuk data warehouse ini memungkinkan tiap departemen dalam

perusahaan untuk membangun sistem operasional, pengumpulan data,

dan fungsionalnya masing-masing. Kemudian bagian-bagian tersebut

akan digabungkan dengan teknologi client-server. Bentuk ini memiliki

keuntungan yaitu dapat mengakses data dari luar perusahaan yang

telah mengalami sinkronisasi terlebih dahulu dan tetap terjaga

konsistensinya, namun kerugian pada bentuk ini adalah harga yang

cukup mahal dan rumit untuk diterapkan karena sistem operasinya

dikelola secara terpisah.

2.1.6.6 Keuntungan Data Warehouse

Menurut Connoly dan Begg (2005, p1152), data warehouse yang

baik dapat memberikan keuntungan sebagai berikut :

a. Pengembalian yang besar dari investasi

Sebuah perusahaan harus mengeluarkan biaya yang besar untuk

membangun dan mengimplementasikan suatu data warehouse secara

sukses, dan jumlahnya bervariasi tergantung pada solusi teknis yang

diberikan. Tetapi menurut survei International Data Corporation

Page 16: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

22  

(IDC) pada tahun 1996 melaporkan bahwa rata-rata 3 tahun ROI

(Return On Investment) dalam data warehousing mencapai 401% lebih

dari 90%-nya mencapai lebih dari 40% ROI, setengahnya mencapai

lebih dari 160% ROI, dan seperempatnya mencapai lebih dari 600%

ROI (IDC, 1996).

b. Keuntungan yang kompetitif

Keuntungan yang kompetitif dapat diperoleh dengan mendukung para

pengambil keputusan mengakses data dan memperlihatkan apa yang

sebelumnya belum pernah terlihat.

c. Meningkatkan produktivitas dari para pengambil keputusan di dalam

perusahaan.

Data warehouse dapat meningkatkan produktivitas para pengambil

keputusan dengan membuat suatu database terpadu dari data-data yang

konsisten, berorientasi pada subjek, dan historical. Dengan adanya

data warehouse, data dari berbagai sistem dapat disatukan menjadi

sebuah bentuk yang konsisten sehingga data tersebut menjadi

informasi yang berguna untuk para pengambil keputusan untuk

melakukan analisis yang lebih nyata, akurat, dan konsisten.

2.1.7 ETL (Extraction Transformation Loading)

ETL menurut Prabhu dan Venatesan (2007, p112) adalah proses dimana

kita melakukan migrasi dari database operasional menuju data warehouse. ETL

merupakan suatu proses yang diperlukan dalam membentuk struktur model

Page 17: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

23  

dimensi (Dimensional Model) dalam data warehouse yang terdiri dari 3 tahap

yaitu :

1. Extraction

Ekstraksi (Extraction) merupakan sebuah proses penarikan data dari satu

atau lebih sistem operasional sebagai sumber data yang dibutuhkan oleh data

warehouse yang akan digunakan di dalam proses selanjutnya. (Pada

umumnya datanya ditarik dari sistem Database OLTP tapi bisa juga berasal

dari sumber-sumber eksternal yang lain)

2. Transform

Setelah data diekstraksi maka akan dilakukan proses Transformasi

(Transform), yaitu sebuah proses untuk mengolah data sedemikian rupa

seperti membersihkan data (antara lain dengan membetulkan ejaan yang

salah, menyelesaikan konflik domain, mengembalikan elemen yang hilang,

dan menyatukannya ke dalam sebuah format yang standar agar data yang ada

menjadi konsisten satu sama lain), menggabungkan data dari berbagai

sumber eksternal yang lain, menghilangkan duplikasi data yang ada, dan

juga memberikan Surrogate Key (sebuah key yang menghubungkan struktur

Data Warehouse dan terpisah dari sistem sumber), selain itu data juga harus

diagregasi untuk mempercepat analisis.

3. Loading

Setelah data telah ada dan telah ditransformasi sedemikian rupa sesuai

dengan kebutuhan maka hasil dari data tersebut akan disimpan dalam bentuk

tabel dimensional yang berkualitas ke dalam sebuah database relational baik

Page 18: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

24  

berupa data warehouse maupun data mart. Proses penyimpanan data inilah

yang dinamakan dengan Loading

Jadi secara singkat, tujuan dari proses ETL ini adalah untuk

mengumpulkan, menyaring, mengolah, dan juga menggabungkan data-data dari

berbagai sumber eksternal yang ada serta menyimpannya ke dalam data

warehouse ataupun data mart.

2.1.8 Model Data

Berikut beberapa jenis model data yang sering digunakan dalam

perancangan sebuah data warehouse:

2.1.8.1 Entity Relationship Modelling

Menurut Connolly dan Begg (2005, p342), salah satu faktor yang

paling sulit dalam perancangan sebuah database dimana perancang,

programmer dan end-user dapat melihat data dari berbagai macam sudut

pandang yang berbeda.

Oleh karena itu, untuk dapat menyatukan pemahaman maka

diperlukan sebuah model data yang akan digunakan sebagai sebuah bentuk

komunikasi antara perancang, programmer, dan end-user dalam

menggunakan data.

Menurut Connolly (2005, P342), ER Modelling adalah sebuah

pendekatan top-down dalam perancangan basis data yang dimulai dengan

mengidentifikasi data yang penting dalam sistem yang akan dibuat yang

disebut dengan entities kemudian Attribute dan relationship antar data yang

Page 19: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

25  

harus direpresentasikan dalam model dan setelah itu menentukan key (baik

composite key, candidate key, primary key, alternative key, foreign key).

2.1.8.2 Multidimensional Modelling

Multidimensional Modelling adalah teknik perancangan logikal

data warehouse untuk menampilkan data dalam bentuk standar dan

memiliki akses performa yang tinggi dalam penggunaannya.

Multidimensional Model terbentuk dari minimal satu buah tabel bernama

tabel fakta, dan serangkaian tabel-tabel lain yang lebih kecil yang disebut

tabel dimensi. Setiap tabel dimensi memiliki satu primary key yang

dihubungkan tepat dengan satu komponen dari composite key di tabel fakta.

Sehingga primary key dari tabel fakta terdiri dari dua atau lebih foreign key

dari tabel-tabel dimensi. Selain itu pada model ini semua natural key

digantikan dengan surrogate key, dimana setiap penggabungan dengan

tabel fakta harus menggunakan surrogate key, bukan natural key. Hasil

pemodelan data ini adalah data dalam bentuk cube yang cukup portable.

• Tabel Fakta

Menurut Kimball dan Ross (2002, p16), tabel fakta adalah tabel yang

utama dalam konsep pemodelan Multidimensional dimana hasil

perhitungan bisnis akan disimpan untuk kemudian disajikan dalam

bentuk laporan yang diinginkan.

Page 20: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

26  

Gambar 2.7 Contoh tabel fakta (Kimball, 2002, p17)

Tabel fakta mempunyai minimal dua atau lebih foreign keys, biasanya

ditandai dengan tanda “FK”, yang berfungsi sebagai penghubung ke

primary keys dalam tabel-tabel dimensi yang bersangkutan. Misalnya,

seperti pada Gambar 2.7 di atas, Product Key merupakan sebuah

foreign key yang menghubungkan fakta “Daily Sales Fact Table”

dengan primary key “Product key” dalam tabel dimensi “Product”.

Begitu juga dengan foreign key “Date Key” pada tabel fakta “Daily

Sales Fact Table” yang terhubung dengan primary key “Date Key”

pada tabel dimensi “Time”. Umumnya tabel fakta itu sendiri memiliki

sebuah primary key yang merupakan gabungan dari foreign keys.

Primary key ini dikenal sebagai composite atau concatenated key.

Setiap tabel fakta dalam konsep pemodelan multidimensional memiliki

sebuah composite key, dan sebaliknya, setiap tabel yang memiliki

composite key merupakan tabel fakta.

Menurut Ponniah (2001, p214), karakteristik tabel fakta adalah sebagai

berikut :

− Memiliki Concatenated Key

Baris dalam tabel fakta berkaitan dengan kombinasi baris dari

semua tabel dimensi yang berhubungan dengan tabel fakta

tersebut.

− Data Grain

Page 21: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

27  

Tabel fakta dapat merupakan tabel dimana kita dapat

menentukan data grain atau tingkat kekhususan atau

kespesifikasian data yang akan digunakan untuk perhitungan

atau kalkulasi.

− Fully Additive Measures

Tabel fakta berisi fully additive measures yaitu perhitungan dari

penjumlahan sederhana atribut-atribut setiap baris hasil agregas i

yang ada sesuai dengan kebutuhan laporan yang akan

ditampilkan.

− Semi-Additive Measures

Dalam sebuah tabel fakta biasanya memiliki Semi-additive

measure, yaitu atribut turunan dari fully-additive measure.

Measure seperti ini tidak bisa dihitung dengan menambahkan

atribut setiap baris hasil aggregasi yang ada karena dapat

menghasilkan perhitungan yang salah. Contohnya dalam fakta

terdapat total pengeluaran, total pemasukan, dan margin

persentase. Apabila kita menghitung margin persentase untuk

tiap baris agregasi yang dilakukan dan kemudian ditambahkan

maka hasil akhir yang didapat akan salah.

− Tabel bersifat dalam, tidak lebar

Tabel fakta biasanya mempunyai lebih sedikit jumlah atribut

dibandingkan dengan tabel dimensi. Berbeda dengan tabel

dimensi, tabel fakta mempunyai jumlah baris yang banyak

Page 22: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

28  

karena merupakan representasi dari transaksi-transaksi yang

terjadi yang akan diolah sehingga bersifat dalam, dan tidak lebar.

− Sparse Data

Tabel fakta merupakan hasil dari kombinasi beberapa tabel

dimensi yang ada, namun tidak semua kombinasi yang ada

mempunyai nilai sehingga menghasilkan isi dari tabel fakta yang

memiliki nilai null (kosong atau tidak ada). Contohnya di

dimensi waktu ada tanggal 1,2,3 dan dimensi pelanggan ada

a,b,c. Apabila kita mencoba men-generate tabel fakta dengan

pelangan a dan tanggal 1, belum tentu ada transaksi a pada

tanggal 1 sehingga mungkin isi dari tabelnya adalah NULL. Kita

tidak perlu menyimpan nilai null dalam tabel fakta, sehingga

terkadang dalam tabel fakta terdapat sejumlah gap.

− Degenerate Dimensions

Pada saat memilih atribut-atribut dari sistem operasional untuk

dimasukkan ke dalam tabel dimensi ataupun fakta, terdapat

sejumlah data dimana data tersebut tidak akan digunakan sebagai

atribut baik dalam tabel dimensi maupun fakta, misalnya nomor

pembelian, nomor penjualan, nomor pemesanan, dan lain-lain.

Namun atribut ini dapat dipakai dalam beberapa tipe analisis

sesuai dengan kebutuhan bisnis yang ada. Atribut-atribut inilah

yang dikenal dengan degenerate dimension.

Page 23: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

29  

• Tabel dimensi

Menurut Ralph Kimball (2002, p19), tabel dimensi berisi penjelasan

deskriptif tentang sebuah transaksi dari sebuah bisnis yang akan

terhubung dengan tabel-tabel fakta yang berhubungan.

Gambar 2.8 Contoh tabel dimensi produk (Kimball, 2002, p20)

Tabel dimensi biasanya memiliki banyak kolom atau atribut. Tabel

dimensi relatif pendek dalam jumlah baris, namun dapat menjadi lebar

karena banyaknya kolom karena berisi master dari sebuah database.

Setiap tabel dimensi mempunyai primary key, yang membedakan satu

dengan yang lain, biasanya ditandai dengan ‘PK’. Atribut tabel

dimensi biasanya berasal dari atribut pada tabel master di database

yang berupa teks, namun tidak berarti bahwa data yang berupa angka

tidak dapat dimasukkan ke dalam tabel dimensi selama data itu

merupakan deskripsi, bukan pengukuran ataupun perhitungan.

Page 24: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

30  

Menurut Ponniah (2001, p213), sebuah tabel dimensi memiliki

beberapa karakteristik sebagai berikut :

a. Memiliki Dimension Table Key

Terdapat sebuah Primary key pada tabel dimensi yang dapat

mengidentifikasikan setiap baris dalam tabel dimensi secara

unik.

b. Tabel bersifat lebar

Pada umumnya, sebuah tabel dimensi dapat memiliki banyak

atribut atau kolom layaknya sebuah tabel master di sistem

database biasa.

c. Atribut biasanya berupa teks

Dalam tabel dimensi jarang ditemukan nilai numerik untuk

perhitungan. Atribut-atributnya biasanya dalam format teks yang

merepresentasikan komponen-komponen antara dimensi bisnis.

d. Atribut-atribut tidak terhubung secara langsung

Sering kali akan ditemukan atribut dari tabel dimensi yang tidak

terhubung langsung dengan atribut lain dalam tabel dimensi yang

sama .

e. Tidak ternormalisasi

Atribut dalam tabel dimensi akan digunakan secara terus

menerus dalam query. Oleh karena itu untuk tujuan efisiensi,

tabel dimensi dibuat tidak ternormalisasi, sehingga query

mengambil langsung atribut dari tabel dimensi untuk tabel fakta

tanpa melalui tabel perantara lainnya. Hal ini dapat membuat

Page 25: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

31  

query yang dijalankan menjadi jauh lebih cepat karena tidak

perlu untuk mengakses melewati beberapa tabel yang lain.

f. Drilling down, Rolling up

Setiap tabel dimensi memiliki kemampuan untuk mengakses data

dari tingkat agregasi yang tinggi ke tingkat yang rendah (Drilling

Down) ataupun sebaliknya dari tingkat yang rendah ke tingkat

yang tinggi (Rolling Up) selama ada hierarki yang terhubung di

antara tabel dimensi tersebut. Misalnya pada pengaksesan atribut

kota, propinsi, dan negara yang membentuk hierarki. Kita dapat

mendapatkan laporan pembelian berdasarkan negara, lalu turun

menjadi laporan berdasarkan propinsi, lalu berdasarkan kota.

Atau sebaliknya, kita dapat memulai dengan mendapatkan

laporan pembelian berdasarkan kota, lalu naik menjadi laporan

berdasarkan propinsi dan kemudian berdasarkan negara.

g. Multiple Hierachies

Tabel dimensi bisa mempunyai banyak hierarki yang

menghubungkannya dengan tabel-tabel lainnya. Pada tabel

dimensi seperti ini dapat diterapkan drilling down ataupun

rolling up untuk mengakses atribut-atribut yang diinginkan.

h. Memiliki sedikit baris

Tabel dimensi mempunyai sifat lebar atau memilki banyak

kolom namun memiliki lebih sedikit baris dibandingkan dengan

tabel fakta. Karena tabel dimensi merupakan master yang akan

dipakai atribut-atributnya secara berulang kali dalam fakta yang

Page 26: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

32  

berisi transaksi-transaksi yang terjadi contohnya dalam sebuah

tabel dimensi kota yang terdiri dari ratusan baris, sedangkan

sebuah fakta dapat berisikan jutaan baris.

2.1.9 Bentuk Pemodelan Multidimensional

2.1.9.1 Skema Bintang

Menurt Inmon (2005, p128), skema bintang adalah sebuah struktur

desain yang digunakan untuk mengatur data dengan cara denormalisasi

dalam jumlah yang besar ke dalam sebuah entity dalam sebuah data mart

untuk mengoptimalkan akses data yang dilakukan.

Menurut Connolly dan Begg (2005, p1183), skema bintang adalah

sebuah struktur logikal yang berisikan sebuah tabel fakta sebagai pusatnya,

dan dikelilingi oleh tabel-tabel dimensi yang berhubungan yang berisi data

referensi ataupun berisi keterangan-keterangan yang biasanya dapat

didenormalisasikan.

Simpulannya, skema bintang adalah suatu struktur logikal data yang

mempunyai suatu tabel fakta sebagai pusat dan dikelilingi oleh tabel-tabel

multidimensi yang berhubungan sebagai penyedia data-data atau informasi

yang terkait serta kompatibel dengan kebutuhan bisnis.

Beberapa karakteristik dari skema bintang antara lain sebagai

berikut :

1. Tabel fakta sebagai pusat dari skema bintang.

2. Tabel fakta dikelilngi oleh tabel dimensi

Page 27: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

33  

3. Tabel fakta mempunyai atribut-atribut yang merupakan indikator-

indikator kinerja pokok / Key Performance Indicators.

4. Obyek-obyek informasi dan waktu adalah kunci utama dari tabel fakta

5. Tiap tabel dimensi berhubungan dengan tabel fakta berdasarkan

primary key-nya.

6. Skema bintang diimplementasikan menggunakan teknologi database

relasional.

Gambar 2.9 Contoh skema bintang

Keuntungan menggunakan Skema bintang menurut Ponniah

(2001,p220), antara lain:

1. Mudah Dimengerti

Skema bintang mampu merefleksikan bagaimana pengguna berpikir

dan mencari data untuk query dan analisis. Skema bintang

Page 28: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

34  

mendefinisikan hubungan antara tabel secara langsung tanpa harus

melewati atau melalui tabel dimensi yang lain sama seperti bagaimana

pengguna menvisualisasikan hubungannya pada umumnya sehingga

mudah dimengerti oleh pengguna.

2. Mengoptimalkan navigasi

Karena tabel fakta langsung berhubungan dengan setiap tabel dimensi

yang berhubungan tanpa ada hierarki atau level yang bertingkat maka

hubungan-hubungan antara tabel dalam skema bintang sederhana,

sehingga navigasinya pun jauh lebih optimal. Walaupun query yang

digunakan terlihat kompleks, tetapi navigasi didalamnya tetap

sederhana.

3. Cocok untuk pemrosesan query atau respon data yang lebih cepat

Struktur skema bintang adalah sebuah skema yang berpusat pada query

yang menghubungkan antara fakta dengan dimensi-dimensi secara

langsung, sehingga struktur data warehouse yang dihasilkan mampu

memberikan respon data yang lebih cepat karena tiap fakta dapat

mengakses langsung data yang pada tabel dimensi tanpa harus

melewati beberapa tabel lain. Setiap query dieksekusi dengan, terlebih

dahulu memilih baris dari tabel dimensi menggunakan filter dari

parameter query, lalu menemukan baris yang terhubung dengannya

dalam tabel fakta. Hal ini memungkinkan karena hubungan yang

sederhana dan tidak adanya tabel penghubung lainnya dari tabel

dimensi ke tabel fakta.

Page 29: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

35  

Umumnya skema bintang digunakan untuk meningkatkan

kecepatan, dengan adanya denormalisasi informasi ke dalam sebuah tabel

dimensi. Proses denormalisasi sangat disarankan apabila terdapat banyak

entitas yang berhubungan dengan tabel dimensi yang sering diakses,

dengan adanya denormalisasi maka kita dapat menghindari

menghubungkan tabel lain untuk mengakses atribut tersebut. Tapi pada

beberapa kasus dimana data tambahan tersebut jarang diakses, maka

disarankan untuk tidak melakukan denormalisasi, karena akan

memperlambat performa query.

2.1.9.2 Skema Snowflake

Menurut Ponniah (2001, p235), snowflaking adalah sebuah

metode menormalisasikan tabel dimensi yang ada di dalam skema bintang.

Yang dimana hasil skema dari metode ini dinamakan skema Snowflake.

Prinsip dasar dari skema ini tidak jauh berbeda dari skema bintang

karena masih berpusat pada tabel fakta dan dikelilingi oleh tabel dimensi-

dimensi lain dimana tabel dimensi dapat berhubungan atau berelasi dengan

tabel dimensi lain sehingga menyerupai keping salju (snowflake). Skema

snowflake dibuat berdasarkan bentuk dari OLTP sehingga semua data akan

termuat detail dalam setiap tabel fakta dan tabel dimensi di dalam

datawarehouse.

Page 30: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

36  

Gambar 2.10 Contoh skema snowflake

Menurut Ponniah (2001, p238), keuntungan dari skema snowflake

adalah sebagai berikut :

− Pemakaian tempat penyimpanan kecil

Bentuk skema snowflake ini akan membutuhkan tempat penyimpanan

yang jauh lebih kecil karena tabel-tabelnya telah ternormalisasi

sehingga sudah tidak terdapat lagi redudansi data.

− Mudah di-update dan dipelihara

Struktur tabel dalam skema snowflake adalah tabel ternormalisasi yang

mempunyai bentuk struktur yang sama dengan OLTP sehingga apabila

terjadi perubahan atau update pada data operasional, maka dapat

Page 31: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

37  

langsung diterapkan perubahan tersebut ke dalam data warehouse

tanpa harus merubah struktur yang ada.

Sedangkan kekurangan dari skema snowflake ini adalah sebagai

berikut:

- Kemampuan untuk melihat isi skema menjadi sulit.

Berbeda dengan skema bintang yang hanya tediri satu level saja,

skema snowflake biasanya terdiri lebih dari 1 level, apabila level

semakin tinggi maka akan semakin sulit untuk dilihat secara langsung

dan juga semakin besar tingkat kompleksitasnya.

- Penurunan performa query

Karena ada beberapa tabel dimensi yang tidak terhubung langsung

dengan fakta maka query yang dibuat memerlukan hubungan

tambahan seperti join, dan sejenisnya untuk dapat mengakses data

tersebut yang dimana akan memperbanyak kegiatan yang akan

dilakukan dalam query sehingga dapat menurunkan performa query.

2.1.9.3 Skema Starflake

Menurut Conolly dan Begg (2005, p1185), skema starflake adalah

struktur campuran antara skema bintang dan skema snowflake.

Perbedaannya adalah pada satu fakta yang sama dapat diterapkan tabel

dimensi yang disajikan dalam bentuk skema bintang maupun skema

snowflake untuk memenuhi kebutuhan query yang berbeda-beda.

Biasanya penentuan pemakaian skema untuk tiap tabel dimensi

dilakukan berdasarkan pertimbangan untuk menghasilkan suatu rancangan

Page 32: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

38  

data warehouse dengan performa yang terbaik, dapat beradaptasi dengan

kebutuhan user, memiliki kemampuan memodelkan situasi bisnis secara

umum, bersifat fleksibel khususnya terhadap perubahan yang terjadi

khususnya pada perkembangan.

2.1.10 Metodologi Perancangan Data Warehouse

Metodologi data warehouse menurut Kimball, yang juga dikutip oleh

Connolly (2005,p1187), disebut dengan nine-step methodology y, yaitu

2.1.10.1 Memilih proses

Fungsi dari proses mengacu pada sebuah permasalahan subyek

yang dibutuhkan oleh data mart. Pada tahap ini, ditentukan proses bisnis

apa yang datanya paling sering digunakan sesuai dengan kebutuhan, dan

dapat menjawab semua permasalahan bisnis yang penting yang akan

digunakan data warehouse.

2.1.10.2 Memilih grain

Setelah menentukan proses yang akan kita bahas dalam sebuah

database maka kita harus memilih grain yang berarti memutuskan dengan

tepat apa yang akan direpresentasikan serta tingkat detail data pada tabel

fakta. Setelah menentukan grain untuk tabel fakta, maka untuk selanjutnya

kita dapat melanjutkan mengidentifikasikan dimensi-dimensi dari tabel

fakta tersebut.

Page 33: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

39  

2.1.10.3 Identifikasi dan penyesuaian dimensi

Pada tahap ini, kita akan membuat dimensi yang dapat

menyesuaikan informasi yang ingin ditampilkan untuk menjelaskan seluruh

isi yang terdapat pada tabel fakta yang ada agar mudah dimengerti dan

mudah digunakan. Tabel dimensi harus mampu menyiapkan konteks untuk

menanyakan pertanyaan tentang fakta yang ada dalam tabel fakta.

Kumpulan dimensi yang dibuat dengan baik akan mempermudah dalam

mengerti dan menggunakan data warehouse.

2.1.10.4 Memilih fakta

Setelah menentukan grain dan mengidentifikasi tabel dimens i

maka proses selanjutnya yang kita lakukan adalah menentukan tabel fakta

yang dapat mengimplikasikan sesuai dengan semua grain yang ada.

2.1.10.5 Menyimpan pre-calculation di tabel fakta

Setiap tabel fakta telah terpilih, maka setiap fakta-fakta yang

sudah terpilih harus diperiksa ulang kembali untuk mengetahui apakah ada

fakta-fakta yang dapat diterapkan pre-calculation dan dilakukan

penyimpanan pada tabel fakta.

2.1.10.6 Memastikan tabel dimensi

Pada tahap ini dilakukan pemeriksaan ulang pada tabel dimens i

yang sudah ada. Selain itu juga dilakukan proses mengidentifikasikan

Page 34: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

40  

detail dimensi yang secukupnya untuk menggambarkan informasi pada

grain yang tepat serta menentukan hierarki atribut dimensi untuk

mempermudah dalam proses analisis. Ketidaklengkapan dari data dimensi

yang dikumpulkan maka akan mengurangi fungsi dari data warehouse

tersebut, dan apabila terlalu berlebihan maka dapat memboroskan kapasitas

data warehouse dan juga mempengaruhi kinerja data warehouse.

2.1.10.7 Memilih durasi database

Pada tahap ini akan ditentukan durasi waktu yang akan digunakan

dalam menjalankan tabel fakta atau kata lainnya ada batas waktu dari data

OLTP yang akan dimasukkan ke dalam data warehouse. Durasi ini

biasanya ditentukan sesuai dengan kebutuhan bisnis yang ada. Pada

sebagian perusahaan, cukup dengan melihat data pada periode tertentu

dalam jangka waktu satu atau dua tahun. Sedangkan untuk perusahaan

lainnya, seperti asuransi mungkin akan membutuhkan data yang

periodenya lebih lama yaitu sekitar 5 bahkan sampai 10 tahun. Ada

beberapa pertimbangan yang harus diketahui dalam menentukan durasi,

yang pertama semakin tua data maka akan semakin sulit digunakan, yang

kedua adalah adanya kemungkinan bahwa dimensi yang lama berbeda

dengan dimensi saat ini. Masalah seperti ini disebut dengan masalah slowly

changing dimension yang akan dibahas pada tahap berikutnya

2.1.10.8 Melacak perubahan dari dimensi secara perlahan

Page 35: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

41  

Pada tahap ini akan dilacak perubahan-perubahan dimensi yang

terjadi, ada 3 tipe yang dapat digunakan, antara lain

• Tipe 1 : Perubahan pada atribut sebuah dimensi akan menyebabkan

atribut itu akan diganti (overwrite).

• Tipe 2 : Perubahan pada atribut sebuah dimensi menyebabkan

dimasukkannya baris data baru ke dimensi tersebut, tapi masih

menggunakan id yang sama.

• Tipe 3 : Perubahan pada atribut sebuah dimensi menyebabkan

penambahan atribut alternatif, sehingga keduanya, nilai yang lama dan

yang baru, dari atribut tersebut, secara bersamaan dapat diakses dalam

dimensi yang sama.

2.1.10.9 Menentukan prioritas dan mode query

Pada tahap ini kita mempertimbangkan segala hal yang berkaitan

dengan masalah perancangan fisikal data warehouse yang mampu

mendukung kebutuhan proses bisnis. Rancangan desain fisikal meliputi

urutan fisik dari tabel fakta pada media penyimpanan, adanya penggunaan

agregasi, pertimbangan terhadap penggunaan indexing, backup, dan

security.

2.1.11 State Transition Diagram

Menurut Whitten (2004, p673) State Transition Diagram adalah sebuah

alat atau sarana yang dapat digunakan untuk menggambarkan urutan dan variasi

Page 36: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

42  

dari tampilan layar yang dapat terjadi selama sesi pengguna. Notasi yang

digunakan dalam STD adalah:

Kotak digunakan untuk representasi / menggambarkan layar tampilan.

Anak panah digunakan untuk menggambarkan aliran dari kontrol dan kejadian

yang memicu layar menjadi aktif atau menerima fokus.

Menurut Whitten (2004, p674) suatu STD dapat menjadi cukup besar,

terutama ketika semua input, output, help, dan layar-layar lainnya dimasukkan ke

dalam diagram. Oleh karena itu, sangat umum untuk memecah diagram menjadi

beberapa diagram yang lebih sederhana dan lebih mudah untuk dibaca.

2.2 Teori Khusus

2.2.1 Business Intelligence

2.2.1.1. Pengertian Business Intelligence

Menurut Dyche (2000, p9) “Business Intelligence adalah satu dari

sekian julukan yang meliputi kumpulan atas produk dan layanan untuk

mengakses dan menganalisis data dan merubahnya menjadi informasi. Itu

adalah salah satu dari istilah-istilah yang mendefinisikan kumpulan besar

dari produk analisis data, dari spreadsheet, ERP, dan Data Mining.

Singkatnya, Business Intelligence adalah sebuah istilah luas yang

digunakan oleh perusahaan-perusahaan, khususnya vendor untuk

memposisikan produk dan layanan baru, dan sering kali disamakan dengan

pendukung keputusan.”

Page 37: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

43  

2.2.1.2. Manfaat Business Intelligence

Keuntungan dari Business Intelligence jika diimplementasikan

pada perusahaan antara lain:

a. Meningkatkan nilai data dan informasi

Seluruh data dan informasi dapat diintegrasikan sedemikian rupa

sehingga menjadi lebih mudah untuk diakses, lebih mudah dimengerti

dan dapat menghasilkan keputusan yang optimal.

b. Memudahkan pemantauan kinerja organisasi

Kinerja dari organisasi dipantau atau diukur dengan menggunakan Key

Performance Indicator (KPI). Dengan adanya Business Intelligence

pencapaian KPI suatu organisasi dapat diketahui dengan mudah, cepat,

dan tepat sehingga memudahkan pihak manajemen dalam pengambilan

keputusan.

c. Meningkatkan nilai investasi teknologi informasi yang sudah ada

Penggunaan Business Intelligence pada perusahaan tidak mewajibkan

perubahan terhadap sistem informasi yang sudah ada. Business

Intelligence menambahkan layanan pada sistem tersebut sehingga data

yang ada menghasilkan informasi yang lebih komprehensif dan lebih

berguna.

d. Menciptakan pegawai yang memiliki akses informasi yang baik

Business Intelligence mempermudah seluruh tingkat lapisan pegawai

dalam suatu perusahaan untuk mengakses data dan informasi yang

Page 38: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

44  

diperlukan sehingga membantu dalam membuat keputusan yang

nantinya akan meningkatkan kinerja organisasi secara keseluruhan.

e. Meningkatkan efisiensi biaya

Dengan adanya Business Intelligence, waktu yang dibutuhkan untuk

mencari data dan mendapatkan informasi akan semakin singkat, dan

juga dapat menghemat biaya pelatihan yang biasanya cukup besar

karena cara untuk mendapatkan data tersebut tidak terlalu rumit

sehingga membutuhkan pelatihan khusus.

2.2.2 Visual Basic.Net

Menurut McMonnies (2004, pp21-22) dalam kasus VB.Net, program

aplikasi, disebut sebagai solusi, dikembangkan sehingga penggunaan terbaik dari

arsitektur .Net yang mendasar dapat diterapkan. Salah satu fitur yang spesifik dari

.Net adalah sebuah software dikembangkan dalam komponen yang disebut

assembly. Assembly dapat berupa keseluruhan program ataupun sebuah komponen

yang dapat digunakan oleh satu atau lebih program.

Menurut McMonnies (2004, pp21-22), Assembly biasanya dibangun dari

beberapa item yang berhubungan. Sktruktur aplikasi .Net antara lain:

Main Assembly 

(executive code) 

Component Assembly 

Statistics Library Code 

Component Assembly 

Data Access Component 

Component Assembly 

Graph Drawing 

Page 39: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

45  

Menurut Sibero (2010, p9) Visual Basic .NET adalah sebuah bahasa

pemrograman yang dikembangkan oleh perusahaan Microsoft. Visual Basic .NET

merupakan pengembangan dari versi sebelumnya, yaitu Visual Basic 6.0.

Perbedaan mendasar antara Visual Basic .NET dengan versi sebelumnya adalah

kemampuan OOP (object oriented programming) yang telah ditanamkan pada

Visual Basic .NET

2.2.3 Sistem Penjualan

Menurut Mulyadi (2001, p202), “Kegiatan penjualan terdiri dari transaksi

penjualan barang atau jasa, baik secara kredit maupun tunai” maka dari itu secara

umum kegiatan penjualan dibedakan menjadi dua jenis berdasarkan pembayaran

yang dilakukan pembeli, yaitu penjualan tunai dan kredit.

Menurut Joel G. Siegel dan Joe K. Shim yang diterjemahkan oleh Moh.

Kurdi(1999, p.404), “Penjualan adalah Penerimaan yang diperoleh dari

pengiriman barang dagangan atau dari penyerahan pelayanan dalam bursa sebagai

barang pertimbangan. Pertimbangan ini dapat dalam bentuk tunai, peralatan kas

atau harta lainnya. Pendapatan dapat diperoleh pada saat penjualan, karena terjadi

pertukaran, harga jual dapat ditetapkan dan bebannya diketahui”.

2.2.3.1 Penjualan Tunai

Menurut Mulyadi (2001, p455), “penjualan tunai dilakukan oleh

perusahaan dengan cara mengharuskan pembeli melakukan pembayaran

harga barang terlebih dahulu sebelum barang tersebut diserahkan ke

pembeli. Setelah uang diterima oleh perusahaan, barang kemudian

diserahkan kepada pembeli dan transaksi tersebut dicatat.

Page 40: BAB 2 LANDASAN TEORI 2.1 2.1.1 Data dan Informasithesis.binus.ac.id/doc/Bab2/2011-1-00142-if 2.pdf2.1.1 Data dan Informasi Menurut Inmon (2005, p493) data adalah rekaman fakta, konsep,

46  

2.2.3.2 Penjualan Kredit

Menurut Mulyadi (2001, p210), “penjualan kredit dilakukan

perusahaan dengan cara mengirimkan barang sesuai dengan permintaan

pembeli, dan untuk jangka waktu tertentu perusahaan mempunyai tagihan

untuk pembeli tersebut”

Menurut Soemarso SR (1999, p.178), “Penjualan kredit adalah

penjualan barang dagang secara tidak tunai yang dicatat sebagai debit pada

perkiraan piutang dagang dan kredit pada perkiraan penjualan”.

2.2.4 Sistem Jaminan

Sutarno (2005, p142) merumuskan pengertian jaminan kredit adalah

“segala sesuatu yang mempunyai nilai mudah untuk diuangkan yang diikat dengan

janji sebagai jaminan untuk pembayaran dari hutang debitur berdasarkan

perjanjian kredit yang dibuat oleh kreditur dan debitur.”

Hadisoeprapto (1984, p50) mengemukakan bahwa “jaminan kredit ialah

segala sesuatu yang diberikan kepada kreditur untuk menimbulkan keyakinan

bahwa debitur akan memenuhi kewajiban, yang dapat dinilai dengan uang yang

timbul dari suatu perikatan.”