Upload
doduong
View
230
Download
0
Embed Size (px)
Citation preview
9
BAB 2
LANDASAN TEORI
2.1 Teori–teori Dasar/Umum
2.1.1 Pengertian Data
Menurut Turban (2005, p38), data adalah deskripsi dasar dari
suatu kejadian, aktivitas, dan transaksi yang ditangkap, direkap,
dikelompokkan dan disimpan namun tidak terorganisir untuk
menyampaikan suatu arti tertentu.
Menurut Inmon (2005, p388), data adalah pengumpulan
berdasarkan fakta, konsep, dan instruksi yang disimpan dalam media
penyimpanan, digunakan untuk komunikasi dan diproses menjadi
informasi sehingga dapat dimengerti oleh manusia (user).
Menurut O’Brien (2006, p696), data adalah kumpulan fakta
atau hasil observasi mengenai fenomena fisik atau transaksi bisnis.
Lebih khusus lagi, data adalah ukuran objektif dari atribut
(karakteristik) dan entitas seperti manusia, tempat, benda atau
kejadian.
Berdasarkan definisi di atas, dapat disimpulkan bahwa data
adalah kumpulan fakta mengenai kejadian, aktivitas, dan transaksi
namun tidak memberikan informasi tertentu bagi manusia (user)
karena belum dilakukan pemrosesan terhadap data tersebut.
10
2.1.2 Pengertian Sistem
Menurut Satzinger (2005, p6), sistem sebagai sekumpulan
komponen yang saling terkait secara bersamaan memiliki tujuan
mencapai hasil tertentu.
Menurut Williams dan Sawyer yang diterjemahkan oleh
Rahayu, N.W. Prabawati T.A. (2007, p510), mendefinisikan sistem
sebagai berikut:
“Sistem merupakan kumpulan dari komponen-komponen yang
berhubungan dan saling berinteraksi untuk melakukan suatu tugas
guna mencapai sebuah tujuan. Dengan memahami aktivitas-aktivitas
yang dilakukan oleh sistem, programmer dapat mencari cara yang
lebih bagus untuk mencapai suatu tujuan”
Menurut Philip Kotler (2006, p57), sistem adalah sebuah
elemen yang sangat penting keberadaannya dalam perusahaan dan
berperan penting bagi bisnis perusahaan , dimana elemen ini
merupakan gabungan dari beberapa elemen yang berkolaborasi antara
satu sama lain.
Berdasarkan definisi diatas dapat disimpulkan bahwa sistem
merupakan sekumpulan komponen yang saling terkait satu sama lain
dan memiliki peranan penting dalam perusahaan untuk mencapai
suatu tujuan tertentu.
11
2.1.3 Pengertian Informasi
Menurut Turban (2008, p5), informasi mengacu pada data
yang telah terorganisir sehingga informasi tersebut memiliki makna
dan nilai kepada penerima informasi.
Menurut Inmon(2005,p391), informasi adalah data yang telah
dipilih dan dievaluasi oleh manusia untuk dapat menyelesaikan
masalah atau mengambil keputusan (decision making).
Menurut Kelly (2006, p3), informasi adalah sekumpulan data
yang telah diolah dan melalui sebuah proses di dalamnya sehingga
yang pada awalnya tidak memiliki nilai (value) apa-apa kemudian
berubah memiliki nilai yang terkandung di dalamnya dan nilai
tersebut memiliki arti bagi penerimanya.
Berdasarkan definisi di atas, dapat disimpulkan bahwa
informasi adalah data yang telah terorganisir sehingga memiliki
makna dan nilai bagi penerima informasi.
2.1.4 Pengertian Sistem Informasi
Menurut Satzinger (2005, p7), sistem informasi adalah
sekumpulan komponen terkait yang mengumpulkan, memproses,
menyimpan, dan menyediakan hasil (output) dari informasi yang
dibutuhkan untuk menyelesaikan tugas bisnis.
Menurut Turban (2008, p8), sistem informasi adalah proses
mengumpulkan, memproses, menyimpan, menganalisis, dan
menyebarkan informasi untuk tujuan tertentu.
12
Menurut Rainer (2011, p38-40), sistem informasi adalah
sebuah kerja sama dan kolaborasi antara beberapa komponen yang
ada agar dapat berkerja secara bersamaan dan sinergi untuk dapat
menghasilkan beberapa tindakan yang terdiri dari mengumpulkan,
memproses, menyimpan, menganalisis, dan menyebarkan informasi
yang ada dengan tujuan yang sudah ditetapkan sebelumnya.Rainer
juga mengutarakan bahwa dalam sistem informasi terdapat beberapa
komponen vital atau utama yang bergerak di dalamnya antara lain
sebagai berikut :
• Hardware
adalah sekumpulan perangkat keras (hardware) yang digunakan
untuk menerima data dan informasi, memprosesnya, dan
menampilkannya kembali.
• Software
adalah sekumpulan program yang dapat memberikan perintah
kepada perangkat keras (hardware) yang ada untuk melakukan
pemprosesan data.
• Database
adalah basis data yang berisikan sekumpulan file atau tabel yang
saling berhubungan antara satu sama lain dan di dalamnya
berisikan data tersebut.
• Network
adalah sebuah system penghubung yang dapat menggunakan kabel
(wireline) atau tidak menggunakan kabel sama sekali (wireless)
yang memiliki peranan penting dalam menghubungkan beberapa
13
komputer berbeda agar dapat berbagi sumber daya yang dimiliki
oleh satu sama lain.
• Procedures
adalah sebuah instruksi, aturan, dan prosedur yang berisikan
bagaimana cara untuk menggabungkan komponen-komponen di
atas dalam rangka melakukan kegiatan pemprosesan informasi dan
menghasilkan apa yang dibutuhkan.
• People
Adalah sumber daya manusia (SDM) yang akan mengoperasikan
perangkat keras (hardware) dan perangkat lunak (software), saling
berhubungan satu sama lain dan menggunakan hasil pemprosesan
tersebut.
Berdasarkan definisi di atas, dapat disimpulkan bahwa sistem
informasi terdiri dari beberapa proses penting yakni : pengumpulan
data, transformasi data, penyimpanan data, dan penyebaran data.
2.1.5 Database
2.1.5.1 Pengertian Database
Menurut Connolly dan Begg (2010, p65), database
adalah kumpulan data yang saling berhubungan satu sama lain
yang digunakan secara bersamaan, dan kumpulan data ini
didesain untuk memenuhi kebutuhan informasi suatu
perusahaan.
Menurut W.H Inmon (2005, p493), database
merupakan kumpulan data-data yang saling berhubungan yang
14
tersimpan (biasanya dengan redudansi yang terkendali dan
terbatas)berdasarkan suatu skema tertentu.Database dapat
digunakan untuk aplikasi tunggal maupun ganda.
Menurut Kelly (2006, p15), database adalah basis data
yang berisikan sekumpulan file atau tabel yang saling berkaitan
dan di dalamnya berisikan data.
Berdasarkan definisi di atas dapat disimpulkan bahwa
databaseadalah kumpulan data dalam bentuk file atau tabel yang
saling berhubungan, tersimpan berdasarkan skema tertentu, dan
digunakan untuk memenuhi kebutuhan informasi suatu
perusahaan.
2.1.5.2 Database Language
Di dalam sebuah aplikasi basis data memiliki
ketentuan-ketentuanyang berlaku dan harus diperhatikan oleh
pengguna (user), serta perancangan juga harus memperhatikan
penggunaan bahasa dalam sistem basis data.
2.1.5.2.1 Data Definition Language (DDL)
Menurut Connolly dan Begg (2010,p92), Data
Definition Language (DDL) didefinisikan sebagai bahasa yang
memungkinkan database administrator untuk menambahkan
dan menamakan entitas, atribut, dan hubungan yang dibutuhkan
dalam aplikasi, terkait dengan integritas dan kendala keamanan
dari aplikasi.
15
2.1.5.2.2 Data Manipulation Language (DML)
Menurut Connolly dan Begg (2010, p92), Data
Manipulation Language (DML) didefinisikan sebagai bahasa
yang menyediakan suatu fungsi agar dapat memanipulasi data-
data yang terdapat di dalam sebuah database.
2.1.5.3 Pengertian DBMS (Database Management System)
Menurut Connolly dan Begg (2010, p66), “Database
Management System (DBMS) is a software system that enables
users to define, create, maintain, and control access to the
database”. Yang dapat diartikan bahwa DBMS adalah
perangkat lunak (software) yang memungkinkan pengguna
(user) untuk mendefinisikan, membuat, memelihara dan
mengontrol akses terhadap database. Sebuah DBMS harus
menyediakan fasilitas sebagai berikut :
1. Mampu mendifinisikan database, biasanya melalui Data
DefinitionLanguage (DDL). DDL memungkinkan pengguna
(user)untuk menentukan tipe data, struktur, dan batasan
terhadap data yang akan disimpan ke dalam database.
2. Memungkinkan pengguna (user) untuk memasukkan
(insert), mengubah (update), menghapus (delete) dan
mengambil (retrieve) data dari database, biasanya melalui
Data Manipulation Language (DML). DML memungkinkan
pengguna (user)untuk melakukan query.
16
3. Menyediakan hak akses ke database. Sebagi contoh DBMS
dapat menyediakan :
a. Sistem keamanan yang memungkinkan untuk mencegah
user yang tidak berkepentingan untuk melakukan akses
terhadap database.
b. Sistem integrasi untuk menjaga konsistensi data yang
tersimpan.
c. Sistem kendali atau kontrol yang memungkinkan
database dapat diakses secara bersamaan.
d. Sistem pemulihan atau recovery yang memungkinkan
untuk dapat mengembalikan keadaan database ke
kondisi konsisten seperti semula jika terjadi kesalahan.
e. Sebuah katalog yang bisa diakses oleh pengguna (user)
yang di dalamnya terdapat deskripsi atau penjelasan dari
data yang terdapat di dalam database.
2.1.5.3.1 Fungsi DBMS
DBMS sangat bermanfaat bagi perusahaan dalam
menjalankan proses bisnisnya. Dengan adanya DBMS
perusahaan diharapkan mampu bersaing dengan perusahaan lain
pada era globalisasi seperti sekarang ini.Menurut Connolly dan
Begg (2010, p99-p104) fungsi DBMS adalah sebagai berikut :
� Penyimpanan, pengambilan, dan peng-update-an data
17
Sebuah DBMS harus dapat menyediakan suatu
kemampuan/fitur untuk menyimpan, mengambil, dan meng-
update data bagi pengguna (user) dalam sebuah DBMS.
� Katalog User-Accesible
Sebuah DBMS harus menyediakan sebuah katalog yang
menyimpan deskripsi tentang item data dan mudah diakses
oleh pengguna (user).
� Mendukung transaksi
Sebuah DBMS harus menyediakan mekanisme yang
memastikan setiap peng-update-an data dilakukan sesuai
dengan transaksi yang diberikan.
� Layanan kendali konkurensi
Sebuah DBMS harus menyediakan sebuah mekanisme
untuk memastikan bahwa basis data di-updatedengan
benar ketika banyak pengguna (user) melakukan update
basis data secara bersamaan.
� Layanan Perbaikan
Sebuah DBMS harus menyediakan sebuah mekanisme
untuk memperbaiki basis data ketika sebuah basis data
mengalami kerusakan (recovery).
� Layanan Autorisasi
Sebuah DBMS harus menyediakan sebuah mekanisme
untuk memastikan bahwa pengguna (user) memiliki
otoritas/hak untuk mengakses basis data.
� Mendukung komunikasi data
18
Sebuah DBMS harus mampu diintegrasikan dengan
perangkat lunak (software) komunikasi.
� Layanan Integritas
Sebuah DBMS harus mampu memastikan bahwa data di
dalam basis data tersimpan dengan baik dan perubahan
yang terjadi pada data harus mengikuti aturan tertentu
yang telah ditetapkan.
� Layanan peningkatan keterbatasan data
Sebuah DBMS harus memasukkan sebuah fasilitas
tambahan untuk mendukung keterbatasan program dari
struktur basis data yang sebenarnya agar menjadi lebih
lengkap.
� Layanan Utilitas
Sebuah DBMS harus dapat menyelesaikan seperangkat
layanan utilitas yang membantu database admin
mengelola basis data secara efektif.
2.1.5.3.2 Komponen DBMS
DBMS merupakan sebuah aplikasi perangkat lunak
(software) yang tentunya memiliki komponen-komponen
penting di dalamnya agar menjadi satu kesatuan di dalam
sebuah sistem.
Menurut Connolly dan Begg (2010, p68-71), terdapat
lima komponen yang sangat penting, yaitu :
1. Perangkat keras (Hardware)
19
DBMS dan aplikasinya membutuhkan perangkat keras
(hardware) untuk dapat mengoperasikannya. Perangkat
keras (hardware) tersebut dapat berupa PC, sebuah
mainframe, dan jaringan komputer. Sedangkan, jenis
perangkat keras tertentu tergantung pada kebutuhan
organisasi dan DBMS yang digunakan. Beberapa DBMS
hanya dapat bekerja pada perangkat keras atau sistem
operasi tertentu. DBMS membutuhkan jumlah minimum dari
main memory dan disk space untuk bekerja.
2. Perangkat Lunak (Software)
Komponen perangkat lunak terdiri dari software DBMS itu
sendiri dan program aplikasi yang dibutuhkan untuk
menjalankan sistem, termasuk network software jika
digunakan pada jaringan. Pada umumnya, program aplikasi
ditulis dalam bahas pemprograman 3GL, seperti C, C++,
Java, Visual Basic, Cobol, Fortran, Ada, atau Pascal, atau
menggunakan 4GL, seperti SQL yang di- embed dalam
generasi ketiga.
3. Data
Komponen terpenting dalam DBMS, terutama dalam sudut
pandang end-user, Data berperan sebagai jembatan
antarakomponen mesin dan komponen manusia. Basis data
memiliki data operasional dna metadata.
4. Prosedur
20
Merupakan instruksi atau aturan yang mengatur desain dan
penggunaan basis data. Pengguna system dan staf yang
mengatur basis data membutuhkan dokumentasi prosedur
untuk menjalankan atau mengoperasikan sistem. Instruksi-
instruksi tersebut, antara lain :
o Log on pada DBMS
o Menggunakan fasilitas DBMS tertentu atau aplikasi
program
o Memulai dan menghentikan DBMS
o Membuat salinan backup dari basis data
o Mengatasi kegagalan perangkat keras (hardware) dan
perangkat lunak (software). Termasuk prosedur untuk
mengidentifikasi komponen yang gagal, dan
mengembalikan basis data ke keadaan semula.
o Mengubah struktur dari tabel, mengatur ulang basis data
melalui multiple disks, meningkatkan performa, atau
menyimpan data pada secondary storage.
5. Manusia
Merupakan komponen yang terakhir yang terlibat dalam
sistem. Terdapat lima tipe komponen manusia yang terlibat
dalam sistem, yaitu Data Administrators, Database
Administrators, Database Designers, Application
Developers, dan End users.
21
2.1.6 Data Warehouse
2.1.6.1 Pengertian Data Warehouse
Menurut Turban (2011, p52), data warehouse adalah
kumpulan data yang dihasilkan untuk mendukung proses
pengambilan keputusan, tetapi juga dapat berfungsi sebagai tempat
penyimpanan data saat ini dan historikal data yang potensial bagi
manajer dalam organisasi.
Menurut W.H Inmon (2005, p495) data warehouse
merupakan kumpulan dari database yang memiliki sifat
berorientasi subjek, terintegrasi, yang dirancang untuk dapat
mendukung pengambilan keputusan dalam organisasi, dimana tiap
datanya berhubungan dengan suatu kejadian yang terjadi pada
suatu waktu tertentu.
Menurut Connolly dan Begg (2010,p1197), data warehouse
adalah kumpulan data yang berorientasi subjek, terintegrasi, time-
variant,dan non-volatile, yang mendukung proses pengambilan
keputusan dalammanajemen.
Berdasarkan teori di atas dapat disimpulkan, datawarehouse
adalah adalah kumpulan dari database yang berorientasi subjek,
terintegrasi, time-variant dan non-volatile, yang mendukung proses
pengambilan keputusan.
22
2.1.6.2 Karakteristik Data Warehouse
Menurut W.H Inmon (2005, p29), karakteristik dari data
warehouse adalah sebagai berikut
a) Subject Oriented (Berorientasi Subjek)
Data warehouse bersifat subject oriented artinya data
warehouse digunakan untuk menganalisa data berdasarkan
subjek-subjek tertentu dalam organisasi, bukan berorientasi
pada berbagai aplikasi tertentu, yang mempermudah
pengguna(user dalam melakukan pengambilan keputusan.
Beberapa perbedaan antara data primitif (data operasional) dan
data warehouse diantaranya sebagai berikut :
Tabel 2.1 Perbedaan antara Data Operasional dan Data
Warehouse
Data Operasional Data Warehouse
Berorientasi pada aplikasi Berorientasi subyek
Dapat berubah Tidak dapat berubah
Dapat diakses oleh sebuah unit
dalam satu waktu
Dapat diakses oleh sebuah set
unit dalam satu waktu
Jumlah data yang diproses kecil Jumlah data yang diproses
besar
Tidak ada redudancy data Ada redudancy data
Untuk komunitas karyawan Untuk komunitas manajer
23
Gambar 2.1 Karakteristik Data Warehouse : Subject Oriented
(Sumber : W.H Inmon, 2005, p30)
b) Integrated (Terintegrasi)
Data warehouse bersifat integrated artinya data
warehouse menyimpan data dari berbagai sumber berbeda
yang disimpan ke dalam suatu format yang konsisten dan data
tersebut terintegrasi satu sama lain, dimana data-data tersebut
merupakan suatu kesatuan sehingga tidak dapat dipecah-pecah.
Syarat integrasi sumber data dapat dipenuhi dengan
berbagaicara seperti konsistensi dalam penamaan dan ukuran
variabel, konsistendalam struktur pengkodean, dan konsisten
dalam atribut fisik daridata.
24
Gambar 2.2 Karakteristik Data Warehouse : Integrated
(Sumber : W.H Inmon, 2005, p31)
c) Non - volatile (Tidak dapat diubah)
Data warehouse bersifat non volatile, artinya data
warehousetidak dapat diubah. Pengguna (user) tidak dapat
mengubah data warehouseyang sudah ada. Berbeda dengan
database operasional yang memiliki tiga kegiatan operasi
sepertiinsert, update, dan delete, data warehousehanya
memiliki dua kegiatan yaitu loading dan akses data.
25
Gambar 2.3 Karakteristik Data Warehouse : Non volatile
(Sumber : W.H Inmon, 2005, p32)
d) Time Variant
Dalam OLTP, record yang ada merupakan record
terbaru sebab OLTP tidak menyimpan record-record yang lama
untuk mempercepat proses karena semakin sedikit data yang
disimpan maka waktu pemrosesan data semakin cepat. Lain
halnya dengan data warehouse yang berisi record-record yang
bersifat historis dan dapat tetap berada dalam sistem untuk
jangka waktu 5-10 tahun sehingga dapat digunakan sebagai
bahan analisis pengambilan keputusan. Tetapi, record yang
terlalu lama juga tidak efektif karena bisa memberikan hasil
analisa yang kurang sesuai dengan trend di masa mendatang.
Oleh karena itulah, data pada datawarehouse bersifat time
variant atau akurat pada periode tertentu.
Selain itu, data pada data warehouse dikatakan
memilikiperbedaan/rentang waktu (time variance) karena data
warehousejuga mempunyai dimensi waktu sehingga data
warehouse akuratselama periode waktu tertentu dan dapat
26
digunakan untukmempelajari trend dan perubahan. Hal ini
sangat berbeda dengan datapada OLTP, dimana data hanya
akurat untuk waktu sesaat setelahdiakses.Aspek yang
menunjukkan karakteristik time variant dalamdata warehouse
adalah sebagai berikut :
• Data warehouse merepresentasikan data untuk kurun waktu
5-10 tahun, sedangkan OLTP merepresentasikan data untuk
jangka waktu yang lebih singkat, yaitu sekitar 60-90 hari.
Karena aplikasi yang digunakan pada OLTP harus memiliki
waktu respon yang singkat maka data yang diproses harus
optimal.
• Setiap struktur data pada data warehouse mengandung
elemenwaktu seperti tahun, bulan, minggu, hari, dan
sebagainya.
• Data pada data warehouse merupakan serangkaian snapshot,
yaitu potongan data yang dikelompokkan sesuai dengan
urutan waktu.
Gambar 2.4 Karakteristik Data Warehouse : Time-variant
(Sumber : W.H Inmon, 2005, p32)
27
2.1.6.3 Anatomi Data Warehouse
Dalam menentukan bentuk dasar dari data warehouse yang
akan digunakan dalam perusahaan, terlebih dahulu kita harus
mengetahui kebutuhan informasi yang diperlukan oleh perusahaan.
Data warehouse terdiri atas tiga jenis dasar sistem, yaitu :
1. Data warehouse fungsional (Functional Data Warehouse)
Data warehouse fungsional dibangun berdasarkan
kebutuhan informasi dari tiap bagian fungsi bisnis perusahaan.
Data warehouse fungsional merupakan pendekatan yang
digunakan untuk membangun suatu sistem data warehouse
dengan biaya investasi yang rendah. Keuntungan dari bentuk
ini adalah sistem mudah dibangun dengan biaya yang relatif
murah sedangkan kerugiannya adalah resiko kehilangan
konsistensi data dan terbatasnya kemampuan dalam
pengumpulan data bagi pengguna (user).
Gambar 2.5 Data Warehouse Fungsional
(Sumber : http://zhang90.files.wordpress.com/2010/12/data-ware-house.ppt)
28
2. Data warehouse terpusat (Centralized Data Warehouse)
Data warehouse terpusat dibangun dari data operasional
yang dikumpulkan dalam pusat penyimpanan data yang
digunakan oleh pengguna untuk membangun data warehouse
fungsional masing-masing.
Menurut W.H Inmon (2005, p193), kebanyakan
organisasi membangun dan memelihara lingkungan data
warehouse terpusat yang tunggal. Pengaturan ini masuk akal
karena alasan sebagai berikut :
a. Data di dalam data warehouse saling terintegrasi antar
cabang perusahaan dengan pusat dan gambaran integrasi
tersebut hanya terdapat pada kantor pusat.
b. Perusahaan beroperasi pada model bisnis terpusat
c. Volume dari data dalam data warehouse seperti tempat
penyimpanan yang bersifat tunggal dan terpusat
d. Sekalipun data dapat terintegrasi dan diedarkan antar area
lokal yang beragam, data tersebut akan tidak praktis untuk
diakses. Keuntungan dari bentuk ini adalah data benar-benar
terpadu karena konsistensinya yang tinggi sedangkan
kerugiannya adalah biaya yang mahal serta perlu waktu
yang cukup lama dalam membangun bentuk ini.
29
Gambar 2.6 Data Warehouse Terpusat
(Sumber :http://zhang90.files.wordpress.com/2010/12/data-ware-house.ppt)
3. Data warehouse terdistribusi (Distributed Data Warehouse)
Perusahaan yang memiliki cabang tersebar di seluruh
dunia membutuhkan informasi yang mencakup tidak hanya
wilayah lokal saja tetapi juga wilayah global. Global data
warehouse membutuhkan informasi terpadu dari data
warehouse tempat infomasi dikumpulkan. Disamping itu, ada
kebutuhan yang lain untuk data warehouse yang terpisah di
setiap cabang perusahaan. Dalam kasus ini, menurut W.H
Inmon (2005, p193), data warehouse terdistribusi dibutuhkan.
Tiga tipe dari data warehouse terdistribusi :
a. Data warehouse yang terdistribusi secara geografi terdiri
dari data warehouse lokal dan data warehouse global.
30
b. Data warehouse yang terdistribusi dalam banyak prosesor,
secara logis ada satu data warehouse tetapi secara fisiknya
ada banyak data warehouse yang saling berhubungan.
c. Data warehouse yang tumbuh dalam sumber yang tidak
terkoordinasi. Keuntungan dari bentuk ini adalah kelebihan
dalam mengakses data dari luar perusahaan yang telah
mengalami sinkronisasi terlebih dahulu dan tetap terjaga
konsistensinya, namun kerugian dari bentuk ini adalah
bentuk yang paling mahal dan kompleks untuk diterapkan,
karena sistem operasinya dikelola secara terpisah.
Gambar 2.7 Data Warehouse Terdistribusi
(Sumber :http://zhang90.files.wordpress.com/2010/12/data-ware-house.ppt)
31
2.1.6.4 Arsitektur Data Warehouse
Menurut Kimball dan Ross, arsitektur data warehouse
digambarkan sebagai berikut :
Berdasarkan gambar arsitektur data warehouse di atas
dijelaskan sebgaai berikut :
1. Program/Project Planning and Management
Menurut Kimball dan Ross (2010, p98), kotak pertama pada
roadmap berfokus pada memulai program/proyek yang dijalankan
termasuk assessing readiness, justification, scooping, dan staffing.
Pada seluruh daur hidup, program dan manajemen proyek yang
terus menerus membuat aktivitas tetap pada jalurnya.
Menurut Kimball dan Ross (2002, p334-337), perencanaan
proyek terbagi menjadi lima kegiatan, yaitu :
a. Assessing Readiness
Sebelum bergerak maju dengan pengeluaran data warehouse
yang signifikan, akan lebih bijaksana terlebih dahulu menilai
kesiapan organisasi untuk melanjutkannya. Ada 5 faktor yang
menjadi indikator kesiapan organisasi yaitu :
� Sponsor bisnis yang kuat
� Memiliki motivasi bisnis yang menarik dan kuat dalam
membangun data warehouse.
� Kelayakan
� Hubungan bisnis dengan organisasi IT
� Budaya analisis yang sekarang berjalan dalam perusahaan.
32
b. Scoping
Setelah organisasi siap, langkah berikutmya adalah
memberikan batasan disekitar proyek yang akan dilaksanakan.
Scoping membutuhkan gabungan input yang baik dari
organisasi IT maupun manajemen bisnis. Scope atau ruang
lingkup dari data warehouse harus memiliki arti atau nilai bagi
organisasi dan dapat diatur.
c. Justification
Justification memerlukan perkiraan keuntungan dan biaya
terkait dengan data warehouse. IT biasanya bertanggung jawab
dalam menentukan pengeluaran. Perkiraan biaya dibutuhkan
untuk pengadaan hardware dan software.
d. Staffing
Proyek data warehouse membutuhkan integrasi dari tim cross
– functional dengan sumber daya dari bisnus dan komunitas
IT. Penugasan dari sumber daya manusia untuk mengisi peran
tersebut tergantung pada besarnya dan cakupan dari proyek,
maupun ketersediaan, kapasitas, dan pengalaman individu.
e. Developing and Maintaining the Project Plan
Mengembangkan suatu proyek data warehouse melibatkan
pengidentifikasian setiap pekerjaan yang penting dalam
mengimplementasikan data warehouse. Sumber daya tersebut
banyak tersedia di pasar untuk membantu menyusun daftar
pekerjaan proyek.
33
2. Business Requirements Definition
Menurut Menurut Kimball dan Ross (2010:98), memunculkan
kebutuhan bisnis merupakan tugas utama dalam Kimball Lifecycle
karena temuan ini mendorong sebagian besar keputusan upstream
dan downstream. Kebutuhan dikumpulkan untuk menentukan
faktor kunci yang mempengaruhi bisnis dengan berfokus pada apa
yang dilakukan oleh pengguna bisnis (atau apa yang akan
dilakukan di masa mendatang), daripada bertanya “apa yang anda
inginkan dalam data warehouse?” Kesempatan utama di seluruh
perusahaan diidentifikasi, diberikan prioritas berdasarkan pada
nilai bisnis dan kelayakan, kemudian rincian kebutuhan
dikumpulkan untuk iterasi pertama dari pembangunan sistem
DW/BI.
Menurut Kimball dan Ross(2002:341-346), business requirement
dapat terbagi menjadi tiga kegiatan, yaitu:
a. Requirements Preplanning
Sebelum bertemu dengan komunitas bisnis untuk
mengumpulkan kebutuhan, sebaiknya dilakukan pembahasan
secara produktif dengan mempertimbangkan hal-hal berikut:
• Choose the Forum
Pengumpulan requirement pada saat menemui perwakilan
pengguna bisnis sementara serta para pakar sistem dan ahli
permasalahan yang ada. Langkah dua arah ini memberikan
wawasan pada dua kebutuhan bisnis dalam hubungannya
dengan kenyataan data.
34
• Identify and Prepare the Requirements Team
Pada tahap ini akan dilakukan pengidentifikasian dan
persiapan anggota tim proyek yang akan terlibat.
• Select, Schedule, and Prepare Business Representatives
Pada tahap ini diperlukan berbicara pada pengusaha yang
mewakili wawasan di seluruh organisasi secara horizontal.
Cakupan ini sangat penting untuk memformulasi blue print
pada data warehouse bus.
b. Collecting and Business Requirements
Pada saat mengumpulkan kebutuhan bisnis biasanya proses
berjalan mengalir dimulai dari perkenalan, pertanyaan secara
terstruktur, sampai dengan penarikan kesimpulan (wrap up).
• Launch
Tanggung jawab untuk melakukan wawancara harus
dipersiapkan terlebih dahulu. Diharuskan berfokus pada
tujuan proyek dan wawancara, tetapi tidak berbicara
berlebihan tentang hardware, software, dan jargon-jargon
teknis.
• Interview Flow
Tujuan dari wawancara adalah mendapatkan pengguna
berbicara tentang apa yang mereka lakukan dan apa yang
mereka inginkan. Mewawancarai orang yang memiliki
pengalaman, terutama pada penanganan data sehingga
memungkinkan mengerti tentang dimensionalitas dari
bisnis.
35
• Wrap – Up
Menarik kesimpulan dengan bertanya pada narasumber
tentang kriteria kesuksesannya pada proyek tersebut.
• Conducting Data-Centric Interviews
Selain memahami kebutuhan bisnis, kita perlu menyisihkan
waktu untuk berbicara dengan ahli data pada sistem sumber
atau ahli subjek untuk menilai kelayakan mendukung
kebutuhan bisnis.
c. Postcollection Documentation and Follow-up
Setelah melakukan wawancara, pewawancara harus
melakukan wawancara ulang. Hal ini untuk memastikan
bahwa memiliki pemahaman yang sama. Selain itu, perlu
dilakukan pemeriksaan laporan-laporan untuk mendapat
pemahaman lebih tentang dimensionalitas yang harus
didukung data warehouse.
Prioritization and Consensus
Setelah berbagai informasi dan dokumen terkumpul,
dibutuhkan penetapan prioritas dari setiap requirement yang
didapatkan dengan mempertimbangkan dampaknya bagi bisnis
serta kelayakannya.
3. Technology Track
Lingkungan DW/BI mewajibkan adanya integrasi dari banyak
teknologi, penyimpanan data, dan metadata terkait. Technology
track dimulai dari desain arsitektur sistem untuk menetapkan
36
daftar belanja dari kemampuan yang dibutuhkan, dilanjutkan
dengan pemilihan dan instalasi produk untuk memenuhi
kebutuhan arsitektur.
Menurut Kimball dan Ross(2002:347-352), technology track
dapat terbagi menjadi dua kegiatan, yaitu :
a. Technical Architecture Design
Technical Architecture Design merupakan blue print dari
layanan teknis dan unsur-unsur data warehouse. Rencana
arsitektur melayani sebagai framework pengorganisasian
untuk mendukung integrasi teknologi. Arsitektur teknis terdiri
dari serangkaian model yang mempelajari pada detail yang
lebih besar mengenai setiap komponen utama.
b. Product Selection and Installation
Setelah menyusun perencanaan arsitektur, akan dilakukan
pemilihan produk yang sesuai dengan framework yang
direncanakan untuk menyampaikan fungsionalitas yang
penting. Tugas dalam pemilihan produk biasanya berjalan
dalam fase yang cepat karena sebagian besar konsep evaluasi
dapat diterapkan pada setiap pilihan teknologi.
4. Data Track
Menurut Kimball dan Ross (2010:98), data track dimulai
dengan merancang sasaran dari model dimensional untuk
memenuhi kebutuhan bisnis, dengan tetap mempertimbangkan
data pokok yang sebenarnya.
37
Model dimensional diubah menjadi rancangan fisik saat
strategi penyesuaian kinerja dipertimbangkan, lalu tantangan
rancangan dan pembangunan sistem Extract, Transform, Load
(ETL) ditangani.
Menurut Kimball dan Ross (2002:353), data track dapat
terbagi menjadi tiga kegiatan, yaitu :
a. Dimensional Modelling
Menurut Kimball dan Ross, (2010:211), dimensional
modeling dapat dilakukan melalui sembilan langkah sebagai
berikut:
1. Choose the process (memilih proses)
Menurut Kimball dan Ross (2010:211), langkah
pertama dalam dimensional modeling adalah pemilihan
proses, dimana proses merupakan aktivitas operasional
tertentu. Proses bisnis pada area subjek yang harus dipilih
adalah yang paling bersentuhan dengan masalah keuangan.
Proses yang dibuat juga harus menjawab pertanyaan bisnis
yang penting dan paling banyak diakses dari sudut
pandang ekstraksi data.
2. Choose the grain (memilih grain)
Menurut Kimball dan Ross (2010:211), memilih grain
berarti menentukan secara pasti apa yang akan diwakili
oleh tiap record pada tabel fakta.
3. Identify and conform the dimensions (mengidentifikasi
dan menyesuaikan dimensi)
38
Menurut Kimball dan Ross (2010:211), dimensi
merupakan sumber bagi constraint pada query dan baris
header pada laporan bagi pengguna. Dimensi memuat
kamus perusahaan bagi pengguna. Dimensi yang dibuat
dengan baik akan membuat model mudah dimengerti dan
mudah digunakan.
4. Choose the facts (memilih fakta)
Menurut Kimball dan Ross (2010:213), grain dari tabel
fakta menentukan fakta mana yang dapat digunakan untuk
proses bisnis tertentu. Semua fakta harus diekspresikan
pada tingkatan yang sama.
5. Store pre-calculations in the fact table (menyimpan pre-
calculation di tabel fakta)
Menurut Kimball dan Ross (2010:213), setelah tabel fakta
telah dibuat, perlu dilakukan pengujian ulang untuk
masing-masing fakta, apakah ada kemungkinan melakukan
prekalkulasi. Fakta hasil kalkulasi sebaiknya disimpan ke
dalam tabel fakta untuk meningkatkan kinerja hasil query.
6. Round out the dimension tables (melengkapi tabel
dimensi)
Menurut Kimball dan Ross (2010:214), pada titik ini tabel
fakta telah lengkap, dan peran tabel dimensi dalam
menyediakan dukungan bagi tabel fakta melalui constraint
pada atribut dimensional dapat dipahami. Pada tahap ini
39
dapat ditambahkan deskripsi berbentuk teks sebanyak
mungkin ke dalam dimensi.
7. Choose the duration of database (memilih durasi
database)
Menurut Kimball dan Ross (2010:215), durasi mengukur
seberapa jauh waktu yang akan digambarkan dalam tabel
fakta. Dalam banyak bisnis, perlu melihat periode waktu
yang sama seperti tahun sebelumnya.
8. Determine the need to track slowly changing dimensions
(menentukan kebutuhan untuk melacak perubahan
dari dimensi secara perlahan)
Menurut Kimball dan Ross (2010:215), deskripsi yang
tepat dari produk dan pelanggan lama harus digunakan
untuk histori transaksi lama. Data warehouse harus
menetapkan key yang digeneralisasi pada dimensi yang
penting ini dengan tujuan untuk menghilangkan snapshot
berulang dari pelanggan dan produk selama rentang waktu
tersebut.
9. Decide the physical design (menetapkan rancangan
fisik)
Menurut Kimball dan Ross (2010:211), setelah melakukan
delapan langkah sebelumnya, dan melengkapi logical
40
design, berikutnya perlu dilakukan physical design. Pada
tahap ini dilakukan proses seperti mengurutkan tabel fakta
dalam media penyimpanan, serta menampilkan rangkuman
dan agregasi yang telah ditentukan sebelumnya. Selain itu,
physical design juga menyangkut administrasi, backup,
indexing, dan keamanan.
b. Physical Design
Menurut Kimball dan Ross (2002:355), model dimensional
yang telah dibangun pada bagian sebelumnya perlu
diterjemahkan ke dalam physical design. Dalam dimensional
modeling, logical dan physical design memiliki kemiripan
yang sangat dekat.
• Aggregation Strategy
Menurut Kimball dan Ross (2002:356), setiap data
warehouse harus memuat tabel agregasi yang dihitung dan
disimpan terlebih dahulu. Setiap agregasi tabel fakta harus
menempati tabel fakta fisikalnya sendiri.
• Initial Indexing Strategy
Menurut Kimball dan Ross (2002:357), tabel dimensi akan
memiliki index yang unik pada primary key kolom tunggal.
Tabel fakta merupakan raksasa dalam data warehouse, jadi
perlu memberikan index secara berhati-hati. Primary key
dari tabel fakta hampir selalu berupa sekumpulan dari
foreign key. Biasanya kita perlu menempatkan index
gabungan secara tunggal pada dimensi utama dari tabel
41
fakta. Karena banyak query dimensional diwakili oleh
dimensi waktu, maka foreign key waktu harus menjadi
index term utama.
c. ETL Design and Development
Aktivitas terakhir dari data track adalah merancang dan
mengembangkan staging atau sistem ETL, yang terdiri dari:
• Dimension Table Staging
Menurut Kimball dan Ross (2002:359), karena tabel
dimensi perlu selaras dan dapat digunakan kembali untuk
tiap model dimensional, secara khusus mereka memiliki
pengaruh yang lebih terpusat. Pengaruh dimensi
bertanggung jawab untuk menentukan, memelihara, dan
menyebarkan dimensi tertentu untuk data mart yang tepat.
Dimensi dapat diproses secara bersamaan. Tetapi semua
dimensi yang terlibat dalam skema harus dimasukkan
terlebih dahulu ke staging dari data fakta.
Staging tabel dimensi melibatkan langkah-langkah berikut :
a. Mengekstrak data dimensional dari sumber sistem
operasional
b. Membersihkan nilai atribut
c. Mengatur penugasan surrogate key
• Fact Table Staging
Menurut Kimball dan Ross (2002:361-362), pada saat tabel
dimensi direplikasi ke semua data mart yang sesuai, tabel
42
fakta secara tegas tidak digandakan. Dengan data
warehouse bus architecture, batasan disekitar tabel fakta
didasarkan pada sumber proses bisnis, bukan garis
organisasi.
Dalam staging tabel fakta dilakukan langkah-langkah :
a. Mengekstrak data dari sumber sistem operasional
b. Menerima update dimensi dari penanggung jawab
dimensi
c. Memisahkan data fakta sesuai granularitas yang
dibutuhkan
d. Mengubah data fakta sesuai kebutuhan
e. Mengganti key sumber operasional dengan surrogate
key
f. Menambahkan key tambahan untuk konteks yang
diketahui,
g. Memastikan kualitas data tabel fakta,
h. Membangun atau memperbaharui agregasi tabel fakta,
i. Bulk load data,
j. Memberi tahu pengguna bahwa tabel fakta siap
digunakan.
5. Business Intelligence Track
Menurut Kimball dan Ross (2010:99), pada saat beberapa
anggota proyek berkonsentrasi pada teknologi dan data, anggota
lain berfokus untuk mengidentifikasi dan membangun aplikasi BI
43
dengan cakupan yang besar, termasuk laporan standar, query
berparameter, dashboard, scorecard, model analisis, dan aplikasi
data mining, bersamaan dengan navigasi interface yang
berhubungan.
Menurut Menurut Kimball dan Ross (2002:363-364), business
intelligence track dapat terbagi menjadi dua kegiatan, yaitu:
a. Analytic Application Specification
Sebelum mulai mendesain aplikasi, akan sangat membantu
jika designer menetapkan standar aplikasi, seperti menu pull-
down dan tampilan serta output yang konsisten. Dengan
menggunakan standar, kita perlu menentukan template tiap
aplikasi, merekam informasi yang cukup tentang tata letak,
variable input, perhitungan, dan istirahat sehingga baik
pengembang aplikasi maupun perwakilan bisnis memiliki
pemahaman yang sama. Tahap ini perlu menentukan struktur
alur navigasi untuk mengakses aplikasi, menggambarkan cara
pengguna berpikir tentang bisnis mereka.
b. Analytic Application Development
Saat berpindah pada fase pengembangan dari analisis aplikasi,
diperlukan fokus pada standar (seperti yang telah ditetapkan
pada Analytic Application Specification). Standar untuk
konvensi penamaan, perhitungan, libraries, dan coding harus
ditetapkan untuk mengurangi mengulang pekerjaan di masa
mendatang. Aktivitas pengembangan aplikasi dapat dilakukan
44
setelah desain database, tools akses data dan metadata telah
diterapkan, dan data historis telah dimasukkan.
6. Deployment, Maintenance and Growth
Menurut Kimball dan Ross (2002:364), jalur teknologi, data, dan
analisis aplikasi akan bertemu pada deployment. Deployment
tidak akan terjadi secara alami, tetapi membutuhkan perencanaan
terlebih dahulu. Menurut Kimball dan Ross (2002:365-366),
setelah melewati tahap deployment, diharuskan tetap
menginvestasikan sumber daya di beberapa area seperti support,
pendidikan, dukungan teknis, dan dukungan program.
Menurut Connolly dan Begg (2010, p1204), arsitektur data
warehouse dapat digambarkan sebagai berikut :
Gambar 2.8Arsitektur Data Warehouse
45
Sumber : Thomas Connolly, C. B. (2010). Database Systems : A
Practical Approach To Design, Implementation, and
Management Fifth Edition
Berdasarkan gambar arsitektur data warehouse menurut Connolly
dan Begg (2010), komponen arsitektur data warehouse dijelaskan
sebagai berikut:
1. Operational data source
Sumber data untuk data warehouse dapat berasal dari :
• Mainframe data operasional yang berada pada tingkatan database
dan jaringan database generasi pertama dimana sebagian besar
data operasional perusahaan disimpan pada sistem tersebut.
• Data departemen yang berada pada sistem file DBMS relasional
(seperti Oracle, SQL Server).
• Data pribadi atau private data yang berada pada server dan
workstation pribadi.
• Berbagai sistem eksternal seperti internet, database yang tersedia
secara komersil, dan database yang berhubungan dengan supplier
atau pemasok dan pelanggan perusahaan.
2. Operational data store(ODS)
Sebuah Operational data store (ODS) merupakan sebuah tempat
penyimpanan data operasional yang sedang terjadi dan
terintegrasi, yang digunakan untuk memenuhi kebutuhan
analisa. ODS mempunyai struktur dan sumber data yang sama
dengan data warehouse dan memiliki peran sebagai tempat
46
penyimpanan sementara data sebelum dipindahkan ke data
warehouse. Data yang telah diekstrak dari sumber sistem dan
telah dibersihkan kemudian akan disimpan di dalam ODS.
3. ETL Manager
ETL Manager dapat melakukan berbagai kegiatan operasi yang
berhubungan dengan proses ETL dari data ke dalam data
warehouse.
4. Warehouse Manager
Warehouse manager melakukan seluruh operasi yang
berhubungan dengan kegiatan manajemen data pada data
warehouse. Operasi-operasi tersebut meliputi :
a. Analisa terhadap data untuk menjaga konsistensi data;
b. Melakukan transformasi dan penggabungan sumber data dari
tempat penyimpanan sementara menjadi tabel-tabel data
warehouse;
c. Membuat atau menghasilkan indeks-indeks dan tampilan-
tampilan (views) berdasarkan tabel-tabel dasar;
d. Melakukan denormalisasi (jika dibutuhkan);
e. Melakukan agregasi;
f. Melakukan backup dan pengarsipan data.
5. Query Manager
Query manager dapat melakukan semua operasi yang
berhubungan dengan manajemen query dari pengguna (user).
Tingkat kesulitan dari query manager dapat diukur dengan
47
fasilitas yang disediakan oleh alat pengaksesan pengguna (end-
user access tools) dan database.
6. Detailed Data
Detailed data merupakan area dari data warehouse yang
menyimpan seluruh detil data dalam skema database. Secara
periodik detil data ditambahkan ke dalam data warehouse untuk
mendukung kegiatan agregasi data.
7. Lightly dan highly summarized data
Komponen ini menyimpan semua data yang diringkas oleh data
warehouse manager dengan tujuan untuk mempercepat
performa dari query data. Tujuan dari informasi yang telah
diringkas adalah untuk meningkatkan kinerja proses query.
Ringkasan data akan diperbaharui secara terus – menerus
sebagai data baru yang dimasukkan ke dalam data warehouse.
8. Achive/ backup data
Achive/backup data merupakan area dari data warehouse yang
menyimpan detailed dan summarized data dengan tujuan untuk
menyimpan dan melakukan backup data.
9. Metadata
Metadata merupakan area dalam data warehouse yang
menyimpan semua definisi metadata yang digunakan untuk
semua proses dalam data warehouse. Metadata digunakan untuk
beberapa tujuan antara lain :
� Proses ekstraksi dan memasukkan data
48
Metadatadigunakan untuk memetakan sumber data ke dalam
sudut pandang umum data yang berada dalam data
warehouse.
� Proses manajemen data warehouse
Metadata digunakan untuk melakukan otomatisasi
pembuatan tabel ringkasan (summary).
� Bagian dalam proses manajemen query
Metadata digunakan untuk mengarahkan query menuju
sumber data yang sesuai.
10. End-User Access Tools
Tujuan utama dari data warehouse adalah untuk mendukung
pembuat keputusan (decision makers) dengan menyediakan
informasi yang akurat. Para pengguna (user) berinteraksi dengan
data warehouse menggunakan End-User access tools,
diantaranya seperti :
• Reporting and Query Tools
Peralatan laporan meliputi alat membuat laporan dan
alat untuk menulis laporan. Alat query pada data warehouse
relasional yang dirancang untuk menerima SQL atau
menciptakan pernyataan SQL untuk melakukan query data
yang tersimpan dalam data warehouse.
• Application Development Tools
Seringkali kebutuhan pengguna (user) akan laporan
dan alat untuk melakukan query masih dinilai belum cukup
untuk mendukung aplikasi yang sudah ada sebelumnya.
49
Oleh sebab itu, harus dibangun sebuah aplikasi yang dapat
mendukung graphical data access tools dan biasanya
dikembangkan untuk lingkungan client-server.
• Executive Information System Tools (EIS)
Executive Information System, dikembangkan dengan
tujuan untuk mendukung pembuatan keputusan tingkat
eksekutif. EIS tools berhubungan dengan mainframe
pengguna (user) untuk membangun kebiasaan-kebiasaan,
aplikasi grafik pendukung keputusan untuk menyediakan
sebuah gambaran mengenai data-data dalam perusahaan
atau organisasi dan akses ke sumber data luar.
• Online Analytical Processing Tools (OLAP)
Online Analytical Processing Tools (OLAP)
didasarkan pada konsep database multidimensional dan
mendukung pengguna (user) untuk dapat menganalisis data
yang kompleks dengan sudut pandang multidimensional.
• Data Mining Tools
Data Mining merupakan sebuah proses pencarian dan
menjelajah hubungan baru yang memiliki arti, mencari pola
dan tren dengan cara menampung sejumlah data yang besar
dengan menggunakan teknik statistical, matematik, dan
artificial intelligence.
50
Menurut Suparto Darudiato (2008,p61), arsitektur data
warehouse dibagi menjadi 3 komponen, yaitu :
• Data warehouse yang mencakup data dan perangkat lunak
yang terkait;
• Perangkat lunak akuisisi data (back-end) yang mengekstraksi
data dari sumber legacy dan sumber eksternal, memperkuat
dan meringkasnya, dan memuatnya ke dalam data warehouse;
• Perangkat lunak klien (front-end) yang mengizinkan para
pengguna untuk mengakses dan meneliti data pada data
warehouse.
Gambar 2.9Arsitektur Data Warehouse
(Sumber : Suparto Darudiato (2008, p62)
Berdasarkan gambar aristektur data warehouse di atas, proses
dimulai dengan melakukan ekstraksi data dari basisdata
operasional dan sumber data eksternal, dibersihkan
51
untukmeminimalisasi error dan mengisikan informasi yang kurang
jika dimungkinkan, danditransformasikan untuk memperbaiki
ketidakcocokan semantik. Loading data terdiri
darimematerialisasikan view dan menyimpannya dalam warehouse.
Oleh karena itu, berbeda dengan viewstandar dalam DBMS
relasional, view disimpan dalam warehouse yang berbeda dari
basisdata yangterdapat dalam tabel yang didefinisikan.
Kemudian, data yang dibersihkan dan ditransformasikan
akhirnya di-load ke dalam warehouse.Pengolahan awal tambahan,
misalnya sorting dan pembuatan informasi ringkasan dilakukan
padatingkat ini. Data dipartisi dan indeks dibuat demi efisiensi.
Berkaitan dengan volume data yang besar,loading merupakan
proses yang lambat. Loading terabyte data secara berurutan
memerlukan waktudalam hitungan minggu dan loading gigabyte
memerlukan waktu berjam-jam. Oleh karena itu,paralelisme perlu
untuk loading warehouse.
Setelah data di-load ke dalam warehouse, pengukuran
tambahan harus dilakukan untukmenjamin data dalam warehouse
di-refresh secara periodik untuk merefleksikan pembaruan
sumberdata dan secara periodik membuang data lama. Tugas
penting dalam mengatur warehouse adalahmencatat data yang
sedang disimpan di dalamnya, pembukuan itu dilakukan dengan
menyimpaninformasi tentang data warehouse dalam katalog
sistem. Katalog sistem yang berhubungan denganwarehouse sangat
52
besar dan sering disimpan dan diatur dalam basisdata terpisah yang
disebutrepository metadata.
Nilai warehouse pada akhirnya berada dalam analisis yang di-
enable-nya. Data dalamwarehouse biasanya diakses dan dianalisis
menggunakan berbagai alat, termasuk mesin query
OLAP,algoritma data mining, alat visualisasi informasi, paket
statistik, dan report generator.
2.1.6.5 Struktur Data Warehouse
Menurut W.H Inmon (2005, p33), data yang ada dalam data
warehouse maupun perubahan data yang di dalamnya berasal dari
lingkungan database operasional dimana data akan mengalami
transformasi yang diperlukan dalam proses perpindahannya.
Apabila data yang ada dalam data warehousesudah kadaluarsa atau
menua (data yang lama) maka data tersebut akan berpindah dari
current level of detail ke older level of detail.Jika data telah
diringkas maka data akan berpindah dari current level of detail ke
level of lightly summarized data dan selanjutnya akan berpindah ke
level of highly summarized data.Struktur data warehouse
digambarkan pada gambar dibawah ini :
53
Gambar 2.10 Struktur Data Warehouse
(Sumber : W.H Inmon, 2005, p34)
Menurut Vikas R. Agrawal (2005, p13), tingkatan-
tingkatan data menurut perbedaan pada tingkatan ringkasan data
(summary data) dan umur data warehouse dijelaskan sebagai
berikut :
• Current Detail Data (detil data sekarang)
Current Detail Data adalah detil data yang aktif pada masa
sekarang, yang merupakan level terendah dari data warehouse
serta mencerminkan keadaan data warehouse yang sedang
berjalan. Current Detail Data biasanya membutuhkan tempat
penyimpanan yang cukup besar.
• Old Detail Data (detil data historis)
54
Old Detail data merupakan data historis yang dapat berupa hasil
backup yang disimpan dalam media penyimpanan (storage)
yang terpisah dan dapat diakses sewaktu-waktu ketika
dibutuhkan. Penyusunan direktori dari data ini harus dapat
menggambarkan umur dari data dengan tujuan untuk
memudahkan pengaksesan kembali ketika dibutuhkan.
• Highly Summarized Data (ringkasan data level tinggi)
Highly Summarized Data merupakan hasil ringkasan data yang
bersifat total atau menyeluruh dan mudah untuk diakses.
Digunakan untuk melakukan analisa perbandingan data
berdasarkan urutan waktu dan analisa yang menggunakan data
multi dimensi. Database multi dimensi merupakan sebuah
teknologi perangkat lunak computer yang dirancang untuk
meningkatkan efisiensi dalam melakukan pencarian tabel atau
query sehingga media penyimpanan menjadi lebih baik, serta
memudahkan pengambilan data dalam jumlah yang besar.
• Lightly Summarized Data (ringkasan data level menengah)
Lightly Summarized Data merupakan ringkasan dari detil data
namun belum bersifat total summary. Data-data ini memiliki
tingkatan yang lebih tinggi dan mendukung kebutuhan dari data
warehouse pada tingkat departemen. Tingkatan data ini juga
disebut dengan data mart. Akses terhadap data jenis ini banyak
digunakan untuk view dari suatu kondisi yang sedang dan sudah
berjalan.
• Metadata
55
Menurut W.H Inmon (2005, p102), metadata (atau
data mengenai data) adalah komponen terpenting di dalam
lingkungan data warehouse, yang merupakan sebuah bagian dari
aturan pemprosesan informasi dimana jika masih terdapat
program dan data. Dalam lingkungan data warehouse, metadata
memiliki tingkat kepentingan yang berbeda, karena metadata
memungkinkan cara penggunaan data warehouse yang paling
efektif.
Metadata menungkinkan end-user atau DSS analyst
untuk melakukan navigasi melalui kemungkinan-kemungkinan
yang ada di dalam metadata tersebut.
Di lain pihak, ketika pengguna (user) melakukan
pendekatan terhadap data warehouse yang tidak memiliki
metadata, maka pengguna (user) tidak tahu harus memulai
analisis dari mana. Pengguna harus mencari tahu terlebih dulu
di dalam data warehouse data apa saja yang tidak terdapat di
dalamnya sehingga banyak waktu akan terbuang sia-sia. Bahkan
setelah pengguna berhasil mencari tahu, tetap tidak ada jaminan
bahwa dia akan menemukan data yang benar atau
menerjemahkan data tersebut dengan benar. Dengan bantuan
metadata maka end-user dapat langsung menemukan data yang
dibutuhkan atau dapat mengetahui ada tidaknya data tersebut.
Jadi dapat disimpulkan bahwa metadata berperan seperti daftar
isi dalam sebuah buku.
56
Ada beberapa item dalam penyimpanan metadata
sebagai berikut :
• Struktur dari data yang dapat digunakan oleh programmer;
• Struktur dari data yang dapat digunakan oleh DSS Analyst;
• Sumber data yang mendukung data warehouse;
• Transformasi data didalam perpindahan ke data warehouse;
• Model data;
• Hubungan antara model data dan data warehouse;
• Catatan dari penggunaan data (History of Extracts)
Metadata menyimpan informasi yang penting mengenai data
dalam data warehouse yang berfungsi sebagai :
1. Direktori yang akan digunakan oleh user dalam mencari lokasi
dalam data warehouse.
2. Suatu panduan untuk summary data dari detail data menjadi
lightly summarized data, kemudian menjadi highly summarized
data.
3. Merupakan penuntun pemetaan (mapping) dalam proses
transformasi dari operasional ke data warehouse.
Karena data warehouse harus bersifat multi fungsional atau
harus dapat melayani banyak fungsi, maka metadata penting
untuk menjawab berbagai kebutuhan dari suatu fungsi tertentu,
karena setiap departemen dalam sebuah perusahaan biasanya
menggambarkan struktur data yang spesifik walaupun data
tersebut berasal dari sumber yang sama.
57
2.1.6.6 Kegiatan Inti Data Warehouse
Kegiatan inti data warehouse digunakan untuk melakukan
kegiatan analisa dan pelaporan informasi bagi pihak eksekutif
perusahaan, maka dalam melakukan perancangan data warehouse,
terdapat beberapa kegiatan inti yang harus ada di dalamnya.
Kegiatan-kegiatan inti tersebut antara lain:
• Memperoleh dan menggabungkan data
Memperoleh data dari berbagai sumber dan melakukan
penggabungan pada suatu tempat penyimpanan data (storage),
data-data yang telah digabungkan merupakan data-data yang
akan membantu kita dalam proses pembuatan laporan, karena
data tersebut merupakan suatu bentuk kesatuan.
• Transformasi data
Pengolahan data dari bentuk awal ke bentuk yang telah
disepakati. Dengan melakukan pemprosesan atau pengolahan
data terlebih dahulu, dalam arti dengan melakukan pengubahan
data ke bentuk yang dibutuhkan atau diharapkan.
• Pendistribusian data
Data-data yang akan digunakan dalam data warehouse
berhubungan dengan lingkunga kerja dalam perusahaan. Bagi
perusahaan yang berhubungan dengan jaringan, pemakaian
data warehouse mendukung kegiatan ini, dimana pengguna
dapat menggunakan data warehouse ini secara fleksibel,
efektif, dan efisien. serta merata pada masing – masing bagian
dalam perusahaan.
58
• Penggunaan Data
Data yang telah diseleksi atau disaring akan menghasilkan
ringkasan yang dapat memudahkan pengguna dalam
mengambil keputusan.
2.1.6.7 Data Flow Data Warehouse
Proses ini terdiri dari :
• Inflow
Berhubungan dengan proses loading, pembersihan (cleaning)
dan pembacaan data sumber yaitu sistem ke dalam data
warehousing.
• Upflow
Proses ini berhugungan dengan penambahan nilai data dalam
data warehousing seperti ringakasan (summary),
penggelompokkan, dan pendistribusian data.
• Downflow
Proses ini berhubungan dengan pengarsipan dan backup data
dalam data warehousing.
• Outflow
Proses ini berhubungan dengan pembuatan data yang dapat
dipakai oleh end- users. Dua kunci utama dari aktivitas ini,
yaitu:
� Accessing:
Berkonsentrasi terhadap kepuasan permintaan dari pengguna
atas data yang mereka butuhkan.
59
� Delivering :
Berkonsentrasi pada proses pengiriman informasi yang
proaktif kepada workstation pengguna.
� Metaflow:
Proses ini berhubungan dengan deskripsi mengenai isi dari
data dalam data warehousing.
2.1.6.8 Granularity
Salah satu factor penting yang harus diperhatikan oleh
pengembang data warehouse adalah granularity.
Granularitymempengaruhi efisiensi dari penggunaan data dalam
melakukan analisis.
Menurut W.H Inmon (2005,p41), granularity merupakan
sebuah level kedetilan/ summarization dari unit data yang ada
dalam data warehouse. Semakin tinggi tingkat kedetilan data maka
semakin rendah level granularity dan begitu sebaliknya semakin
rendah tingkat kedetilan data maka semakin tinggi level
granularity.
2.1.6.9 Agregasi
Menurut W.H Inmon (2005, p114), terdapat banyak kasus
dimana data dalam warehouse tidak memenuhi kriteria stabilitas
dan tidak sering berubah, kasus lainnya dimana jumlah data terlalu
banyak, sering terjadi perubahan isi data, dan sebagainya. Dalam
kasus-kasus tersebut, dapat dilakukan agregasi yang
60
mengelompokkan beberapa data detil operasional yang berbeda ke
dalam satu record tunggal. Record tunggal disebut sebagai profile
record atau aggregate record.
Sebuah profile record dibuat dengan tujuan mengelompokkan
record detil yang sangat banyak jumlahnya. Sebagai contoh,
sebuah perusahaan telepon pada akhir bulan mengumpulkan semua
data-data aktivitas telepon para pelanggan dalam sebulan ke dalam
data record pelanggan padadata warehouse.
Agregrasi dari data operasional kedalam sebuah record
tunggaldalam data warehouse dapat dilakukan dengan
menggunakan cara sebagai berikut :
• Nilai-nilai yang diambil dari data operasional yang dapat
diringkas.
• Unit-unit data operasional dapat dihitung/dijumlahkan,
dimanajumlah dari unit data tersebut disimpan.
• Unit-unit data dapat diproses untuk menentukan yang paling
tinggi,paling rendah, rata-rata, dan lain-lain.
• Kemunculan pertama dan terakhir sebuah data dapat ditangkap.
• Tipe data tertentu, yang berbeda pada batasan parameter
tertentudapat diukur.
• Data yang efektif pada momem waktu tertentu dapat
terperangkap.
• Data yang paling muda dan yang paling tua dapat ditangkap.
Faktor yang mendukung pembuatan agregrasi adalah :
� meningkatkan performa query.
61
� mengurangi jumlah penggunaan CPU cycle.
Gambar 2.11 Pembentukan satu profile record dari beberapa record
( Sumber : W.H Inmon, 2005, p115)
2.1.6.10 Keuntungan Data Warehouse
Menurut Connolly dan Beg (2010, p1198),keuntungan yang
didapat dari pemanfaatan data warehouse antara lain :
• Keuntungan potensial yang besar dalam investasi
Sebuah organisasi atau perusahaan harus memiliki
sumber daya yang memadai yaitu dalam jumlah yang cukup
besar untuk memastikan keberhasilan pengimplementasian
sebuah data warehouse. Besarnya biaya yang harus dikeluarkan
dapat bervariasi tergantung pada solusi teknis yang tersedia.
Walaupun demikian, investasi dalam data warehouse akan
memberikan keuntungan yang cukup besar setelah dilakukan
pengimplentasian dimasa mendatang.
62
• Keuntungan Kompetitif
Salah satu keuntungan kompetitif yang didapatkan oleh
organisasi atau perusahaan yang telah berhasil dalam
mengimplementasikan data warehouse seperti, pihak eksekutif
perusahaan diperbolehkan untuk melakukan pengambilan
keputusan dengan mengakses data yang dapat menjelaskan
analisa dari data tersebut yang awalnya tidak tersedia, tidak
diketahui, dan tidak tercatatnya informasi tersebut.
• Meningkatkan produktivitas bagi para pengambil keputusan
atau pihak eksekutif perusahaan
Data warehouse meningkatkan produktivitas dari para
pengambil keputusan atau pihak eksekutif perusahaan dengan
membuat sebuah database yang terintegrasi, konsisten, dan
berorientasi subjek. Dengan melakukan transformasi data
menjadi sebuah informasi yang memiliki arti dan nilai, data
warehouse memperbolehkan bagi para manajer bisnis untuk
dapat melakukan analisa yang lebih konsisten, akurat, dan
substantif.
Selain itu, Mutaz M. Al-Debei (2011, p156) juga menjabarkan
keuntungan data warehouse seperti gambar berikut.
63
Gambar 2.12Keuntungan Data Warehouse
(Sumber : Mutaz M. Al-Debei, 2011, p156)
2.1.7 Dimensionality Modelling (Permodelan Dimensional)
Menurut Connolly and Begg (2010,p1227), dimensionality
modelling (permodelan dimensional) merupakan suatu teknik desain
logikal yang bertujuan untuk merepresentasikan data dalam bentuk
dasar atau standar serta desain ini memungkinkan untuk melakukan
pengaksesan data dengan performa yang tinggi. Setiap model
dimensional yang terbentukdan terbuat dari gabungan beberapa
primary key yang disebut tabel fakta (fact table) dan sekumpulan tabel
yang lebih kecil didalamnya yang disebut tabel dimensi (dimensional
table). Setiap tabel dimensi memiliki sebuah primary key yang
berhubungan secara langsung dengan sebuah key lain yang berada
dalam tabel fakta.
Keuntungan menggunakan pemodelan dimensional antara lain :
1. Pengaksesan data dapat dilakukan dengan lebih efisien;
2. Model dimensi dapat diperluas lagi jika dibutuhkan;
64
3. Kemampuan untuk menggambarkan keadaan bisnis secara umum;
4. Kemampuan untuk menangani perubahan akan kebutuhan.
2.1.7.1 Fact Table (Tabel Fakta)
Menurut Connolly dan Begg (2010), tabel fakta adalah tabel
yang berisikan composite primary key yang terdapat pada
dimensional model. Primary key dari tabel fakta dibuat dari 2 atau
lebih foreign key. Tabel fakta mengandung sesuatu yang dapat
diukur seperti harga, jumlah barang dan lain-lain.
Gambar 2.13Contoh Tabel Fakta
Sumber : Thomas Connolly, C. B. (2010). Database Systems :
A Practical Approach To Design, Implementationand Management Fifth
Edition
2.1.7.2 Dimensional Table (Tabel Dimensi)
Menurut Connolly dan Begg (2010), tabel dimensi adalah
kumpulan dari tabel yang lebih kecil dibandingkan tabel fakta pada
dimensional model. Setiap tabel dimensi mempunyai simple
(noncomposite) primary key yang berhubungan dengan salah satu
komponen composite key pada tabel fakta.
65
Gambar 2.14Contoh Tabel Dimensi
Sumber : Thomas Connolly, C. B. (2010). Database Systems : A Practical
Approach To Design, Implementation, and Management Fifth Edition
2.1.7.3 Skema Bintang (Star Schema)
Menurut Connolly dan Begg (2010, p1227), skema
bintang merupakan struktur logikal yang terdapat tabel
fakta yang berisi data faktual, serta dikelilingi oleh tabel
dimensi yang berisikan data referensi (dimana dapat
didenormalisasikan).
66
Gambar 2.15Contoh Star Schema
Sumber : Thomas Connolly, C. B. (2010). Database Systems : A
Practical Approach To Design, Implementation, and
Management Fifth Edition
2.1.7.3.1 Keuntungan Menggunakan Skema Bintang
Menurut Connolly dan Begg (2010, p1230)
keuntungan menggunakan skema bintang antara lain :
67
• Efisiensi, dalam arti struktur database yang konsisten
menjadikan akses data lebih efisien dengan menggunakan alat
untuk menampilkan data termasuk laporan tertulis dan query.
• Kemampuan untuk mengatasi perubahan kebutuhan, skema
bintang dapat beradaptasi terhadap perubahan kebutuhan yang
terjadi, karena sebuah tabel diemensi memiliki kesamaan dalam
hal menyediakan akses ke tabel fakta.
• Extensibility, dalam arti model dimensional ini dapat
dikembangkan lebih lanjut. Contohnya, dengan menambah
tabel fakta selama data tersebut masih konsisten, menambah
tabel dimensi selama masih terdapat nilai tunggal pada tabel
dimensi tersebut yang mendefinisikan setiap record yang
terdapat dalam tabel fakta.
• Proses query yang dapat diprediksi, aplikasi data warehouse
yang mencari data dari level bawah akan lebih mudah dengan
menambahkan jumlah atribut pada tabel dimensi sebuah skema
bintang.
2.1.7.3.2 Jenis Skema Bintang
Skema bintang merupakan suatu rancangan database
yang terdapat dalam data warehouse yang menggambarkan
secara jelas hubungan antara struktur tabel fakta dan tabel
dimensi.Skema bintang terdiri dari beberapa jenis, yaitu
sebagai berikut :
68
1. Skema bintang sederhana
Dalam skema bintang sederhana, setiap tabel harus
mempunyai primary key yang terdiri dari satu atau lebih
foreign key dan primary key tersebut harus bersifat
unique.Gambar berikut ini menggambarkan hubungan
antara tabel fakta dan dimensi.
Gambar 2.16Skema Bintang Sederhana
( Sumber : W.H Inmon, 2005, p129)
2. Skema bintang dengan banyak tabel fakta
Skema bintang juga dapat memiliki lebih dari satu tabel
fakta.Hal tersebut terjadi dikarenakan skema ini berisi lebih
banyak tabel fakta pembelian dan tabel fakta persediaan.
Walaupun terdapat banyak tabel fakta, skema ini
menggunakan tabel dimensi secara bersamaan.
69
2.1.7.4 Snowflake Schema
Selain skema bintang (star schema), juga terdapat
snowflake schema. Menurut Thomas Connolly (2010,
p.1229), snowflake schema adalah sebuah model data
dimensional yang terdiri dari tabel fakta yang diletakkan di
tengah-tengah dan dikelilingi oleh tabel dimensi yang sudah
mengalami proses normalisasi.
Gambar 2.17Snowflake Schema
Sumber : Thomas Connolly, C. B. (2010). Database Systems :
A Practical Approach To Design, Implementation, and
Management Fifth Edition
70
2.1.7.5 Starflake Schema
Selain star schema dan snowflake schema masih
terdapatstarflake schema. Menurut Thomas Connolly
(2010, p.1230), starflakeschema adalah sebuah model data
dimensional yang terdiri dari tabel fakta yang diletakkan di
tengah-tengah dan dikelilingi oleh tabel dimensi yang sudah
mengalami proses normalisasi maupun denormalisasi.
2.1.7.6 Surrogate Key
Surrogate Key adalahKey yang digunakan dalam tabel
dimensi adalah surrogate key dan menurut Thomas
Connolly (2010, p.1079), surrogate key adalah salah satu
fitur penting dalam tabel dimensi yang dibuat berdasarkan
bilangan bulat, yang berfungsi untuk menggabungkan
antara tabel dimensi dengan tabel fakta.
2.1.8 Data Warehousing Tools and Technique
2.1.8.1 Extraction, Transformation, Loading (ETL)
2.1.8.1.1 Extraction
Tahapan pertama dalam proses ETL adalah
extraction.Menurut Thomas Connolly (2010, p1208),
extractionadalah sebuah tahapan dimana mengambil data dari
sumber data bagi Environment DataWarehouse (EDP), sumber
inibiasanya terdiri dari database OLTP dan juga bisa terdapat
beberapa sumber lainnya seperti database pribadi, data ERP
71
dan data penggunaan dari web.Selain itu, menurut Fahad Sultan
(2010, p411), data extraction merupakan proses ekstraksi data
yang bersumberdari data operasional organisasi dan juga
sumbereksternal lain, seperti file, html, dokumen, dan lainnya
untuk data pada data warehouse.
Berdasarkan definisi di atas dapat disimpulkan
bahwaextractionmerupakan kegiatan ekstraksi data
yangbersumberdaridata operasional dan data eksternal untuk
dimasukkan ke- dalam lingkungan data warehouse.
2.1.8.1.2 Transformation
Tahapan kedua dalam proses ETL adalah
transformation. Menurut Connolly dan Begg (2010, p1208),
transformation merupakan tahapan yang menggunakan
beberapaperaturanatau fungsi dari data yang sudah diambil dan
mengukur bagaimana data tersebut dapat digunakan untuk
analisis dan dapat meliputi transformasi seperti penjumlahan
data, encoding data, penggabungan data, pemisahan
data,penghitungan data dan pembuatan surrogate keys.
Menurut Fahad Sultan (2010, p411), transformation
merupakan teknik transformasi data yang telah diterapkan pada
data untuk membuat data yang ada menjadi lebih seragam,
Setelah proses transformasi, data yang dihasilkan akan menjadi
lebih homogen (sama), serta menjadi lebih konsisten dan
72
meminimalkan error atau kesalahan. Tindakan ini dapat
meningkatkan kinerja data warehouse.
Berdasarkan definisi diatas dapat disimpulkan
bahwa,transformation merupakan proses penggabungan dan
pengubahan data agar data yang ada menjadi seragam sehingga
data tersebut bisa dimuat ke dalam satu tabel baru yang disebut
tabel fakta / tabel dimensi, dimana tabel tersebut berisikan
surrogate key yang digunakan untuk menghubungkan antara
tabel dimensi dan tabel fakta dalam data warehouse.
2.1.8.1.3 Loading
Tahapan ketiga dalam proses ETL adalah loading.
Menurut Thomas Connolly (2010, p1209), loading adalah
tahapan untuk memasukkan data yang sudah mengalami
prosestransformasi ke dalam data warehouse.Menurut Fahad
Sultan, loading merupakanproses peletakan data yang telah
dibersihkan dan ditransformasi ke dalam data warehouse.
Berdasarkan definisi diatas dapat disimpulkan bahwa,
loading merupakan proses memasukkan data yang telah
dibersihkan dan ditransformasikan ke dalam data warehouse.
2.1.8.1.4 ETL Tools
Tahapan keempat dalam proses ETL adalah proses
ETL(ETL tools). MenurutConnolly dan Begg(2010, p1209),
proses ETL dapat dibuat dengan membuat sebuah program
73
sendiri atau dengan membeli sebuah program ETL yangberada
di pasaran.
2.1.8.1.5 Data Profilling and Data Quality Control
Tahapan kelima dalam proses ETL adalah data
profiling and data quality control. Menurut Connolly dan Begg
(2010,p1209), data profilling and data quality control
menyediakan informasi penting tentang jumlah dan kualitas
data yang bersumber dari sistem. Misalnya data profilling dapat
mengindikasikan berapa banyak baris yang telah hilang, salah
dan pemasukkan atau input datayang kurang lengkap.
2.1.8.1.6 Metadata Management
Tahapan terakhir dalam proses ETL adalah metadata
management. Menurut Thomas Connolly (2010, p1209),
metadata management adalah sebuah penyimpanan yang diatur
oleh peralatan ETL yang akan menjelaskan tentang rincian
sumber sistem, rincian pengubahan data danrincian dari
pengubahan atau pemisahan data.
2.1.8.2 Data Warehouse DBMS
Sama seperti halnya dengan relational database maka
datawarehouse juga membutuhkan sebuah database management
system yang baik. Menurut Menurut Thomas Connolly (2010,
p1209), adabeberapa masalah yang berhubungan dengan database
datawarehouse. Parallelism menjadi masalahyang utama
74
sepertiperformance, scalability, availability dan manageability
semuanyaharus dipertimbangkan dalam pemilihan DBMS. Dalam
pemilihanDBMS dipelukan adanya identifikasi, kebutuhan untuk
proses datawarehouse DBMS dan bagaimana kebutuhan data
warehousemendukung teknologi secara paralel, yaitu terdiri dari :
� Load Performance
Load performance dalam data warehouse dibutuhkan
untukmemuat data dalam waktu yang cepat secara periodik dan
data yang masuk ke dalam data warehouse harus cepat dan
tanpa ada batasan maksimum.Data warehouse membutuhkan
peningkatan dalam memasukkan data dengan waktu yang cepat
secara periodik. Kinerja dalam proses masuknya data
seharusnya diukur dalam jumlah ratusan juta baris atau
gigabyte data per-jam dan tidak adanya batasan maksimum.
� Load Processing
Banyak tahap yang harus dilakukan untuk memuat data
baru atau meng-update data ke data warehouse mencakup Data
conversion, filtering, reformating, integrity checks, fisical
storage dan metadata update. Meskipun masing-masing tahap
dalam prakteknya adalah atomik, proses memasukkan data
seharusnya dieksekusi dalam satu kali pekerjaan.
� Data quality management
Tahapan ini untuk menjamin kualitas data yang baik,
untuk menjamin local consistency, global consistency,
75
referensial integrity. Meskipun sumber-sumber luar dan ukuran
databaseyang besar.
� Query performance
Fact based management dan ad hoc analysis
seharusnya tidak memperlambat kinerja data warehouse.
Query yang rumit harus dapat dieksekusi dalam waktu yang
cepat untuk mendukungpengambilan keputusan.
� Terabyte scalability
Ukuran data warehouse yang berkembang begitu
cepat dari ukuran ratusan gigabyte ke terabyte dan petabyte
seharusnya dapat ditangani oleh Database Management System
(DBMS) yang tidak mempunyai batasan ukuran data dan
seharusnya mendukung modular dan paralel manajemen dan
bila terjadi kesalahan Database Management System (DBMS)
harus dapat mendukung availability yang berkelanjutan dan
menyediakan mekanisme untuk perbaikan (recovery).
� Mass user scalability
Database Management System(DBMS) harus mampu
mendukung ratusan maupun ribuan query user dalam saat yang
bersamaan.
� Networked data warehouse
Sistem data warehouse harus mampu beroperasi dalam
jaringan data warehouse yang lebih besar. Data warehouse
harus mencakup tools yang mengkordinasikan aliran data
dalam data warehouse tersebut. User seharusnya mampu untuk
76
melihat dan bekerja dengan multiple data warehouses dari
sebuah sebuahclient workstation.
� Warehouse administration
Data-data yang sangat besar dalam data warehouse
dibutuhkan fleksibilitas dan kemudahan dalam administrasinya.
Database Management System (DBMS) harus menyediakan
control untuk membatasi sumber daya prioritas query untuk
memenuhi kebutuhan bagi pemakai dan aktivitas yang berbeda-
beda.
� Integrated Dimensional Analysis
Kemampuan cara pandang multidimensi dalam data
warehousemendukung kemampuan tinggi untuk menyediakan
peralatan relasional Online Transaction Processing (OLAP).
Database Management System (DBMS) harus dapat
mendukung secara cepat dan mudah dalam pembuatan
rangkuman di dalam data warehouse yang besar dan
menyediakan peralatan perawatanuntuk dapat mengotomatisasi
pembuatan rangkuman tersebut.
� Advanced query functionality
Para pengguna membutuhkan perhitungan analisis,
pengurutan,perbandingan analisis dan daya akses yang
konsisten untukmengambil data rangkuman dan data rincian.
2.1.9 Online Transaction Processing (OLTP)
Menurut Thomas Connolly (2010, p1198), OLTP adalah
sebuah sistem yang dirancang untuk memaksimalkan kapasitas
77
pemrosesan transaksi. Dapat diartikan bahwa OLTP adalah sebuah
sistem yang dirancang untuk memasukkan data yang sesuai ke dalam
database dan dirancang untuk memaksimalkan kapasitas pemrosesan
transaksi.
2.1.10 Online Analytical Processing (OLAP)
Menurut Connolly dan Begg (2010, p1250) Online Analytical
Processing(OLAP) merupakansintesisdinamis, analisisdan
konsolidasi volume terbesardari multidimensional data. Teknologi
OLAP memungkinkandata warehousedigunakansecaraefektifuntuk
proses online analysis,
memberikanresponyangcepatterhadapanalytical queries yang
kompleks.Berikutinibeberapakeuntungan yang
diperolehdenganmenerapkan OLAp, yaitu :
1. Meningkatkanproduktivitasdariend-users
bisnisdanpengembangteknologiinformasi.
2. Meningkatkanpenghasilandankeuntunganpotensialdenganmemung
kinkanperusahaanuntukmeresponpermintaanpasarlebihcepat.
3. Mengurangiback-log
daripengembanganaplikasiuntukstafteknologiinformasidenganme
mbuat end-user bebasuntukmembuatperubahanskema
danmemungkinkanorganisasiuntukmeresponpermintaanpasarlebih
cepat.
4. Mengurangilalulintasjaringandalamsistem OLTP
ataudalamdatawarehouse.
78
2.1.11 Entity Relational Diagram
Menurut Connolly dan Begg (2010, p.330) Entity Relationship
(ER) modeladalah sebuah pendekatan terstruktur dalam
perancangan basis data(database) yang dimulai dengan
mengidentifikasi data penting yangdisebut entitas dan hubungan
antara data yang direpresentasikan dalamsebuah model.
2.1.12 IBM Infosphere Datastage
IBM InfoSphere DataStage digunakan untuk melakukan
transformasi data dan gerakan dari sumber sistem untuk menargetkan
sistem batch dan real time. Sumber data seperti file indeks, file
sekuensial, relasional database, arsip, sumber data eksternal, dan
aplikasi perusahaan.
2.1.13 IBM Cognos
IBM Cognos Business Intelligence merupakan perangkat
lunak (software) yang menyediakan ruang kerja terpadu untuk
business intelligence dan analisis terhadap organisasi agar dapat
digunakan dalam menjawab pertanyaan-pertanyaan bisnis dan
menghadapi persaingan dengan competitor. Dengan Cognos Business
Intelligence, pengguna (user) dapat meperoleh keuntungan dari
kemampuan sebagai berikut :
� Kemudahan dalam melihat, merakit, dan personalisasi informasi
� Kemudahan dalam menjelajahi semua jenis informasi dari
berbagai sudut untuk menilai situasi bisnis pada saat ini
79
� Menganalisis fakta dan mengantisipasi implikasi taktis dan
strategis dengan peegeseran dari melihat data ke melakukan
analisi yang lebih canggih dan prediktif
� Melakukan kolaborasi dengan tujuan membangun jaringan
keputusan untuk berbagi pengetahuan dan mencapai kecerdasan
kolektif
� Memberikan transparansi dan akuntabilitas untuk mendorong
keselarasan dan consensus
� Melakukan komunikasi dan mengkoordinasikan tugas untuk
melibatkan orang yang tepat pada waktu yang tepat
� Akses informasi dan mengambil tindakan di mana saja, seperti
mengambil keuntungan dari perangkat mobile dan analisis secara
real-time
� Mengintegrasikan dan menghubungkan analisis dalam pekerjaan
sehari-hari untuk alur kerja
2.1.14 Metodologi Perancangan Data Warehouse
Menurut Kimball (2010, p210) terdapat 9 langkah dalam
perancangan data warehouse yang dikenal dengan nine- step
methodology, yaitu :
• Memilih Proses (Choosing the Process)
Memilih proses berarti menetukan subjek utamanya. Subjek
Utama merujuk pada suatu kegiatan bisnis perusahaan yang dapat
menjawab semua pertanyaan bisnis yang penting serta memiliki
ciri khas tersendiri.
80
• Memilih Grain (Choosing the Grain)
Memilih grain artinya menentukan apa yang akan disajikan atau
dipresentasikan oleh sebuah tabel fakta. Setelah menentukan grain
dari tabel fakta, selanjutnya dapat menentuka tabel dimensi yang
berhubungan dengan tabel fakta tersebut. Grain pada tabel fakta
juga menentukan grain untuk tabel dimensinya.
• Identifikasi dan Membuat Dimensi yang Sesuai (Identifying and
Conforming the Dimensions)
Identifikasi dan menghubungkan tabel dimensi dengan tabel fakta.
Dimensi merupakan kumpulan sudut pandang yang penting untuk
menggambarkan berbagai fakta yang terdapat dalam tabel fakta.
• Memilih Fakta (Choosing the Facts)
Grain dari suatu tabel fakta menentuka fakta-fakta apa saja yang
dapat digunakan. Pada tahap ini, dilakukan penentuan measure
(ukuran) yang dibutuhkan pada tabel fakta tersebut.
• Menyimpan Pra-Kalkulasi Dalam Tabel Fakta
Umumnya hasil perhitungan dari atribut pada database tidak
disimpan pada suatu atribut khusus pada database, namun dalam
tahap ini, perlu dilakukan pertimbangan kembali mengenai
penyimpanan hasil perhitungan pada suatu atribut tersendiri pada
database, dengan tujuan untuk mengurangi resiko kesalahan pada
program setiap kali melakukan perhitungan pada atribut-atribut
tersebut.
81
• Melengkapi Tabel Dimensi
Dari banyak dimensi yang telah teridentifikasi, pada tahap ini
dilakukan deskripsi yang memuat informasi secara terstruktur
mengenai atribut-atribut pada tabel dimensi. Tabel dimensi
tersebut harus diberi keterangan secara lengkap, jelas, dan mudah
dipahami oleh pengguna (user).
• Memilih Durasi dari Database
Pada tahap ini dilakukan penentuan durasi atau periode waktu dari
data-data yang akan dimasukkan ke dalam data warehouse.
Contohnya, pada perusahaan distributor IT, data biasanya
disimpan selama 5 tahun atau lebih.
• Mencari Perubahan pada Dimensi
Dimensi dapat terjadi perubahan sewaktu-waktu, sehingga untuk
mengantisipasinya ada tiga cara untuk melakukan pengubahan
data pada dimensi tersebut, yaitu :
a Menulis ulang atribut yang mengalami perubahan
b Membuat record baru pada dimensi tersebut
c Membuat suatu atribut alternative untuk menampung nilai
baru, sehingga nilai lama dan nilai baru dari atribut tersebut
dapat diakses secara bersamaan.
• Memutuskan Prioritas dan Cara query
Pada tahap terakhir, dilakukan perancangan fisik dari data
warehouse dan menentukan masalah-masalah apa yang mungkin
ada dala perancangan fisik seperti administrasi, backup data,
indexing, dan security.
82
2.2 Teori – teori Khusus
2.2.1 Pembelian (Purchasing)
Pembelian merupakan proses bisnis yang dilakukan antar dua
pihak yaitu pihak supplier dan pihak perusahaan untuk mendapatkan
bahan-bahan produk yang akan dijual oleh perusahaan.
MenurutRender (2011, p414), pembelian adalah perolehan
barang dan jasa.Secara umum definisi pembelian adalah suatu usaha
pengadaan barangatau jasa dengan tujuan yang akan digunakan sendiri,
untuk kepentinganproses produksi maupun untuk dijual kembali.
Menurut Stevenson (2009, p518), pembelian adalah proses
mendapatkanmaterial, bagian-bagian, persediaan, dan layanan yang
diperlukan untuk memproduksi sebuah produk atau menyediakan sebuah
layanan.
Menurut William B. Joyce (2006, p202), pembelian adalah
sebuah kegiatan untuk mendapatkan material, layanan, yang dibutuhkan
untuk menghasilkan produk atau jasa layanan.
Menurut Andreas P. Kakorius (2006, p709-711), membagi
proses pembelian menjadi lima langkah, yaitu :
• Initiation Phase
Proses pembelian diawali dengan adanya kebutuhan akan jasa
maupun suatu barang.
• Planning Phase
Merupakan siklus utama dari suatu siklus pembelian dimana terjadi
perencanaan terhadap list barang yang akan dibeli agar tidak terjadi
kesalahan dalam pembelian yang dapat menyebabkan kerugian.
83
• Qualification Phase
Pemilihan pemasok melalui tingkat kualitas barang yang dihasilkan
agar barang tersebut terjamin kualitasnya.
• Winning Phase
Merupakan tahap akhir untuk memilih pemasok yang tepat untuk
menjadi distributor tetap.
• Monitoring and Review Phase
Pembeli harus secara teratur dalam melakukan pemantauan agar
barang yang dihasilkan oleh pemasok dapat terpantau terus
kualitasnya.
Berdasarkan pengertian di atas dapat disimpulkan bahwa
pembelian adalah suatu proses bisnis dalam perusahaan ebagai upaya
mendapatkan produk untuk barang-barang yang akan dijual oleh
perusahaan kepada pelanggan.
2.2.2 Penjualan (Selling)
Penjualan merupakan suatu proses bisnis yang penting bagi
perusahaan dalam tujuannya untuk mencari keuntungan yang
maksimal.Untuk mendapat keuntungan yang semaksimal mungkin
diperlukan teknik-teknik khusus agar produk yang dihasilkan dapat
disukai oleh pasar dan berkualitas sehingga menarik minat para
pelanggan.
Menurut Kotler et al (2006, p470), menerangkan bahwa proses
penjualan merupakan serangkaian langkah-langkah yang dilakukan
untuk menjual suatu produk kepada pelanggan oleh bagian penjualan.
84
Menurut Fess (2006, p300), menerangkan bahwa penjualan
merupakan jumlah tukar uang yang dibebankan kepada pelanggan
atassuatu barang yang dipesan.
Berdasarkan pengertian di atas dapat disimpulkan bahwa
penjualan merupakan suatu proses bisnis untuk menjual barang atau
produk kepada pelanggan untuk mendapatkan keuntungan bagi
perusahaan.
2.2.3 Persediaan Barang (Inventory Stock)
Persediaan merupakan suatu kegiatan dalam perusahaan untuk
menyimpan produk yang akan dijual untuk dijadikan sebagai
persediaan.Persediaan barang ini biasanya disimpan dalam suatu gudang
(warehouse).
Menurut Alfredson et. al. (2007, p342), persediaan merupakan
aset yang tersediauntuk dijual dalam proses bisnis biasa atau set yang
ada dalam proses produksi.
Persediaan dibagi menjadi beberapa jenis oleh Horngren et. al.
(2002,p759)menjadi sebagai berikut :
a. Persediaan bahan mentah
Persediaan ini akan digunakan dalam proses manufaktur untuk diolah
kembali.
b. Persediaan barang dalam proses
Yaitu barang yang sudah melalai beberapa tahap pada proses
manufaktur, tetapi masih perlu diolah kembali.
c. Persediaan barang jadi
85
Persediaan barang yang sudah diproses dan siap untuk dijual.
Menurut Alfredson, K.,etal (2007, p342), menerangkan bahwa
persediaan merupakan harta atau aset perusahaan yang tersedia untuk
dijual kepada pelanggan.
Menurut I Nyoman Yudha Astana (2007, p185), terdapat enam
fungsi penting yang terdapat dalam persediaan dalam memenuhi
kebutuhan perusahaan, sebagai berikut :
1. Meminimalkan resiko keterlambatan pengiriman barang
yangdibutuhkan oleh perusahaan
2. Menghilangkan resiko akan adanya barang rusak ketika memesan
barang
3. Meminimalkan resiko terhadap kenaikan harga
4. Untuk menyimpan barang-barang secara aman sehingga jika
dibutuhkan sewaktu-waktu dapat tersedia.
5. Mendapatkan potongan harga atas pembelian barang
6. Menyediakan barang yang diperlukan oleh pelanggan agar
kebutuhannya dapat terpenuhi
Berdasarkan pengertian di atas dapat disimpulkan bahwa
persediaan merupakan sebuah aset atau kekayaan perusahaan berupa
barang-barang dagangan hasil produksi yang disimpan di dalam suatu
tempat atau gudang yang kemudian akan dijual kepada pelanggan.
86
2.3 Kerangka Pikir
Berdasarkan Kimball Lifecycle diatas kami membuat kerangka pikir
dalam merancang data warehouse ini agar lebih matang dalam melakukan
perencanaan, implementasi, dan evaluasi, sehingga hasil yang diharapkan
lebih optimal dan tepat waktu
Gambar 2.18Kerangka Pikir
1.1 Latar Belakang
1.2 Ruang Lingkup
1.3 Tujuan dan Manfaat
4.2 Perancangan Data Warehouse (Nine-Step
Methodology)
4.3 Implementasi
4.4 Evaluasi