26
7 BAB 2 Landasan Teori 2.1 Teori Umum Teori umum adalah sebuah pernyataan yang dianggap benar maka akan berlaku secara universal. Teori umum merupakan dasar untuk mengembangkan teori selanjutnya yang lebih khusus (spesifik). Berikut teori umum yang digunakan: 2.1.1 Pengertian Data Menurut Wahyudi (2008:2) pengertian data adalah informasi yang telah diterjemahkan ke dalam bentuk yang lebih sederhana untuk melakukan suatu proses. Sehubungan dengan komputer saat ini dan media transmisi, jadi data adalah informasi yang diubah menjadi bentuk digital biner. Sedangkan menurut Agus Mulyanto (2009:15) pengertian data adalah merupakan definisi sebagai representasi dunia nyata mewakili suatu objek seperti manusia, hewan, peristiwa, konsep, keadaan dan sebagainya yang direkam dalam bentuk angka, huruf, simbol, teks, gambar, bunyi, atau kombinasinya. Dengan kata lain data merupakan kenyataan yang menggambarkan suatu kejadian dan kesatuan yang nyata. Data merupakan material atau bahan baku yang belum mempunyai makna atau belum berpengaruh langsung kepada pengguna sehingga perlu diolah untuk dihasilkan sesuatu yang lebih bermakna. Adapun pendapat lain, menurut Turban (2010:41) pengertian data adalah deskripsi dasar yang berasal dari sebuah benda, peristiwa, aktivitas dan transaksi yang direkam, dikelompokkan, dan disimpan, akan tetapi belum terorganisir untuk menyampaikan arti tertentu. 2.1.2 Pengertian Informasi Menurut Agus Mulyanto (2009:12) pengertian informasi adalah data yang diolah menjadi bentuk yang lebih berguna dan lebih berarti bagi yang menerima nya, Sedangkan data merupakan sumber informasi yang

BAB 2 Landasan Teori Teori umum adalah sebuah pernyataan ...library.binus.ac.id/eColls/eThesisdoc/Bab2/RS1_2016_1_765_Bab2.pdf · 2.1.8 Arsitektur Data Warehouse Menurut Connoly dan

Embed Size (px)

Citation preview

7

BAB 2

Landasan Teori

2.1 Teori Umum

Teori umum adalah sebuah pernyataan yang dianggap benar maka

akan berlaku secara universal. Teori umum merupakan dasar untuk

mengembangkan teori selanjutnya yang lebih khusus (spesifik). Berikut teori

umum yang digunakan:

2.1.1 Pengertian Data

Menurut Wahyudi (2008:2) pengertian data adalah informasi yang

telah diterjemahkan ke dalam bentuk yang lebih sederhana untuk

melakukan suatu proses. Sehubungan dengan komputer saat ini dan media

transmisi, jadi data adalah informasi yang diubah menjadi bentuk digital

biner.

Sedangkan menurut Agus Mulyanto (2009:15) pengertian data adalah

merupakan definisi sebagai representasi dunia nyata mewakili suatu objek

seperti manusia, hewan, peristiwa, konsep, keadaan dan sebagainya yang

direkam dalam bentuk angka, huruf, simbol, teks, gambar, bunyi, atau

kombinasinya. Dengan kata lain data merupakan kenyataan yang

menggambarkan suatu kejadian dan kesatuan yang nyata. Data merupakan

material atau bahan baku yang belum mempunyai makna atau belum

berpengaruh langsung kepada pengguna sehingga perlu diolah untuk

dihasilkan sesuatu yang lebih bermakna.

Adapun pendapat lain, menurut Turban (2010:41) pengertian data

adalah deskripsi dasar yang berasal dari sebuah benda, peristiwa, aktivitas

dan transaksi yang direkam, dikelompokkan, dan disimpan, akan tetapi

belum terorganisir untuk menyampaikan arti tertentu.

2.1.2 Pengertian Informasi

Menurut Agus Mulyanto (2009:12) pengertian informasi adalah data

yang diolah menjadi bentuk yang lebih berguna dan lebih berarti bagi yang

menerima nya, Sedangkan data merupakan sumber informasi yang

8

menggambarkan suatu kejadian nyata yang berdasarkan peristiwa dan

keadaan.

Sedangkan menurut Jimmy L.Goal (2008:8) pengertian informasi

adalah suatu data yang telah diproses atau diolah kedalam bentuk yang

berarti atau bermakna untuk penerimanya dan merupakan nilai yang

sesungguhnya atau dipahami dalam tindakan atau keputusan sekarang atau

nantinya.

Selanjutnya menurut Edy Sutanta (2009:8), pengertian informasi

adalah data yang diolah menjadi bentuk yang berguna dan menjadi berarti

bagi penerimanya. Kegunaan informasi adalah untuk mengurangi

ketidakpastian di dalam proses pengambilan keputusan tentang suatu

keadaan. Suatu informasi dikatakan bernilai bila manfaatnya lebih efektif

dibandingkan dengan biaya untuk mendapatkan informasi tersebut.

Kualitas informasi sangat dipengaruhi atau ditentukan oleh beberapa hal

yaitu : Relevan (Relevancy), Akurat (Accurancy), Tepat waktu (Time

liness), Ekonomis (Economy), Efisien (Efficiency), Ketersediaan

(Availability), Dapat dipercaya (Reliability), Konsisten.

2.1.3 Pengertian Database

Menurut Winarno (2013:117), pengertian database adalah tempat atau

wadah sebuah data. Secara istilah kumpulan informasi yang disimpan

didalam komputer secara sistematik sehingga dapat diambil datanya atau

diolah menggunakan suatu program.

Selanjutnya menurut Connolly dan Begg (2010:65), database adalah

sekumpulan data tersebar yang berhubungan secara logis, dan penjelasan

dari data ini dirancang untuk memenuhi kebutuhan informasi dari suatu

organisasi.

2.1.4 Pengertian Database Management System (DBMS)

Menurut Connolly dan Begg (2010:66), database management system

(DBMS) adalah sebuah sistem software atau piranti lunak yang

memungkinkan pengguna untuk mendefinisikan, membuat, me-maintain,

dan mengontrol akses ke database.

9

2.1.5 Pengertian Structured Query Language (SQL)

Menurut Raharjo (2011:55), SQL adalah kependekan dari Structured

Query Language, yang merupakan bahasa atau kumpulan perintah standar

yang digunakan untuk berkomunikasi dengan database.

Sedangkan menurut Ichwan (2011:20), pengertian bahasa SQL adalah

bahasa yang mempunyai fungsi untuk membangun sebuah basis data,

menjalankan query terhadap basis data, dan melakukan penambahan,

pengurangan, perubahan terhadap data yang sudah ada di dalam database.

2.1.6 Pengertian Data Warehouse

Menurut Sharda dan Turban (2014:64), data warehouse adalah

kumpulan data yang dihasilkan untuk mendukung pengambilan keputusan,

dan juga merupakan repository data. Data biasanya akan terstruktur dan

tersedia dalam bentuk yang siap digunakan untuk kegiatan pengolahan

analisis.

Menurut Paul Lane (2007:29), data warehouse adalah sebuah

relational database yang dirancang untuk query dan analisis. Bukan untuk

pemrosesan transaksi. Biasanya berisi historical data yang berasal dari

data transaksi, tetapi bisa termasuk data yang berasal dari sumber lain.

Data warehouse juga memungkinkan menggabungkan data dari berbagai

macam sumber.

2.1.7 Karakteristik Data Warehouse

Menurut Ralph Kimball dan Margy Ross. (2010:30), karakteristik

data warehouse terdiri dari subject-oriented, integrated, time variant,

nonvolatile. Keempat karakteristik tersebut saling terhubung satu sama

lain sehingga semuanya harus diimplementasikan untuk merancang data

warehouse.

2.1.7.1 Subject Oriented

Data warehouse bersifat subject oriented, merupakan data

warehouse yang didesain untuk menganalisa data berdasarkan

10

subject-subject tertentu dalam organisasi, bukan pada proses atau

fungsi aplikasi tertentu.

Gambar 2.1 Karakteristik Data Warehouse : Subject-Oriented

(Sumber: W. H. Inmon, 2005:30)

2.1.7.2 Integrated

Data warehouse bersifat integrated, merupakan data

warehouse yang dapat menyimpan data-data yang berasal dari

umber-sumber yang terpisah kedalam suatu format yang konsisten

dan saling terintegrasi satu dengan lainnya. Dengan demikian data

tidak bisa dipecah-pecah karena data yang ada merupakan suatu

kesatuan yang menunjang keseluruhan konsep data warehouse itu

sendiri.

Gambar 2.2 Karakteristik Data Warehouse : Integrated

(Sumber: W. H. Inmon, 2005:31)

11

2.1.7.3 Time Variant

Data warehouse bersifat time-variant artinya data yang ada di dalam

data warehouse selalu akurat dalam periode tertentu dan memiliki banyak

variant waktu (time-variant). Aspek yang menunjukkan karakteristik time-

variant dalam data warehouse adalah sebagai berikut:

Gambar 2.3 Karakteristik data warehouse : Time Variant

(Sumber: W. H. Inmon, 2005:35)

2.1.7.4 Non-Volatile

Data warehouse bersifat non-volatile, artinya adalah

data pada data warehouse tidak di-update secara real time,

tetatpi di refresh dari sistem operasional secara reguler. Jadi

pengguna tidak dapat mengubah data yang ada di dalam data

warehouse. Berbeda dengan database operasional yang

memiliki tiga kegiatan operasi, seperti insert, update, dan delete.

Data warehouse hanya memiliki dua kegiatan yaitu loading dan

akses.

12

Gambar 2.4 Karakteristik Data Warehouse : Non-Volatile

(Sumber: W. H. Inmon, 2005:32)

2.1.8 Arsitektur Data Warehouse

Menurut Connoly dan Begg (2010:1156), arsitektur data

warehouse memiliki empat karakteristik yang saling berkaitan yang harus

dimiliki oleh data warehouse, yaitu sebagai berikut:

1. Data di ambil dari sistem asal, database, dan file.

2. Data dari sistem asal diintegrasikan dan ditransformasi sebelum

disimpan ke dalam database management system (DBMS) seperti

Oracle, Ms SQL, server, sybase dan masih banyak yang lainnya.

3. Data warehouse merupakan sebuah database terpisah, bersifat hanya

dapat dibaca yang dibuat khusus untuk mendukung pengambilan

keputusan.

4. Pengguna dapat mengakses data warehouse melalui aplikasi front end

tool.

Arsitektur dan komponen utama dari data warehouse dapat

dilihat pada gambar berikut ini:

13

Gambar 2.5 Arsitektur dan Komponen Utama Data Warehouse

(Sumber: Conolly, T. M., Begg, 2010:1157)

a. Operational Data

Sumber data dari data warehouse dapat berasal dari:

• Mainframe operasional data yang memegang kendali di

hierarki generasi pertama dan di database jaringan.

• Departemental data yang memegang kendali di kepemilikan

sistem file seperti VSAM, RMS, dan relational DBMS.

• Private data yang memegang kendali di workstation dan

private server.

• External System seperti internet, database komersial yang

tersedia atau database yang berhubungan dengan organisasi

pelanggan

b. Operational Data Store (ODS)

Operational Data Store menampung data yang di ekstrak dari

sistem utama atau sumber-sumber data yang ada dan kemudian data

dari hasil ekstrasi tersebut dibersihkan.

ODS diciptakan ketika sistem operasional tidak mampu

mencapai kebutuhan sistem pelaporan. ODS menyediakan manfaat

yang berguna dari suatu relational database dalam mengambil

keputusan yang mendukung fungsi data warehouse.

14

c. Load Manager

Load Manager melakukan semua operasi yang berhubungan

dengan extract, transform, load data ke dalam gudang. Data dapat

diambil langsung dari sumber data atau yang umumnya berasal dari

data operasional.

d. Warehouse Manager

Warehouse Manager melakukan semua operasi yang

berhubungan dengan pengelolaan data di dalam data warehouse.

Operasi yang dilakukan warehouse manager antara lain:

• Analisa terhadap data untuk memastikan konsistensi.

• Transformasi dan penggabungan sumber data dari tempat

penyimpanan sementara menjadi tabel data warehouse.

• Pembuatan index dan view berdasarkan tabel-tabel dasar.

• Menghasilkan denormalisasi jika diperlukan.

• Backup dan archieve data.

e. Query Manager

Query Manager juga disebut komponen back-end, melakukan

operasi-operasi yang berhubungan dengan manajemen user queries.

Operasi-operasi yang dilakukan oleh komponen ini termasuk

mengarahkan query kepada tabel-tabel yang tepat dan melakukan

penjadwalan eksekusi dari query tersebut.

f. Detailed Data

Area ini menyimpan semua detil data di dalam skema

database, yang bertujuan untuk melengkapkan kumpulan data untuk

data warehouse. Biasanya detailed data tidak disimpan secara online

melainkan dibuat dengan melakukan agregasi data. Tetapi pada

dasarnya, detailed data ditambahkan ke warehouse untuk melengkapi

data aggregate.

15

g. Lightly and Summarize Data

Dalam data warehouse, lightly dan hightly summarize data

adalah tempat penyimpanan semua data predefined lightly dan highly

summarized yang dihasilkan oleh warehouse manager. Tujuan dari

ringkasan informasi ini adalah mempercepat tanggapan terhadap

permintaan user. Ringkasan data di-update terus menerus seiring

dengan bertambahnya jumlah data dalam data warehouse.

h. Achieve / Backup Data

Area warehouse yang menyimpan detil data dan ringkasan

data dengan tujuan sebagai arsip dan backup data. Data ditransfer ke

penyimpanan arsip seperti magnetic tape atau optical disk.

i. Metadata

Area warehouse ini menyimpan semua definisi metadata (data

mengenai data) menggunakan semua proses yang ada pada data

warehouse. Metadata digunakan untuk beberapa tujuan seperti:

• Proses ekstraksi dan loading Metadata digunakan untuk memetakan

data source menjadi bentuk data yang lebih umum dalam

warehouse.

• Proses manajemen warehouse Metadata digunakan untuk

mengotomatisasi produksi dari tabel ringkasan.

• Bagian dari proses manajemen query Metadata digunakan untuk

query secara langsung pada sumber data yang paling sesuai.

j. End-User Access Tools (EUAT)

Prinsip atau tujuan utama dari dibangunnya data warehouse

adalah untuk menyediakan informasi bisniskepada user, untuk dapat

melakukan pengambilan keputusan secara cepat dan tepat. User ini

berinteraksi dengan warehouse melalui end-user access tools. Data

warehouse secara efisien mendukung secara khusus kebutuhan user

serta secara rutin melakukan analisis. Lima kelompok utama dari end-

user access tool adalah:

• Reporting dan Qurty Tools

16

Reporting tool meliputi production reporting tool dan report

writer. Production reporting tool digunakan untuk menghasilkan

laporan operasional regular. Report writer adalah desktoptool yang

dirancang untuk menerima SQL atau menghasilkan pernyataan

SQL untuk proses query data yang tersimpan dalam warehouse.

• Application Development Tools

Aplikasi yang dapat digunakan user yaitu graphical data access

yang dirancang untuk client server. Beberapa application

development tools terintegrasi dengan OLAP tools dan mengakses

semua sistem database utama.

• Executive Information System (EIS) Tools

Executive Information System mendukung pengambilan keputusan

semua tingkat manajemen. EIS tools yang terhubung dengan

mainframe memungkinkan pengguna membuat aplikasi pendukung

pengambilan keputusan untuk meneydiakan overview data

organisasi dan mengakses sumber data eksternal.

• Online Analytical Processing (OLAP) Tools

OLAP tools berbasis pada konsep multidimensional database dan

memperbolehkan pengguna untuk menganalisis data dengan

menggunakan view yang kompleks dan multidimensional view.

Tools ini mengasumsikan bahwa data diatur dalam model

multidimensi yang didukung oleh multidimensional database

(MDDB) atau oleh relational database relational database yang

dirancang untuk mendapatkan multidimensional queries.

• Data Mining Tools

Data mining adalah proses menemukan korelasi, pola, dan arah

baru yang mempunyai arti dengan mining sejumlah besar data

dengan menggunakan teknik statistic, matematika, dan artificial

intelligence (AI). Data mining memiliki potensi untuk mengganti

kemampuan dari OLAP tools.

17

2.1.9 Struktur Data Warehouse

Seperti yang kita lihat sebelumnya pada arsitektur data

warehouse, ada beberapa struktur yang spesifik terdapat pada bagian

warehouse manager, Bagian tersebut merupakan struktur data

warehouse.

Menurut Kimball & Ross (2010:18), pengertian struktur data

warehouse adalah aliran data dari lingkungan operasional ke dalam

lingkungan data warehouse dimana data mengalami transformasi dari

tingkatan operasional ke tingkatan data warehouse. Pada perumusan data

dapat dilihat digambar, data disampaikan dari current detail ke older

detail. Setelah data diringkas, data tersebut disampaikan dari current

detail ke lightly summarized data, kemudian dari lightly summarized data

ke highly summarized data.

Gambar 2.6 Struktur data warehouse

2.1.9.1 Current Detail Data

Current detail data merupakan data detil yang aktif

saat ini, mencerminkan keadaan yang sedang berjalan dan

18

merupakan level terendah dalam data warehouse. Didalam area

ini warehouse menyimpan seluruh detail data yang terdapat pada

skema basis data. Jumlah data sangat besar sehingga memerlukan

storage yang besar pula dan dapat diakses secara cepat. Dampak

negatif yang ditimbulkan adalah kerumitan untuk mengatur data

menjadi meningkat dan biaya yang diperlukan menjadi mahal.

Berikut ini beberapa alasan mengapa current detail data menjadi

perhatian utama:

• Menggambarkan kejadian yang beru terjadi dan selalu menjadi

perhatian utama.

• Sangat banyak jumlahnya dan disimpan pada tingkat

penyimpanan terendah.

• Hampir selalu disimpan dalam storage karena cepat di akses

tetapi mahal dan kompleks dalam pengaturannya.

• Bisa digunakan dalam membuat rekapitulasi sehingga current

detail data harus akurat.

2.1.9.2 Older Detail Data

Older detail data merupakan data historis dari current

detail data, dapat berupa hasil cadangan atau archive data yang

disimpan dalam storage terpisah. Karena bersifat backup, maka

biasanya data disimpan dalam storage alternatif seperti tape-desk.

Data ini biasanya memiliki tingkat frekuensi akses

yang rendah. Penyusunan file atau directory dari data ini disusun

berdasarkan umur dari data yang bertujuan untuk mempermudah

pencarian atau pengaksesan kembali.

2.1.9.3 Granularity

Menurut Doug Vucevic (2012: 159), pengertian granularity

adalah salah satu aspek penting dalam mempertimbangkan desain

data warehouse. Dalam granularity terdapat tingkat detail yang

terkandung pada setiap unit data. Semakin detail tingkat datanya,

maka semakin rendah tingkat granularity dan sebaliknya semakin

19

rendah tingkat detail datanya, maka akan semakin tinggi tingkat

granularity.

2.1.9.4 Lightly Summarized Data

Data ini merupakan ringkasan atau rangkuman dari

current detail data. Data ini dirangkum berdasarkan periode atau

dimensi lainnya yang sesuai dengan kebutuhan.

Ringkasan dari current detail data belum bersifat total

summary. Data-data ini memiliki detil tingkatan yang lebih tinggi

dan mendukung kebutuhan warehouse pada tingkat departemen.

Tingkatan data ini disebut juga dengan data mart. Akses terhadap

data jenis ini banyak digunakan untuk view suatu kondisi yang

sedang atau sudah berjalan.

2.1.9.5 Highly Summarized data

Data ini merupakan tingkat lanjutan dari lightly

summarized data, merupakan hasil ringkasan yang bersifat

totalitas, dapat diakses misal untuk melakukan analisis

perbandingan data berdasarkan urutan waktu tertentu dan analisis

menggunakan data multidimensi. Akses terhadap data jenis ini

biasanya digunakan untuk memantau kondisi yang sedang dan

sudah berjalan.

2.1.9.6 Metadata

Metadata bukan merupakan data hasil kegiatan seperti

keempat jenis data di atas. Metadata adalah 'data tentang data' dan

menyediakan informasi tentang struktur data dan hubungan antara

struktur data di dalam atau antara storage. Metadata berisikan

data yang menyimpan proses perpindahan data.

2.1.10 Keuntungan Data Warehouse

Menurut Connoly dan Begg (2010:1198), Keuntungan

mengimplementasikan data warehouse dapat memberikan keuntungan-

keuntungan antara lain:

• Potensi nilai kembali yang besar pada investasi.

20

Organisasi harus mengeluarkan uang dan sumber daya dalam jumlah

yang besar untuk memastikan bahwa data warehouse telah

diimplementasikan dengan baik. Biaya yang di keluarkan tergantung

dari solusi teknikal yang diinginkan. Akan tetapi, setelah data

warehouse digunakan, kemungkinan didapatkan ROI (Return on

Investment) akan relatif lebih besar.

• Keuntungan Kompetitif.

Keuntungan kompetitif didapatkan apabila pengambil keputusan

mengakses data yang dapat mengungkapkan informasi yang

sebelumnya tidak diketahui atau tidak tersedia.

• Meningkatkan produktifitas para pengambil keputusan perusahaan.

Data warehouse dapat meningkatkan produktifitas pengambil

keputusan perusahaan dengan menciptakan sebuah database yang

terintegrasi secara konsisten, berorientasi pada subjek, dan data

historis. Data warehouse akan mengintegrasikan data dari beberapa

sumber yang tidak kompitabel ke dalam bentuk yang dapat

menyediakan satu pandangan yang konsisten dari organisasi sehingga

mengambil keputusan dan melakukan analisa secara akurat.

2.1.11 Metode Perancangan Data Warehouse

Menurut Kimball & Ross (2010: 97), ada 9 tahapan

perancangan data warehouse yang dikenal dengan business

dimensional lifecycle, yaitu:

1. Pemilihan Proses

Proses bisnis adalah proses kegiatan alami yang dilakukan

dalam organisasi atau perusahaan. Untuk memilih proses bisnis,

menggabungkan pemahaman tentang kebutuhan bisnis dengan

pemahaman dari data yang tersedia. Contoh proses bisnis :

pembelian, pengiriman, pemesanan, faktur dan buku besar.

2. Menentukan Grain / menentukan sumber dari proses bisnis

Memilih tingkatan grain dengan cara menemukan

keseimbangan antara kebutuhan bisnis dan apa yang sumber data

21

dapat berikan. Grain menjelaskan apa yang fact table record dapat

tampilkan. Tahap ini sangat penting karena jika melakukan

kesalahan pada tahap ini, maka pada tahap ke 3 dan ke 4 pasti akan

terjadi kesalahan. Contoh menentukan grain : sebuah rincian bulanan

untuk setiap rekening bank.

3. Mengidentifikasi dan menyeseuaikan dimensi

Dimensi menyiapkan konteks untuk menanyakan fakta yang

ada pada fact table. Kumpulan tabel dimensional yang baik adalah

dimensional yang mudah untuk dimengerti. Mengindentifikasi

dimensi dengan detail yang cukup untuk menjelaskan hal-hal kepada

client dan perusahaan pada grain yang tepat. Dengan pilihan masing

- masing dimensi, akan dapat menampilkan atribut yang akan

menyempurnakan setial tabel dimensi. Contoh identifikasi dimensi :

date, product, customer, transaction type.

4. Mengidentifikasi dan menentukan fakta

Grain pada fact table menjelaskan fakta mana yang

dinyatakan pada level yang tersirat oleh grain. Dan semua kandidat

fakta dalam desain harus sesuai dengan grain yang telah ditentukan

pada tahap ke 2.

5. Menyimpan Pre-Kalkulasi dalam tabel fakta

Pada tahap ini, hasil perhitungan pada suatu atribut perlu

dipertimbangkan untuk disimpan di database. Hal ini untuk

mengurangi risiko kesalahan pada program setiap kali melakukan

perhitungan pada atribut-atribut tersebut.

6. Melengkapi Tabel Dimensi

Dari dimensi-dimensi yang telah diidentifikasi, dibuat

deskripsi yang memuat informasi terstruktur mengenai atribut-atribut

pada tabel dimensi. Tabel dimensi tersebut harus diberi keterangan

secara lengkap dan mudah dipahami oleh pengguna.

22

7. Memilih Durasi dari Database

Menentukan batas waktu dari umur data yang diambil dan

akan dipindahkan ke dalam tabel fakta. Misalnya, data perusahaan

dua tahun yang lalu atau lebih diambil dan dimasukkan ke dalam

tabel fakta.

8. Melacak perubahan dari dimensi secara perlahan

Dimensi dapat berubah dengan lambat dan menjadi sebuah

masalah. Terdapat tiga tipe dasar dari perubahan dimensi yang

lambat, yaitu :

• Menulis ulang atribut yang berubah

• Membuat record baru pada dimensi

• Membuat suatu atribut alternatif untuk menampung

nilai yang baru.

9. Menentukan desain fisik

Pada tahap ini, dilakukan perancangan fisik dari data

warehouse. Selain itu, penentuan masalah-masalah yang mungkin

ada pada perancangan fisik.

2.1.12 Extract, Transform, Load Process (ETL)

Menurut Connoly dan Begg (2010:1208), ETL process ini

terdiri dari extract, transform, load yang memiliki penjelasan masing-

masing:

• Extraction

Tahapan dimana mengambil data dari sumber data untuk

envinronment data warehouse. Sumber data ini biasanya terdiri

dari database OLTP dan juga bisa terdapat beberapa sumber

lainnya.

• Transformation

Sebagai tahapan yang menggunakan beberapa peraturan atau

fungsi dari data yang sudah di ambil dan mengukur bagaimana

23

data tersebut dapag digunakan untuk analisis dan dapat

meliputi transformasi.

• Load

Tahap ini untuk memasukkan data yang sudah mengalami

proses transformasi ke dalam data warehouse.

2.1.12.1 Staging area

Di dalam ETL Process, ada sebuah area yang

bernama staging area. Pengertian staging area adalah

sebuah area tempat penampungan data sebelum data

dimasukkan ke dalam data warehouse. Setelah data di-

ekstrak ke dalam staging area, maka data akan banyak

dilakukan perubahan seperti melakukan cleansing data

(Memperbaiki kesalahan ejaan, mengatasi konflik domain,

menangani bagian yang hilang), Menggabungkan data dari

berbagai sumber, menghilangkan data berulang.

2.1.13 Online Analytical Processing (OLAP)

Menurut Scheps (2008:68), Online Analytical Processing

adalah sebuah konsep data multidimensional yang mencatat data

transaksi perusahaan. Bukan hanya mengagregasi data, OLAP

memberikan kemampuan pada sistem business intelligence untuk

melihat data dengan cara baru.

24

Gambar 2.7 Online Analytical Processing

(Sumber: Scheps, 2008:69)

Menurut Scheps (2008:77), sistem Online Analytical

Processing memiliki dua kategori yaitu:

• OLAP Cube

Penyimpan data yang telah dispesialisasi dan dirancang secara spesifik

untuk menangani data ringkasan multidimensional (multidimentional

summary data). Strukturnya seperti spreadsheet.

• OLAP Access Tool

Lingkungan client yang memungkinkan pengguna untuk memanipulasi

data cube dan akhirnya menghasilkan business intelligence yang berarti

dari berbagai sudut pandang dan dapat lebih dari satu sudut pandang.

2.1.14 Online Transaction Processing (OLTP)

Menurut Connoly dan Begg (2010:1196), pengertian online

transaction processing adalah suatu sistem yang dirancang bertujuan

untuk menangani transaksi dengan jumlah yang tinggi, dengan transaksi

yang pada umumnya membuat perubahan kecil bagi data operasional

perusahaan.

25

2.1.15 Komponen Pemodelan Dimensional

2.1.15.1 Dimensi

Menurut Kimball dan Ross (2013:10), pengertian

dimensi adalah sebuah entitas yang berbentuk model

dimensional yang mempunyai atribut di dalamnya untuk

mengukur apa yang ada dalam tabel fakta.

2.1.15.2 Dimension Table

Menurut Kimball dan Ross (2013:13), pengertian

dimension table adalah tabel dalam dimensional model

dengan sebuah primary key dan kolom atribut-atribut yang

deskriptif. Tabel dimensi berisi konteks tekstual yang terkait

dengan kegiatan pengukuran proses bisnis, menjelaskan

"siapa, apa, dimana, kapan, bagaimana, dan mengapa"

berkaitan dengan kegiatan tersebut.

2.1.15.3 Fakta

Menurut Kimball dan Ross (2010: 402), pengertian fakta

adalah sebuah ukuran performa bisnis, biasanya berupa

numerik dan penjumlahan, Hal ini berlanjut pada pengertian

dari tabel fakta sebagai tempat lokasi penyimpanan fakta

yang ada.

2.1.15.4 Fact Table

Menurut Kimball dan Ross (2013:10), pengertian fact

table adalah sebuah tabel utama dengan performa

perhitungan karakteristik numerik berdasarkan composite

key, serta setiap elemen foreign key yang diambil dari tabel

dimensi.

2.1.15.5 Surrogate key

Menurut Thomas Connoly (2010:1079), pengertian

surrogate key adalah salah satu fitur penting dalam tabel

dimensi yang dibuat berdasarkan bilangan bulat, yang

berfungsi untuk menggabungkan antara tabel dimensi dengan

tabel fakta.

26

2.1.16 Star Schema

Sedangkan menurut Connoly dan Begg (2010:1227),

pengertian star schema atau skema bintang adalah data model

dimensional yang memiliki tabel fakta di tengah-tengah dan

dikelilingi oleh tabel dimensi yang berisi referensi data.

Gambar 2.8 Star Schema

(Sumber: Connoly dan Begg, 2010:1228)

Skema bintang memiliki beberapa kelebihan, yaitu:

- Efisiensi, struktur database konsisten sehingga efisien dalam

mengakses data dengan menggunakan tool untuk menampilkan data

termasuk laporan tertulis dan query.

- Kemampuan untuk mengatasi perubahan kebutuhan, skema bintang

dapat beradaptasi terhadap perubahan kebutuhan pengguna karena

semua tabel dimensi memiliki kesamaan dalam hal menyediakan

akses ke tabel fakta.

- Extensibility, model dimensional dapat dikembangkan. Seperti

menambah tabel fakta selama data masih konsisten, menambah tabel

27

dimensi selama ada nilai tunggal di tabel dimensi tersebut yang

mendefinisikan setiap record tabel fakta yang ada, menambahkan

attributte tabel dimensi, dan memecahkan record tabel dimensi yang

ada menjadi level yang lebih rendah daripada level sebelumnya.

2.1.17 Snowflake Schema

Menurut Connoly dan Begg (2010:1229), pengertian

snowflake schema adalah sebuah model data dimensional yang terdiri

dari tabel fakta yang di letakkan di tengah-tengah dan dikelilingi oleh

tabel dimensi yang sudah mengalami normalisasi. Pada snowflake

schema, sebuah tabel dimensi dapat mempunyai tabel dimensi lainnya.

Gambar 2.9 Snowflake Schema

(Sumber: Connoly dan Begg, 2010:1229)

2.1.18 Starflake Schema

Menurut Connoly dan Begg (2010:1230), pengertian starflake

schema adalah sebuah struktur gabungan yang terdiri dari gabungan

star schema dan snowflake schema. Dalam struktur ini beberapa tabel

dimensi dapat disajikan dalam bentuk star schema maupun snowflake

schema sesuai untuk kebutuhan query.

28

Gambar 2.10 Starflake Schema

(Sumber: Connoly dan Begg, 2010:1230)

2.1.19 Activity Diagram

Menurut Satzinger (2012:57) activity diagram menjelaskan

tentang macammacam aktivitas user atau sistem, orang yang melakukan

tiap aktivitasnya, dan aliran yang berurutan dari aktivitas. Activity

Diagram menggunakan banyak simbol seperti:

1. Oval, melambangkan aktivitas individual di dalam workflow.

2. Connecting arrow, melambangkan urutan diantara aktivitas.

3. Lingkaran hitam, melambangkan awal dan mula dari suatu workflow.

4. Diamond, melambangkan poin pengambilan keputusan di dalam

workflow.

5. Heavy solid line, merupakan bar sinkronasi yang mana memisahkan

satu jalur menjadi banyak jalur atau menggabungkan banyak jalur

menjadi satu.

29

Gambar 2.11 Activity Diagram

(Sumber: Satzinger, 2012:58)

2.1.20 Entity Relationship Diagram (ERD)

Menurut Sutanta (2011:91), pengertian Entity Relationship

Diagram (ERD) adalah suatu model data yang dikembangkan

berdasarkan objek. ERD digunakan untuk menjelaskan hubungan antar

data dalam basis data kepada pengguna secara logis. Entity Relationship

Diagram (ERD) didasarkan pada suatu persepsi bahwa real world

terdiri atas obyek-obyek dasar tersebut.

Sedangkan menurut Mata-Toledo dan Cushman (2007:139),

pengertian entity relationship diagram (ERD) merupakan representasi

grafis dari logika database dengan menyertakan deskripsi detail

mengenai seluruh entitaas (entity), hubungan(relationship), dan

batasan(constraint).

2.1.21 5W 1H

Menurut Ridwan Ilyas (2015), 5W+1H adalah sebuah metode

yang digunakan untuk mendapatkan informasi dengan menyajukan

pertanyaan sesuai kepanjangannya adalah what, who, where, when,

why, how. yang masing-masing memiliki pengertian berupa:

• What

Merupakan predikat dari subjek yang dibicarakan dan diawali oleh

kata kerja aktif atau positif.

30

• Who

Merupakan subjek pelaku dari berita yang dibahas dan menunjukkan

orang, tokoh, jabatan atau organisasi tertentu dan terdiri dari

kumpulan benda.

• Where

Merupakan bagian dari berita yang menunjukkan dari lokasi kejadian

dan biasa berbentuk dalam rangkaian lokasi.

• When

Merupakan penunjuk waktu dari kejadian dan struktur yang paling

umum diawali dengan hari kemudian tanggal.

• Why

Merupakan alasan dari kejadian terjadi.

• How

Merupakan penjelasan dari kejadian.

2.2 Teori khusus

Teori khusus adalah teori yang berkaitan dengan sejumlah fakta-fakta

partikular tertentu. Teori ini berusaha menjelaskan fakta-fakta dalam

hubungannya yang satu dengan yang lainnya. Teori khusus akan saling berkaitan

dengan topik yang dibahas. Berikut adalah teori khusus yang digunakan:

2.2.1 Penjualan

Menurut Mulyadi (2008:202), pengertian penjualan adalah kegiatan

yang dilakukan oleh penjual dalam menjual barang atau jasa dengan

harapan akan memperoleh laba dari adanya transaksi-transaksi tersebut

dan penjualan dapat diartikan sebagai pemindahan hak kepemilikan atas

barang dari pihak penjual ke pembeli yang bersangkutan.

2.2.2 Pembelian

Menurut Sofjan Assauri (2008:223), pengertian pembelian adalah

salah satu fungsi yang penting dalam berhasilnya suatu kegiatan operasi

dalam perusahaan. Fungi ini dibebani tanggung jawab untuk mendapatkan

kuantitas dan kualitas bahan-bahan yang tersedia pada waktu yang

31

dibutuhkan dengan harga yang sesuai dengan keadaan yang berlaku.

Pengawasan perlu dilakukan terhadap pelaksanaan fungsi ini, karena

pembelian menyangkut investasi dana dalam persediaan dan

mempengaruhi kelancaran bahan baku.

Sedangkan menurut Render (2011:414), pengertian pembelian adalah

perolehan barang dan jasa. secara umum definisi pembelian adalah suatu

usaha pengadaan barang atau jasa dengan tujuan yang akan digunakan

sendiri, untuk kepentingan proses produksi maupun untuk dijual kembali.

2.2.3 Persediaan

Menurut Agus Ristono (2009:1), pengertian persediaan adalah

barang-barang yang disimpan untuk digunakan atau dijual pada masa yang

akan datang. Persediaan terdiri dari persediaan bahan baku dan persediaan

barang jadi.

2.3 Kerangka Berpikir

Kerangka berpikir menggambarkan konsep pemecahan sementara dari

permasalahan yang telah dirumuskan atau diidentifikasi. Kriteria utama suatu

kerangka berpikir adalah alur-alur pikiran yang logis dalam membangun suatu

kerangka berpikir yang membuahkan kesimpulan.

32

Topic:

Data Warehouse

Pengumpulan Fakta

• Observasi

• Interview

Problems:

• Perusahaan membutuhkan

data yang terintegrasi untuk

menganalisa historical data

dari berbagai dimensi.

Study Literature • Membaca jurnal dan buku

yang terkait dengan data

warehouse.

Perancangan Data Warehouse

• Extraksi data

• Transformasi Data

• Data Modelling

• Load Data

Membuat dashboard