31
UNIVERZITET ZA POSLOVNE STUDIJE BANJA LUKA FAKULTET ZA POSLOVNE I FINASIJSKE STUDIJE SEMINARSKI RAD PREDMET: MENADŽMENT INFORMACIONIH SISTEMA TEMA: SKLADIŠTENJE PODATAKA Profesor: Prof.dr. Branko Latinović Student: Slaviša Šarović

Seminarski rad -Skladišta podataka

Embed Size (px)

DESCRIPTION

Skladišta podataka

Citation preview

Page 1: Seminarski rad -Skladišta podataka

UNIVERZITET ZA POSLOVNE STUDIJE

BANJA LUKA

FAKULTET ZA POSLOVNE I FINASIJSKE STUDIJE

SEMINARSKI RAD

PREDMET: MENADŽMENT INFORMACIONIH SISTEMA

TEMA: SKLADIŠTENJE PODATAKA

Profesor: Prof.dr. Branko Latinović Student: Slaviša Šarović

Istočno Sarajevo: Maj 2012.

Page 2: Seminarski rad -Skladišta podataka

SADRŽAJ

UVOD...................................................................................................................1

DEFINICIJA.........................................................................................................2

ULOGA SKLADIŠTA PODATAKA...................................................................3

OSNOVNE FUNKCIJE SKLADIŠTA PODATAKA..........................................4

ETL PROCESI......................................................................................................5

EKSTRAKCIJA PODATAKA...............................................................................................5

PROCES TRANSFORMACIJE PODATAKA......................................................................6

PROCESI PUNJENJA SKLADIŠTA PODATAKA.............................................................7

OSNOVNI MODELI SKLADIŠTA PODATAKA..............................................8

DVOSLOJNA ARHITEKTURA S JEDNIM ZAJEDNIČKIM SKLADIŠTEM

PODATAKA..........................................................................................................................8

DVOSLOJNA ARHITEKTURA S VIŠE NEZAVISNIH LOKALNIH SKLADIŠTA

PODATAKA..........................................................................................................................8

TROSLOJNA ARHITEKTURA SKLADIŠTA PODATAKA..............................................9

IMPLEMENTACIJA SKLADIŠTA PODATAKA U POSLOVNI SUBJEKT. 10

VIŠEDIMENZIONALNI PRIKAZ PODATAKA.............................................12

ZAKLJUČAK.....................................................................................................14

LITERATURA....................................................................................................15

Page 3: Seminarski rad -Skladišta podataka

UVOD

Danas, više nego ikad, menadžerima su potrebni lako dostupni i konzistentni podaci

predstavljeni tako da u isto vrijeme, precizno i sažeto daju prikaz organizacije u cjelini kao i

njenog okruženja. Međutim složeni uslovi poslovanja generišu svakim danom sve veći broj

poslovnih događaja u okviru preduzeća i izvan njega, a dobijeni podaci najčešće su pohranjeni

u operativnim bazama podataka. Zbog veličine takvih baza nije ih moguće pretraživati u

stvarnom vremenu, a kad se i dobije konačni odgovor na upit, obično su to izvještaji u

dvodimenzionalnom obliku na velikom broju stranica i predstavljaju selektovano prepisivanje

podataka iz baze.

Budući da je pravovremeno dobijanje kvalitetnih informacija bitno za ostvarenje prednosti

pred konkurencijom, menadžer ih mora dobiti što prije i u obliku prilagođenom njegovim

potrebama. Iz toga proizlazi da se od današnjih informacionih sistema preduzeća očekuje da

osiguraju informacije čiji sadržaj, brzina pristupa i način prikaza odgovaraju trenutnim

potrebama menadžera u procesu odlučivanja. Dok se za potrebe operativnog vođenja

poslovanja koriste klasične baze podataka, zasnovane na relacionom modelu, koje odražavaju

ažurno, stvarno stanje poslovnog sistema, a određenim se podacima nakon ažuriranja gubi

trag, za donošenje pravilnih poslovnih odluka potrebno je imati uvid i u vremenski tok

dešavanja poslovnih događaja, pa takve baze podataka ne predstavljaju zadovoljavajuće

rješenje.

Radi toga se prišlo kreiranju novih oblika organizovanja podataka u računarskim memorijama

informacionih sistema. Razvijena je nova generacija računarskih sistema koja se temelji na

konceptu skladištenja podataka. Skladište podataka sadrži podatke prikupljene iz različitih

izvora, istorijske o poslovanju preduzeća kao i podatke iz vanjskog okruženja, a dizajnirano je

tako da omogućava pretraživanje podataka, on-line analitičku obradu, izvještavanje i

podržavanje procesa donošenja odluka. Skladište podataka je po tehničkim zahtjevima i po

sadržaju sasvim drugačije od transakcionih sistema1. Premda je operativna baza njegova

pretpostavka, skladišta podataka se u svom dizajnu oslanjaju na višedimenzionalni koncept.

Dakle, nova generacija računarskih sistema sada se sastoji od dva dijela, operativnog

(transakcijonog) i skladišta podataka (analitičkog), čime se postiže izdvajanje procesa za

generisanje informacija (ekstrakcije, agregacije, izvještaji, analize) koji se po svojoj prirodi

razlikuju od operativnih procesa.

1 Transakcioni sistemi- manipulacija transakcijama, procesima koji su frekventni i ponavljajući, paralelno se izvode (primer: bankarski poslovi, rezervacije letova, naručivanje robe). (On-Line Transaction Processing)

3

Page 4: Seminarski rad -Skladišta podataka

Definicija

Sam pojam "skladište podataka" (engl. Data Warehouse) podrazumijeva zbirku podataka

izolovanih iz operativnih baza i spremljenih u posebne baze

Glavna karakteristika koja određuje skladište podataka odnosi se na njegovu svrhu. U

skladištu podataka podaci se skupljaju i organizuju na način da budu lako dostupni da bi ih

menadžment mogao na brz i jednostavan način koristiti za potrebe analize svog poslovanja.

Prema definiciji koju je postavio William H. Inmon2, skladište podataka predstavlja subjektno

usmjeren (subject-oriented), integrisani (integrated), vezan na vrijeme (time-variant) i

sadržajno nepromjenjiv (non-volatile) skup podataka, a krajnji cilj mu je pomoć

menadžmentu pri donošenju odluka.

Subjektna usmjerenost podataka znači da se oni organizuju oko predmeta, na način da daju

informacije o tačno određenim predmetima u okviru funkcionalnih područja (npr. u okviru

prodaje, nabavke.) umjesto o tekućim operacijama preduzeća. Suprotno tome operativne baze

podataka organizovane oko poslovnih aplikacija, dakle usmjerene su na tekuće operacije (npr.

obrade narudžbi, isporuka i sl.).

Integrisanost - podaci se skupljaju u bazu podataka iz različitih izvora i pohranjuju uvijek u

istom formatu, te su konzistentni i prikazuju se na dosljedan način.

Vezanost uz vrijeme - svi podaci u skladištu podataka vezani su i identifikuju se uz određeni

vremenski period, što znači da imaju istorijski karakter. Za razliku od njih, u operativnim

bazama podataka pohranjeni su samo aktuelni, najsvježiji podaci.

Sadržajna nepromjenjivost - podaci u skladištu su stabilni i kad se jednom pohrane u skladište

u pravilu se ne mijenjaju. Time se omogućuje da menadžement ili svako ko koristi skladište

podataka može biti siguran da će dobiti jednak odgovor nezavisno od vremena ili učestalosti

postavljanja upita.

Postupak skladištenja podataka predstavlja kontinualan proces planiranja, građenja, i

prikupljanja podataka iz različitih izvora te njegovog korištenja, održavanja upravljanja i

2 "The Business Intelligence and Data Warehousing Glossary", http://www.sdgcomputing.com/glossary.htm,

2.4.2004.

4

Page 5: Seminarski rad -Skladišta podataka

stalnog unaprjeđenja. Među mnogim koracima u tom kompleksnom kontinualnom procesu

bitno je naglasiti važnost posjedovanja vizije o tome što se želi postići kreiranjem skladišta

podataka. Jedna od uloga skladišta je primjerice razvijanje i korištenje znanja zasnovanog na

podacima (engl. data-based knowledge).

ULOGA SKLADIŠTA PODATAKA

Običnim jezikom rečeno, glavni cilj skladišta podataka je osloboditi informacije koje su

"zaključane" u bazama podataka i "pomiješati" ih s informacijama iz ostalih, u pravilu

vanjskih izvora podataka. Velike organizacije danas sve više traže dodatne podatke iz

vanjskih izvora, kao što su npr. podaci o konkurenciji, demografski trendovi, prodajni

trendovi i sl.

Da bi skladište podataka moglo ispuniti cilj i svrhu svog postojanja, mora prije svega ispuniti

sljedeće preduslove:

Mora osiguravati pristup svim zaposlenim u preduzeću, a ne samo menadžerima, znači

može služiti velikom broju ljudi. Taj pristup mora biti pouzdan, brz i jednostavan.

Skladište treba sadržavati veliku količinu detaljnih podataka. To znači da sve poslovne

transakcije relevantne za donošenje poslovnih odluka, koje su nastale u procesima

preduzeća moraju biti evidentirane u skladištu podataka. Uneseni podaci trebaju biti

konzistentni, npr. ako je sa dva različita mjesta u različito vrijeme postavljen jednak

upit i rezultat tih upita mora biti isti.

Osvježavanje, odnosno ažuriranje novim podacima treba biti kontinualan proces, po

mogućnosti treba se odvijati u stvarnom vremenu praktično odmah nakon što se neki

poslovni događaj odigrao ili odmah po završetku nekog procesa.

Mora biti uvijek raspoloživo i oblikovano na način da može poslužiti svakoj svrsi koju

nije uvijek moguće unaprijed predvidjeti.

Treba predvidjeti mogućnost izdvajanja i međusobnog povezivanja podataka u smislu

5

Page 6: Seminarski rad -Skladišta podataka

dobijanja svih mjera i pokazatelja poslovanja u poduzeću (engl. slice and dice).

Podaci u skladištu koji se skupljaju iz različitih izvora, čiste se uz osiguranje kvaliteta

i samo takvi su dostupni korisnicima. Loši ulazni podaci ne mogu davati dobre izlazne

podatke.

Mora biti proširivo da bi moglo pratiti strategiju proširenja poslovanja preduzeća.

I na kraju, mora zadovoljiti odgovarajuće mjere zaštite tajnosti osjetljivih podataka što

se postiže provođenjem rigoroznih mjera čuvanja tajnosti.

OSNOVNE FUNKCIJE SKLADIŠTA PODATAKA

Uspostavljanjem skladišta podataka operativne baze podataka rasterećuju se složenih upita pa

dolazi do unapređenja njihovih operativnih funkcija. Iz operativnih baza time je uklonjena

ogromna masa najčešće istorijskih podataka i preseljena je u skladište podataka. Informacioni

sistem sastoji se sada od dva dijela, operativnog dijela i skladišta podataka. Budući da se tako

lakše kontroliše i restrukturira on postaje puno produktivniji.

Pomoću tehnika otkrivanja znanja skladište podataka osigurava stalno pronalaženje novih

informacija zavisno od novonastalih uslova i zahtjeva. Procesi za generisanje informacija

(ekstrakcije, agregacije, analize, izvještaji itd.) izdvojeni su iz operativnih procesa, što znači

da operativni nivo sistema više nije njima opterećen. Sada skladište podataka postaje mjesto

skupljanja i pohranjivanja poslovnih podataka i izvor informacija korištenih pri poslovnom

odlučivanju.

Strukturu skladišta podataka čine dva osnovna dijela, a to su podaci i mehanizmi manipulacije

tim podacima. Dio skladišta gdje se nalaze podaci sastoji se od osnovnih podataka i

agregiranih višedimenzionalnih podataka3, a mehanizme manipulacije predstavljaju procesi

3 Agregacija – apstrakcija u kojoj se skup objekata i njihovih međusobnih veza tretira kao novi, jedinstveni, agregirani tip. Agregirani objekat kao svoje komponente ima objekte koji čine agregaciju, a može da ima, kao celina i svoje sopstvene atribute i može kao celina da stupa u vezu sa drugim objektima u modelu.

6

Page 7: Seminarski rad -Skladišta podataka

ekstrakcije, transformacije i punjenja podataka (ETL) sistem upravljanja podacima, postupci

analitičke obrade podataka i sama prezentacija podataka.

Na slici 1. prikazana je struktura skladišta podataka predstavljena u dva dijela

7

sistem za upravljanje podacima

prezentacija informacije

analitička obrada

višedimenzionalnipodaci

osnovni podaci

ETL procesi

Page 8: Seminarski rad -Skladišta podataka

Osnovna funkcija skladišta podataka je skupljanje podataka i stvaranje logički

integrisanih i predmetno usmjerenih informacija. Treba ga oblikovati na način da se može

na jednostavan način i brzo prilagođavati svim promjenama i zahtjevima poslovnog

okruženja. S obzirom na predmetnu usmjerenost podataka, pri modelovanju skladišta

primjenjuju se tehnike koje podržavaju predmetnu orijentaciju te osiguravaju dovoljnu

prilagodljivost da bi se tokom vremena mogli integrisati i podaci iz mogućnih dodatnih

izvora. Skladište podataka treba biti izvor stabilnih podataka, nezavisnih od eventualnih

promjena u poslovnim procesima. Iz tog razloga potrebno je koristiti model neosjetljiv na

uticaje operativnih procesa koji kreiraju većinu podataka. Oslobođeno operativnih

obrada, skladište podataka osigurava unapređenje procesa generisanja informacija, a kroz

tehnike otkrivanja znanja osigurava stalno pronalaženje novih informacija.

ETL PROCESI

Kao što je već prethodno rečeno, podaci ulaze u skladište podataka iz različitih izvora,

najčešće iz transakcionih sistema preduzeća. Najopsežniji posao u aktivnostima

skladištenja podataka predstavljaju procesi integrisanja podataka i organizovanje

njihovog sadržaja. Pri tom glavnu ulogu predstavlja skup procesa kojima je zadatak

obuhvatanje, preoblikovanje i punjenje ili unošenje podataka iz jednog ili više

transakcionih sistema u skladište podataka.4 Zajednički im je naziv ETL procesi, nastao

od prvih slova engleskih riječi extraction, transformation and loading.

Prije samog početka ETL procesa potrebno je izvršiti pripremne aktivnosti vezane uz

reformu, usklađivanje i čišćenje podataka. Izvorne podatke zaprimljene iz različitih

datoteka i baza podataka potrebno je unificirati odnosno prikazati u jedinstvenom

formatu. U tom formatu podaci će se koristiti u svim daljnjim fazama obrade.

Usklađivanje podataka se provodi da bi se izbjegla redundancija podataka. Osim što se u

informacionom sistemu isti podaci mogu pojaviti na više mjesta, oni znaju biti i

nedosljedni, odnosno njihove vrijednosti nisu iste na svim mjestima kojima se ti podaci

javljaju. Radi toga potrebno ih je otkriti i uskladiti. Čišćenje kao pripremna aktivnost

4 Panian Ž., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003., str 86.

8

Page 9: Seminarski rad -Skladišta podataka

ETL procesa ima zadatak ukloniti one podatke koji se pojavljuju kao posljedica ranijih

grešaka u radu informacionih sistema (greške podrazumijevaju podatke koji nisu

kompletni, tačni, konzistentni i sl.) ili zbog namjernih ubacivanja netačnih i lažnih

podataka u sistem (računarski virusi i sl.).

Uopšteno, karakteristika standardnih ETL alata je da, ako imaju bolje performanse

vezane uz procese čišćenja, tada im je slabiji kapacitet vezan uz procese transformacije ili

obrnuto. Pa je prije izbora potrebno znati karakteristike podataka koji će se slijevati u

skladište podataka. Na primjer, ako se unaprijed zna da će biti puno podataka koji

zahtjevaju postupak transformacije, tada treba odabrati ETL alate koji su "jači" u

procesima transformacije, ili obrnuto.

EKSTRAKCIJA PODATAKA

Proces ekstrakcije podataka potrebno je provoditi na način da pri tom redovni operativni

poslovi što manje trpe. Pa su programi i alati za ekstrakciju oblikovani tako da ETL

procese mogu obavljati što produktivnije uz nastojanje da potrebne podatke iz

operativnih procesa zaprimaju što je moguće brže. Pri tom se kao problem može pojaviti

potencijalno visok stepen redundancije podataka u transakcionim sistemima, pa treba

odabrati takav pristup ekstrakciji kojim se vrši zahvatanje samo onih podataka koji će se

koristiti u aplikacijama poslovne inteligencije.

PROCES TRANSFORMACIJE PODATAKA

U okviru ETL procesa najviše vremena troši se na postupak transformacije podataka,

prema stručnim procjenama i preko 80 posto od ukupnog ETL procesa. U postupku

transformacije mogu se pojaviti različiti problemi koji usporavaju proces, a kao najčešći

javljaju se:5

5 Panian Ž., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003., str 89.

9

Page 10: Seminarski rad -Skladišta podataka

Nekonzistentne vrijednosti podataka - pojavljuju se prilikom kopiranja podataka,

a kopija pri tom nije potpuno vjerna orginalu.

Nepodudarnost primarnih ključeva korištenih u izvornim datotekama i bazama

podataka s primarnim ključevima koje pretpostavljaju aplikacije poslovne

inteligencije.

Netačne vrijednosti podataka - potrebno je definisati logiku čišćenja za

ispravljanje netačnih vrijednosti podataka. Čišćenje je potrebno provoditi stalno,

odnosno svakim novim ciklusom punjenja podataka.

Različiti formati podataka - format podataka, na primjer broj žiro-računa kupca

nije evidentiran u operativnoj bazi u istom formatu kako ga očekuje alat poslovne

inteligencije te ga treba prilagođavati.

Problem sinonima i homonima - ponekad se isti podaci pojavljuju pod različitim

nazivima. Isto tako događa se da različiti podaci nose isti naziv tj. govori se o

homonimima. Oba slučaja su nepoželjna i treba ih uklanjati premda

pretpostavljaju velik dodatni posao.

"Skrivena" procesna logika - može predstavljati problem koji usporava proces

transformacije kad se za zahvatanje podataka koriste softverski sistemi stari

nekoliko decenija i danas više nitko ne zna kako oni rade. U njima se može naići

na arhaične odnose među podacima koje nije lako protumačiti i ukoliko je

potrebno transformisati u neki drugi poznati tip odnosa. Takva procesna logika

može biti velik problem kao izvor grešaka koje treba ispravljati.

Iako proces transformacije podataka podrazumijeva pažljiv, dugotrajan i savjestan

posao, potrebno ga je savjesno i do kraja u cjelini izvršiti.

10

Page 11: Seminarski rad -Skladišta podataka

Procesi punjenja skladišta podataka

Slika2. Mjesto i tok ETL procesa u kreiranju koncepta poslovne inteligencije

Podaci u transakcionim sistemima nalaze se u bazama podataka koje obuhvataju krači

vremenski period pa nisu dovoljni kao podloga za kvalitetne analize i pomoć odlučivanju.

Pored njih, dio izvornih podataka koji se obrađuju ETL procesima čine i istorijski podaci.

Pa se za procese punjenja skladišta podataka koristi više vrsta ETL programa kao što su

programi za inicijalno punjenje, za punjenje istorijskih podataka i programi za

inkrementalno punjenje.

Karakteristika programa za inicijalno punjenje skladišta podataka jest da sadrže rutine za

čišćenje i usklađivanje podataka, da bi se iz podataka uklonile greške. Kod istorijskih

podataka ponekad nije moguće primijeniti postupke čišćenja koji se primjenjuju za "žive"

podatke, jer je od vremena nastanka tih podataka do danas možda došlo do različitih

promjena u slogovima i formatima podataka. Pa se za tu kategoriju podataka primjenjuju

programi za punjenje istorijskih podataka koji čine nastavak inicijalnog punjenja. Za

razliku od živih, istorijski su podaci statičnog karaktera i sada čine samo sadržaj

arhivskih datoteka. Treću vrstu predstavljaju programi za inkrementalno punjenje

podataka, a aktiviraju se nakon što su prethodna dva programa obavili postupak čišćenja i

usklađivanja podataka. Njihova karakteristika je da se pokreću po periodama i oni

predstavljaju stalno aktivan mehanizam punjenja skladišta podataka odgovarajućim

sadržajima. Na slici 2. prikazan je tok ETL procesa važnih u kreiranju skladišta podataka

i jednim od preduslova za razvijenje i primjenu koncepta poslovne inteligencije.

OSNOVNI MODELI SKLADIŠTA PODATAKA

11

Skladište IzvještajiTransakcione baze podataka BIpodataka

Page 12: Seminarski rad -Skladišta podataka

Prilikom kreiranja skladišta podataka danas u praksi susrećemo tri osnovna modela ili

osnovne arhitekture skladišta podataka: dvoslojna arhitektura s jednim zajedničkim

skladištem podataka, dvoslojna arhitektura s više nezavisnih lokalnih skladišta podataka

(engl. Data Marts) i troslojna arhitektura sa zajedničkim skladištem podataka i više

povezanih lokalnih skladišta podataka.

DVOSLOJNA ARHITEKTURA S JEDNIM ZAJEDNIČKIM SKLADIŠTEM

PODATAKA

Ovaj model karakteriše jedinstveno, zajedničko centralizovano skladište podataka. Podaci

se zaprimaju iz različitih izvora unutar organizacije (npr. podaci iz online sistema za

obradu transakcija, podaci iz ranije razvijenih sistema koji održavaju baze podataka itd.) i

vanjskih izvora podataka dostupnih putem Interneta ili nekim drugim načinima.

Karakteristika dvoslojne arhitekture skladišta je da ono služi većem broju organizacionih

jedinica preduzeća kao i pojedinačnim korisnicima. Takva skladišta su velikog obima i

vrlo složena, a u njima se u pravilu skladišti ogromna količina podataka. Pa i šeme

podataka prema kojima se vrši pohranjivanje podataka trebaju podržavati široku lepezu

aplikacijskih zahtjeva. Iz navedenog je vidljivo da su troškovi održavanja takve

arhitekture visoki i pretpostavljaju znatan angažman i vrijeme određenog broja i profila

stručnjaka.

DVOSLOJNA ARHITEKTURA S VIŠE NEZAVISNIH LOKALNIH SKLADIŠTA

PODATAKA

Karakteristika ove arhitekture skladišta podataka je postojanje većeg broja nezavisnih

lokalnih skladišta podataka namijenjenih za podržavanje pojedinačnih aplikacija po

organizacionim jedinicama preduzeća. Rezultat takve arhitekture je velik broj sistema

koji svaki posebno zaprimaju "svoje" podatke iz različitih transakcionih baza podataka.

12

Page 13: Seminarski rad -Skladišta podataka

Prednost navedenog modela skladišta podataka je jednostavnija izgradnja i lakše

korištenje. Međutim takav model ima i nedostatke kao što su:

otežana komunikacija među organizacionim jedinicama preduzeća. Ovaj model

nije pogodan za preduzeća čije poslovanje zahtjeva podršku aplikacija i projekata

koji pretpostavljaju međusobnu komunikaciju i saradnju većeg broja

organizacionih jedinica preduzeća,

povećanjem broja međusobno nezavisnih skladišta podataka, usporedno raste i

opterećenost samih transakcionih sistema,

data mart-ovi oblikovani su tako da podržavaju samo jednu aplikaciju, pa

naknadno dodavanje novih aplikacija u određeno skladište predstavlja poteškoće,

ograničena proširivost platforme i

otežan je uvod u stvarno stanje informacija na nivou preduzeća.

TROSLOJNA ARHITEKTURA SKLADIŠTA PODATAKA

Ovaj model sastoji se od većeg broja lokalnih skladišta podataka i jednog zajedničkog

skladišta podataka koje je smješteno između skladišta podataka i različitih izvora

podataka unutar i izvan preduzeća. Skladišta podataka oslanjaju se na centralno skladište

podataka koje im isporučuje podatke u obliku koji daje ujednačen uvid u sve segmente

poslovanja preduzeća. U odnosu na prethodna dva modela prednosti troslojne arhitekture

su veća tačnost informacija nevezano s kojeg izvora su zahvaćene, olakšana je

komunikacija među organizacionim jedinicama, smanjena je opterećenost informatičara,

povećana je skalabilnost i proširivost platforme za skladištenje podataka i na kraju ova

arhitektura pruža mogućnost korištenja vanjskih aplikacija čime se omogućava

povezivanje svih subjekata u lancu vrijednosti.

13

Page 14: Seminarski rad -Skladišta podataka

Na slici 3. prikazan je primjer troslojnog modela sistema skladištenja podataka.

Slika 3. Troslojni model sistema skladištenja podataka

IMPLEMENTACIJA SKLADIŠTA PODATAKA U POSLOVNI

SUBJEKT

Razvoj i implementacija sistema skladišta podataka zahtijeva dosta vremena i značajna

finansijska sredstva. Međutim kako su danas uspješna preduzeća svjesna činjenice da

posjedovanje pravih i pravovremenih informacija predstavlja "stratešku imovinu"

odnosno mogućnost brze reakcije na stanja na tržištu, odlučuju se na korištenje

14

Istorijski podaci

Page 15: Seminarski rad -Skladišta podataka

tehnologije skladišta podataka jer je upravo ona preduslov za brzo i fleksibilno

pretraživanje podataka.

Jedan od praktičnih pristupa je postepena izgradnja sistema uz sukcesivno

nadograđivanje. Ukoliko se primjeni taj pristup, završni korak predstavlja kreiranje

troslojnog modela sistema skladištenja podataka. Sam postupak započinje razvojem

nekoliko skladišta podataka koja podržavaju troslojnu arhitekturu. Nakon određenog

vremena, kad je već razvijen određeni broj skladišta podataka, tok i izgradnja centralnog

skladišta i odvajanje od pojedinih skladišta podataka.

Tok izgradnje sistema skladištenja podataka sastoji se od nekoliko faza koje se

nadovezuju:6

1. Utvrđivanje zajedničkih elemenata svih predmetnih područja koje ima smisla

ugraditi u svako lokalno skladište podataka, s ciljem osiguranja integracije

svih

elemenata u jedinstveni model.

2. Razvoj prve pilot-aplikacije kojoj se pridružuje prvo skladište podataka.

Skladište podataka podijeljeno je na dvije komponente: na miniskladište i na

skladište podataka. Miniskladište se fizički pohranjuje kao nezavisna

relaciona baza podataka. Komponenta skladišta podataka zahvaća podatke iz

miniskladišta i nakon obrade puni ih u relacione tabele rezervisane za zbirne

podatke.

3. U trećoj fazi slijedi postupno aktiviranje novih skladišta podataka i razvijanja

daljnjih aplikacija potrebnih za zahvatanje njima potrebnih informacija iz

"mini skladišta" razvijenog s prvim skladištem.

4. U četvrtoj fazi dolazi do odvajanja skladišta podataka. Postepenim prethodnim

6 Panian Ž., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003., str. 101.

15

Page 16: Seminarski rad -Skladišta podataka

dodavanjem novih aplikacija mini skladište razvija se u sveobuhvatno

centralno skladište podataka koje u potpunosti zadovoljava potrebe svih

skladišta podataka za ekstrakcijom informacija. Budući da sva skladišta

podataka zaprimaju informacije iz centralno kontrolišenog skladišta podataka,

dobijeni podaci su normalizovani i konzistentni. Samo centralno skladište

moguće je sada premjestiti na posebnu server platformu čime se završava

proces kreiranja troslojnog modela sistema skladištenja podataka.

Postepena izgradnja i implementacija sistema skladišta podataka predstavlja prihvatljivije

rješenje za većinu preduzeća jer ga je moguće ostvariti uz vremensko razgraničenje

troškova.

16

Page 17: Seminarski rad -Skladišta podataka

Uvođenjem ovog sistema u preduzeće i "puštanjem u rad" završen je jedan velik posao,

međutim to nije i sam kraj. Implementacijom skladišta podataka i korištenjem njegovih

"usluga" u praksi, pojavit će se nova pitanja i zadaci s pozitivnim i negativnim

predznakom, koja će trebati rješavati. Na primjer u postupku skladištenja podataka i

korištenja dobijenih informacija, pojavit će se potreba za podacima koje nije moguće

zahvatiti iz postojećih transakcionih sistema. U takvim slučajevima, za nadopunu tim

podacima, pojavit će se potreba za nadogradnjom ili modifikacijom sistema za

transakcijsku obradu podataka ili razvoja sistema namijenjenom za zahvatanje podataka

koji nedostaju. Tradicionalni projekti započinju sa zahtjevima, a završavaju s podacima,

projekti skladištenja podataka startaju s podacima, a završavaju za zahtjevima.

Konkretno, jednom kad korisnici skladišta podataka uoče sve mogućnosti koje im pruža

tehnologija novog doba, oni će tražiti i više, što samo po sebi i nije loše. Pa prilikom

projektovanja skladišta podataka, korisnicima skladišta podataka ne treba postavljati

samo pitanja koje informacije trebaju i žele sada, već i koje informacije će trebati nakon

njih.

S druge pak strane mnogi krajnji korisnici skladišta podataka, koji su prošli trening i

obučeni za njegovo korištenje, nikad u potpunosti ne koriste sve mogućnosti koje im

skladište pruža. Prema nekim istraživanjima, samo četvrtina osposobljenih u potpunosti

koristi usluge skladišta podataka

VIŠEDIMENZIONALNI PRIKAZ PODATAKA

Skladište podataka, kao što je ranije rečeno, puni se izvorima podataka unutar

organizacije (transakcione baze) kao i vanjskim izvorima podataka. Postupcima

ekstrakcije, transformacije i punjenja kojima se zaprimaju podaci iz unutrašnjih i vanjskih

izvora dobijaju se osnovni podaci skladišta. Primjenom sistema za upravljanje podacima

17

Page 18: Seminarski rad -Skladišta podataka

dobijaju se agregirani7, višedimenzionalni podaci koji različitim analitičkim metodama

obrade omogućuju dobijanje različitih oblika informacija potrebnih menadžerima u

procesu donošenja odluka. Najveća prednost dimenzione strukture je mogućnost vizuelne

prezentacije informacija. Povezivanje skladišta podataka s korisničkim interfejsom, uz

određivanje načina postavljanja upita i prikaza rezultata upita omogućeno je

menadžerima jednostavno i brzo postavljanje upita kao i odgovarajući prikaz rezultata

upita i to prema potrebi tekstom, slikom, grafikonom i sl.

Pa se u skladištu podataka najčešće koristi dimenziona struktura podataka koja se temelji

na elementima relacione baze podataka odnosno na relacionim tabelama. Vezni element

koji objedinjuju sve elemente predstavlja središnja relaciona tabela. Ona pohranjuje

elemente primarnih šifri svake od relacionih tabela koje učestvuju u strukturi, te

numeričke varijable koje želimo analizirati.

Za vizuelni prikaz dimenzionalnog modela podataka koristi se tzv. zvijezda šema (star

šema) jer dijagram ima izgled zvijezde, kao što je prethodno navedeno - jednu središnju

veliku relacionu tabelu koja se naziva i tabelom činjenica (engl. fact table) i skup manjih

tabela. Tabela činjenica je najveća tabela u skladištu podataka, a njena veličina zavisi od

nivoa poslovnog procesa koji se prati. Ona je jedina tabela koja je povezana s ostalim

dimenzijskim tabelama u modelu podataka. Dimenzione tabele posjeduju određene

atribute, odnosno pozicije dimenzija i predstavljaju mogućnosti koje prikazuju neku

pojavu, npr. otpremu određenog proizvoda.

Na slici 4. date su dvije varijante prikaza dimenzionalnog modela podataka (otpreme

proizvoda) zvijezda šemom.

7 Agregacija – apstrakcija u kojoj se skup objekata i njihovih međusobnih veza tretira kao novi, jedinstveni, agregirani tip. Agregirani

objekat kao svoje komponente ima objekte koji čine agregaciju, a može da ima, kao celina i svoje sopstvene atribute i može kao celina da stupa u vezu sa drugim objektima u modelu.

18

Page 19: Seminarski rad -Skladišta podataka

19

Page 20: Seminarski rad -Skladišta podataka

Slika 4. Varijante prikaza dimenzionalnog modela podataka zvijezda šemom (otpreme

proizvoda )

Centralni dio šeme, tabela činjenica, predstavlja središnji dio koordinacije, koji uz

osnovne podatke o šiframa relacionih tabela koje su objedinjene u strukturu, može

sadržavati i ostale segmente informacija.

Višedimenzionalna struktura podataka pruža velike mogućnosti za otkrivanje mnogih

detalja različitim postupcima analitičke obrade kao što su agregacija i detaljizacija ili

svrdlanje (drill up, drill down, drill through), unakrsno tabeliranje (cross tabulation),

selekcija, isijecanje, izdvajanje i kombinovanje svih dimenzija (slice and dice

requirement), rotacija odnosno isticanje jedne dimenzije dok su druge u pozadini

(pivoting), prognoza, modelovanje, grafičko prikazivanje (charting), statistike analize

(trend, klaster) itd.

20

Page 21: Seminarski rad -Skladišta podataka

Z A K LJ U Č A K

Skladištenje podataka - Data Warehouse je posebno projektovano tehnološko okruženje

koje omogućava objedinjavanje srodnih podataka u oblik pogodan za analizu čime se

olakšava proces donošenja odluka i daje nov pristup sistemima za podršku odlučivanju.

Ovaj koncept obezbeđuje fleksibilan, efikasan način raspolaganja podataka u formatu

pogodnom za savremene poslovne aplikacije. Postojanje skladišta podataka kao bogato

informacijama integrisano okruženje orijentisano je ka potrebama krajnjih korisnika koji

uz pomoć alata za poslovno odlučivanje mogu donositi pravovremene i kvalitetne

poslovne odluke.

Omogućava stalno pronalaženje novih informacija namijenjenih menadžerima, a služe im

prvenstveno za strateško, taktičko i operativno donošenje odluka. Uvođenjem koncepta

skladištenja podataka, operativne baze prestaju biti opterećene složenim upitima, pa cijeli

informacioni sistem koji se sad sastoji od dva dijela, operativnog i skladišta podataka

postaje produktivniji i lakše se kontroliše i restrukturira.

Metode skladištenja podataka sve više postaju integrisane u softverske pakete temeljnog

informacionog sistema preduzeća, novije verzije relacionih baza podataka (kao npr.

Oracle i SQL server) imaju dio za Data Warehousing integrisan u svom paketu kao

OLAP. Menažerima nije potreban angažman analitičara za obradu ključnih pokazatelja o

stanju preduzeća, već takve podatke klikom miša mogu dobiti obrađene iz baze podataka,

te koristiti kao pomoć u donošenju poslovnih odluka.

Načela upravljanja prema ciljevima (Management by Objectives) će biti podržana

mogućnostima online pristupa bazama i skladištima podataka, kroz alate poslovne

inteligencije. Koncept skladišta podataka usklađivanjem podataka omogućuje jedinstvenu

istinu o preduzeću, što povećava kredibilitet informacionog sistema.

21

Page 22: Seminarski rad -Skladišta podataka

LITERATURA

Bojan Ćirić, Poslovna inteligencija, Data status, Beograd, 2006

A.Bonifati, F.Cattaneo, S.Ceri, A.Fugetta, S.Paraboschi, “Designing Data marts

for Data Warehouse”

Kellett, A., "Integrated Business Intelligence", Butler Group, April 2003.

Panian Ž., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003.

22