Seminarski rad -Skladišta podataka

Embed Size (px)

Citation preview

UNIVERZITET ZA POSLOVNE STUDIJE BANJA LUKA FAKULTET ZA POSLOVNE I FINASIJSKE STUDIJE

SEMINARSKI RADPREDMET: MENADMENT INFORMACIONIH SISTEMA TEMA: SKLADITENJE PODATAKA

Profesor: Prof.dr. Branko Latinovi

Student: Slavia arovi

Sarajevo: Maj 2012.

SADRAJ

Definicija...............................................................................................................4 OSNOVNE FUNKCIJE SKLADITA PODATAKA..........................................6 ETL PROCESI......................................................................................................8EKSTRAKCIJA PODATAKA...................................................................................................9 PROCES TRANSFORMACIJE PODATAKA..........................................................................9 Procesi punjenja skladita podataka..........................................................................................10

OSNOVNI MODELI SKLADITA PODATAKA............................................11TROSLOJNA ARHITEKTURA SKLADITA PODATAKA................................................13

IMPLEMENTACIJA SKLADITA PODATAKA U POSLOVNI SUBJEKT. 14 VIEDIMENZIONALNI PRIKAZ PODATAKA.............................................16 Z A K LJ U A K..............................................................................................19 LITERATURA....................................................................................................20

UVOD Danas, vie nego ikad, menaderima su potrebni lako dostupni i konzistentni podaci predstavljeni tako da u isto vrijeme, precizno i saeto daju prikaz organizacije u cjelini kao i njenog okruenja. Meutim sloeni uslovi poslovanja generiu svakim danom sve vei broj poslovnih dogaaja u okviru preduzea i izvan njega, a dobijeni podaci najee su pohranjeni u operativnim bazama podataka. Zbog veliine takvih baza nije ih mogue pretraivati u stvarnom vremenu, a kad se i dobije konani odgovor na upit, obino su to izvjetaji u dvodimenzionalnom obliku na velikom broju stranica i predstavljaju selektovano prepisivanje podataka iz baze. Budui da je pravovremeno dobijanje kvalitetnih informacija bitno za ostvarenje prednosti pred konkurencijom, menader ih mora dobiti to prije i u obliku prilagoenom njegovim potrebama. Iz toga proizlazi da se od dananjih informacionih sistema preduzea oekuje da osiguraju informacije iji sadraj, brzina pristupa i nain prikaza odgovaraju trenutnim potrebama menadera u procesu odluivanja. Dok se za potrebe operativnog voenja poslovanja koriste klasine baze podataka, zasnovane na relacionom modelu, koje odraavaju aurno, stvarno stanje poslovnog sistema, a odreenim se podacima nakon auriranja gubi trag, za donoenje pravilnih poslovnih odluka potrebno je imati uvid i u vremenski tok deavanja poslovnih dogaaja, pa takve baze podataka ne predstavljaju zadovoljavajue rjeenje. Radi toga se prilo kreiranju novih oblika organizovanja podataka u raunarskim memorijama informacionih sistema. Razvijena je nova generacija raunarskih sistema koja se temelji na konceptu skladitenja podataka. Skladite podataka sadri podatke prikupljene iz razliitih izvora, istorijske o poslovanju preduzea kao i podatke iz vanjskog okruenja, a dizajnirano je tako da omoguava pretraivanje podataka, on-line analitiku obradu, izvjetavanje i podravanje procesa donoenja odluka. Skladite podataka je po tehnikim zahtjevima i po sadraju sasvim drugaije od transakcionih sistema1. Premda je operativna baza njegova pretpostavka, skladita podataka se u svom dizajnu oslanjaju na viedimenzionalni koncept. Dakle, nova generacija raunarskih sistema sada se sastoji od dva dijela, operativnog (transakcijonog) i skladita podataka (analitikog), ime se postie izdvajanje procesa za generisanje informacija (ekstrakcije, agregacije, izvjetaji, analize) koji se po svojoj prirodi razlikuju od operativnih procesa.

1

Transakcioni sistemi- manipulacija transakcijama, procesima koji su frekventni i ponavljajui, paralelno se izvode (primer: bankarski poslovi, rezervacije letova, naruivanje robe). (On-Line Transaction Processing)

3

DefinicijaSam pojam "skladite podataka" (engl. Data Warehouse) podrazumijeva zbirku podataka izolovanih iz operativnih baza i spremljenih u posebne baze Glavna karakteristika koja odreuje skladite podataka odnosi se na njegovu svrhu. U skladitu podataka podaci se skupljaju i organizuju na nain da budu lako dostupni da bi ih menadment mogao na brz i jednostavan nain koristiti za potrebe analize svog poslovanja. Prema definiciji koju je postavio William H. Inmon2, skladite podataka predstavlja subjektno usmjeren (subject-oriented), integrisani (integrated), vezan na vrijeme (time-variant) i sadrajno nepromjenjiv (non-volatile) skup podataka, a krajnji cilj mu je pomo menadmentu pri donoenju odluka. Subjektna usmjerenost podataka znai da se oni organizuju oko predmeta, na nain da daju informacije o tano odreenim predmetima u okviru funkcionalnih podruja (npr. u okviru prodaje, nabavke.) umjesto o tekuim operacijama preduzea. Suprotno tome operativne baze podataka organizovane oko poslovnih aplikacija, dakle usmjerene su na tekue operacije (npr. obrade narudbi, isporuka i sl.). Integrisanost - podaci se skupljaju u bazu podataka iz razliitih izvora i pohranjuju uvijek u istom formatu, te su konzistentni i prikazuju se na dosljedan nain. Vezanost uz vrijeme - svi podaci u skladitu podataka vezani su i identifikuju se uz odreeni vremenski period, to znai da imaju istorijski karakter. Za razliku od njih, u operativnim bazama podataka pohranjeni su samo aktuelni, najsvjeiji podaci. Sadrajna nepromjenjivost - podaci u skladitu su stabilni i kad se jednom pohrane u skladite u pravilu se ne mijenjaju. Time se omoguuje da menadement ili svako ko koristi skladite podataka moe biti siguran da e dobiti jednak odgovor nezavisno od vremena ili uestalosti postavljanja upita.

2

"The Business Intelligence and Data Warehousing Glossary", http://www.sdgcomputing.com/glossary.htm, 2.4.2004.

4

Postupak skladitenja podataka predstavlja kontinualan proces planiranja, graenja, i prikupljanja podataka iz razliitih izvora te njegovog koritenja, odravanja upravljanja i stalnog unaprjeenja. Meu mnogim koracima u tom kompleksnom kontinualnom procesu bitno je naglasiti vanost posjedovanja vizije o tome to se eli postii kreiranjem skladita podataka. Jedna od uloga skladita je primjerice razvijanje i koritenje znanja zasnovanog na podacima (engl. data-based knowledge). ULOGA SKLADITA PODATAKA

Obinim jezikom reeno, glavni cilj skladita podataka je osloboditi informacije koje su "zakljuane" u bazama podataka i "pomijeati" ih s informacijama iz ostalih, u pravilu vanjskih izvora podataka. Velike organizacije danas sve vie trae dodatne podatke iz vanjskih izvora, kao to su npr. podaci o konkurenciji, demografski trendovi, prodajni trendovi i sl. Da bi skladite podataka moglo ispuniti cilj i svrhu svog postojanja, mora prije svega ispuniti sljedee preduslove: Mora osiguravati pristup svim zaposlenim u preduzeu, a ne samo menaderima, znai moe sluiti velikom broju ljudi. Taj pristup mora biti pouzdan, brz i jednostavan. Skladite treba sadravati veliku koliinu detaljnih podataka. To znai da sve poslovne transakcije relevantne za donoenje poslovnih odluka, koje su nastale u procesima preduzea moraju biti evidentirane u skladitu podataka. Uneseni podaci trebaju biti konzistentni, npr. ako je sa dva razliita mjesta u razliito vrijeme postavljen jednak upit i rezultat tih upita mora biti isti. Osvjeavanje, odnosno auriranje novim podacima treba biti kontinualan proces, po mogunosti treba se odvijati u stvarnom vremenu praktino odmah nakon to se neki poslovni dogaaj odigrao ili odmah po zavretku nekog procesa. Mora biti uvijek raspoloivo i oblikovano na nain da moe posluiti svakoj svrsi koju nije uvijek mogue unaprijed predvidjeti. 5

Treba predvidjeti mogunost izdvajanja i meusobnog povezivanja podataka u smislu dobijanja svih mjera i pokazatelja poslovanja u poduzeu (engl. slice and dice). Podaci u skladitu koji se skupljaju iz razliitih izvora, iste se uz osiguranje kvaliteta i samo takvi su dostupni korisnicima. Loi ulazni podaci ne mogu davati dobre izlazne podatke. Mora biti proirivo da bi moglo pratiti strategiju proirenja poslovanja preduzea. I na kraju, mora zadovoljiti odgovarajue mjere zatite tajnosti osjetljivih podataka to se postie provoenjem rigoroznih mjera uvanja tajnosti.

OSNOVNE FUNKCIJE SKLADITA PODATAKAUspostavljanjem skladita podataka operativne baze podataka rastereuju se sloenih upita pa dolazi do unapreenja njihovih operativnih funkcija. Iz operativnih baza time je uklonjena ogromna masa najee istorijskih podataka i preseljena je u skladite podataka. Informacioni sistem sastoji se sada od dva dijela, operativnog dijela i skladita podataka. Budui da se tako lake kontrolie i restrukturira on postaje puno produktivniji. Pomou tehnika otkrivanja znanja skladite podataka osigurava stalno pronalaenje novih informacija zavisno od novonastalih uslova i zahtjeva. Procesi za generisanje informacija (ekstrakcije, agregacije, analize, izvjetaji itd.) izdvojeni su iz operativnih procesa, to znai da operativni nivo sistema vie nije njima optereen. Sada skladite podataka postaje mjesto skupljanja i pohranjivanja poslovnih podataka i izvor informacija koritenih pri poslovnom odluivanju. Strukturu skladita podataka ine dva osnovna dijela, a to su podaci i mehanizmi manipulacije tim podacima. Dio skladita gdje se nalaze podaci sastoji se od osnovnih podataka i agregiranih viedimenzionalnih podataka3, a mehanizme manipulacije predstavljaju procesi ekstrakcije,3

Agregacija apstrakcija u kojoj se skup objekata i njihovih meusobnih veza tretira kao novi, jedinstveni, agregirani tip. Agregirani objekat

6

transformacije i punjenja podataka (ETL) sistem upravljanja podacima, postupci analitike obrade podataka i sama prezentacija podataka. Na slici 1. prikazana je struktura skladita podataka predstavljena u dva dijela

prezentacija informacije

analitika obrada

viedimenzionalni podaci sistem za upravljanje podacima

osnovni podaci

ETL procesi

kao svoje komponente ima objekte koji ine agregaciju, a moe da ima, kao celina i svoje sopstvene atribute i moe kao celina da stupa u vezu sa drugim objektima u modelu.

7

Osnovna funkcija skladita podataka je skupljanje podataka i stvaranje logiki integrisanih i predmetno usmjerenih informacija. Treba ga oblikovati na nain da se moe na jednostavan nain i brzo prilagoavati svim promjenama i zahtjevima poslovnog okruenja. S obzirom na predmetnu usmjerenost podataka, pri modelovanju skladita primjenjuju se tehnike koje podravaju predmetnu orijentaciju te osiguravaju dovoljnu prilagodljivost da bi se tokom vremena mogli integrisati i podaci iz mogunih dodatnih izvora. Skladite podataka treba biti izvor stabilnih podataka, nezavisnih od eventualnih promjena u poslovnim procesima. Iz tog razloga potrebno je koristiti model neosjetljiv na uticaje operativnih procesa koji kreiraju veinu podataka. Osloboeno operativnih obrada, skladite podataka osigurava unapreenje procesa generisanja informacija, a kroz tehnike otkrivanja znanja osigurava stalno pronalaenje novih informacija.

ETL PROCESIKao to je ve prethodno reeno, podaci ulaze u skladite podataka iz razliitih izvora, najee iz transakcionih sistema preduzea. Najopseniji posao u aktivnostima skladitenja podataka predstavljaju procesi integrisanja podataka i organizovanje njihovog sadraja. Pri tom glavnu ulogu predstavlja skup procesa kojima je zadatak obuhvatanje, preoblikovanje i punjenje ili unoenje podataka iz jednog ili vie transakcionih sistema u skladite podataka.4 Zajedniki im je naziv ETL procesi, nastao od prvih slova engleskih rijei extraction, transformation and loading. Prije samog poetka ETL procesa potrebno je izvriti pripremne aktivnosti vezane uz reformu, usklaivanje i ienje podataka. Izvorne podatke zaprimljene iz razliitih datoteka i baza podataka potrebno je unificirati odnosno prikazati u jedinstvenom formatu. U tom formatu podaci e se koristiti u svim daljnjim fazama obrade. Usklaivanje podataka se provodi da bi se izbjegla redundancija podataka. Osim to se u informacionom sistemu isti podaci mogu pojaviti na vie mjesta, oni znaju biti i nedosljedni, odnosno njihove vrijednosti nisu iste na svim mjestima kojima se ti podaci javljaju. Radi toga potrebno ih je otkriti i uskladiti. ienje kao pripremna aktivnost ETL procesa ima zadatak ukloniti one4

Panian ., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003., str 86.

8

podatke koji se pojavljuju kao posljedica ranijih greaka u radu informacionih sistema (greke podrazumijevaju podatke koji nisu kompletni, tani, konzistentni i sl.) ili zbog namjernih ubacivanja netanih i lanih podataka u sistem (raunarski virusi i sl.). Uopteno, karakteristika standardnih ETL alata je da, ako imaju bolje performanse vezane uz procese ienja, tada im je slabiji kapacitet vezan uz procese transformacije ili obrnuto. Pa je prije izbora potrebno znati karakteristike podataka koji e se slijevati u skladite podataka. Na primjer, ako se unaprijed zna da e biti puno podataka koji zahtjevaju postupak transformacije, tada treba odabrati ETL alate koji su "jai" u procesima transformacije, ili obrnuto.

EKSTRAKCIJA PODATAKAProces ekstrakcije podataka potrebno je provoditi na nain da pri tom redovni operativni poslovi to manje trpe. Pa su programi i alati za ekstrakciju oblikovani tako da ETL procese mogu obavljati to produktivnije uz nastojanje da potrebne podatke iz operativnih procesa zaprimaju to je mogue bre. Pri tom se kao problem moe pojaviti potencijalno visok stepen redundancije podataka u transakcionim sistemima, pa treba odabrati takav pristup ekstrakciji kojim se vri zahvatanje samo onih podataka koji e se koristiti u aplikacijama poslovne inteligencije.

PROCES TRANSFORMACIJE PODATAKAU okviru ETL procesa najvie vremena troi se na postupak transformacije podataka, prema strunim procjenama i preko 80 posto od ukupnog ETL procesa. U postupku transformacije mogu se pojaviti razliiti problemi koji usporavaju proces, a kao najei javljaju se:5

5

Panian ., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003., str 89.

9

Nekonzistentne vrijednosti podataka - pojavljuju se prilikom kopiranja podataka, a kopija pri tom nije potpuno vjerna orginalu. Nepodudarnost primarnih kljueva koritenih u izvornim datotekama i bazama podataka s primarnim kljuevima koje pretpostavljaju aplikacije poslovne inteligencije. Netane vrijednosti podataka - potrebno je definisati logiku ienja za ispravljanje netanih vrijednosti podataka. ienje je potrebno provoditi stalno, odnosno svakim novim ciklusom punjenja podataka. Razliiti formati podataka - format podataka, na primjer broj iro-rauna kupca nije evidentiran u operativnoj bazi u istom formatu kako ga oekuje alat poslovne inteligencije te ga treba prilagoavati. Problem sinonima i homonima - ponekad se isti podaci pojavljuju pod razliitim nazivima. Isto tako dogaa se da razliiti podaci nose isti naziv tj. govori se o homonimima. Oba sluaja su nepoeljna i treba ih uklanjati premda pretpostavljaju velik dodatni posao. "Skrivena" procesna logika - moe predstavljati problem koji usporava proces transformacije kad se za zahvatanje podataka koriste softverski sistemi stari nekoliko decenija i danas vie nitko ne zna kako oni rade. U njima se moe naii na arhaine odnose meu podacima koje nije lako protumaiti i ukoliko je potrebno transformisati u neki drugi poznati tip odnosa. Takva procesna logika moe biti velik problem kao izvor greaka koje treba ispravljati. Iako proces transformacije podataka podrazumijeva paljiv, dugotrajan i savjestan posao, potrebno ga je savjesno i do kraja u cjelini izvriti.

Procesi punjenja skladita podatakaSlika2. Mjesto i tok ETL procesa u kreiranju koncepta poslovne inteligencije 10 Transakcione baze podataka Skladite podataka Izvjetaji BI

Podaci u transakcionim sistemima nalaze se u bazama podataka koje obuhvataju krai vremenski period pa nisu dovoljni kao podloga za kvalitetne analize i pomo odluivanju. Pored njih, dio izvornih podataka koji se obrauju ETL procesima ine i istorijski podaci. Pa se za procese punjenja skladita podataka koristi vie vrsta ETL programa kao to su programi za inicijalno punjenje, za punjenje istorijskih podataka i programi za inkrementalno punjenje. Karakteristika programa za inicijalno punjenje skladita podataka jest da sadre rutine za ienje i usklaivanje podataka, da bi se iz podataka uklonile greke. Kod istorijskih podataka ponekad nije mogue primijeniti postupke ienja koji se primjenjuju za "ive" podatke, jer je od vremena nastanka tih podataka do danas moda dolo do razliitih promjena u slogovima i formatima podataka. Pa se za tu kategoriju podataka primjenjuju programi za punjenje istorijskih podataka koji ine nastavak inicijalnog punjenja. Za razliku od ivih, istorijski su podaci statinog karaktera i sada ine samo sadraj arhivskih datoteka. Treu vrstu predstavljaju programi za inkrementalno punjenje podataka, a aktiviraju se nakon to su prethodna dva programa obavili postupak ienja i usklaivanja podataka. Njihova karakteristika je da se pokreu po periodama i oni predstavljaju stalno aktivan mehanizam punjenja skladita podataka odgovarajuim sadrajima. Na slici 2. prikazan je tok ETL procesa vanih u kreiranju skladita podataka i jednim od preduslova za razvijenje i primjenu koncepta poslovne inteligencije.

OSNOVNI MODELI SKLADITA PODATAKA

Prilikom kreiranja skladita podataka danas u praksi susreemo tri osnovna modela ili osnovne arhitekture skladita podataka: dvoslojna arhitektura s jednim zajednikim skladitem podataka, dvoslojna arhitektura s vie nezavisnih lokalnih skladita podataka (engl. Data Marts) i troslojna arhitektura sa zajednikim skladitem podataka i vie povezanih lokalnih skladita podataka.

11

DVOSLOJNA PODATAKA

ARHITEKTURA

S

JEDNIM

ZAJEDNIKIM

SKLADITEM

Ovaj model karakterie jedinstveno, zajedniko centralizovano skladite podataka. Podaci se zaprimaju iz razliitih izvora unutar organizacije (npr. podaci iz online sistema za obradu transakcija, podaci iz ranije razvijenih sistema koji odravaju baze podataka itd.) i vanjskih izvora podataka dostupnih putem Interneta ili nekim drugim nainima. Karakteristika dvoslojne arhitekture skladita je da ono slui veem broju organizacionih jedinica preduzea kao i pojedinanim korisnicima. Takva skladita su velikog obima i vrlo sloena, a u njima se u pravilu skladiti ogromna koliina podataka. Pa i eme podataka prema kojima se vri pohranjivanje podataka trebaju podravati iroku lepezu aplikacijskih zahtjeva. Iz navedenog je vidljivo da su trokovi odravanja takve arhitekture visoki i pretpostavljaju znatan angaman i vrijeme odreenog broja i profila strunjaka.

DVOSLOJNA ARHITEKTURA S VIE NEZAVISNIH LOKALNIH SKLADITA PODATAKA Karakteristika ove arhitekture skladita podataka je postojanje veeg broja nezavisnih lokalnih skladita podataka namijenjenih za podravanje pojedinanih aplikacija po organizacionim jedinicama preduzea. Rezultat takve arhitekture je velik broj sistema koji svaki posebno zaprimaju "svoje" podatke iz razliitih transakcionih baza podataka. Prednost navedenog modela skladita podataka je jednostavnija izgradnja i lake koritenje. Meutim takav model ima i nedostatke kao to su: oteana komunikacija meu organizacionim jedinicama preduzea. Ovaj model nije pogodan za preduzea ije poslovanje zahtjeva podrku aplikacija i projekata koji pretpostavljaju meusobnu komunikaciju i saradnju veeg broja organizacionih jedinica preduzea, poveanjem broja meusobno nezavisnih skladita podataka, usporedno raste i optereenost samih transakcionih sistema, 12

data mart-ovi oblikovani su tako da podravaju samo jednu aplikaciju, pa naknadno dodavanje novih aplikacija u odreeno skladite predstavlja potekoe, ograniena proirivost platforme i otean je uvod u stvarno stanje informacija na nivou preduzea.

TROSLOJNA ARHITEKTURA SKLADITA PODATAKAOvaj model sastoji se od veeg broja lokalnih skladita podataka i jednog zajednikog skladita podataka koje je smjeteno izmeu skladita podataka i razliitih izvora podataka unutar i izvan preduzea. Skladita podataka oslanjaju se na centralno skladite podataka koje im isporuuje podatke u obliku koji daje ujednaen uvid u sve segmente poslovanja preduzea. U odnosu na prethodna dva modela prednosti troslojne arhitekture su vea tanost informacija nevezano s kojeg izvora su zahvaene, olakana je komunikacija meu organizacionim jedinicama, smanjena je optereenost informatiara, poveana je skalabilnost i proirivost platforme za skladitenje podataka i na kraju ova arhitektura prua mogunost koritenja vanjskih aplikacija ime se omoguava povezivanje svih subjekata u lancu vrijednosti.

Na slici 3. prikazan je primjer troslojnog modela sistema skladitenja podataka.

13Istorijski podaci

Slika 3. Troslojni model sistema skladitenja podataka

IMPLEMENTACIJA SKLADITA PODATAKA U POSLOVNI SUBJEKTRazvoj i implementacija sistema skladita podataka zahtijeva dosta vremena i znaajna finansijska sredstva. Meutim kako su danas uspjena preduzea svjesna injenice da posjedovanje pravih i pravovremenih informacija predstavlja "strateku imovinu" odnosno mogunost brze reakcije na stanja na tritu, odluuju se na koritenje tehnologije skladita podataka jer je upravo ona preduslov za brzo i fleksibilno pretraivanje podataka. Jedan od praktinih pristupa je postepena izgradnja sistema uz sukcesivno nadograivanje. Ukoliko se primjeni taj pristup, zavrni korak predstavlja kreiranje troslojnog modela sistema skladitenja podataka. Sam postupak zapoinje razvojem nekoliko skladita podataka koja podravaju troslojnu arhitekturu. Nakon odreenog vremena, kad je ve razvijen odreeni broj skladita podataka, tok i izgradnja centralnog skladita i odvajanje od pojedinih skladita podataka. Tok izgradnje sistema skladitenja podataka sastoji se od nekoliko faza koje se nadovezuju:66

Panian ., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003., str. 101.

14

1. Utvrivanje zajednikih elemenata svih predmetnih podruja koje ima smisla ugraditi u svako lokalno skladite podataka, s ciljem osiguranja integracije svih elemenata u jedinstveni model. 2. Razvoj prve pilot-aplikacije kojoj se pridruuje prvo skladite podataka. Skladite podataka podijeljeno je na dvije komponente: na miniskladite i na skladite podataka. Miniskladite se fiziki pohranjuje kao nezavisna relaciona baza podataka. Komponenta skladita podataka zahvaa podatke iz miniskladita i nakon obrade puni ih u relacione tabele rezervisane za zbirne podatke. 3. U treoj fazi slijedi postupno aktiviranje novih skladita podataka i razvijanja daljnjih aplikacija potrebnih za zahvatanje njima potrebnih informacija iz "mini skladita" razvijenog s prvim skladitem. 4. U etvrtoj fazi dolazi do odvajanja skladita podataka. Postepenim prethodnim dodavanjem novih aplikacija mini skladite razvija se u sveobuhvatno centralno skladite podataka koje u potpunosti zadovoljava potrebe svih skladita podataka za ekstrakcijom informacija. Budui da sva skladita podataka zaprimaju informacije iz centralno kontrolienog skladita podataka, dobijeni podaci su normalizovani i konzistentni. Samo centralno skladite mogue je sada premjestiti na posebnu server platformu ime se zavrava proces kreiranja troslojnog modela sistema skladitenja podataka. Postepena izgradnja i implementacija sistema skladita podataka predstavlja prihvatljivije rjeenje za veinu preduzea jer ga je mogue ostvariti uz vremensko razgranienje trokova.

15

Uvoenjem ovog sistema u preduzee i "putanjem u rad" zavren je jedan velik posao, meutim to nije i sam kraj. Implementacijom skladita podataka i koritenjem njegovih "usluga" u praksi, pojavit e se nova pitanja i zadaci s pozitivnim i negativnim predznakom, koja e trebati rjeavati. Na primjer u postupku skladitenja podataka i koritenja dobijenih informacija, pojavit e se potreba za podacima koje nije mogue zahvatiti iz postojeih transakcionih sistema. U takvim sluajevima, za nadopunu tim podacima, pojavit e se potreba za nadogradnjom ili modifikacijom sistema za transakcijsku obradu podataka ili razvoja sistema namijenjenom za zahvatanje podataka koji nedostaju. Tradicionalni projekti zapoinju sa zahtjevima, a zavravaju s podacima, projekti skladitenja podataka startaju s podacima, a zavravaju za zahtjevima. Konkretno, jednom kad korisnici skladita podataka uoe sve mogunosti koje im prua tehnologija novog doba, oni e traiti i vie, to samo po sebi i nije loe. Pa prilikom projektovanja skladita podataka, korisnicima skladita podataka ne treba postavljati samo pitanja koje informacije trebaju i ele sada, ve i koje informacije e trebati nakon njih. S druge pak strane mnogi krajnji korisnici skladita podataka, koji su proli trening i obueni za njegovo koritenje, nikad u potpunosti ne koriste sve mogunosti koje im skladite prua. Prema nekim istraivanjima, samo etvrtina osposobljenih u potpunosti koristi usluge skladita podataka

VIEDIMENZIONALNI PRIKAZ PODATAKASkladite podataka, kao to je ranije reeno, puni se izvorima podataka unutar organizacije (transakcione baze) kao i vanjskim izvorima podataka. Postupcima ekstrakcije, transformacije i punjenja kojima se zaprimaju podaci iz unutranjih i vanjskih izvora dobijaju se osnovni podaci skladita. Primjenom sistema za upravljanje podacima dobijaju se agregirani7, viedimenzionalni podaci koji razliitim analitikim metodama obrade7

Agregacija apstrakcija u kojoj se skup objekata i njihovih meusobnih veza tretira kao novi, jedinstveni, agregirani tip. Agregirani objekat kao svoje komponente ima objekte koji ine agregaciju, a moe da ima, kao celina i svoje sopstvene atribute i moe kao celina da stupa u vezu sa drugim objektima u modelu.

16

omoguuju dobijanje razliitih oblika informacija potrebnih menaderima u procesu donoenja odluka. Najvea prednost dimenzione strukture je mogunost vizuelne prezentacije informacija. Povezivanje skladita podataka s korisnikim interfejsom, uz odreivanje naina postavljanja upita i prikaza rezultata upita omogueno je menaderima jednostavno i brzo postavljanje upita kao i odgovarajui prikaz rezultata upita i to prema potrebi tekstom, slikom, grafikonom i sl. Pa se u skladitu podataka najee koristi dimenziona struktura podataka koja se temelji na elementima relacione baze podataka odnosno na relacionim tabelama. Vezni element koji objedinjuju sve elemente predstavlja sredinja relaciona tabela. Ona pohranjuje elemente primarnih ifri svake od relacionih tabela koje uestvuju u strukturi, te numerike varijable koje elimo analizirati. Za vizuelni prikaz dimenzionalnog modela podataka koristi se tzv. zvijezda ema (star ema) jer dijagram ima izgled zvijezde, kao to je prethodno navedeno - jednu sredinju veliku relacionu tabelu koja se naziva i tabelom injenica (engl. fact table) i skup manjih tabela. Tabela injenica je najvea tabela u skladitu podataka, a njena veliina zavisi od nivoa poslovnog procesa koji se prati. Ona je jedina tabela koja je povezana s ostalim dimenzijskim tabelama u modelu podataka. Dimenzione tabele posjeduju odreene atribute, odnosno pozicije dimenzija i predstavljaju mogunosti koje prikazuju neku pojavu, npr. otpremu odreenog proizvoda. Na slici 4. date su dvije varijante prikaza dimenzionalnog modela podataka (otpreme proizvoda) zvijezda emom.

17

18

Slika 4. Varijante prikaza dimenzionalnog modela podataka zvijezda emom (otpreme proizvoda ) Centralni dio eme, tabela injenica, predstavlja sredinji dio koordinacije, koji uz osnovne podatke o iframa relacionih tabela koje su objedinjene u strukturu, moe sadravati i ostale segmente informacija. Viedimenzionalna struktura podataka prua velike mogunosti za otkrivanje mnogih detalja razliitim postupcima analitike obrade kao to su agregacija i detaljizacija ili svrdlanje (drill up, drill down, drill through), unakrsno tabeliranje (cross tabulation), selekcija, isijecanje, izdvajanje i kombinovanje svih dimenzija (slice and dice requirement), rotacija odnosno isticanje jedne dimenzije dok su druge u pozadini (pivoting), prognoza, modelovanje, grafiko prikazivanje (charting), statistike analize (trend, klaster) itd.

Z A K LJ U A K19

Skladitenje podataka - Data Warehouse je posebno projektovano tehnoloko okruenje koje omoguava objedinjavanje srodnih podataka u oblik pogodan za analizu ime se olakava proces donoenja odluka i daje nov pristup sistemima za podrku odluivanju. Ovaj koncept obezbeuje fleksibilan, efikasan nain raspolaganja podataka u formatu pogodnom za savremene poslovne aplikacije. Postojanje skladita podataka kao bogato informacijama integrisano okruenje orijentisano je ka potrebama krajnjih korisnika koji uz pomo alata za poslovno odluivanje mogu donositi pravovremene i kvalitetne poslovne odluke. Omoguava stalno pronalaenje novih informacija namijenjenih menaderima, a slue im prvenstveno za strateko, taktiko i operativno donoenje odluka. Uvoenjem koncepta skladitenja podataka, operativne baze prestaju biti optereene sloenim upitima, pa cijeli informacioni sistem koji se sad sastoji od dva dijela, operativnog i skladita podataka postaje produktivniji i lake se kontrolie i restrukturira. Metode skladitenja podataka sve vie postaju integrisane u softverske pakete temeljnog informacionog sistema preduzea, novije verzije relacionih baza podataka (kao npr. Oracle i SQL server) imaju dio za Data Warehousing integrisan u svom paketu kao OLAP. Menaerima nije potreban angaman analitiara za obradu kljunih pokazatelja o stanju preduzea, ve takve podatke klikom mia mogu dobiti obraene iz baze podataka, te koristiti kao pomo u donoenju poslovnih odluka. Naela upravljanja prema ciljevima (Management by Objectives) e biti podrana mogunostima online pristupa bazama i skladitima podataka, kroz alate poslovne inteligencije. Koncept skladita podataka usklaivanjem podataka omoguuje jedinstvenu istinu o preduzeu, to poveava kredibilitet informacionog sistema.

LITERATURA

20

Bojan iri, Poslovna inteligencija, Data status, Beograd, 2006 A.Bonifati, F.Cattaneo, S.Ceri, A.Fugetta, S.Paraboschi, Designing Data marts for Data Warehouse Kellett, A., "Integrated Business Intelligence", Butler Group, April 2003. Panian ., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003.

21