Upload
viktor-vass
View
85
Download
0
Tags:
Embed Size (px)
Citation preview
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 1/28
1
Üzleti intelligencia
Gyakran használt BI funkciók Gyakran használt üzleti intelligencia funkciók:
± a lefúrás (drill-down), vagyis az aggregát adatok elre def iniált dimenziók mentén
történ részletezése
± rendezés (sorting)
± a szrés (f iltering)
± a graf ik us f elhasználói f elület (GUI) és a
± vizualizáció.
± elrejelzési-elemzési lehetségek (predictive analytic capability).
Az üzleti analitika kihívásai
y Az adatok és a modellek mennyiségének növekszik
y Integráció más rendszerekkel
y Manuális folyamatok
y Szabályozási környezetnek való megf elelés
Napjaink BI igényei
y A BI megoldások f eleljenek meg a mai f elhasználói elvárásoknak (Consumerization of BI) y Az extrém adatf eldolgozási igények, a nagy mennyiség adatforrások kezelésének támogatása
(Support for Extreme Data Per formance; Emerging Data Sources)
y A BI termékek döntéstámogatási platformokként viselked jenek (BI as a Decision Platform)
Az üzleti intelligencia terület változásai a közelmúltban
A BI piac f ellendülése, növek v eladások
Open source megoldások terjedése
BI f ejlesztések: Micr osof t, Oracle
Felvásárlási hullám, a Änagyok´ irányítanak:SAP ± BO, IBM ± Cognos«
Az üzleti intelligenciát alkalmazó cégek jellemzi
Az elemzéseket, a BI-t minden funkció és részleg esetén alkalmazzák
Az alkalmazottak számára lehetvé teszik a BI megoldások használatát
A tény ala pú döntéshozatal a vállalati k ultúra része
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 2/28
2
A f els vezetés f elismeri az elemzések fontosságát és az ezt támogató megoldások f ejlesztését
karbantartását támogatja
A k ulcsfontosságú üzleti folyamatokra mértékrendszert használnak
Az adatokat és elemzéseket megosztják a beszállítókkal és az ügyf elekkel is
Az adatokat folyamatosan gyjtik és használják
Az elemzéseket megosztják a pénzügyi elemzkkel is
Az üzleti intelligencia projektek leggyakrabban elforduló nehézségei
Nem tudatosul a szer vezetben, hogy az üzleti intelligencia pr o jekt egy, a szer vezeti
egységeken átível kezdeményezés, ezért k ülönbözik a független megoldásoktól.
A pr o jekt nem ka p ja meg a szükséges üzleti támogatást.
A pr o jektszere plk üzleti oldalról nem hozzáf ér hetk, nem hajlandók tevékenyen részt venni a
f eladatokban.
A pr o jekttagok nem kellen szakké pzettek és/vagy nem állnak rendelkezésre; olyk or a pr o jekt résztvevit nem használják f el megf elelen egyes f eladatokban.
Nem használnak a szof tver f ejlesztésben módszertant.
Nincs munkalebontási str uktúra (workbreak down str ucture), nem alkalmaznak
pr o jektmenedzsment módszertant.
Nem végeznek üzleti elemzést, nem használják a szakter ület szabványait.
Az adatminséggel ka pcsolatos kér désekre nem for dítanak kell f igyelmet (nem veszik
számításba a ne megf elel minség adatok hatását az üzleti jövedelmezségre).
A metaadatok (egy másik adatot leíró, meghatár ozó adat, amely összefoglalja az adat
használatára vonatk ozó összes fontos tényt [Márk us 1994]) kezelése, használata nem
megf elel.
Túlságosan ragaszk odnak egy k onkrét módszertanhoz, vagy eszközhöz. [Shak u 2003]
Az üzleti intelligencia tevékenységek láthatatlanok a f elhasználó számára, csak a na pi
munkafolyamatok részeként jelennek meg.
Miért is van szükségünk üzleti intelligencia megoldásokra?Leginkább azért, hogy támogassa a jo bb döntéshozatalt és így hozzájár uljon a szer vezeti tudás
gyara pításához.
y Üzleti ri portok
y K PI-k
y Üzleti szituációk jo bb megértése
y Üzleti ter vezés elsegítésére
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 3/28
3
Üzleti intelligencia ± adatminség, adattárház, adatpiac
Az adatok
y Miért fontos az adatok elemzése?
y Az adat lehet
o bels adat (internal data)
alkalmazottakról nyilvántartott adatok,
A forgalmazott termékek adatai,
a vállalat folyamataihoz ka pcsolódó adatok,
a szolgáltatások adatai
o k üls adat (external data)
adatok a gazdasági környezetrl,
a versenytársakról,
az ügyf elekrl, stb.
o A k üls adatok forrása szeleskör: Internetes források, kereskedelmi adatbázisok,
statisztikai, k utatási adatok, stb.
Adatgyjtéssel, adatminséggel kapcsolatos problémák általában
A hibák elfordulási pontjai
y megmagyarázhatatlan f luktuáció a cég kimutatott eredményességében;
y ügyf él-reklamáció, az ügyf elek számának csökkenése;
y a ri porting- es k ontr olling-osztályok mködési költségének növekedése;
y a jelentések összeállításának késése;
y Nem egyez adatok az egyes kimutatásokban
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 4/28
4
Az adatminségi hibák okai
y A vállalatok nagyon sok f ajta rendszert használnak
y R ossz minség adatok többf éle forrásból keletkezhetnek:
o adatf elviteli pr o blémák, hiányosságok;
o nem megf elel adatátvitel/inter f észek;
o mivel az adatokat legtöbbször több rendszerben, más str uktúrában tar oljak, nehézkessé
válik az adatok szinkr oniasa;
o Az üzleti folyamatk ontr olloknál jelentkez hiányosság;
o Hiányoznak megf elel adatvalidálási eszközök az egyes informatikai rendszerekben;
o A k ulcs pontoknál nem ellenriztek megf elelen az üzleti szabályokat, így a teljesség
nem biztosított;
o R endszermködési hiba;
o Hibás k orábbi migráció;
o Adatgazdák hiánya.
Adatminség
y Pontosság (accuracy): az adat hitelesen re prezentálja-e a valóságot, vagy az ellenrizhet
adatforrást?
y K onzisztencia (consistency): az adat elemeket következetesen, ellentmondások nélk ül (vagyis
k onzisztens módon) def iniáltak-e?
y Integritás, sértetlenség (integrity): az adatszerkezet, az entitások közötti ka pcsolatok és
attribútumaik karbantartása nem tartalmaz-e ellentmondást (vagyis, k onzisztens-e)? y Teljesség (com pleteness): valamennyi szükséges adat jelen van?
y Ér vényesség (validity): az adat az üzleti követelmények által meghatár ozott tartományba esik-
e?
y Idszerség (timeliness): az adat hozzáf ér het-e amik or szükséges?
y Elér hetség (accessibility): az adat elér het-e, megérthet-e, használható-e?
A Garantiqa Hitelgarancia Zrt adattárhaza - háttér
y Cél
o A hazai kis- es közé pvállalk ozások f ejldésének, az önk ormányzatok es
önk ormányzati vállalk ozások hitelf elvételeinek es kötvénykibocsátásainak elsegítése
y Meghatár ozó funkciók
o Ügyf élminsítés, k ockázatf elmérés és az üzleti döntések meghozatala
y K övetelmény
o Folyamatosan naprakész, hiteles es aktuális inf ormációk álljanak rendelkezésére
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 5/28
5
A Garantiqa Hitelgarancia Zrt adattárhaza - kihívások
y A szer vezet ügyviteli folyamatait többf éle informatikai rendszer segíti
y Az ügyviteli rendszerben, a pénzügyi tranzakciós rendszerben, az portfoliót kezel
rendszerben, a Micr osof t Excel táblákban es egyéb rendszerekben nyilvántartott adatok
k onszolidációja y K om plex (több rendszerben es eltér szerkezetben rendelkezésre álló adatokból állíthatok el)
jelentések elállítása a f elsvezetk számára
y Pénzügyi és számviteli ter ületen idközi mérleg- és eredmény kimutatások
y Ad-hoc pénzügyi elemzések
y K PI értékek alak ulásának nyomonkövetése
y Biztonságos ügyf él portál
A megoldás: Micr osof t ala pú adattár ház
Az adattárházak és üzleti intelligencia rendszerek kialakulásához vezet tényezk
y Gazdasági tényezk
o szabályozási környezet átalak ulása, dereguláció
o glo balizáció, ú j piacok, a gazdasági verseny ersödése
o Igényesebb ügyf elek - jo bb minség es testreszabott termékeket es szolgáltatásokat
varnak el
o integrált vállalatirányítási rendszerek szeleskör elterjedése
o üzleti hajtóerk
y Technológiai, informatikai f ejldés o Hálózati megoldások f ejldése
Miért van szükség adattárházra?
y Adatminségi pr o blémák, ügyf él reklamációk megnövekedett száma
y Az üzletágak közötti ri portozási folyamatok átfutási idtartama magas
y Az ETL es ri portolasi folyamatok nem szabványosak
y Nincs tudatos üzleti metaadatkezelés és egységes terminológia
y Az ad-hoc ri portok elkészítésének ideje túl hosszú
y A megrendeléstl az adat pu blikációig tartó folyamatok idtartama nem f elel meg az üzleti
követelményeknek
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 6/28
6
Miért nem elegendek az integrált vállalatirányítási rendszerek (ERP)?
y Nem lekér dezésre optimalizáltak
y A lekér dezések bonyolultak, drágák
y Hosszú válaszidk
y Összehasonlításhoz hiányoznak a történeti adatok
y R ugalmasság hiánya (csak str ukturált kér désekre adnak választ)
A megoldás
y A k ülönböz forrásokból származó ala p adatokat elre, egy menetben válogassuk le, az összes
szükséges szem pont szerint
y aggregáljuk olyan mertekben, amilyen lé ptekben döntéseinket hozzuk
y ezeket gyú jtsuk össze egy helyre, es rendezzük az ³üzleti´ gondolk odásnak megf elel ú j
str uktúrába, amelyet
y tegyük - on line - elér hetvé a vezetk és elemzk számára
y És tegyünk rá olyan eszközt vagy cél alkalmazást, amely az elemzéshez szükséges funkciókat
biztosítja.
Az adattárház
y ³Az adattár ház tárgyorientált, integrált, tartós es idfügg adatgyjtemény a vezeti
döntéstámogatás szolgálatában.´ Bill Inmon
y ÄAz adattár ház a szer vezet egy olyan adatgyjt, szolgáltató része, ahol a mködési adatok az
egyszeren végrehajtható, haték ony elemzés céljait szolgálják´ R al ph K imball y ³Az információszolgáltatás technológiai keretrendszere´
Az adattárház felépítése ± az adattár tágabb értelemben
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 7/28
7
Az adattárházak jellemzi
y Tárgy-orientált (su bject-oriented)
o Az adatok az adattár házban tárgyk or ala p ján es nem alkalmazások szerint vannak
rendezve.
y Integrált (integrated)
o Általában a vállalaton belül az adatok k ülönböz operatív részlegeknél es
üzletágakban keletkeznek, így egymásnak ellentmondok, ink onzisztensek. Az
adatintegráció során az egyik legfontosabb lé pes ezeknek az ink onzisztenciáknak a
megszüntetése Ugyanígy az ink onzisztens jelentéstartalmakat is megszüntetik (pl.
nettó eladás a marketing és a kereskedelmi részlegen mást-mást jelenthet).
y Tartós (nonvolatile)
o Azok az adatok, amelyek egyszer beker ültek a tár házba, utána már nem változnak
meg.
y Idfügg (time-variant)
o Az adattár ház olyan adatokat is tartalmazhat, amelyek 5 vagy akar 10 évnél is
régebbiek. Ezekre is szükség lehet összehasonlító elemzések, trendek vizsgálata során.
Az operatív rendszerek, mivel egyrészt nem céljuk a hosszú-távú adattar olás, másrészt
igen sok adat mozog bennük na p, mint na p, általában kis idtávú adathalmazt
tartalmaznak.
Az adattárházak további fontos jellemzi
y Összegzett (summarized)
o A tranzakciós adatok igény szerint összegzettek, aggregátak (esetleg pl. eladás
összesen, adott régióban, adott termékre vonatk oztatva)
y Nem normalizált (not normalized) (K imball es Inmon szerinti megközelítések
o Az adatok általában nem normalizáltak es redundánsak (K imball; adat piacokból
f ejlesztik ki az adattar hazat; bottom-up megközelítés)
o Az adatok általában normalizáltak (Inmon; top-down megk ozelites).
y Források (sources)
o Az adatok lehetnek k üls és bels adatok is, nincs megszorítás.
y Metaadatok (metadata)
o A metaadatok def iniálásra ker ülnek.
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 8/28
8
Adattárház folyamatok
y Extraction
o a szükséges adatokat a forrásadatbázisokban azonosítjuk, kinyerjük.
y Staging, Trans portation, Transformation, Cleansing
o A kinyert adatokat a célrendszerbe vagy egy átmeneti rendszerbe (staging arra) szállítjuk (Trans portation) ahol f eldolgozzuk, k onzisztens formára hozzuk
(Transformation)
y Loading (metadata - data)
o a f eldolgozott adatok adattar hazba töltéset takarja
y Aggregation
y Queries
Az adatpiac
y Nincs egységes meghatár ozás
y Az adat piac nem normalizált, aggregalt adatokat tartalmaz, es valamely szer vezeti egység
mködési, f elhasználói követelményei által meghatár ozott (Bill Izmon)
y Az adat piac az adattár ház egy tárgyter ülethez (pl. marketing) köthet része (Ef raim Turban)
o Az adat piac lehet egy önállóan létez, az adattár háztól független megoldás, vagy
annak része
Az adattárházak és az adatpiacok összehasonlítása
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 9/28
9
Az adattárház adatmodell
y Hár omszint modellezési megközelítés:
o Fels szint modell ± logikai adatmodell, egyed-ka pcsolat modell (ER D - entity
relationshi p design)
o közé p szint modell ± adatelem halmaz (data item set, DIS)
o Alsó szint modell ± f izikai modell
Az adattárház fejlesztési megközelítése
y iterativ f ejlesztés pref erált, a következ ok ok miatt:
o A f elhasználói követelményeket így könnyebb megragadni
o A menedzsmentet könnyebb meggyzni a tényleges eredményekrl a folytatás
szükségességérl
o Az eredmények a f ejlesztés k orai szakaszában hozzáf ér hetk
o Az i pari-üzleti visszajelzések támogatják
y A követelmények meghatár ozása is iteratív
y Az adatmodell szere pe nem egyértelm
o Végül egy egységes modellt célszer készíteni
Az adattárházak tervezése (Inmon)
y Az adattár házak ter vezése során gyakran a szokásos normalizált megközelítést támogatják,
mert:
o nincs elre optimalizálva valamely f eldolgozási követelmény szerint
o Jól illeszkedik az adatmodellekre ala puló megk ozelitesek hez
o R ugalmasságot, biztosit
y A f elhasználói igények ala p ján eltér hetünk a normalizált modelltl, de normalizálásra példa a
kreatív index használata is.
Csillagsema (Star Join)
y Az adat piacok ter vezésénél haszna latos
y Tartalmazza a tény táblát és dimenziókat
y Tényadatnak (v. mutatószámnak, keyf igure, K ennzahl) nevezzük azokat mer het, numerik us
adatokat, melyeket elemezni es ehhez tar olni szeretnénk
y Lehetnek hagyományos, vagy a közgazdaságtanból átvett merszámok. Ilyenek pl. az
árbevétel, súly, eladott darabszám, nyereség, raktárkészlet, stb. A tényadatok általában
additívak (pl. árbevétel), de lehetnek részben additívak vagy nem additívak is (pl.
haszonk ulcs).
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 10/28
10
y Dimenziónak (v. egyszeren jellemznek) nevezzük azokat a jellemzket, tulajdonságokat,
melyek szerint a merszámokat csoportosítani, jellemezni tud juk. A dimenziók egymástól
független jellemzi egy-egy tényadatnak. Dimenziók lehetnek pl. id, hely, termek, ala panyag
y A tény tábla az összes tényadatot es azok jellemzit foglalja össze
y A mutatószám
o
k jellemzit dimenziók szerint dimenziótáblákban gyjtik össze - (ezeket kulcsok (általában Generált) azonosítják)
Csillagséma Hópehelyséma példa
A csillagséma elnyei és hátrányai
y A csillagsémának számos elnye van [Sidlo 2004]:
o egyszer, intuitív adatmodell
o használata kevés join adatbázis mveletet igényel
o Használata kevés tábla olvasását igényli
o könnyen megvalósítható, a modell metaadatai (adatokat leíró adat) egyszerek
y A csillagséma hátrányai:
o aggregaciok (összegek) ké pzése nehézkes
o Nagy dimenziótáblák eseten a hierarchiakezelés nagyon lassíthatja a lekér dezéseket
o a dimenzióadatok tar olása redundáns
Hópehelyséma
y Hopehelyéema (snowf lake scheme)
o Hasonlít a csillagsemara
o A különbség, hogy a hópehelyséma esetében a redundanciát csökkentik
(normalizáljak a dimenziotablakat)
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 11/28
11
A felhasználói csoportok
A jól mköd adattárház kritériumai
y Megf elel f eltöltési ka pacitás
y Jól mköd f eltöltési folyamat
o Nem egyszer másolási funkciót jelent
o Ide tartozik az adatok k onvertálása, szrések, formázás, az integritás vizsgálata, f izikai
tar olás, indexelés es a metaadatok f rissítése
y Az adatminség kezelése
o Az adattar haznak biztosítania kell a bels k onzisztenciát, a környezettel való
k onzisztenciát, és megf elel integritást
y Gyors sebesség lekér dezés o Egy bonyolultabb lekér dezés ideje másodpercekben kell, hogy mer het legyen, nem
pedig na pokban
y Méretnövekedés lehetsége
o Az adattár házak mérete ex ponenciálisan növekszik na p jainkban
o A százezer gigabájtos illetve néhány terrabajtos adatbázisok mára mar hetk ozna piva
kezdenek válni
o A moduláris f elé pítés es könny bvíthetség ala pvet
y Egy lekér dezés sebessége ne az adatbázis méretétl, hanem a lekér dezés bonyolultságától
függjön.
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 12/28
12
A jól mköd adattárház kritériumai
y Felhasználok szeles csoportjának támogatása
o A Ävállalati tudástár´ lehetsége
y Hálózati adattár ház k once pció
o Az adattár házak a legtöbb esetben több egymással hálózatban k ommunikáló egységbl állnak
y Adattár ház f lexibilis irányítása
o Az adattár házak szamara fontos a rendszeres es r ugalmas irányítás lehetsége:
A lekér dezések prioritásainak vizsgálata f elhasználói szint es a lekér dezés
fontossága ala p ján
Bizonyos k orlátozások es engedélyezések megadassanak lehetsége is
elengedhetetlen
y Integrált elemzési módszerek
o A többdimenziós (több szem pontú) lekér dezések es adatbázis nézetek gyak orlati
haszna tagadhatatlan
y Magas szint lekér dezési lehetségek
o ahhoz, hogy a f elhasználok a késbbikben jól hasznosítható, értékes információkat
szerezzenek az adattár házból, minél k om plexebb és pr of esszionálisabb elemz
eszközökre van szükségük.
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 13/28
13
Üzleti analitika ± döntéstámogató rendszerek
Üzleti analitika kategóriák
A döntéstámogató rendszerek
y DSS-ek azok a döntéshozatal folyamán használható számítógé pes rendszerek, amelyek a
str ukturált és kevéssé str ukturált f eladatok megoldásához is segítséget nyú jtanak a beé pített
döntési szabályok és modellek f elhasználásával, s ezeket a f elhasználó is módosíthatja, vagy
bvítheti.
y A DSS tehát k om plex döntési szituációk megoldásában segít, növelve a döntések hatásosságát
A problémakategóriák jellemzése
y Jól-str ukturált pr o blémák (well-str uctured pr o blems).
o Teljes mértékben ismertek mind a cél(ok), mind a mveletek; dönteni csak a
mveletek alkalmazásának sorrend jérl kell, még pedig r utinszeren
y Féligstr ukturált pr o blémák (semi-str uctured pr o blems).
o A kitzött cél(ok) teljesen, a mveletek viszont csak részben ismertek
vagyis a megoldási módszerek, eszközök és utak részben vagy teljesen
ismeretlenek. y Nemstr ukturált pr o blémák (unstr uctured pr o blems).
o Sem a kitzhet álla pot(ok), sem a mveletek nem ismertek eléggé. E pr o blémákat
nagyon általánosan megfogalmazható elvárások jellemzik
y Nemdef iniálható pr o blémák (undef ined pr o blems)
o A pr o bléma egyáltalán nem formalizálható
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 14/28
14
A döntéstámogató rendszerek által nyújtott támogatás
y Adatok, álla pot-jelentések szolgáltatása - What is «? (Mi a «?)
y Általános elemz lehetségek - What is«/Why «? (Mi a«/Miért «?)
y R e prezentációs modellek (pl. pénzügyi helyzet) - What will be «? (Mi lesz«?)
y Oksági modellek (elrejelzés, diagnózis) - Why «? (Miért«?)
y Megoldási javaslatok, kiértékelések - What if «? (Mi van akk or, ha ...?)
y Megoldások közötti választás - What is best «? (Mi a legjo bb «?), What is good enough «?
(Mi elég jó «?)
DSS hasznok
y Függ a DSS természetétl, a döntéshozótól és a döntési helyzettl
y Növeli a döntéshozók ismeretkezelési lehetségeit
y A döntéshozó olyan pr o blémákat is megoldhat, amelyet DSS nélk ül meg se kísérelt volna az
idráfor dítás nagysága és k om plexitása miatt
y Egyszerbb pr o blémák esetén gyorsabban és megbízhatóbban dolgozhat a döntéshozó DSS-
sel. Még ha a döntéshozó elé ker ül pr o blémát nem is siker ül a DSS-sel megoldani, de
stimulálja a döntéshozó gondolk odását (pl. kiterjesztési kísérletek; analízis; tanácsok; hasonló
esetek jelzése)
y A DSS k onstr uálás (a döntéshozó részvételével) lehetséget ad a pr o blémater ület ú j módon
való megközelítésére, a döntéshozatal egyes részeinek formalizálására
y A döntéshozó pozíciójának megersítése
y Versenyelny a megnövekedett bels pr oduktivitás miatt
A DTR felhasználói által vétett leggyakoribb hibák a következk
y túlhangsúlyozzák a DTR -ek szere pét;
y az adatok pontosságának és fontosságának f eltételezése;
y az o bjektivitásba vetett hamis illúzió
A döntési folyamat fázisai
Egy döntési folyamat f ázisai ([Turban 1998] szerint):
(1) f eladat-meghatár ozás és adatgyjtés f eladat-meghatár ozás
(2) ter vezés alternatívák
(3) választás megoldás
(4) megvalósítás im plementált megoldás
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 15/28
15
A döntési folyamat támogatása
DSS követelmények I.
y Végf elhasználói kezelés és interaktivitás
y K önny hozzáf érés a megf elel információk hoz
o Adatok és az adatok és változók jelentésének magyarázata
o Döntési modellek
o Statisztikai, elrejelzési és optimalizálási eszközök
o Prezentáció ( jelentések, graf ikák)
y Alkalmazk odás a növek v f elhasználói igények hez
y Hor dozhatóság és perif éria támogatás
y Megbízhatóság és teljesítmény
DSS követelmények II.
y Nem-str ukturált és f élig str ukturált f eladatok megoldásának támogatása
y K ülönböz vezeti szintek, egyének és csoportok támogatása
y Független és összefügg döntések sor ozatának támogatása
y A döntési folyamat minden f ázisának támogatása
y Ada ptivitás, visszacsatolás
y Végf elhasználói módosíthatóság
y Továbbf ejlesztési lehetség y K ísérletezési lehetség a modellekkel
y Tudásbázis k om ponensek
y K ényelmes elemzési és érzékenységi vizsgálatok
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 16/28
16
A döntéstámogató rendszerek komponensei
Az adatkezel alrendszer
y Az adatkezel alrendszer biztosítja
o a k üls és bels adatbázisok hoz való hozzáf érésen kívül a DTR saját adatainak
tár olását,
o az adatok kezelését, f eldolgozását (adatbáziskezel rendszerek),
o az adatok egységes és k onzisztens adatszótárba rendezését, végül
o az adatok lekér dezését.
A modellkezel alrendszer
y A modellkezel alrendszer ti pik us elemei:
o modellbázis,
o modellbázis-kezel rendszer,
o modellez nyelv,
o modellszótár,
o modellvégrehajtó-, integráló- és parancsvégrehajtó rendszer
Felhasználói felület vagy kommunikációs alrendszer
y biztosítja a f elhasználó és a rendszer ka pcsolatát,
y vezérli az interakciókat,
y f elels a használat kényelmességéért és haték onyságáért
y minsége meghatár ozója lehet egy DTR elterjedésének vagy háttérbe szor ulásának függetlenül
a többi k om ponens minségétl
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 17/28
17
A tudásmenedzsment alrendszer
y Biztosítja a pr o bléma megoldásához szükséges tudást és így növeli a többi DSS k om ponens
haték onyságát
y Az intelligens rendszerek integráláshoz és f elhasználásához szükséges f eladatokat támogatja
y Tartalmazhat neurális hálózatot, szakért rendszert, egyéb intelligens megoldásokat
y Ti pik usan szövegorientált DSS
y Lehetséges elnevezései: intelligens DSS, DSS/ES, szakérttámogató rendszer, vagy tudás-
ala pú DSS
y A szakért rendszerek lehetséges f elhasználási mód jai:
o A döntési folyamat tudás ala pú támogatása (pl. a modell kategória kiválasztásánál)
o A modell osztályok f elé pítésének, alkalmazásának és kezelésének támogatása
o A bizonytalanság kezelése a tudásbázisokban
A döntéstámogató rendszerek osztályozása (Holsapple)
y Szöveg-ala pú DTR :
o szövegesen tár olt információk f eldolgozásával támogatja a döntéshozatalt. Felhasznált
technológiák: Web-ala pú dok umentációf eldolgozás, hi pertext, intelligens ágensek.
y Adatbázis-ala pú DTR :
o haték ony jelentésgeneráló és lekér dez funkciókkal rendelkeznek.
y Döntésitábla-ala pú DTR :
o a végf elhasználó által generált DTR -ek nagy része döntési táblák on ala pul. Többségük
adatbázis-ala pú szolgáltatást is nyú jt. Számos rendszer rendelkezik Ämi van akk or, ha´ (Äwhat-if ́ ) és célkeres elemz (Ägoal-seeking analysis´) szolgáltatásokkal.
y Megoldás-ala pú DTR (solver-oriented DSS):
o s peciális pr o blémamegoldó algoritmusokat, eljárásokat tartalmazó rendszerek.
Pr o blémamegoldó eljárások pl.: mennyiségek (gazdasági szem pontból) optimális
rendezése, trend-kidolgozó lineáris regresszió.
A döntéstámogató rendszerek osztályozása (Holsapple)
y Szabály-ala pú DTR : az ismeretala pú k om ponens tartalmaz tanácsadó szakért rendszert,
amelynek szabályai lehetnek k vantitatív vagy k valitatív jellegek.
y Összetett vagy hibrid DTR : az elz döntéstámogató rendszerekbl 2±5 f ajta összeé pítve alk ot
egy hibrid DTR -t. Pl. pénzügyi jelentéskészít, döntéstámogató és f elsvezeti elrejelz
rendszer.
y Intelligens vagy ismeretalapú DTR szakért rendszert, vagy egyéb intelligens rendszert
tartalmaz
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 18/28
18
Adatvizualizáció
Az adatok és az adatelemzés eredményének graf ik us, animációt és videót tartalmazó re prezentációja.
y Lehetvé teszi a vállalati trendek és az üzleti elnyhöz juttató adatok gyors azonosítását.
y A prediktív modellek segítségével ellenrizhetvé válnak a trendek jellemzi, ezáltal is
támogatva az alkalmazások tartalom, tranzakció és folyamat f ejlesztését Ú j irányzatok az adatvizualizációban 1990-tl
y Az adatvizualizáció beé pítésre ker ül a döntéstámogató rendszerekbe és alkalmazásokba, a
Ämainstream com puting ́része lesz
y Megjelenik az intelligens adatvizualizáció, amely adat/információ inter pretációt is tartalmaz
Ú j irányzatok az adatvizualizációban:
y Dash boar dok és scorecar dok
y Vizuális elemzés
y Pénzügyi adatok vizualizációja
Vezeti információrendszerek OLAP
Új igények az adatkezelés területén
y Nagy adatmennyiségek közötti gyors ka pcsolatteremtés igénye
y Analitik us mveleteket tartalmazzon
y Támogassa a bonyolultabb lekér dezéseket
y Az ú j tí pusú adatkezelés neve: OLAP (On Line Analitical Pr ocessing, 90-es évek)
y A hagyományos adatkezelés: OLTP (On Line Transaction Pr ocessing)
OLTP és OLAP
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 19/28
19
Üzleti folyamat szerinti különbség
Technológia szerinti különbség
Az OLAP által nyújtott új lehetségek
y m
ulti-
dimenzi
onális
adatbázis
(f el
váltja
a relációs
adatbázist)
o k om plex lekér dezések
több változó ka pcsolatát, a változók on értelmezett aggregációs értékeket, azok
ka pcsolatát vizsgálja
a klasszik us elsdleges k ulcs - idegen k ulcs szerkezettel ez hosszadalmas
mvelet
o heter ogén forrás
y drill-down és annak graf ik us követése
y szakért rendszerek egyes elemeinek beé pítése
y egyes DSS elemek beé pítése (elemz és szimulációs eszközök)
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 20/28
20
Az adatkocka dimenziói, mérete
y Példa:
y Fogyasztók
o Ország (2)
K örzet (8)
y Vár os (50)
y Termékek
o Termékcsoport (3)
Termékcsalád (3)
y Termék (250)
y Id
o Év (5)
Hóna p (12)
y Hét(4)
Az adatkocka megjelenítése
y K étdimenziós táblázatok (szeletelés)
y Bármilyen dimenziókkal (forgatás)
Az adatkocka dimenziói, mérete
Adatkocka tervez (szerkeszt)
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 21/28
21
A klasszikus DBMS-t át kell alakítani az OLAP igényeknek megfelelen
y A legfontosabb OLAP funkciók nem részei a DBMS-nek (alkalmazásfüggk is lehetnek)
y az OLAP analitik us mveletek idszükséglete nagy a hagyományos DBMS tár olási str uktúra
mellett
y a klasszik us DBMS-t át kell alakítani az OLAP igényeknek megf elelen
y cél: OLAP igények hez igazított DBMS rendszer kialakítása
Adatbázis konverzió
OLAP igények Codd szerint
y Idszak os és online adatelérés
o az OLAP rendszereknek rendelkezniük kell egy saját adatbázissal és él hozzáf érést
kell biztosítaniuk k üls adatforrások hoz is
y OLAP elemzési eszközök
o Paraméterezhet statik us jelentéskészítés
o Lefúrás (drill down) adatelérési lehetség
o Mi lenne ha? (What-If ) elemzés
o Cél-keres (Goal seeking) modellezés
Az OLAP jellemzi Codd nyomán 1-3.
y Sok dimenziós fogalmi megközelítés (Multi-dimensional Conce ptual View)
y Átláthatóság, áttekinthetség (Trans parency)
o a f elhasználó tisztában lehessen a rendszer mködésével, ké pességeivel, f elé pítésével
y Hozzáf ér hetség (Accessability)
o az elemzések hez szükséges adatok hoz a f elhasználók hozzáf érését biztosítani kell
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 22/28
22
Az OLAP jellemzi Codd nyomán 4-8.
y Egyenletes ri porting teljesítmény (Consistent R e porting Per formance)
y K liens-szer ver architektúra
y Többdimenziós f elé pítés (Generic Dimensionality)
o az adatdimenziók egyenértékek legyenek, str ukturális és mködési szem pontból is
y Dinamik us ritka mátrix kezelés (Dinamic S parse Matrix Handling)
y Sok f elhasználó támogatása (Multi-User Support)
Az OLAP jellemzi Codd nyomán 9-12.
y K orlátlan többdimenziós mveletek (Unrestricted Cr oss-Dimensional Operations)
y Intuitív adatkezelés (Intuitive Data Mani pulation)
o az adatok elérését, kezelését, elemzését a f elhasználó számára a lehet legegyszerbbé
kell tenni
y R ugalmas megjelenítés (Flexible R e porting)
y K orlátlan számú dimenzió és összegzési szint (Unlimited Dimension and Aggregation Levels)
Az OLAP speciális jellemzi Codd nyomán
S peciális jellemzk:
y Denormalizált adatok kezelése
o integráció az OLAP adatmotor és a nem normalizált adatforrások között
y Az OLAP adatok elk ülönítése az él adatforrásoktól
o az OLAP rendszereket nem lehet közvetlenül él tranzakciós adatokra é píteni y Hiányzó értékek megk ülönböztetése és kezelése
o a hiányzó (nem értelmezett) értékeket meg kell különböztetni a 0 értéktl és
f igyelmen kívül kell hagyni
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 23/28
23
Web-bányászat és szövegbányászat
y Internetes adatok gyjtése es elemzése webes eszközökkel (web mining) y A web-bányászat tehát az adatbányászat alkalmazása a webes forrásokra
Fajtai:
Webtartalom- bányászat---Web content mining, ter ületei ( Nyeki, 2007): y web szövegbányászat, y intelligens keresügynökök, y információ-szrés es y kategorizálás, y web lekér dez rendszerek;
Webstruktura- bányászat---Web str ucture mining ter ületei ( Nyeki, 2007): y látogatási str uktúra elemzése, y klikkelés-sor ozatok elemzése, y web site-ok ter vezési stratégiája; y példa: Google Page R ank
Web használat elemzése Pl. Google Analytics
y Internetes adatok gyjtése és elemzése a web használat jellegzetességeinek megértése és optimalizálása céljából
y Megállapítható, hogy az egyes tranzakciókat mely kampányok és kulcsszavak eredményezték,
vizsgálhatók a hségi és a lappangási mutatok, és azonosíthatok a legjobb bevételi f orrások.
A web-bányászat alkalmazásai
y Az ügyf él életciklus/érték meghatározása
y Marketing stratégia tervezése
y Marketing kampányok kiértékelése
y Hirdetések testreszabása
y Felhasználói viselkedés elrejelzése
y Ügyf él tájékoztatás támogatása
Web-bányászat példa: Amazon
y webes kosár: együttesen vásárolt termékekre vonatkozó adatok -aktuális kattintás utáni
a jánlatok,
y bejelentkezett f elhasználók múltbeli cselekedeteinek (vásárlás és keresés) adatai - hasonló ú j termékek a jánlata,
y elzmények: elzleg meglátogatott (akar más szerveren lév) lapok adatai,
y keresések adatai -kif inomult keresés/kevés találat: öntudatos vásárló, illetve elnagyolt
keresés/sok találat: útmutatásra, támogatásra szoruló látogató,
y kérdívek válaszai és valós cselekedetek összevetése - miért vásárolt az, akinek nem volt szándékában és miért nem vásárol az, aki tervezte.
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 24/28
24
Privacy kérések
y adatszerzés webbuggal,
y hálózati befolyás: azon f elhasználók jellemzése, akik képesek másokat vásárlásra ösztönözni,
y megadott vásárlói adatok f elhasználása (szavatosság, vásárlásösztönzés).
Szövegbányászat
A szövegbányászat meghatározása
y A szövegbányászat strukturálatlan inf ormációkat elemez (mint pl. e-mail-ek,
dokumentumok), hogy
o adatokat (pl. tényállításokat) és
o _ metaadatokat, inf ormációkat (pl. kategorizálás) nyerjen ki bellük nyelvi vagy
statisztikai technikákkal
y Lehetvé teszi legalábbis részlegesen a meg strukturálatlan adatok strukturálttá
alakítását, amit aztán nyomon lehet követni, lehet mérni és be lehet építeni további
analitikus modellekbe
Milyen hatással van a kormányzati kommunikáció a blogoszf érára?
Milyen trendek f igyelhetk meg az elmúlt években a különböz nagy szövegállományokban?Hogyan változnak egy tudományterület kedvenc témái, illetve milyen hatással van a kormányzati
kommunikáció a blogoszf érára?Cél: döntéstámogatása a kutatásf ejlesztési pályázatok kiirásában
A szövegbányászat
y A strukturalizáló (kivonatoló) megoldások nemcsak szövegekre, hanem más kevessé
strukturált adattí pusra is alkalmazhatok (pl. hanglenyomatok azonositása f elvételeken, arcf elismerés videókon, képeken)
y A ma szövegbányászata ilyen módon a strukturálatlan adatokban megtalált minták,
kategóriák, illetve ezek trendjeinek a meglév, strukturált adatokkal való összevetési f eladatává, valamint az ilyen módon kapott adatok hagyományos adatbányászati
módszerekkel való további elemzésévé alakul át
Véleményfeltárás
Komplex kutatási terület
o NLP, text mining, andWeb mining
o Számítástudomány --- menedzsment
Mi a vélemény?
y Mi a vélemény? (Opinion def inition)
o Tudunk-e strukturált def iniciót adni?
o Ha nem tudunk, nem értjük a problémát
Összehasnlító vélemény (Comparative opinion) iPhone is better than Blackberry. A véleményeket összegezni kell
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 25/28
25
Kapcsolódó informatikai területek
y inf ormációkinyerés
y adatbányászat
y gépi tanulás
y statisztikay szöveg klaszterizálása
y tartalom kiemélése
y számítógépes nyelvezet, morf ológiai és szemantikai elemzés
Hasznosítása
y inf ormáció inteníiv nagyipari ágazatok
y piaci inf ormációk rendszerezése
y online üzleti hírszerzés és üzleti elny megszerzése
y célorientált online hírf igyelés
y blog elemzés
y gyógyszeripar, telekommunikáció, banki-pénzügyi szf éra, autógyártás
A szövegbányászat sajátosságai
y a szövegbányászat során olyan tudásra, ismeretekre is szert kívánunk tenni, ami explicit
módon nem volt benne a rendelkezésre álló dokumentum állományban (korpuszban), csak
indirekt módon, rejtve, latensen
y nagy mértékben épít az adatbányászat eredményeire (minták f elismerése, adatreprezentáció
elrejelzés, statisztikai összef üggések kimutatás)
Adatbányászat
A döntések minségének változása
Intuíció alapú döntések
Ösztön, elérzet
Hüvelykujj
Korábbi tapasztalaton alapuló
Szabályozott döntéshozatal
Tudás, szabályok és rutin az üzleti szabályokban A döntések hatékonyak es konzisztensek
Ob jektív
Prediktív döntéshozatal
Pontos, optimalizált döntések tapasztalati mintákon Minden elérhet adat hasznosul
Rugalmas, tény alapú döntések
Változó környezetben is robusztus a legf rissebb adatok alap ján ú jratanuló modellek reagálnak a
trendekre
Ha a döntéshozó képes lenne gyorsan, minden elérhet adat f igyelembevételével optimalizáltandönteni az adott helyzetben külön elemz szakért támogatása nélkül
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 26/28
26
Mi az adatbányászat ?
y Inf ormációk elállítása nyers adatokból
y Eljárás, f olyamat
y Nagy mennyiség adat leválogatása, vizsgálata, modellezése, korábban ismeretlen jellemzk, összef üggések f eltárása üzleti elnyök kiaknázása céljából
y Jiawei Han: a tudás nagy mennyiség adatból történ kinyerése, kibányászása
y Az adatbányászat egy szervezetben található vagy más f orrásból származó, nagy mennyiség adatból történ hatékony inf ormáció, illetve tudáskinyerés, üzleti elnyök szerzése
érdekében.
y Multidiszciplinális tudományág
Jellemzk és célok
y Az adatok nagy száma miatt gyakran alkalmaznak párhuzamos f eldolgozást
y A f eldolgozás során többf éle technikát használnak
y Az adatok f orrása gyakran adattárház, vagy adatpiac
y Az eljárás gyakran nem várt értékes eredményekhez vezet
y Végf elhasználói alkalmazás
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 27/28
27
Adatbányászat folyamata
SEMMA - az adatbányászat módszertana (SAS)
y Sampling mintavétel
tanuló minta (train), ellenrz minta (validation), teszt minta
y Exploring - f eltárás
vizuális és analitikus
y Manipulating - módosítások
leválogatás, transzf ormáció, pótlás
y Model - modellezés neurális hálózatok, statisztikai elemz eszközök, döntési fa, idsorok
y Assesment - értékelés tesztek, graf ikonok
Adatbányászati tanuló algoritmusok
y Nem f elügyelt
o Mintázatot, csoportokat keres.
o Nincs elre kitüntetett változó
o Példa, bolthálózat: keressünk jellemz ügyf élcsoportokat a
o vásárolt termékeik alap ján
y Felügyelt
o Egy adott változó minél pontosabb elrejelzése a cél
o A megjóslandó változó a célváltozó o Amit használhatunk az elrejelzésre, az a magyarázó változó
o Példa: csalásf elderítés
5/13/2018 zleti intelligencia - slidepdf.com
http://slidepdf.com/reader/full/uezleti-intelligencia 28/28
28
Adatbányászati eszközök
SPSS PASW Modeler (Clementine)
SAS Enterprise Miner
IBM Intelligent Miner Microsof t SQL Server
Oracle Data Mining Nepszersegi lista
Adatbányászati-feladatok
gyakori minták kinyerése asszociációs szabályok keresése, gyakori elemhalmazok keresése,
elrejelzés és osztályozás ellenrzött tanulás (supervised learning), predikció, klasszif ikáció
klaszterezés halmaz elemeinek csoportokba sorolása, valamely hasonlósági / távolsági f üggvény alap ján;
f elügyelet nélküli tanulás (unsupervised learning) eredmények
összef üggések f eltárása, osztály
ozás, cs
o
portosítás, elrejelzés, s
orrend kialakítása
+ egyéb speciális f eladatok, eltér megf ogalmazások
Az adatbányászat felhasználási területei
inf ormatikai visszaélések megelzése tiltott tartalmak publikálásának monitorozása
jogosultságokkal való visszaélések kiszrése
kereskedelem:
o f ogyasztói szokások f eltárása, f ogyasztói viselkedés elemzése
o bevétel elrejelzése
o célz
o
tt marketing o kapcsolódó áruk f eltárása
o direkt marketing
biztositok, bankok:
o hitelminsítés
o visszaélések kiszrése (pl. hitelkártya esetén) telekommunikáció:
o lemorzsolódás vizsgálat
o nézettségi mutatok elrejelzése
o energiaf ogyasztás elrejelzése