View
1
Download
0
Category
Preview:
Citation preview
Prof. Dr. Klaus D. Wilde
Lehrstuhl für ABWL und Wirtschaftsinformatik
Katholische Universität Eichstätt-Ingolstadt
CRM mit SAP CRM: SAP NetWeaver BI
SoSe 2012
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 1 Literatur
Egger, N. et al. (2006): SAP BW Reporting und Analyse, 1. Auflage –korrigierter Nachdruck, Bonn.
Egger, N. et al. (2007): SAP Business Intelligence, 1. Auflage –korrigierter Nachdruck, Bonn.
Egger, N. et al. (2007): SAP BW Datenbeschaffung, 1. Auflage – korrigierter Nachdruck, Bonn.
Kießwetter, M.; Vahlkamp, D. (2007): Data Mining in SAP NetWeaver BI, 1.Auflage, Bonn.
Mehrwald, C. (2007): Datawarehousing mit SAP BW 7, 4. Auflage, Heidelberg.
www.sap.help.com
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 2 Copyright
SAP, SAP Logo, R/2, RIVA, R/3, SAP ArchiveLink, SAP Business Workflow, WebFlow, SAP EarlyWatch, BAPI, SAPPHIRE, Management Cockpit, SAP, SAP.com und alle im Text erwähnten SAP-Produkte und –Dienstleistungen, Screenshots sowie die entsprechenden Logos sind Marken oder eingetragene Marken der SAP AG in Deutschland und anderen Ländern weltweit
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e Struktur der Übung 3
SAP Praxis / Übungen
Theorie
Allgemeines
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e Lernziele der Übung
Theorie Was ist ein DW?
Was versteht man unter einem ETL-Prozess?
…
SAP-Praxis Wie ist die Software
aufgebaut?
Wie funktioniert die Software?
…
4
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.2 Data Warehouse
3.3 Business Intelligence
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.1.1 Definition analytisches CRM
3.1.2 Closed-Loop-Prozess
3.1.3 SAP
3.2 Data Warehouse 3.2.1 Definition Data Warehouse
3.2.2 ETL Prozess
3.2.3 SAP NetWeaver BI
3.3 Business Intelligence
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.1.1 Definition analytisches CRM
3.1.2 Closed-Loop-Prozess
3.1.3 SAP
3.2 Data Warehouse 3.2.1 Definition Data Warehouse
3.2.2 ETL Prozess
3.2.3 SAP NetWeaver BI
3.3 Business Intelligence
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.1.1 Definition analytisches CRM
3.1.2 Closed-Loop-Prozess
3.1.3 SAP
3.2 Data Warehouse 3.2.1 Definition Data Warehouse
3.2.2 ETL Prozess
3.2.3 SAP NetWeaver BI
3.3 Business Intelligence
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 9 3.1 Einführung
3.1.1 Definition analytisches CRM
Quelle: in Anlehnung an: Hippner/Wilde 2006, S. 48; Kemper/Baars 2008, S. 2
Analytisches CRM dient der Untersuchung des Kundenbestandes und -verhaltens.
In diesem Umfeld werden auf der Basis kundenzentrierter Data Warehouses mit Hilfe von Analysesystemen (vor allem Data Mining und OLAP) Kundenwertmodelle, Kundensegmentierung bzw. -klassifikationen und kundenspezifische Verhaltensänderungen ermittelt (Churn-Analysen).
Marketing- Prozesse
Back
Off
ice
Ente
rpris
e R
esso
urce
Pla
nnin
g Su
pply
Cha
in M
anag
emen
t
Operative CRM-Systeme
Analytische CRM-Systeme
Data Warehouse
Data Mining
CRM- Anwendungen
Interaktions- kanäle
Customer Touch Points
Außendienst Innendienst CIC Filiale Website
OLAP
Pers. Kontakt WWW E-Mail Telefon Brief/Fax Etc.
Service- Prozesse
Sales- Prozesse
Operative Kundendatenbank
Etc.
Kampagne Opportunity Feedback Lead Angebot/Auftrag Support
Basis- Anwendungen
Kontakt Workflow Stammdaten
Aktivitäten Eskalation
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.1.1 Definition analytisches CRM
3.1.2 Closed-Loop-Prozess
3.1.3 SAP
3.2 Data Warehouse 3.2.1 Definition Data Warehouse
3.2.2 ETL Prozess
3.2.3 SAP NetWeaver BI
3.3 Business Intelligence
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 11 3.1 Einführung
3.1.2 Closed-Loop-Prozess
Geschlossener Regelkreis verschafft strategischen Mehrwert und bindet Kunden langfristig.
Im operativen Bereich gewonnene Daten werden im analytischen CRM ausgewertet.
Die daraus abgeleiteten Erkenntnisse werden in den Produktionsprozess eingearbeitet, verwirklicht und somit wieder in den operativen Verfahren eingespeist.
Der Regelkreis ist geschlossen!
Ergebnis:
- Gezieltere Kundenansprache
- Intensivere Kundenbindung
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 12 3.1 Einführung
3.1.2 Closed-Loop-Prozess
Praktische Anwendungen:
Service-Hotline
Kundenbefragung
After Sales Management (Postkarte beilegen)
Internet: Verkaufsportale, Online Marketing, Verfahren um Verhalten der Internetbesucher zu analysieren
Kombi-Produkte: Amazon Kunden die dieses Buch gekauft haben, haben auch … gekauft.
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 13
Quelle: Egger et al. 2007a, S. 27
Ziel:
Operative Daten in analysierbare Informationen umzuwandeln, daraus Action Knowledge (handlungsauslösendes Wissen) zu generieren, um damit wieder Einfluss auf die operativen Systeme zu nehmen.
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 14
Ziel:
Eliminieren der Wissenslücke!
Quelle: Egger et al. 2007a, S. 57
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 15
Voraussetzung:
Unternehmensweite, konsistente Informationslandschaft als Basis.
Die 5 Schritte des Closed-Loop Business Analytics Process:
1. Verfolgen
2. Analysieren
3. Modellieren
4. Entscheiden
5. Handeln
Quelle: Egger et al. 2007a, S. 27 ff.
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 16
Closed-Loop Business Analytics Process – 1. Schritt: Verfolgen
Datenbeschaffung und Datenhaltung
Extraktion der Daten aus allen relevanten operativen Systemen (entweder zeitversetzt oder Echtzeit)
Bereinigung, Umwandlung, Anreicherung und Vereinheitlichung der Daten
SAP: Laden und Lagerung der bereinigten Daten im Enterprise Data Warehouse Layer des Data Warehouses
Quelle: Egger et al. 2007a, S. 27 f.
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 17
Closed-Loop Business Analytics Process – 2. Schritt: Analysieren
Datenbereitstellung, Daten stehen für Analyse mit Business Intelligence-Werkzeugen zur Verfügung
Möglichkeit von Query, Reporting und multidimensionale Analysen
Beantwortung der Fragen: Was ist passiert?
Wie ist es passiert?
Wann ist es passiert?
Es fehlen jedoch die Antworten auf folgende Fragen: Welche Entscheidungsalternativen gibt es?
Was ist die optimale Entscheidung?
Was sind die Tragweiten, Konsequenzen dieser Entscheidung ?
Was wird passieren?
Quelle: Egger et al. 2007a, S. 27 f.
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 18
Quelle: Egger et al. 2006, S. 58
Closed-Loop Business Analytics Process:
Evolutionspfad analytischer Methoden
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 19
Closed-Loop Business Analytics Process – 3. Schritt: Modellieren
Kreieren von Regeln, Klassifizierungen und weiteren Modellen mit Hilfe von Advanced-Analytics-Werkzeugen (fortschrittliche Analyse Werkzeuge)
Einsatz von: Entscheidungsmodellierung
Prognostik
Simulation
Optimierung
Risikoanalyse
Quelle: Egger et al. 2007a, S. 28
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 20
Closed-Loop Business Analytics Process – 4. Schritt: Entscheiden
Auf Basis von soliden Informationen, die auch anwendergerecht präsentiert wurden, Entscheidungen zu treffen.
Grundlage bietet der Zugriff auf die konsistenten und integrierten Informationen.
Quelle: Egger et al. 2007a, S. 29 f.
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 21
Closed-Loop Business Analytics Process – 5. Schritt: Handeln
Bildet die Rückkopplung zu den operativen Prozessen im Unternehmen Vollautomatisch = Retraktion
Entscheider mit handlungsauslösendem Wissen = manuelle Rückkopplung
Beispiele: Weitere Marketing Kampagne auf Basis der Ergebnisse früherer Kampagnen
Automatische Sperrung einer Kreditkarte im Falle des Betrugsverdachts (Transaktionsanalyse!)
Aufgrund von Kundenprofilen Kredite gewähren oder verweigern
Quelle: Egger et al. 2007a, S. 29 f.
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 22
Ziele des Closed-Loop-Prozesses:
Den Prozess an sich beschleunigen ohne zu schnelle vorzeitige Entscheidungen zu treffen.
Präzision bei der Entscheidungsfindung!
Verständnis der Auswertungsergebnisse und Marktkenntnisse,
um echte Wettbewerbsvorteile zu generieren!
Quelle: Egger et al. 2007a, S. 30
3.1 Einführung 3.1.2 Closed-Loop-Prozess
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.1.1 Definition analytisches CRM
3.1.2 Closed-Loop-Prozess
3.1.3 SAP
3.2 Data Warehouse 3.2.1 Definition Data Warehouse
3.2.2 ETL Prozess
3.2.3 SAP NetWeaver BI
3.3 Business Intelligence
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 24 3.1 Einführung
3.1.3 SAP
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 25
SAP: Systeme, Anwendungen und Produkte in der Datenverarbeitung
Aktiengesellschaft
Größter europäischer und weltweit 4. größter Softwarehersteller
53 513 Mitarbeiter
Über 100 000 Kunden und 12. Mio Anwender
Niederlassungen in mehr als 50 Ländern
Umsatz in 2011: 14,233 Mrd. Euro
Quelle: SAP
3.1 Einführung 3.1.3 SAP
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 26
Quelle: Einkauf.Österreich.com
Entwicklungsverlauf:
Grau = informationstechnologische Konzepte
Schwarz = dazugehörige SAP Lösungen
Externe Entwicklungen
SAP
Produktentwicklungen
3.1 Einführung 3.1.3 SAP
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 27
Quelle: SAP
Beschaffungs-partner Kunde
Vertriebs- partner Unternehmen
SAP SCM/APO SAP ERP SAP CRM
Nachfragefluss
Auftragserfüllungsfluss
Finanzmittelfluss
SAP Netweaver BI
Ope
rativ
e Pr
ozes
se
Analyse und Reporting
Anal
ytis
che
Proz
esse
3.1 Einführung 3.1.3 SAP
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 28
Quelle: SAP
FI (Financial Accounting) FI
CO: Controlling CO-PC: Kostenträgerrechnung (Product Costing)
CO-OM-CEL: Kostenartenrechnung (Cost Element Accounting)
CO-OM-CCA: Kostenstellenrechnung (Cost Center Accounting)
SEM: Strategic Enterprise Management
EC: Enterprise Controlling
PSM: Haushaltsmanagement (Public Sector Management)
PS: Projektabwicklung (Project System)
Human Capital Management PA: Personnel Management
Logistics MM: Materialwirtschaft (Materials Management)
PP: Produktionsplanung und -steuerung (Production Planning and Control)
LE: Lagerverwaltung, Versand und Transport (Logistics Execution)
IS: Branchenlösungen
3.1 Einführung 3.1.3 SAP ERP
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 29
Quelle: SAP NetWeaver BI
3.1 Einführung 3.1.3 SAP NetWeaver BI Menübaum
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 30
Quelle: SAP NetWeaver BI
Nur im Bereich des BI Training KU Eichstätt-Ingolstadt / Übung SoSe 12 wird gearbeitet!!!
3.1 Einführung 3.1.3 SAP NetWeaver BI: Data Warehousing Workbench
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 31
Wichtige Symbole:
Enter Freigabe / Bestätigung der getätigten Eingabe
Sichern Sichern der zuvor eingegebenen Daten
Zurück man gelangt eine Anwendungsstufe zurück auf den vorherigen Bildschirm
Beenden aktuelle Anwendung wird ohne Datensicherung verlassen
Abbrechen beendet Anwendung ohne Speicherung der Daten
Suchen Suchen von Daten, die auf dem aktuellen Bildschirm angezeigt werden
F1-Hilfe kurze Feldhilfe zu dem Feld auf dem sich der Cursor befindet
Anzeigen <-> Ändern wechselt vom Anzeigen in den Änderungsmodus
Aktivieren aktiviert die getätigte Eingabe / Änderung
Neu anlegen gibt die Möglichkeit zur Neuanlage eines Objektes
Auffrischen integriert die neuen Änderungen und zeigt aktuelle Situation an
F4 Werthilfe
Quelle: SAP NetWeaver BI
3.1 Einführung 3.1.3 SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 32
Symbole:
Quelle: SAP NetWeaver BI
Merkmal
Kennzahl
Dimension
InfoCube
Info Objekt Katalog
DataSource
InfoProvider
InfoObjects
3.1 Einführung 3.1.3 SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 33
Nach Erwerb eines SAP-Systems muss die Software an die unternehmensspezifischen Anforderungen angepasst werden.
Customizing bezeichnet die Vorgehensweise der Systemkonfiguration, in der die Mitarbeiter des Projektteams Systemeinstellungen vornehmen.
Customizing wird im SAP-System über den Einführungsleitfaden (IMG: Implementation Guide) vorgenommen.
IMG: Werkzeug zur Anpassung des SAP-Systems an die betriebswirtschaftlichen Anforderungen im Unternehmen.
Alle Änderungen die im Customizing vorgenommen werden haben später Auswirkungen auf die Handhabung des Systems.
-> Nur Dokumentationen betrachten, keine Änderungen durchführen!!!
Quelle: SAP
3.1 Einführung 3.1.3 SAP NetWeaver BI: Customizing
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 34
Quelle: SAP NetWeaver BI
3.1 Einführung 3.1.3 SAP NetWeaver BI: Customizing
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 35
Quelle: SAP NetWeaver BI
Login
Die Kommunikation zwischen dem Benutzer und dem SAP System erfolgt üblicherweise über das SAP GUI (Graphical User Interface) und ist lokal auf den entsprechenden Clients installiert.
Eingabe: VS_12-XX (Nummer wird vom Dozenten vergeben!) Passwort: winter
3.1 Einführung 3.1.3 SAP NetWeaver BI Benutzeroberfläche
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 36
Übungen 1-10:
Einführende Aufgaben zu SAP NetWeaver BI
3.1 Einführung 3.1.3 SAP NetWeaver BI Benutzeroberfläche
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.1.1 Definition analytisches CRM
3.1.2 Closed-Loop-Prozess
3.1.3 SAP
3.2 Data Warehouse 3.2.1 Definition Data Warehouse
3.2.2 ETL Prozess
3.2.3 SAP NetWeaver BI
3.3 Business Intelligence
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.1.1 Definition analytisches CRM
3.1.2 Closed-Loop-Prozess
3.1.3 SAP
3.2 Data Warehouse 3.2.1 Definition Data Warehouse
3.2.2 ETL Prozess
3.2.3 SAP NetWeaver BI
3.3 Business Intelligence
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 39 3.2 Data Warehouse
3.2.1 Definition
Quelle: Heine, P. (1999): Unternehmensweite Datenintegration - modular-integrierte Datenlogistik in betrieblichen Informationssystemen, Stuttgart [u.a.].
Ausgangsproblematik (d.h. ohne Data Warehouse) Nachfolgende Abbildung (Heine 1999, S. 75) veranschaulicht die damit i.d.R.
verbundene Speicherung der Daten in unterschiedlichen Datenbanksystemen mit abweichenden physikalischen und logischen Strukturen.
Aus Sicht der Datenauswertung bedeutet dies, dass Informationen auf horizontaler Ebene über mehrere operative Anwendungssysteme - teilweise redundant - verteilt sind und informationelle Zusammenhänge durch u.a. unterschiedliche Modelle, Schlüsselung und Zeitbezüge der Bewegungsdaten verloren gehen.
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 40 3.2 Data Warehouse
3.2.1 Definition
Ausgangsproblematik (d.h. ohne Data Warehouse)
Zudem werden teilweise Daten individuell zum Zweck der Auswertung direkt aus den operativen Systemen extrahiert. Dies führt zu einer Belastung der operativen Systeme, zu Medienbrüchen und innerhalb des managementunterstützenden Teilinformationssystems teilweise zu personenspezifischen Datenbanken, die von einzelnen Anwendern weiterverarbeitet und ausgewertet werden.
Dies wiederum führt entlang der vertikalen Ebenen der Informationssystem-Pyramide zu starkem Wachstum, Heterogenität und Redundanz der Datenbestände und damit zu einer mangelhaften Datenqualität (Heine 1999, S. 72 ff.). Insgesamt entsteht für das Herauslösen und Zusammenführen von Daten zum Zweck der Auswertung ein sehr hoher Aufwand.
Das Konzept des Data Warehouse wurde entwickelt, um die genannten Integrationsdefizite zu beheben. Es hat in der Praxis eine rasche Verbreitung erfahren und wesentlich zur „Reifung“ der MSS beigetragen.
Quelle: Heine, P. (1999): Unternehmensweite Datenintegration - modular-integrierte Datenlogistik in betrieblichen Informationssystemen, Stuttgart [u.a.].
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 41 3.2 Data Warehouse
3.2.1 Definition
Quelle: Bauer, A.; Günzel, H. (2004): Data Warehouse Systeme - Architektur Entwicklung Anwendung, 2. Aufl., Heidelberg. Mucksch, H.; Behme, W. (2000): Das Data Warehouse-Konzept als Basis einer unternehmensweiten Informationslogistik. In: Mucksch, H.; Behme, W. (Hg.): Das Data Warehouse-Konzept - Architektur - Datenmodelle - Anwendungen, 4. Aufl., Wiesbaden, S. 3-80.
Begriffsabgrenzung und Eigenschaften
Der Data-Warehouse-Begriff umfasst sowohl technische als auch betriebswirtschaftliche Aspekte.
Data Warehouse : Datenbank, „die aus der technischen Sicht Daten aus verschiedenen Datenquellen integriert und aus der betriebswirtschaftlichen Sicht dem Anwender diese Daten zu Analysezwecken zur Verfügung stellt“ (Bauer/Günzel 2004, S. 5).
Data Warehouse : Eine von den operationalen Systemen isolierte Datenbank, „die als unternehmensweite Datenbasis für alle Ausprägungen managementunterstützender Systeme dient und durch eine strikte Trennung von operationalen und entscheidungsunterstützenden Daten und Systemen gekennzeichnet ist“ (Mucksch/Behme 2000, S. 6).
Zu den Leitgedanken des Data Warehouse zählen somit Integration, Separation und Informationsbereitstellung für Analysezwecke.
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 42 3.2 Data Warehouse
3.2.1 Definition
Quelle: Chamoni, P.; Gluchowski, P. (2006): Analytische Informationssysteme - Einordnung und Überblick. In: Chamoni, P.; Gluchowski, P. (Hg.): Analytische Informationssysteme - Business Intelligence-Technologien und Anwendungen, 3. Aufl., Berlin [u.a.], S. 3-22.
Begriffsabgrenzung und Eigenschaften
Integration: Übernahme von Daten aus unterschiedlichen Vorsystemen mit verschiedenen
Datenhaltungen (z.B. relationale Datenbanken, hierarchische Datenbanken, Flat-Files) und Datenformaten (z.B. Datenbank-Tabellen, unstrukturierte Textdateien, Bild-Dateien).
Zu den Vorsystemen gehören nicht nur die internen operativen Informationssysteme, mit denen die Geschäftsvorfälle des betrieblichen Basissystems in Transaktionen innerhalb des Informationssystems abgebildet werden (Online Transaction Processing Systems, OLTP), sondern auch externe Systeme, wie z.B. kommerzielle Datenbanken.
Relevante atomare Daten der Vorsysteme werden periodisch extrahiert, in vielfältiger Weise aufbereitet und im Data Warehouse systematisch zusammengeführt (vgl. Chamoni/Gluchowski 2006, S. 12).
Nach den englischen Bezeichnungen der Teilschritte - „Transformation“, „Extraction“ und „Loading“ - wird dieser Vorgang auch als „ETL-Prozess“ bezeichnet.
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 43 3.2 Data Warehouse
3.2.1 Definition
Quelle: Mucksch, H.; Behme, W. (2000): Das Data Warehouse-Konzept als Basis einer unternehmensweiten Informationslogistik, in: Mucksch, H.; Behme, W. (Hg.): Das Data Warehouse-Konzept - Architektur - Datenmodelle - Anwendungen, 4. Aufl., Wiesbaden, S. 3-80.
Begriffsabgrenzung und Eigenschaften
Separation: Basiert auf der Erkenntnis, dass die operativen Vorsysteme durch analytische
Abfragen nicht in ihrem reibungslosen Betrieb gestört werden dürfen.
Beeinträchtigungen eines operativen Systems durch darauf ausgeführte analytische Abfragen lassen sich technisch kaum verhindern. Nachfolgende Abbildung (leicht modifiziert nach Mucksch/Behme 2000, S. 16) verdeutlicht, dass die Auslastung der zugrunde liegenden Hardware bei den transaktional ausgerichteten operativen Systemen relativ gleichmäßig ist.
operative DV-Systeme
Zeit
HW
-Nut
zung
Managementunterstützungssysteme
Zeit
HW
-Nut
zung
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 44 3.2 Data Warehouse
3.2.1 Definition
Quelle: Bauer, A.; Günzel, H. (2004): Data Warehouse Systeme - Architektur Entwicklung Anwendung, 2. Aufl., Heidelberg, S. 8 ff.
Begriffsabgrenzung und Eigenschaften
Informationsbereitstellung für Analysezwecke : Hard- und Software sowie Datenmodell der operativen Systeme sind für die
schnelle Bearbeitung von kurzen, einfachen Transaktionen ausgelegt, wobei die Anfragen keine modellseitige Bevorzugung haben und damit auf einem anfrageflexiblen Datenmodell basieren.
Analytische Abfragen hingegen umfassen sehr viele Datensätze in langen Lese-transaktionen und benötigen ein analysebezogenes Datenmodell.
Die Daten der operativen Systeme sind zeitaktuell und ständigen Modifikationen unterworfen.
Analytische Anwendungen dagegen benötigen konsolidierte, stabile und meist aggregierte Daten.
Das Datenbankschema des Data Warehouse muss sich dem Einsatzzweck anpassen und wird im Gegensatz zu den OLTP-Systemen nicht anwendungsneutral, sondern auswertungsorientiert mit vorgedachten Analysepfaden ausgelegt
Dies spricht ebenfalls für die Separation von operativen und Data Warehouse-Systemen.
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 45
Quelle: SAP
Gründe für ein gesondertes Data Warehouse:
Themenorientierung
Vereinheitlichung
Zeitraumorientierung
Beständigkeit
3.2 Data Warehouse 3.2.1 Nutzenpotenziale eines Data Warehouse
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 46
Quelle: Heine, P. (1999): Unternehmensweite Datenintegration - modular-integrierte Datenlogistik in betrieblichen Informationssystemen, Stuttgart [u.a.]. Strauch, B. (2002): Entwicklung einer Methode für die Informationsbedarfsanalyse im Data Warehousing, Bamberg.
3.2 Data Warehouse 3.2.1 Nutzenpotenziale eines Data Warehouse
Begriffsabgrenzung und Eigenschaften
Data Warehouse-Systeme haben sich als Zwischenschicht durchgesetzt, die dispositive und operative Applikationen entkoppelt (s. Abbildung, leicht modifiziert nach Strauch 2002, S. 24).
Das Data Warehouse stellt somit ein Teilinformationssystem des betrieblichen Informationssystems dar.
Es handelt sich hierbei weder um einen Standard, noch um ein Produkt, sondern viel mehr um eine Architektur, deren Umsetzung für jedes Unternehmen unterschiedliche Software- und Hardware-Komponenten umfasst und einen sehr hohen Anteil an Fachwissen benötigt (Heine 1999, S. 112).
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 47 3.2 Data Warehouse
3.2.1 Definition
Quelle: Hippner/Wilde 2006, S. 48
Marketing- Prozesse
Back
Off
ice
Ente
rpris
e R
esso
urce
Pla
nnin
g Su
pply
Cha
in M
anag
emen
t
Operative CRM-Systeme
Analytische CRM-Systeme
Data Warehouse
Data Mining
CRM- Anwendungen
Interaktions- kanäle
Customer Touch Points
Außendienst Innendienst CIC
Filiale Website
OLAP
Pers. Kontakt WWW E-Mail Telefon Brief/Fax Etc.
Service- Prozesse
Sales- Prozesse
Operative Kundendatenbank
Etc.
Kampagne Opportunity Feedback Lead Angebot/Auftrag Support
Basis- Anwendungen
Kontakt Workflow Stammdaten
Aktivitäten Eskalation
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 48
Quelle: in Anlehnung an: Mucksch/Behme 1996, S. 64 ff.
Abfrage- und Analysewerkzeuge
Archivierungs-systeme
Datenbasis
Benutzerschnittstelle bzw. Output-Schicht
Datenschnittstelle bzw. Input-Schicht Transformationsprogramme
Met
adat
en
Direktzugriff Analysen Berichte
Data Marts
Unternehmensinterne und –externe transaktionsorientierte Daten
Verdichtungsstufe 1
Verdichtungsstufe 2
Verdichtungsstufe n
3.2 Data Warehouse 3.2.1 Architektur des Data Warehouse Systems
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 49
Technischer Nutzen
Verbesserte Datenintegration
Keine dezentralen Datenprüfungen mehr notwendig
Schnelle Abfragen möglich
Entlastung operativer Anwendungen
Flexible Zugriffsmöglichkeiten
Betriebswirtschaftlicher Nutzen
Verbesserte Informationsbereitstellung
Frühzeitiges Erkennen von Trends
Zügige Reaktion auf Umweltveränderungen
Verbesserung der Kundenzufriedenheit
Harmonisierung von Begriffen
Quelle: SAP
3.2 Data Warehouse 3.2.1 Nutzenpotenziale eines Data Warehouse
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 50
Quelle: SAP
Online Transaction Processing DWH
Ziel Effizienz durch Automation Vorteile durch Wissensgenerierung
Inhalt der Daten Anwendungs- & funktionsbezogen Themenbezogen
Art der Daten Transaktionsdaten Aggregierte- & Transaktionsdaten
Alter der Daten Aktuell, zeitnah: 30-60 Tage Historisch, aktuell, zukünftig
Datenvolumen Klein Sehr umfangreich
Hauptfunktionalität Häufige Änderungen Zeitabhängige Auswertungen
State of the Art beim Normalisiert Relationale & multidimensionale DB
Datenbanksystem
Erlaubte Operationen auf Einfügen, Aktualisieren, Löschen, Lesen
den Datenbestand Lesen
3.2 Data Warehouse 3.2.1 Nutzenpotentiale eines OLTP im Vergleich zum Data Warehouse
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.1.1 Definition analytisches CRM
3.1.2 Closed-Loop-Prozess
3.1.3 SAP
3.2 Data Warehouse 3.2.1 Definition Data Warehouse
3.2.2 ETL Prozess
3.2.3 SAP NetWeaver BI
3.3 Business Intelligence
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 52
Bevor BI relevante Daten im DW bereit gestellt werden können, sind
umfangreiche Bearbeitungsaktivitäten erforderlich.
Im ETL-Prozess werden die operativen Systeme aufgegriffen und in
betriebswirtschaftlich interpretierbare Daten transformiert.
ETL besteht aus 3 nachfolgenden Prozessschritten:
Extraktion der relevanten Daten aus verschiedenen Quellen (Filterung)
Transformation der Daten in das Schema und Format der Zieldatenbank (syntaktische und semantische Datenaufbereitung)
Laden der Daten in das Data Warehouse (Datenübernahme in das DW)
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 53
Extraktion
Erster Schritt
Auswahl der Daten aus Quellsystem
Vorbereitung der Daten für Transformation
In der Regel wird nur ein Ausschnitt aus den Quelldaten selektiert
Interne Datenquelle
Externe Datenquelle
Extrakt Extrakt
Bereinigte Rohdaten
Data Warehouse
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 54
Datenquellen
Meist aus verschiedenen Informationssystemen
Oftmals bestehen sie aus unterschiedlichen Datenformaten und Datenstrukturen.
Im Idealfall sind die Daten in relationalen Datenbanken abgelegt.
Unstrukturierte Textdaten lassen sich nur schwer einlesen!
ETL- Tools ermöglichen den Zugriff auf vielfältige Datenformate.
Quelle: SAP
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 55
Aktualität der Datenquellen
Extraktion muss regelmäßig stattfinden Asynchrone Extraktion
Periodisch
Ereignisgesteuert
Nachfragegesteuert
Synchrone Extraktion
Oftmals stehen für das Auslesen aus operativen Datenbestände nur begrenzt
Zeitfenster zur Verfügung; daher nachts Zugriff auf Quellsysteme um
den operativen Tagesbetrieb nicht durch aufwendige Lese- und Kopiervorgänge
zu behindern!
Quelle: SAP
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 56
Unterteilung des
Transformationsprozesses
in 4 Einzelschritte:
1. Filterung
2. Harmonisierung
3. Aggregation
4. Anreicherung
Transformation
Quelle: Kemper/Finger 2006, S. 116
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 57
Transformation – 1. Schritt: Filterung
Filterung: Extraktion und Bereinigung syntaktischer und inhaltlicher (semantischer)
Defekte der Daten
Syntaktische Mängel: falsche Steuerzeichen, formale Fehler
Semantische Mängel: Fehler betriebswirtschaftlich-inhaltlicher Art (offensichtlich falsche Umsatzzahlen)
Quelle: Kemper/Finger 2006, S. 114 ff.
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 58
Unterscheidung: Mängel 1., 2. und 3. Klasse
1. Klasse: lassen sich automatisch erkennen und während des Extraktionsvorgangs auch automatisch korrigieren
2. Klasse: Defekterkennung erfolgt automatisch, die Korrektur muss aber nach dem Extraktionsvorgang manuell vorgenommen werden
3. Klasse: Mängel können ausschließlich manuell erkannt und korrigiert werden
Die Mängel 2. und 3. Klasse bedingen kurz- oder mittelfristig eine
Fehlerbereinigung in den operativen Quellsystemen!
Quelle: Kemper/Finger 2006, S. 114 ff.
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 59
Syntaktische Mängel:
1. Klasse: Bekannte Formatanpassungen
Beispiel: intern verwendete Sonderzeichen werden durch Mapping- Tabellen automatisch beim Extrahieren erkannt und bereinigt
2. Klasse: Erkennbare Formatinkompatibilitäten
Beispiel: Entdecken bislang unberücksichtigter Syntaxvarianten der operativen Datenquellen / erkennbare Formatinkompatibilitäten
Quelle: Kemper/Finger 2006, S. 114 ff.
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 60
Semantische Mängel:
1. Klasse: Fehlende Datenwerte
2. Klasse: Ausreißerwerte / unstimmige Wertekonstellationen
Beispiel: Negative Umsatzzahlen; Abhilfe durch Plausibilitätskontrollen, Domänenüberprüfung zur Identifikation fehlerhafter Datenfelder
3. Klasse: Unerkannte semantische Fehler in operativen Quellen
Beispiel: Zuordnung Produkte zu Produktgruppen; Extrahierte Daten enthalten inkorrekte Datenwerte
Quelle: Kemper/Finger 2006, S. 114 ff.
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 61
Transformation – 2. Schritt: Harmonisierung der Daten
Die gefilterten und bereinigten Daten werden zusammengeführt
3 Problemklassen:
Abgleichen von Kodierungen, Synonymen und Homonymen
Auflösen von Schlüsselharmonien
Betriebswirtschaftliche Harmonisierung
Quelle: Kemper/Finger 2006, S. 114 ff.
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 62
Kodierung: Einzelne Datenbestände können unterschiedlich kodiert sein. So könne Attribute wie Geschlecht in Datenquelle 1 als „M“ / „W“ kodiert sein, in Datenquelle 2 als „0“ / „1“ Variable
-> Harmonisierung durch einheitlichen Attributwert „0“ / „1“
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 63
Synonyme = unterschiedliche Attributnamen können die gleiche Bedeutung haben. Beispielsweise kann in Datenquelle 1 für den Namen von Betriebsmitarbeitern das Attribut „Personal“ vorgesehen sein, in Datenquelle 2 aber „Mitarbeiter“
-> Harmonisierung durch identische Attributnamen
Homonyme = gleiche Attributnamen können unterschiedliche Bedeutung haben. In Datenquelle 1 kann „Partner“ den Namen von Kunden bezeichnen, in Datenquelle 2 den Namen von Lieferanten
-> Harmonisierung durch unterschiedliche Attributnamen
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 64
Auflösung von Schlüsseldisharmonien
Beim Zusammenführen von Daten aus mehrer Datenbanken ist ein gemeinsamer
Primärschlüssel notwenig.
Mit Hilfe von Zuordnungstabellen wird jedem neuen Kunden ein künstlicher
Primärschlüssel generiert.
Die Primärschlüssel der operativen Systeme werden als Fremdschlüssel
mitgeführt, so dass übergreifende Datenauswertungen möglich sind.
Im letzten Schritt erfolgt die Vereinheitlichung betriebswirtschaftlicher
Begriffe. Bsp.: Währungen, Periodenzählweise, Einheiten etc.
Quelle: SAP
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 65
Beispiel: Schlüsseldisharmonien
Kundenreklamation eines schadhaften Ersatzteils.
Herstellerfirma hat anderen Schlüssel als Vertriebsfirma
-> Garantiefall ohne angelegten Lieferantenschlüssel und ohne
Beschaffungssystem, kein Kundenschlüssel bekannt
-> Lieferant des schadhaften Ersatzteils ist nicht identifizierbar!
Quelle: SAP
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 66
Transformation – 3. Schritt: Aggregation
Betriebswirtschaftliche Aufbereitung. Die Daten werden in die gewünschte
Granularität (Detaillierungsebene der abgelegten Daten innerhalb eines DWH)
überführt.
Aggregationsalgorithmen für tagesaktuelle Daten zusammenfassen
Vorsummierung für betriebswirtschaftliche Kennziffern
Entwicklung von Dimensionshierarchietabellen (Kunde, Kundengruppe, Gesamt)
Wichtiger Einschnitt was „Neutralität“ der Daten betrifft
Quelle: Kemper/Baars 2008, S. 10; Kemper /Finger 2006, S. 114 ff.
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 67
Quelle: Kemper/Finger 2006, S. 132
Granularität
Beschreibt den Detaillierungsgrad von Daten
Sehr detaillierte Daten haben eine niedrige Granularität
Mit steigender Verdichtung der Daten wird eine höhere Granularität erreicht
Die Granularität wirkt sich unmittelbar auf den benötigten Speicherplatz, die Verarbeitungsgeschwindigkeit und die Flexibilität des Data Warehouses aus
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 68
Transformation – 4. Schritt: Anreicherung
Aufweichung der strikten Trennung
zwischen Daten und Programmlogik. Die
Daten werden um betriebswirtschaftliche
Kennziffern expandiert.
Vorteile: Abfragen sind effizienter durchführbar
Die errechneten Werte sind wegen der einmaligen Berechnung konsistenter
Es liegt ein abgestimmtes betriebswirtschaftliches Instrumentarium vor
Dieser Prozess findet in der Staging Area
statt!
Quelle: Skript Wirtschaftsuniversität Wien
3.2 Data Warehouse 3.2.2 ETL Prozess
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 69
Laden der geprüften Daten
Die vorbereiteten Daten werden in das Data Warehouse integriert.
Hierzu müssen sie physikalisch in die Datenbank des DW verschoben werden und darauf aufbauende Datenanalysesysteme aktualisiert werden.
Das Laden aus der Staging Area in das DW soll möglichst effizient geschehen, daher werden meist nicht alle Daten bei jeder Aktualisierung geladen, sonder nur die Neuen.
Um operativen Betrieb nicht zu beeinträchtigen wird der ETL Prozess meist über Nacht abgewickelt.
Quelle: SAP
3.2 Data Warehouse 3.2.2 ETL Prozess
Übersicht
1 Grundlagen
2 SAP CRM
3 SAP BI 3.1 Einführung
3.1.1 Definition analytisches CRM
3.1.2 Closed-Loop-Prozess
3.1.3 SAP
3.2 Data Warehouse 3.2.1 Definition Data Warehouse
3.2.2 ETL Prozess
3.2.3 SAP NetWeaver BI
3.3 Business Intelligence
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 71
Quelle: SAP
Datenbasis
Datenschnittstelle bzw. Input-SchichtTransformationsprogramme
Unternehmensinterne - und -externe transaktionsorientierte Daten
Met
adat
en
Verdichtungsstufe 2
Verdichtungsstufe 1
Verdichtungsstufe n
Verdichtungsstufe 2
Verdichtungsstufe 1
Verdichtungsstufe n
Data MartsData Marts
ArchivierungsArchivierungs--systemesysteme
Benutzerschnittstelle bzw . Output-Schicht
Direktzugriff Analysen BerichteDirektzugriff Analysen Berichte
Abfrage- und Analysewerkzeuge
3.2 Data Warehouse 3.2.3 Vom DW zum SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 72
Quelle: http://www.uniorg.de/page/sap_beratung_netweaver_soa
3.2 Data Warehouse 3.2.3 SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 73
Quelle: SAP
3.2 Data Warehouse 3.2.3 Integration SAP NetWeaver BI im SAP NetWeaver
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 74
Quelle: SAP
Data Warehouse
BI Plattform
BI Suite: Business Explorer
Entwicklertechnologien
3.2 Data Warehouse 3.2.3 Integration SAP NetWeaver BI im SAP NetWeaver
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 75
Quelle: http://www.youtube.com/watch?v=zB-uBLI_30Q SAP
3.2 Data Warehouse 3.2.3 SAP NetWeaver BI – Body of Information
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 76
Die SAP-Lösung für den DWH Bereich ist das SAP NetWeaver BI, sprich es handelt sich um eine von SAP entwickelte Applikation eines Data Warehouses
Das SAP NetWeaver BI: ist für die Datenhaltung und Datenanalyse von SAP interner und externer Daten
entwickelt worden
ist inzwischen die Grundlage für verschiedene SAP Anwendungen geworden
dient der Unterstützung von strategischen und operativen Unternehmensentscheidungen. Dabei werden Warehouse-Technologien mit vorkonfigurierten betriebswirtschaftlichen Inhalten (Business Content) miteinander verbunden. Auf diese Weise wird ein umfassender Überblick über unternehmensinterne und –externe Daten geboten.
Quelle: SAP
3.2 Data Warehouse 3.2.3 … zur Praxis SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 77
Die 3 Ebenen des SAP NetWeaver BI:
Präsentationsebene (Auswertungen)
Administrationsebene (Aufbereitung der Daten)
Zentraler Punkt: Data Warehousing Workbench
Extraktionsebene (Datenbeschaffung)
Quelle: SAP
3.2 Data Warehouse 3.2.3 Definition SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 78
Datenübernahme einplanen
Daten laden
Datenübernahme überwachen
Fortschreibungs-prozess überwachen
BW Erstellung Pflege
Überwachung
Zentraler Punkt der BW Verwaltung und Steuerung
3.2 Data Warehouse 3.2.3 Administrator Workbench
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 79
Data Warehousing Workbench:
Funktionsbereiche:
Modellierung
Administration
Transportanschluss
Dokumente
Business Content
Übersetzung
Metadaten Repository
Quelle: SAP NetWeaver BI
3.2 Data Warehouse 3.2.3 Extraktion im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 80
Data Warehousing Workbench:
Funktionsbereich Modellierung:
Das Werkzeug zur Modellierung von Daten
ist die Data Warehousing Workbench. Je
nach Anforderung für Analyse und Reporting
stehen verschiedene BI-Objekte zur
Integration, Transformation, Konsolidierung,
Bereinigung und Ablage von Daten zur
Verfügung. Die BI-Objekte erlauben eine
effiziente Bereitstellung der Daten zur
Analyse und Interpretation.
Quelle: SAP
3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 81
Data Warehousing Workbench (RSA1)
Die Data Warehousing Workbench (DWB),
ist für die Aufgaben im Data
Warehousing Prozess das zentrale
Werkzeug.
Sie stellt die Funktionen zur
Datenmodellierung sowie zur Steuerung,
Überwachung und Pflege aller mit der
Datenbeschaffung, -haltung und
–verarbeitung verbundenen Prozesse
im SAP NetWeaver BI zur Verfügung.
Quelle: SAP NetWeaver BI
3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 82
Quelle: SAP
Extraktionsebene
3.2 Data Warehouse 3.2.3 Extraktion im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 83
Einspeisung der Daten sowohl aus dem ERP als auch aus Fremdsystemen: Andere SAP NetWeaver BI-Systeme
SAP CRM
Flat-Files
Datenbanksysteme
XML
PSA = Persisting Staging Area = Eingangsschnittstelle
Quelle: SAP
3.2 Data Warehouse 3.2.3 Extraktion im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 84
Der Weg zur PSA: InfoArea anlegen
InfoObjectCataloge anlegen
InfoObjects anlegen
InfoCube anlegen Struktur fertig angelegt, jetzt mit Daten füllen!
Anwendungskomponente anlegen
DataSources anlegen
Transformation anlegen
InfoPackages laden
Datentransferprozess anlegen
Prüfen ob die Daten fehlerfrei in der PSA und im InfoCube angekommen sind!
Quelle: SAP
3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 85
Der Weg zur PSA: InfoArea anlegen
InfoObjectCataloge anlegen (beinhaltet Merkmale / Kennzeichen)
InfoObjects anlegen (kleinste Einheit!)
InfoCube anlegen Struktur fertig angelegt, jetzt mit Daten füllen!
Anwendungskomponente anlegen
DataSources anlegen (woher kommen die Daten?)
Transformation anlegen (Zuordnung)
InfoPackages laden
Datentransferprozess anlegen
Prüfen ob die Daten fehlerfrei in der PSA und im InfoCube angekommen sind!
Quelle: SAP
3.2 Data Warehouse 3.2.3 Überblick einzelne Schritte
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 86
Quelle: SAP NetWeaver BI
3.2 Data Warehouse 3.2.3 Extraktion im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 87
Quelle: SAP NetWeaver BI
3.2 Data Warehouse 3.2.3 Anlegen eines Merkmals
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 88
Der Weg zur PSA: InfoArea anlegen
InfoProvider ist eine persistente Datenablage, er stellt die Daten für Analyse,
Reporting und Planung zur Verfügung
(Modellierungsebene der Data Warehousing Workbench)
Quelle: SAP
3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 89
Der Weg zur PSA: InfoObjectCataloge anlegen
IOC beinhaltet mehrere InfoObjects (Merkmale oder Kennzahlen), dient somit
einer besseren Strukturierung und ist im InfoObjectsbaum integriert.
Ist ein IOC angelegt, kann er mit InfoObjects (kleinste Einheiten des BI) gefüllt werden.
Quelle: SAP
3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 90
Zwei Arten von Tabellen:
Faktentabellen beinhalten betriebswirtschaftliche Daten wie Umsatz, Verkaufsdaten usw.
Zu jeder Faktentabelle sind Dimensionstabellen ver- bunden, die die Geschäfts- strukturen des Unternehmens beschreiben.
Quelle: http://de.wikipedia.org/wiki/Sternschema
3.2 Data Warehouse 3.2.3 Exkurs: Stern (Star) Schema
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 91
Der Weg zur PSA: InfoCube anlegen
Mehrdimensionale Ablage für den Decision Support.
Wird aus einer oder mehreren DataSources gefüllt und enthält zwei Arten von Daten: Merkmale und Kennzahlen
Bildet das Datenmodell des SAP Business Information Warehouse.
Technische Sicht: InfoCube besteht aus einigen relationalen Tabellen die nach dem Star-Schema zusammengestellt sind. Eine große Faktentabelle im Zentrum (Kennzahlen) und mehrere sie umgebende Dimensionstabellen (Merkmale).
Struktur fertig angelegt, jetzt mit Daten füllen! Quelle: SAP
3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI
Kath
olis
che
Uni
vers
ität E
ichs
tätt-
Ingo
lsta
dt
Lehr
stuh
l für
ABW
L un
d W
irtsc
hafts
info
rmat
ik
Prof
. Dr.
Klau
s D
. Wild
e 92
Sie sind Praktikant des anerkannten PC Vertriebsunternehmens WIF (Wir Informieren Fachleute). Im Rahmen Ihrer Praktikumsstelle will das Unternehmen testen wie fit Sie im Umgang mit spezieller Systemsoftware sind, in diesem Fall der SAP NetWeaver BI.
Sie sollen mit Hilfe dieser Software Unternehmensdaten in das Data Warehouse laden und diese entscheidungsrelevant aufbereiten. Dazu empfiehlt es sich nach spezifischen Kennzahlen (Umsatz, Produktpreise,..) und Merkmalen (Buchungskreis, Kunden, Kundengruppen,..) zu suchen, welche anschließend in Form eines Daten-Würfels vorliegen und somit auch eine Analysebasis für zukünftig umfangreichere Daten bilden.
Sind die Daten in Form einer aussagekräftigen Grafik mit Hilfe des Query Designers verfügbar, steht einer Festanstellung nichts mehr im Wege!
3.2 Data Warehouse 3.2.3 Szenario
Recommended