24
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/24 Beispiel einer Anfrage Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen Kosmetik, Elektro und Haushaltswaren in den Bundesländern Sachsen-Anhalt und Thüringen angefallen?

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Embed Size (px)

DESCRIPTION

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24. Beispiel einer Anfrage Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen Kosmetik, Elektro und Haushaltswaren in den Bundesländern Sachsen-Anhalt und Thüringen angefallen?. - PowerPoint PPT Presentation

Citation preview

Page 1: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/24

Beispiel einer Anfrage

Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen Kosmetik,

Elektro und Haushaltswaren in den Bundesländern Sachsen-Anhalt und

Thüringen angefallen?

Page 2: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 2/24

Fragestellungen und Aufgaben (Bsp.)

• Überprüfung des Warensortiments zur Erkennung von Ladenhütern oder

Verkaufsschlagern

• Standortanalyse zur Einschätzung der Rentabilität von Niederlassungen

• Untersuchung der Wirksamkeit von Marketing-Aktionen

• Auswertung von Kundenbefragungen, Reklamationen bezüglich bestimmter

Produkte etc.

• Analyse des Lagerbestandes

• Warnkorbanalyse mit Hilfe der Kassenbons

Page 3: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Kosmetik

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 3/24

Zeitraum

Produkt

SummeHaushaltElektro

1998

1999

Summe

Sachs

en-

Anhal

t

Thür

inge

nSum

me Region

KennzahlUmsatz

Ergebnis (Würfel)

Page 4: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 4/24

Ergebnis (Bericht)

Umsatz Kosmetik Elektro Haushalt SUMME

1998 Sachsen-Anhalt 45 123 17 185

Thüringen 43 131 21 195

SUMME 88 254 38 380

1999 Sachsen-Anhalt 47 131 19 197

Thüringen 40 136 20 196

SUMME 87 267 39 393

SUMME 175 521 77 773

Page 5: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 5/24

Aspekte von Data Warehouses

Integration

• Vereinigung von Daten aus verschiedenen, meist heterogenen Quellen

• Überwindung der Heterogenität auf verschiedenen Ebenen (System, Schema,

Daten)

Analyse

• Bereitstellung der Daten in einer vom Anwender gewünschten Form (bezogen

auf Entscheidungsgebiet)

• erfordert Vorauswahl, Zeitbezug, Aggregation

Page 6: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 6/24

Marktentwicklung

Marktgröße

Data Warehouse und OLAP (Quelle: OLAP Report OnLine www.olapreport.com)

0

0,5

1

1,5

2

2,5

3

3,5

4

4,5

1994 1995 1996 1997 1998 1999 2000 2001

Mrd. Euro

Page 7: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 7/24

Abgrenzung zu OLTP

Klassische operative Informationssysteme

Online Transactional Processing (OLTP)

• Erfassung und Verwaltung von Daten

• Verarbeitung unter Verantwortung der jeweiligen Abteilung

• Transaktionale Verarbeitung: Kurze Lese-/Schreibzugriffe auf wenige

Datensätze

Data Warehouse

• Analyse im Mittelpunkt

• lange Lesetransaktionen auf vielen Datensätzen

• Integration, Konsolidierung und Aggregation der Daten

Page 8: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 8/24

Abgrenzung zu OLTP: Anfragen

Anfrage transaktional analytisch

FokusLesen, Schreiben, Modifizieren, Löschen 

Lesen, periodisches Hinzufügen  

Transaktionsdauer und -typ

kurze Lese-/ Schreibtransaktionen 

lange Lesetransaktionen 

Anfragestruktur  einfach strukturiert komplex 

Datenvolumen einer Anfrage

 wenige Datensätze viele Datensätze 

Datenmodell  anfrageflexibel analysebezogen 

Page 9: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 9/24

Abgrenzung zu OLTP: Daten

Daten transaktional analytisch

Datenquellen meist eine mehrere

Eigenschaftennicht abgeleitet, zeitaktuell, autonom, dynamisch

abgeleitet/konsolidiert, nicht zeitaktuell, integriert, stabil

Datenvolumen  MByte…GByte GByte…TByte

Zugriffe  Einzeltupelzugriff Tabellenzugriff

Page 10: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 10/24

Abgrenzung zu OLTP: Anwender

Anwender transaktional analytisch

AnwendertypEin-/Ausgabe durch Angestellte oder Applikationssoftware

Manager, Controller, Analyst

Anwenderzahl sehr vielewenige (bis einige hundert)

Antwortzeit  ms…sec sec…min

Page 11: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 11/24

Data Warehouse: Charakteristika

Fachorientierung (subject-oriented)

• Zweck des Systems ist nicht Erfüllung einer Aufgabe (z.B.

Personaldatenverwaltung), sondern Modellierung eines spezifischen

Anwendungsziels

Integrierte Datenbasis (integrated)

• Verarbeitung von Daten aus mehreren verschiedenen Datenquellen (intern und

extern)

Nicht-flüchtige Datenbasis (non-volatile)

• stabile, persistente Datenbasis

• Daten im Data Warehouse werden nicht mehr entfernt oder geändert

Historische Daten (time-variant)

• Vergleich der Daten über Zeit möglich (Zeitreihenanalyse)

• Speicherung über längeren Zeitraum

Page 12: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 12/24

Data Warehouse

Datenbank, die Daten aus unterschiedlichen Quellen integriert und Analysen

darauf unterstützt (Rahm/Vossen)

Data Mining

Nach Rahm/Vossen eine Sammlung von Verfahren zur Entdeckung von Mustern

in großen Datenmengen.

Verfahrensklassen sind Clustering, Klassifikation und die Bestimmung von

Assoziationsregeln

Page 13: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 13/24

Aufgabe 1 (IR)

Information Retrieval wird durch sogenannte Suchmaschinen (Search Engines)

im Web realisiert.

Teilweise spezialisieren sich diese Suchmaschinen auf bestimmte

Themengebiete.

Finden Sie solche Anbieter mit Suchmaschinen und notieren Sie sich die

abgedeckten Themengebiete.

Page 14: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 14/24

Erweiterung der Abfrage

Kombination

select *

from germany, cities

where cities.name = germany.stadt

and germany.hotel like arcor

and cities.plz like 6%

or cities.plz like 5%

Page 15: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 15/24

W3QL Beispiel

• select from n1, l1, (n2, l2), n3, l3

where n1 in {URL};

l1 in {path}

l2 in {path}

n3: PERLCOND, n3.format =~/image/‘

n3 in {path}

using ISSEARCH –d 5-l 1000

• Ergebnis: Tabelle mit Links

Page 16: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 16/24

XML Beispiel

• WHERE <hotel>

<name>arcor<name/>

<inhaber>$i<inhaber/>

<stadt>$s<stadt/>

</hotel> IN „www.a.b/hotels.xml“

• CONSTRUCT <result>

<inhaber>$i<inhaber/>

<stadt>$s</stadt>

<result/>

Page 17: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 17/24

Meta Viz

• Umgebung zur visuellen Interaktion mit Geodaten

• Ziel: Reduktion des Informationsüberflusses anderer Geodatensuchmaschinen

• Auswahl der Zielregion durch Zoomen

• Suche nach Attributen in Metadaten

• Gefundene Objekte werden im

selektierten Großraum angezeigt

• Problem: einzelne Objekte

können verdeckt werden

Page 18: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 18/24

Meta Viz

• Lösung: rotierbare 3D-Darstellung

Page 19: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 19/24

Information Retrieval

• Art und Weise der Informationsbeschaffung

• Ziel: effektive Verwaltung großer Datenmengen

• Benutzerorientiertes Extrahieren von interessanten Informationen aus beliebiger

Datenbasis

• Sinnvolle, interaktive, graphische Sortierung/Darstellung der Suchergebnisse

Abfragesprachen

• Schnittstelle zwischen Datenbank und Benutzerinterface

• einfache Darstellung der Abfrage, verständlich für Mensch und Maschine

• flexible Gestaltung der Sprache für einfache und komplexe Abfragen

• Erweiterbarkeit von Abfragen graphischer Präsentationen unterstützt

ausgeprägte menschliche Mustererkennungsfähigkeit

Page 20: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 20/24

SQL

Erweiterungen der Sprache durch CSQL und ParaSQL

W3QL

XML basierende Abfragesprachen

XML-QL

SQL

• allgemeiner Standard

• SQL hat als Datengrundlage eine relationale Datenbankstruktur

Page 21: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 21/24

Aufbau von SQL

• Formulierung mittels Text

• Datentypen wie Text und Zahl

• Gliederung:

• Definition der Rückgabe select cities

• Datenquelle from germany

• Suchparameter where hotel like ar%

• Sortierreihenfolge order by inhaber

Page 22: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 22/24

Ergänzungen von SQL

CSQL

• geo-technische Funktionen

• Abstand, Überschneidung (z.B. Flugbahnen, Straßen) und Grenzen

• Distance (hotel, bahnhof) <= 100

ParaSQL

• pattern matching auf Geodaten

• neue Datentypen: Raum, Zeit, Raum-Zeit

• Bsp: Circle (earth-quake(10) = high,50)

Kommerzielle Produkte

• Oracle, Sybase: Ergänzungen von SQL um eigene Funktionen

Page 23: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 23/24

W3QL

• Struktur wie SQL

• Datenquelle: das WWW (Domains und Pfade)

• zur Suche regular expressions (Perl)

• Suche nach/in verschiedenen Datei-Typen: Text, HTML, LaTeX, Bildern, Filmen

• automatische Formbearbeitung

• Tiefensuche

XML und Abfragesprachen

• Datenquelle: XML-Dokumente (Objekt, Struktur)

• eignet sich zur Speicherung von Metadaten

• kein einheitlicher Standard für Abfragesprache

Page 24: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/24

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 24/24

XML-QL

• Formulierung mittels Text

• typenlose bzw. an XML-Struktur gebunden

• Struktur der Abfrage

• Suchbedingungen

• Definition der Rückgabe