25
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/25 Textdatenbanken Volltextdatenbanken enthalten im Prinzip den vollen Text einer Dokumentationseinheit. Aber in allen Fällen wird der Text bzw. die in ihm enthaltenen Informationen durch weitere Felder beschrieben: • Attribute • Merkmale • Nomenklaturen • Thesaurus

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

  • Upload
    yan

  • View
    65

  • Download
    0

Embed Size (px)

DESCRIPTION

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25. Textdatenbanken Volltextdatenbanken enthalten im Prinzip den vollen Text einer Dokumentationseinheit. Aber in allen Fällen wird der Text bzw. die in ihm enthaltenen Informationen durch weitere Felder beschrieben: Attribute - PowerPoint PPT Presentation

Citation preview

Page 1: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/25

Textdatenbanken

Volltextdatenbanken enthalten im Prinzip den vollen Text einer

Dokumentationseinheit. Aber in allen Fällen wird der Text bzw. die in ihm

enthaltenen Informationen durch weitere Felder beschrieben:

• Attribute

• Merkmale

• Nomenklaturen

• Thesaurus

Page 2: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 2/25

Feldname Datentyp

ND (Dokument-, Artikelnummer qualitatives Merkmal

PY (Erscheinungsjahr) Rangmerkmal

VN (Ausgabenummer der Zeitung) Rangmerkmal

PD (Erscheinungsdatum der Zeitung) Rangmerkmal

PA (Seite der Zeitung) Rangmerkmal

AC (zweistelliger Zifferncode des Autors

qualitatives Merkmaloder Redakteurs)

AU (Name oder Namenskurzzeichen des

qualitatives MerkmalAutors oder Redakteurs)

RB (Titel einer Rubrik) formatiertes Feld bzw. qualitatives Merkmal

TI (Titel des Artikels) formatiertes Feld

UT (Untertitel) formatiertes Feld

AB (Einleitung des Artikels) Text

T1 (1. Textabschnitt des Artikels) Text

++ (weitere Textabschnitte des Artikels) Text

Page 3: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 3/25

Die drei formatierten Felder RB, TI und UT übernehmen noch Informationen des

Artikels mit Textcharakter. Lediglich das Feld RB könnte, bei entsprechender

Strukturierung auch ein qualitatives Merkmal sein. Hinzu kommen noch

Rangmerkmale. VN und PD, sowie die Seitennummer haben einen eindeutigen

Rangcharakter. Für das Retrieval bedeutet das, dass zusätzlich die

kleiner/größer-Operatoren Verwendung finden können.

Die verbleibenden Felder stellen qualitative Merkmale dar. Wie bereits

ausgeführt, bilden qualitative Merkmale nach dem Messvorgang disjunktive

Teilmengen auf der betrachteten Menge der Objekte. Einige jedoch nehmen eine

Sonderstellung ein, weil ihre Teilmengen aus nur je einem Element bestehen. In

diesem Datensatz ist dies z.B. das Feld ND.

Page 4: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 4/25

Für das Retrieval stellen diese Felder insoweit eine Besonderheit dar, weil ein

Suchvorgang mit ihnen (über eine Merkmalsausprägung) immer zu einer

einelementigen Menge führt. Diese Felder erlauben also die Identifikation

einzelner Sätze der Datenbank. Sie sollen, in Anlehnung an den entsprechenden

Begriff der Datenbanktheorie, „Schlüssel“ genannt werden.

Neben langen Texten (allgemein, Zeitschriften, Vorschriften) werden auch

Patentdatenbanken als Volltextdatenbanken geführt.

Page 5: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 5/25

Bibliographische Datenbanken

AB = textliche Informationen

Textliche Informationen werden modelliert. Da aber Wissen modelliert wird, wird

von Repräsentationen (Wissensrepräsentationen) gesprochen. Diese

Repräsentationen können nun als Erklärungsversuch verstanden werden.

Page 6: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 6/25

Feldname Datentyp

AN (Accession number) Schlüssel

TI (Original title) formatiertes Feld

AU (Author(s)) formatiertes Feld

DT (Document type) qualitatives Merkmal

SO (Source) formatiertes Feld bzw. qualitatives Merkmal

Decimal Classification

DP (primary) Nomenklatur

DS (Secondary) Nomenklatur

DG (Geographical) Nomenklatur

MJ (Major descriptors) Nomenklatur bzw. qualitatives Merkmal

MN (Minor descriptors) Nomenklatur bzw. qualitatives Merkmal

AB (Abstract) Text (Information über Text)

Page 7: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 7/25

Integrierte Datenbanken

Datenbanken mit umfangreichem Inhalt. Sie integrieren Daten aus Fakten-

basierenden Datenbanken und aus textlichen Datenbanken.

Data Warehouse ist ein Begriff, der in diesem Zusammenhang verwendet wird.

• Fakten an Produkten

• statische Daten (z.B. Herstellung Ein- und Ausfuhr)

• Daten der Zulieferer

• Rechtsvorschrift

• (Umweltverträglichkeit)

• Patentinformationen

• Formalismen

Page 8: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 8/25

1. Auf der unteren Ebene sind horizontal die mengenorientierten Systeme

angegeben, die sich an den operativen Funktionen Produktion, Technik,

Beschaffung, Vertrieb und Personaleinsatz ausrichten. Als Beispiel kann

Betriebsdatenerfassung (BDE), bspw. Auch die Arbeitszeiterfassung genannt

werden.

2. Die mengenorientierten Prozesse werden vertikal in wertorientierten

Abrechnungssystemen des Rechnungswesens erfasst. Beispiele für das

Beschaffungssystem sind die Kreditorenbuchführung, für das Vertriebssystem

die Debitorenbuchführung und für das Personalwesen die Lohn- und

Gehaltsabrechnung.

3. Aus den mengen- und wertorientierten Systemen Informationen für Berichts-

und Kontrollsysteme abgeleitet.

4. Analyse- und Informationssysteme werden erstellt, die neben den verdichteten

Daten auch Daten externer Quellen einbeziehen. Beispiele hierfür sind

Marketing-, Beschaffungs- und Produktionsinformationssysteme.

Page 9: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 9/25

5. Die höchste Verdichtungsstufe bilden Planungs- und Entscheidungssysteme,

die insbesondere für langfristig wirkende Entscheidungen Unterstützung

geben sollen, zum Beispiel etwa ein Vertriebs-Führungsinformationssystem für

den Vertriebsvorstand.

Auch hier liegt wieder ein zusammengesetztes Feld vor (CI), das ohne

Schwierigkeit in die Form einzelner Merkmale überführt werden kann. Weiter

finden sich hier bereits in diesem ersten Teil der Informationseinheit numerische

Informationen im Feld CD (Corporate Statistics). Numerische Informationen in

Online-Datenbanken stellen wiederum im Regelfall Ausprägungen quantitativer

Merkmale oder vercodete Ausprägungen qualitativer Merkmale dar. In diesem

Fall handelt es sich um klare quantitative Merkmale: SALES (in US-Dollar) und

EMPLOYEES, allerdings in einem zusammengehörigen Teil erfasst.

Page 10: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 10/25

Feldname Datentyp

AB (Abstract, hier Time Series) Text bzw. Tabelle (!)

AN (Identification number) qualitatives Merkmal/Schlüssel

CI (Corporate Information) zusammengesetztes Feld aus qualitativen Merkmalen

CN (Country Descriptor & Country Code) Nomenklatur

CO (Company Descriptor) qualitatives Merkmal/Schlüssel

CS (Corporate Statistics) zusammengesetzt aus qualitativen Merkmalen und einem

  Rangmerkmal

EN (Event Descriptor & Country Code) Nomenklatur mit Mehrfacheinträgen

PN (Product Descriptor & Event Code) Nomenklatur mit Mehrfacheinträgen

SE (Stock exchange and symbol) qualitative Merkmale

SF (Special feature) qualitatives Merkmal

SO (Source) qualitatives Merkmal

TI (Title) formatiertes Feld

YR (Year of Publication) Rangmerkmal

Page 11: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 11/25

Grafik in Datenbanken

Grafik in

integrierten

Datenbanken

Bilddateien

gif

jpeg

Geographische

Datenbank

(Stadtpläne)

Grafische Struktur

(Kommunikation

über grafische

Elemente)

Page 12: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 12/25

Funktionsorientierte Informationssysteme

Produktion Technik Beschaffung Vertrieb Personal

vertikal

horizontal

Page 13: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 13/25

Typische Begriffe:

Planungs- und Entscheidungssysteme Gewinn, Marktanteil

Analyse- und Informationssysteme Abweichungen, Korrelationen

Berichts- und Kontrollsysteme Kosten- und Erlösart, Kostenstelle, Kostenträger

Wertorientierte Abrechnungssysteme Konto, Buchungssatz

Mengenorientierte operative Systeme Produktionsfaktoren, Aufträge

(Administrations- & Dispositionssysteme  

Page 14: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 14/25

Einarbeitung

Disposition

Informationsübertragungs- und Wartezeiten

Einarbeitung

Lieferantenauswahl

Informationsübertragungs- und Wartezeiten

Einarbeitung

Bestellschreibung

8. Stunde

8. Stunde

1. Stunde

1. Stunde

1. Stunde

1. Stunde

2. Stunde

2. Stunde

Prozesskette mit arbeitsteiliger Datenverwaltung

Durchlaufzeit (DLZ) = 24 Stunden = 3 Tage

Ablauf bei traditioneller arbeitsteiliger Organisation

Page 15: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 15/25

Einarbeitung

Disposition

Wartezeiten

Einarbeitung

Lieferantenauswahl

Wartezeiten

Einarbeitung

Bestellschreibung

Datenbank

Prozesskette mit integrierter Datenbasis

Durchlaufzeit (DLZ) = 16 Stunden = 2 Tage

Ablauf bei Unterstützung durch integrierte Datenbank

4. Std.

4. Std.

Page 16: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 16/25

Integration (lateinisch) : „Wiederherstellung eines Ganzen“

Allgemein: (Wieder-)Herstellung einer Einheit; Einbeziehung;

Eingliederung in ein größeres Ganzes, d.h. z.B.

• das Zusammenwirken der verschiedenen Informationssysteme

• unternehmensintern und unternehmensübergreifend

• auf den unterschiedlichsten Ebenen

• Daten, Funktionen, Organisation

Page 17: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 17/25

Kriterien für Anfragesprachen

Ad hoe Formulierung:

Der Benutzer soll eine Anfrage formulieren können, ohne ein vollständiges

Programm schreiben zu müssen.

Deskriptivität:

Der Benutzer soll formulieren: „Was will ich haben?“ und nicht „Wie komme ich an

das, was ich haben will?“

Mengenorientiertheit:

Jede Operation soll auf Mengen von Daten gleichzeitig arbeiten, nicht navigierend

nur auf einzelnen Elementen (one-tuple-at-a-time).

Abgeschlossenheit:

Das Ergebnis kann wieder als Eingabe für die nächsten Anfragen verwendet

werden

Page 18: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 18/25

Adäquatheit:

Alle Konstrukte des zugrundeliegenden Datenmodells werden unterstützt.

Orthogonalität:

Sprachkonstrukte sind in ähnlichen Situationen auch ähnlich anwendbar.

Optimierbarkeit:

Die Sprache besteht aus wenigen Operationen, für die es Optimierungsregeln

gibt.

Effizienz:

Jede Operation ist effizient ausführbar.

Sicherheit:

Keine Anfrage, die syntaktisch korrekt ist, darf in eine Endlosschleife geraten oder

ein unendliches Ergebnis liefern.

Page 19: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 19/25

Eingeschränktheit:

Die Anfragesprache darf keine komplette Programmiersprache sein. Diese

Eigenschaft folgt aus Sicherheit, Optimierbarkeit und Effizienz.

Vollständigkeit:

Die Sprache muss mindestens die Anfrage einer Standardsprache ausdrücken

können.

Page 20: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 20/25

Invnr Name

4711 Meyer

1201 Schulz

0007 Müller

4712 Meyer

Invnr Titel ISBN Autor

0007 Dr. No 3-125 James Bond

1201 Objektdatenbanken 3-111 Heuer

4711 Datenbanken 3-765 Vossen

4712 Datenbanken 3-891 Ullman

4717 Pascal 3-999 Wirth

Ausleih

Buch

Page 21: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 21/25

Projektion

Der Syntax der Projektion ist

¶ [attributmenge] (relation)

Beispiel:

¶ [Name] (Ausleih)

Selektion

Die Syntax der Selektion ist

σ [bedingung] (relation)

Beispiel:

σ [Name<‚N‘] (Ausleih)

Name

Meyer

Schulz

Müller

Invnr Name

4711 Meyer

0007 Müller

4712 Meyer

Page 22: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 22/25

Verbund

Relation 1 Relation 2

Beispiel:

Ausleih Buch

Umbenennung

ß [ neu alt] (relation)

Beispiel:

ß [Autor 1 Autor 2] (Buch 2)

Müller Dr. No 3-125James Bond

SchulzObjektdaten-

banken3-111 Heuer

Meyer Datenbanken 3-765 Vossen

Meyer Datenbanken 3-891 Ullman

Autor 2

Witt

Vossen

Silberschatz

Meier

Wirth

Page 23: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 23/25

Vereinigung

relation 1 U relation 2

Beispiel:

Buch 1 U ß [Autor 1 Autor 2] (Buch 2)

Differenz

relation1 – relation 2

Beispiel:

Buch 1 – ß [Autor 1 Autor 2] (Buch 2)

Name

James Bond

Heuer

Ullman

Autor 1

James Bond

Heuer

Vossen

Ullman

Wirth

Witt

Silberschatz

Meier

Page 24: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 24/25

Durchschnitt

relation 1 ∩ relation 2

Beispiel:

Buch 1 ∩ ß [Autor 1 Autor 2] (Buch 2)

Minimale Menge relationenalgebraischer Operatoren

Für theoretische Untersuchungen ist es wichtig, mit einer minimalen Menge von

Operationen auszukommen. Eine minimale Relationenalgebra besteht etwa aus

den Operationen.

π σ ß U - ∩

Autor 1

Vossen

Wirth

Page 25: Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/25

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 25/25

Wobei bei der Selektion nur einfache Konstanten- und Attribute – Selektionen,

aber keine vollständigen booleschen Ausdrücke notwendig sind. Wir bezeichnen

diese Menge von Operationen mit Ω.

Die Operationen mit Ω sind unabhängig, d.h. es kann keine weggelassen werden,

ohne die Vollständigkeit zu verlieren.