25
U. Altmann, Institut für Medizinische Informatik , Gießen, 2000 Einführung in XML und Techniken

Einführung in XML und Techniken

Embed Size (px)

DESCRIPTION

Einführung in XML und Techniken. Entwicklung von XML. XML eXtensible Markup Language Subset von SGML Standard Generalized Markup Language Jedes XML Dokument ist ein SGML Dokument aber nicht umgekehrt. Entwicklung von XML. HTML Formale Strukturierung von Texten - PowerPoint PPT Presentation

Citation preview

Page 1: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Einführung in XML und Techniken

Page 2: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Entwicklung von XML

XML eXtensible Markup Language Subset von SGML

Standard Generalized Markup Language Jedes XML Dokument ist ein SGML Dokument

aber nicht umgekehrt

Page 3: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Entwicklung von XML

HTML Formale Strukturierung von Texten Darstellung der Dokumente im Vordergrund Statische Tag Definitionen - keine

Modifikationendurch den Benutzer

DTD nicht individuell sondern nur für Versionen

begrenzte inhaltliche Erschließung von Dokumenten

Page 4: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Entwicklung von XML

XML Zwischen SGML und HTML einfacher als SGML umfassender als HTML insbesondere für Anwendungen im Internet Anwendungen

für die Speicherung und Strukturierung vonDokumenten

als Austauschformat bei Kommunikationsstandards

Page 5: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Entwicklung von XML

Entwicklungsziele von XML Programme zur Verarbeitung von XML

Dokumenten sollen leicht zu entwickeln seinZiel - eine Woche Trainingszeit für Studenten

Optionale Variationen sollten so gering wie möglich gehalten werden - ideal keine

XML Dokumente sollen in gleicher Weise für Mensch und Maschine lesbar sein

Konzepte für XML Dokumente sollen einfachen Regeln folgen und kurz und bündig sein

Page 6: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

XML Dokumente bestehen aus Markup

start-tags, end-tags, empty-element tagsentity references, character referencescomments, CDATA section delimiters (nicht die Inhalte)document type declarationsprocessing instructions

Character Dataalles andereauch Attributwerte, sofern Typ als solcher deklariert

Page 7: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

Markup von Elementeneingeschlossen in < >Anfangs - Markup <Diagnose>Ende - Markup </Diagnose>Anfangs- und Ende - Markup sind stets erforderlich

- wesentlicher Unterschied zu SGML -

Markup von leeren Elementenohne Ende Markup <Diagnose/>

Page 8: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

MARKUP in XML MARKUP mit & verweisen auf ersetzbare

Informationsobjekte (Entities)&lt; &chap1;

mit & gekennzeichnete Verweise sind entweder in XML definiert (&lt) oder müssen im DTD definiert werden (&chap1)

Document Type Deklarationen werden in < > Markup eingeschlossen <!DOCTYPE Document SYSTEM [ ]>

Page 9: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

MARKUP in XML MARKUP beginnt stets mit < oder &

und endet mit > Diese Zeichen dürfen daher im Text nicht erscheinen

< - &lt& - &amp

Diese Zeichen sollten ebenfalls nicht verwendet werden

> - &gt‘ - &apos“ - &quot

Page 10: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

XML DokumenteEin Informationsobjekt ist ein XML Dokument wenn es entweder genügt den in einer Dokument Type Definition

beschriebenen Anforderungen - Valid document -

den allgemeinen Anforderungen an XML Dokumente - wellformed document -

Page 11: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

Document Type Definitions (DTD) definieren die Struktur des Dokuments enthalten Hinweise für die Verarbeitung

XML Parser prüfen die Verträglichkeit des Dokuments mit

der DTD - Valid Document ersetzen (sofern verarbeitbar) die

sogenannten Entitäten

Page 12: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

Zeichensatz in XML Dokumente Unicode (ISO 10646) als Standardzeichensatz

Default Zeichensatz ist ISO 10646 UTF-8andere Zeichensätze müssen deklariert werden

( encoding =“UTF-16“ )schließt ASCII Zeichensatz unverändert einumfaßt alle internationalen ZeichensätzeUTF 16-2 kann auch symbolorientierte Sprachen

darstellen

Page 13: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

Kommentare in XML<!--Dies ist ein Kommentar-->

Beginnen mit <!-- Enden mit --> -- innerhalb von Kommentaren nicht erlaubt

Page 14: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

Verarbeitungs- (Processing) Instruktionen<?AUDIO ‘Herztöne‘? >

Beginnen mit <?Name Enden mit ?> werden an die Applikation übergeben „Name“ darf nicht mit „xml“ beginnen

<?xml für System reserviert jedes XML Dokument beginnt mit der

Verarbeitungsanweisung<?xml version=“1.0“ ?>

Page 15: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML

CDATA Bereiche<![CDATA [ <tag1><tag2> ] ] >

Beginnen mit <! [CDATA [ Enden mit ] ] > keine Verarbeitung durch XML Prozessoren benutzt für Beispiele, Quellcode etc. keine hierarchische Strukturierung (nesting)

möglich

Page 16: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML und zugehörige Techniken

Problem Präsentation Darstellung von Inhalten

Problem Analyse / Abruf von Information Wie beschreibe ich Zugriffswege?

Problem Manipulation standardisiertes API

Problem Vielfalt semantische Vergleichbarkeit vs. Vielfalt von Tags und

Attributen

Problem Struktur Einschränkungen der DTD Ausdrucksmöglichkeiten

Page 17: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XMLXML

InhaltInhalt

StrukturStruktur

XSLTTransformation

XSLTTransformation

XQLAbfrageXQL

Abfrage

NamespaceNamespace

DOMDOM

RDFRDF

XLinkXLink

XML SCHEMAXML SCHEMA

XPathXPathXSL-FO

PräsentationXSL-FO

Präsentation

XML und zugehörige Techniken

XPointerXPointer

Page 18: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML und zugehörige Techniken

XML Techniken (Auswahl) Standardisierte Methoden für die Manipulation von

XML Dokumenten (Document Object Model, DOM), Verknüpfen von XML Dokumenten (XLink), Abfragen von Informationen in XML Dokumenten

(XPointer, XPath, XQL, XML-QL), Umformen von XML Dokumenten (XML style language

and transformation XSLT) Darstellung von Information mit sog. Style Sheets

(XSL-FO, CSS).

Standardisiert (Recommendation): u.a. XML, DOM Level 1, XPath, XSLT http://www.w3.org

Page 19: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Namespaces

Ziele Sollen ermöglichen, daß Dokumente aus

verschiedenen Quellen gemeinsam verarbeitet werden können

Zur Vermeidung von Überschneidungen der Element, Attribut etc. Bezeichnungen werden vor die lokalen Namen Präfixe gesetzt, die die lokale Anwendung identifizieren - Qualified Names

Namespace Deklaration wird als Attribut in einer der Eröffnungsdeklarationen definiert und gilt für das gesamte Dokument

Page 20: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML Schema

DTD‘s haben sich bei XML Anwendungen als zu inflexibel erwiesen.

Datentypen konnten nicht definiert werden

Abfolge von Elemente war relativ fixiert und nur über Kardinalitätsoperatoren zu beeinflussen

DTD‘s konnten nicht in XML beschrieben werden - eigene Sprache

Page 21: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML Schema

XML Schema Teil 1 - Struktur von Dokumenten

erweiterter und flexiblerer „DTD“ AnsatzSchema Import und Einfügung vorgesehen

Teil 2 - DatentypenPrimitive DatentypenBuilt-in Derived DatatypesUser Derived Datatypes

Page 22: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XPath - XLink - XPointer

XPath Zugriff auf Teile (Knoten) eines Dokumentes Grundlage für / Verwendung in weiteren Techniken

(XLink, XPointer, XSLT)

XLink Zugriff auf andere Dokumente

Anker <a> nicht notwendig

unterstützt auch mehrdirektionale Links

XPointer kann auch Bereiche markieren

Page 23: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML Stylesheet Language (XSL)

XSLT - Transformation Language Umformung von XML Dokumenten in andere

Dokumente (XML, HTML, Text) Nahezu alle Formen der Umformung

zugelassen(Änderung der Reihenfolge, Weglassen und Hinzufügen von Daten und Texten etc.)

XSL - Formatting Language Zuordnung eines Ausgabeformates zu einem

XSLT Dokument

Page 24: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Einführung in XML in Übungen

Elemente von XML-DokumentenUnterschied XML / HTMLEinsatzmöglichkeitenBeschreibungsmöglichkeitenVerarbeitungsmöglichkeiten

Page 25: Einführung in XML und Techniken

U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Einführung in XSLT und XPath

Zentrale Rolle von XPathRolle von XSLT in der Zusammenführung

unterschiedlich strukturierter Dokumente ähnlichen Inhalts

Festigung des Verständnisses von XML-Strukturelementen

Abgrenzung zu Document Object Model (DOM)