WWW, HTML, HTTP,... Wie funktioniert das World Wide Web ?

  • Published on

  • View

  • Download

Embed Size (px)


  • Folie 1
  • WWW, HTML, HTTP,... Wie funktioniert das World Wide Web ?
  • Folie 2
  • till.haenisch@gmx.de Hype, warum ? Vorraussetzung: weltweites Netzwerk Internet, war schon vor dem WWW da Email, FTP, Gopher,... Jeder kann, praktisch ohne Aufwand, Informationen finden Surfen (Informationen sind verknpft) Suchen (Suchbare Verzeichnisse) Informationen verffentlichen Einfache Werkzeuge Browser Editoren Multimedial Keine zentrale Kontrolle/Zensur Jeder kann alles verffentlichen
  • Folie 3
  • till.haenisch@gmx.de As we may think The investigator is staggered by the findings and conclusions of thousands of other workers -- conclusions which he cannot find time to grasp, much less to remember, as they appear. [...] Professionally our methods of transmitting and reviewing the results of research are generations old and by now are totally inadequate for their purpose. [...] Mendel's concept of the laws of genetics was lost to the world for a generation because his publication did not reach the few who were capable of grasping and extending it [...] A record if it is to be useful to science, must be continuously extended, it must be stored, and above all it must be consulted. [...] When data of any sort are placed in storage, they are filed alphabetically or numerically, and information is found (when it is) by tracing it down from subclass to subclass. [...] The human mind does not work that way. It operates by association [...] If the user wishes to consult a certain book, he taps its code on the keyboard, and the title page of the book promptly appears before him, projected onto one of his viewing positions. [...] This is the essential feature of the memex. The process of tying two items together is the important thing. [...] Wholly new forms of encyclopedias will appear, ready made with a mesh of associative trails
  • Folie 4
  • till.haenisch@gmx.de Informationen Jeder braucht Informationen Informationen mssen existieren Dokumente, Bcher, Zeitschriften,... und gefunden werden knowledge management Kataloge Hierarchien nicht immer eindeutig Metadaten welche (jetzt und spter) wichtig ? Klassifikationen (Schlagworte) Jeder nutzt seine eigenen !!
  • Folie 5
  • till.haenisch@gmx.de Ordnung zum ersten: Gopher
  • Folie 6
  • till.haenisch@gmx.de Zum zweiten: Udine,HyperG,... Ende der achtziger Jahre entstanden viele Hypertext- Informationssysteme, hauptschlich hierarchisch strukturiert, die versuchten, die Schwchen von Gopher und anderen zu berwinden.
  • Folie 7
  • till.haenisch@gmx.de Und Chaos: T. Berners-Lee The actual observed working structure of the organisation is a multiply connected "web" whose interconnections evolve with time. In this environment, a new person arriving, or someone taking on a new task, is normally given a few hints as to who would be useful people to talk to. Information about what facilities exist and how to find out about them travels in the corridor gossip and occasional newsletters, and the details about what is required to be done spread in a similar way. [...] A problem, however, is the high turnover of people. When two years is a typical length of stay, information is constantly being lost.[...] Often, the information has been recorded, it just cannot be found. [...] CERN is a model in miniature of the rest of world in a few years time. CERN meets now some problems which the rest of the world will have to face soon [...] the method of storage must not place its own restraints on the information This is why a "web" of notes with links (like references) between them is far more useful than a fixed hierarchical system. The system we need is like a diagram of circles and arrows, where circles and arrows can stand for anything.
  • Folie 8
  • till.haenisch@gmx.de Requirements Remote access across networks. CERN is distributed, and access from remote machines is essential. Heterogeneity Access is required to the same data from different types of system (VM/CMS, Macintosh, VAX/VMS, Unix) Non-Centralisation Information systems start small and grow. They also start isolated and then merge. A new system must allow existing systems to be linked together without requiring any central control or coordination. Access to existing data If we provide access to existing databases as though they were in hypertext form, the system will get off the ground quicker. Private links One must be able to add one's own private links to and from public information. One must also be able to annotate links,as well as nodes, privately.
  • Folie 9
  • till.haenisch@gmx.de Informationen
  • Folie 10
  • till.haenisch@gmx.de Architektur
  • Folie 11
  • till.haenisch@gmx.de Integration
  • Folie 12
  • till.haenisch@gmx.de WWW Die am CERN entwickelten Protokolle und Werkzeuge wurden rasch weltweit akzeptiert, insb. als grafische Browser entwickelt wurden (NCSA-Mosaic) Warum ? Jeder kann mit minimalem Aufwand Dokumente publizieren und integrieren Die Protokolle sind so einfach (primitiv) und portabel, dass jedes System angebunden werden kann Link sind privat, d.h. werden nicht zentral registriert unidirektional bidirektionale Links (z.B. HyperG) konnten sich nicht durchsetzen broken link Problematik keine zentrale Struktur lost in hyperspace Relevanz von Informationen (altavista vs. google,...)
  • Folie 13
  • till.haenisch@gmx.de Architektur Wie funktioniert das eigentlich ? Darstellung: HTML Abwicklung: HTTP Browser Webserver TCP/IP Dateien???
  • Folie 14
  • till.haenisch@gmx.de HTML Auszeichnungssprache Tags Dokument...,,... Metadaten,,,... Struktur,, Links home stellen Semantik des Dokuments dar enthalten Links Prsentation durch Browser heute auch Prsentation durch HTML Formatierung,... Logik JavaScript, DHTML,...
  • Folie 15
  • till.haenisch@gmx.de HTML-Dokument Ein schnes Dokument Eine berschrift Etwas Text Ein Absatz Ein Bild hier klicken Eine Liste erstens zweitens drittens
  • Folie 16
  • till.haenisch@gmx.de Tabellen Ein schnes Dokument Eine berschrift Etwas Text Spalte 1 Spalte 2 Spalte 3 Spalte 1 und 2 Spalte 3 ganz schn breit
  • Folie 17
  • till.haenisch@gmx.de HTML Ursprnglich nur zur Strukturierung gedacht heute auch zur Formatierung da keine Positionierung,... schwierig hauptschlich durch FONTS, Farben Tabellen Bilder browserabhngig Style sheets Pfusch --> PDF, XML,...
  • Folie 18
  • till.haenisch@gmx.de HTTP Wie kommen die Dokumente zum Browser ? Ursprnglich Auslieferung von Dateien deshalb einfaches, zustandsloses Protokoll Struktur Browser fordert eine Seite an (GET) Webserver liest Datei und schickt sie zurck fertig keine Anmeldung,... bei jeder Anfrage wird neue Verbindung aufgebaut einfach !!!
  • Folie 19
  • till.haenisch@gmx.de Frage... GET /mini.html HTTP/1.0 Connection: Keep-Alive User-Agent: Mozilla/4.51 [de]C-CCK-MCD DT (WinNT; I) Host: dbserv Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, image/png, */* Accept-Encoding: gzip Accept-Language: de Accept-Charset: iso-8859-1,*,utf-8
  • Folie 20
  • till.haenisch@gmx.de und Antwort HTTP/1.1 200 OK Date: Thu, 17 May 2001 09:12:50 GMT Server: Apache/1.3.12 (Unix) (SuSE/Linux) Last-Modified: Thu, 17 May 2001 09:05:17 GMT ETag: "3aed8-40-3b03944d" Accept-Ranges: bytes Content-Length: 64 Connection: close Content-Type: text/html X-Pad: avoid browser bug Hallo Hallo
  • Folie 21
  • till.haenisch@gmx.de dynamische Seiten GET liefert eine Datei aus Mimetype in Content-Type Was aber, wenn Inhalt nicht als Datei vorliegt ? z.B. Suche nach Inhalten, Uhrzeit,... CGI Common Gateway Interface Wenn eine Datei in speziellem Verzeichnis (meist cgi-bin) angefordert wird, "wei" der Webserver, da diese ausgefhrt werden soll GET /cgi-bin/SayHello ruft das programm SayHello im entsprechenden Verzeichnis auf Parameter werden im Environment bergeben
  • Folie 22
  • till.haenisch@gmx.de CGI Environment DOCUMENT_ROOT="/usr/local/httpd/htdocs" GATEWAY_INTERFACE="CGI/1.1" HTTP_ACCEPT="image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, image/png, */*" HTTP_ACCEPT_CHARSET="iso-8859-1,*,utf-8" HTTP_ACCEPT_ENCODING="gzip" HTTP_ACCEPT_LANGUAGE="de" HTTP_CONNECTION="Keep-Alive" HTTP_HOST="" HTTP_USER_AGENT="Mozilla/4.51 [de]C-CCK-MCD DT (WinNT; I)" PATH="/sbin:/bin:/usr/sbin:/usr/bin" QUERY_STRING="" REMOTE_ADDR="" REMOTE_PORT="1049" REQUEST_METHOD="GET" REQUEST_URI="/cgi-bin/printenv" SCRIPT_FILENAME="/usr/local/httpd/cgi-bin/printenv" SCRIPT_NAME="/cgi-bin/printenv" SERVER_ADDR="" SERVER_ADMIN="[no address given]" SERVER_NAME="mac.e-technik.uni-ulm.de" SERVER_PORT="80" SERVER_PROTOCOL="HTTP/1.0" SERVER_SIGNATURE=" Apache/1.3.12 Server at mac.e-technik.uni-ulm.de Port 80 \n" SERVER_SOFTWARE="Apache/1.3.12 (Unix) (SuSE/Linux)" UNIQUE_ID="OwOfSMCoAW4AAAGfAxA"
  • Folie 23
  • till.haenisch@gmx.de Parameter Wie erhlt z.B. Suchprogramm das zu suchende Wort URL der Form: http://server/pfad/script?Parameter=Wert z.B....suche?Begriff=Internet QueryString QUERY_STRING="Begriff=Internet" mehrere mit ?p1w1&p2=w2... Eingabe durch Benutzer ? HTML Forms, INPUT Tags
  • Folie 24
  • till.haenisch@gmx.de Parameter contd. Problem: viele/lange Parameter Lnge von URL ist begrenzt Platz im Environment ist begrenzt (OS spezifisch) Lsung: POST GET /Suche?Begriff=Internet HTTP/1.0 Connection: Keep-Alive User-Agent: Mozilla/4.51 [de]C-CCK-MCD DT (WinNT; I) Ho