Upload
dirk-lewandowski
View
70
Download
2
Embed Size (px)
DESCRIPTION
Citation preview
15.04.13
1
Neue Entwicklungen im Suchmaschinenbereich und deren Relevanz für Bibliotheken
Prof. Dr. Dirk Lewandowski [email protected] http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew
Semantik?
• „Semantic Web“ – Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander
verbunden werden und von Maschinen verstanden werden können.
– Alternative Ansätze: Linked Open Data, ...
• „Low Level Semantics“ – Faktenextraktion aus „chaotischen“ Dokumenten
– Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen)
• Verstehen der Dokumente vs. Verstehen der Suchanfragen
15.04.13
2
Semantische Annotation von Dokumenten
• Semantische Annotationen können in der Suche ausgenutzt werden, um • die Ergebnisqualität zu verbessern • die Trefferdarstellung („Snippets“) zu verbessern
• Das Problem von „echten“ Semantic-Web-Anwendungen ist die Komplexität in der Erstellung.
• Die großen Suchmaschinen haben sich auf ein gemeinsames Format für semantische Annotationen geeignet, das in HTML umgesetzt wird.
Beispiel Google Knowledge Graph
15.04.13
3
Suchanfragen verstehen
• bbl • vatikan • stockbrot • motonetix • nedcom • fußball • drehscheibe • frauentausch • seelenfarben • kachelmannwetter • osterei • wie ich • wgt
15.04.13
4
Suchanfragen im Kontext
Beispiel: Navigationsorientierte Suchanfragen anhand von Klicks bestimmen
(Lewandowski, Drechsler & von Mach, 2012)
15.04.13
5
Semantische Suche
• Verbesserung der Qualität der Suchergebnisse durch – Verstehen der Suchanfrage – Kontextsensitive Vorschläge zur Verbesserung der Suchanfrage – Verstehen der Dokumente, dadurch besserer Abgleich mit der Suchanfrage – Semantische Anreicherung der Ergebnisbeschreibungen („Snippets“), dadurch
besser fundierte Entscheidung der Nutzer? – Präsentation von aus Dokumenten zusammengestellten Ergebnissen (auf den
Seiten der Suchmaschine)
Soziale Suche
• Problem des bisherigen Rankings: Qualität wird vor allem durch Popularität (Links/Klicks) gemessen
• Populär bei der Masse
• Populär in einer bestimmten Nutzergruppe
• Populär bei einem bestimmten Nutzer (Personalisierung)
• Das Versprechen des „Social Ranking“:
• Von Bekannten empfohlene Suchergebnisse sind relevanter und vertrauenswürdiger.
• Problem: Im Gegensatz zu Linkdaten aus dem freien Web handelt es sich bei Sozialen Netzwerken um geschlossene Netzwerke, auf die die Suchmaschinen nicht per Crawling zugreifen können.
15.04.13
6
Bing und Facebook
• Vereinbarung über die Nutzung von Facebook-Daten in Bing – Anmeldung in Bing mit dem Facebook-Account – Bislang nur in den USA verfügbar – Bing-Websuche in Facebook integriert
• Anreicherung der Suchergebnisse durch Daten aus Facebook – Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden – Höheres Ranking von empfohlenen Ergebnissen – Möglichkeit, Suchergebnisse in Facebook zu posten – Diskussion mit Facebook-Freunden auf den Bing-Ergebnisseiten
12 | Dirk Lewandowski
• x
15.04.13
7
Google und Google+
• Aufbau eines eigenen sozialen Netzwerks durch Google – Integration in alle Google-Dienste – Bislang allerdings nicht besonders erfolgreich
• Anreicherung der Suchergebnisse – Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden – Höheres Ranking von empfohlenen Ergebnissen
• Weiterer Nutzen von Google+ – „Klarnamen-Pflicht“ – Kombination mit anderen Profilen im Web (Twitter, etc.) – Verbindung mit Daten zur Autorschaft (rel=author)
à Dadurch „Vertrauens-Graph“ als weitere Komponente des Rankings
Fazit Soziale Suche
• Soziale Suche vielschichtig (kollaborative Suche, ...), wichtigster Punkt ist aber das Einbeziehen von Daten aus sozialen Netzwerken in das Ranking und die Ergebnispräsentation.
• Beide großen Suchmaschinen haben Ansätze, solche Daten zu integrieren. – Vorteil Bing: Daten aus dem Netzwerk, in dem tatsächlich etwas los ist. – Vorteil Google: Tiefere Integration möglich, da es sich um ein eigenes Netzwerk
handelt.
15.04.13
8
15 |
• x
Anzeigen
Nachrichten
Bilder
Videos
Blogbeiträge
Zusammenstellung der Suchergebnisse
• Das Suchanfragevolumen ist sehr ungleichmäßig verteilt.
• Treffer auf den vorderen Plätzen werden sehr stark bevorzugt.
• Durch entsteht ein großer Einfluss von Suchmaschinen (Google) auf das, was Nutzer zu sehen bekommen.
1. Dürfen die Suchmaschinen ihre eigenen Angebote / die Angebote von Partnern in der Ergebnisdarstellung bevorzugen?
2. Tun sie das?
• „Such-Neutralität“ bedeutet, dass eine Suchmaschine alle Dokumente im Index nach gleichen Kriterien in das Ranking mit einbezieht.
15.04.13
9
17 | Dirk Lewandowski
• x
18 | Dirk Lewandowski
• x
15.04.13
10
19 | Dirk Lewandowski
• x
Problemfelder
• Bevorzugung eigener Angebote – In den organischen Ergebnissen – In den Universal-Search-Ergebnissen
• Aufnahme in den Index – Bsp. Paid Inclusion bei Google Shopping: Eintragungen sind kostenpflichtig – Folgen weitere Dienste (Places, ...)?
à Kennzeichnung als eigenes Angebot bzw. Partnerangebot als Lösung?
15.04.13
11
Vielen Dank für die Aufmerksamkeit.
Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information
http://www.bui.haw-hamburg.de/lewandowski.html
[email protected] @Dirk_Lew