Upload
irene-pochinok
View
840
Download
2
Tags:
Embed Size (px)
DESCRIPTION
Владимир ГоровойВШМ СПбГУ
Citation preview
Использование данных семантического веба поисковыми
системами
Владимир ГоровойВШМ СПбГУ
[email protected]://twitter.com/vgorovoy
Содержание
• Семантическая разметка• Использование FOAF• Использование Freebase
Поисковые системы стимулируют вебмастеров для получения
семантических данных
Основной тренд
Сниппеты
RDF
subjectsubject objectobject
predicate
Cambridge SemanticsCambridge Semantics
headquartered
MassachusettsMassachusetts
Тройки (Triples):
“Cambridge Semantics is headquartered in Massachusetts”:
Микроформаты и RDFa
Аннотирование HTML метаданными
Отличие: Жестко заданные виды метаданных в микроформатах (hCard, hReview …) и использование словарей (Dublin Core, словарь Гугла и т.д.) в RDFa
RDFa
Микроформаты
Подход Google (Rich Snippets)
• Google сам формирует сниппеты• Поддержка hReview, hCard, hProduct,
hReview_Aggregate (не утвержден даже на microformats.org)
• Свой словарь для RDFa (http://rdf.data-vocabulary.org/rdf.xml)
• Запустили только для проверенных партнеров (Yelp.com, Cnet.com, LinkedIn.com)
• Не влияет на ранжирование
Подход Yahoo (Search Monkey)
• Формирование сниппетов силами пользователей
• Большой словарь для RDFa , использующий существующие словари (http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs)
• Не влияет на ранжирование
Подход Яндекса
• Сами формируем сниппеты• Поддержка микроформатов (hCard,
hRecipe) и XML-фидов в специальных форматах
• Не влияет на ранжирование
Адреса организаций
hCard, выгрузка в специальном формате и заполнение в Я.Вебмастере
Рецепты
hRecipe и в виде XML-фида
Рефераты
В виде XML-фида
Словари
Внимание: microdata (html5)
Словари
Поддержка в CMS
• Drupal (много в модулях, обещают в ядре Drupal 7)
• Wordpress (XFN; в модулях: hAtom, hCard)• Movable Type (XFN, hAtom; в модулях:
hCard, rel-tag)
Где RDFa и микроформаты уже есть?
STW Thesaurus for Economics
FOAF
FOAF (Friend of a Friend) – онтология для описания людей, групп и отношений между ними
Yandex FOAF Extension – расширение FOAF, определяющее классы для постов, комментариев, читателей и т.п. (http://api.yandex.ru/blogs/doc/indexation/appendices/yandex-foaf-ext-rdf.xml)
Использование FOAF
API поиска по блогам: http://blogs.yandex.ru/search_profiles_atom.xml?text=лебедев
Использование Freebase