53
Barbora Poláková ; Martin Kozel

Vyhledávání v prostředí internetu

  • Upload
    armina

  • View
    54

  • Download
    1

Embed Size (px)

DESCRIPTION

Barbora Poláková ; Martin Kozel. Vyhledávání v prostředí internetu. Osnova přednášky. Co se děje? změny v přístupu a práci s informacemi Co s tím ? Struktura informací na webu – teorie a praxe Jak na to ? Strategie vyhledávání a postupy. Informace. - PowerPoint PPT Presentation

Citation preview

Page 1: Vyhledávání v prostředí internetu

Barbora Poláková ; Martin Kozel

Page 2: Vyhledávání v prostředí internetu
Page 3: Vyhledávání v prostředí internetu

Osnova přednášky Co se děje?

změny v přístupu a práci s informacemi Co s tím ?

Struktura informací na webu – teorie a praxe Jak na to ?

Strategie vyhledávání a postupy

Page 4: Vyhledávání v prostředí internetu

Informace Komunikovatelný popis jevu, jehož přijetím

dochází ke změnám v informačním systému. Odstraněná ENTROPIE

Vyšší míra uspořádanosti Čím více neurčitosti odstraní tím větší má

informace hodnotu. (Shannon,1948)

○ popsatelná○ kontextově nezávislá○ organizovatelná

informační zdroj/pramen

Page 5: Vyhledávání v prostředí internetu

Informační společnost je taková společnost, ve které je věnována pozornost

informační činnosti natolik, že dojde ke snížení zájmu o zemědělskou a průmyslovou výrobu (Vlasák, 2000)

Marc Uri Porat (1976). Information economy : definition and measurement

70.léta – postindustriální společnost ○ průmysl ----- > služby

Page 6: Vyhledávání v prostředí internetu

80.léta – informační společnost propojení počítačového průmyslu s ostatními průmyslovými

odvětvími rozvoj informační a počítačové GRAMOTNOSTI INFORMAČNÍ SEKTOR – profese tvorby, sběru, zpracovávání,

uchovávání, zpětného vyhledávání a dalšího šíření informací (Vlasák, 2000)

Page 7: Vyhledávání v prostředí internetu

Informační exploze Informace = Moc = Peníze !!!

Prudký rozvoj informačních technologií a jejich dostupnost

KVANTITATIVNÍ nárůst informací a informačních zdrojůRedundance ; relevance ; pertinenceMrtvá data – long tail effect

Page 8: Vyhledávání v prostředí internetu

Informační smog (Shenk 1997) lidstvo se nevyvíjí dost rychle aby

zvládalo množství informací

Exformace - informace existující za hranicemi našeho vědomí (Gore, 1994)

Zahlcení snížení citlivosti k obsahu  - mozková

kapacita je stále stejná (Černohlávková, 2006)

Page 9: Vyhledávání v prostředí internetu

Znalostní společnost nadstavba informační společnosti

založená na kolaboraci a interakci mezi uživateli

Web 2.0 - Tim Bernards-Lee (2000) Znalost

kontextově závislá ; pragmatický obraz informace reprezentovaný intelektuálním kapitálem jednotlivce (Bukh, 2001)

Page 10: Vyhledávání v prostředí internetu

Terminologické vyjasnění Základní abstraktní pojmy :

INFORMACEZNALOSTI

Základní konkrétní pojmy : Informační / elektronický zdroj digitální / informační objekt / entita

Page 11: Vyhledávání v prostředí internetu

Publikační procesy

Page 12: Vyhledávání v prostředí internetu

Publikační proces informačního zdroje - původní

Nakladatelství, časopisy, databáze, databázová centra

Page 13: Vyhledávání v prostředí internetu

Publikační proces informačního zdroje – nyní

Web 2.0 – sociální sítě, wiki, blog

Page 14: Vyhledávání v prostředí internetu

Hodnocení +

AktuálnostRychlost Kooperace

-Kontrola kvality, relevance Korektura Odborný dohled Distribuce a popis jsou na autorovi –

NEDOHLEDATELNOST

Page 15: Vyhledávání v prostředí internetu

KDE TO VŠECHNO MŮŽEME NAJÍT ?

Page 16: Vyhledávání v prostředí internetu

World Wide Web Viditelný / povrchový web

informační entity volně přístupné a snadno dostupné pomocí vyhledávacích strojů

Neviditelný / hluboký webneviditelný pro běžné vyhledavače

○ databáze, adresáře, rejstříky, dokumenty v nepodporovaných formátech, licencované stránky

○ 500x větší než povrchový web

Page 17: Vyhledávání v prostředí internetu

Web povrchový a hluboký (Bergman,2001)

Page 18: Vyhledávání v prostředí internetu

Obsahové rozvrstvení hlubokého webu (Bergman, 2001)

Page 19: Vyhledávání v prostředí internetu

CO TAM MŮŽEME NAJÍT ?

Page 20: Vyhledávání v prostředí internetu

Digitální objekt (DO) základní entita

Hledisko původu: digitalizované informační zdroje

○ E-book ; postprinty born digital

○ Webové stránky, fóra, komunity, blogy, wiki

Page 21: Vyhledávání v prostředí internetu

Hledisko typů DO MIME - Multipurpose Internet Mail Extension

Specifikuje charakter obsahu oficiálně komunikovaných DO na internetu

Typy: ○ Text ○ Obraz ○ Video ○ Zvuk○ Software○ Trojrozměrné digitální objekty

Page 22: Vyhledávání v prostředí internetu

Digitální objekt Hlavička /Metadata

Obsah

Podpis

Page 23: Vyhledávání v prostředí internetu

Metadata – Velká a mocná „Data o datech“

Strukturované informace, které popisují, osvětlují, lokalizují a usnadňují vyhledávání a využívání informačního zdroje. (Guidlines for Digitalization, 2007)

Page 24: Vyhledávání v prostředí internetu

Popis DO Předobraz metadatového popisu je v

popisu tradičních zdrojů. strojem čitelný X stroji srozumitelný

Dvě úrovně popisu:

věcná – obsah, anotace, abstrakt, klíčová slova, kódy systematického třídění …

popisná –popis dokumentu podle formálních znaků ; autor, název, vydavatel, rok vyd. …

Page 25: Vyhledávání v prostředí internetu

Tradiční bbg. Záznam - MARC 21

Page 26: Vyhledávání v prostředí internetu

Dublin Core Metadata Initiative -DCMI Dublin Core

Soubor 15 metadatových kvalifikovatelných prvků

Původně popis zdrojů na WWW ; současně popis jakéhokoli objektu

Garant popisu - autor user-friendly

Dublin Core Czech DCMI homepage

Page 27: Vyhledávání v prostředí internetu

Prvky DC

Page 28: Vyhledávání v prostředí internetu

Identifikátory URL

Adresa DO; určuje pozici DO v prostředí webu

URN Znakový řetězec nebo číslo, které

jednoznačně identifikuje dokumentTrvalé, nepřenosné

Generátory metadat XML soubory

Page 29: Vyhledávání v prostředí internetu

Metadata - DC

Page 30: Vyhledávání v prostředí internetu

TAK JSME TO HEZKY POPSALI … A JAK TO NAJDEM?

Page 31: Vyhledávání v prostředí internetu

Vyhledávací nástroje

„HLAVORUČNÍ“ Předmětové katalogy - directories-

Seznam katalog, Yahoo katalog

třídění a organizace DO podle předem dané taxonomie nebo předmětové klasifikace Nejpodobnější tradičním knihovnám Lidský faktor Malé pokrytí, úplnost taxonomie

Page 32: Vyhledávání v prostředí internetu

Vyhledávací nástroje

AUTOMATICKÉ Vyhledavače - search engine

Altavista Metavyhledavače

víc indexů najednouOpen Text

Sekvenční analýza Automatická INDEXACE digitálních objektů za

pomoci speciálního softwaruRobot ; crawler ; spiders ; bot Index – reprezentace fondu úplných textů - metadata

Page 33: Vyhledávání v prostředí internetu

Vyhledavač – obecné schéma

Vyhledavač Prostředí webu

(Poláková, 2009)

Page 34: Vyhledávání v prostředí internetu

Google Schéma (Brin & Page, 2000)

Page 35: Vyhledávání v prostředí internetu

Uživatelské rozhraní – 1/2Textové

Textový vyhledávací dotaz

Textová reprezentace výsledku Index – zkrácená informace o příslušném

zdroji odkaz na fulltext

○ Google

Page 36: Vyhledávání v prostředí internetu

Question answering2/2

Page 37: Vyhledávání v prostředí internetu

Uživatelské rozhraní – 1/3Clustry

Vektorová logika –Vážení podobnosti dokumentů s dotazy –

relevance

Informační prostor – soubor prvku a vztahů mezi nimi udržovaných informačním systémem (Ingwersen 1996)

Page 38: Vyhledávání v prostředí internetu

Clustry 2/3v informačním prostoru

(Traykovski &Sosisk, 2007)

Page 39: Vyhledávání v prostředí internetu

Clusty.com 3/3

Page 40: Vyhledávání v prostředí internetu

Uživatelské rozhraní – 1/3

Vizuální

Page 41: Vyhledávání v prostředí internetu

Carrot2

2/3

Page 42: Vyhledávání v prostředí internetu

Searchme 3/3

Page 43: Vyhledávání v prostředí internetu

CO, KDE, a JAK

Page 44: Vyhledávání v prostředí internetu

Základní princip

CO? KDE? JAK?

Page 45: Vyhledávání v prostředí internetu

Co chci najít? Informační potřeba

to co vím mi nestačí Požadavek

konkretizovaná představa o informační potřebě Dotaz

Kladu přímo zdroji, ve kterém hledámVe vyhledávačích obecně:

navigační, informační, transakční (např. co, kdy, kde atd.)

Page 46: Vyhledávání v prostředí internetu

Informační potřeba V 80-90 letech se rozvíjí věda nazvaná

„informační chování uživatele“ Posun v přístupu

computer-centred => user-centred Tři základní přístupy

KognitivníSociální Sociokognitivní (nejvíc in, kombinace

individualismu s kontextualitou prostředí)

Page 47: Vyhledávání v prostředí internetu

KDE Typ zdroje

Primární zdrojeSekundární zdrojeTerciální zdroje

Vyhledavače, katalogy, databáze, encyklopedie

Globální / lokální charakter, Gatekeeping

Page 48: Vyhledávání v prostředí internetu

JAK Vychytávky

Boolean logika (AND, OR, NOT )Proximitní operátory (NEAR,

WITHIN, SAME, „…“)Lematizace (skloňování, ?, * atd.)

Typy vyhledáváníFulltextovéFaktografické Atd.

Rešeršní strategie

Page 49: Vyhledávání v prostředí internetu

JAK ANALYTICKÉ VYHLEDÁVÁNÍ

Systematická strategiePříprava, promýšlení problému,

předdotazy

PROHLÍŽENÍ (browsing)Intuitivní vyhledávání

Page 50: Vyhledávání v prostředí internetu

ZPĚTNÁ VAZBA

Page 51: Vyhledávání v prostředí internetu

REŠERŠNÍ STRATEGIE Základní kameny Rostoucí perla Osekávání

Page 52: Vyhledávání v prostředí internetu

Literatura GORE, Albert. Země na misce vah. 1.vyd. Praha: Argo, 1994, ISBN 80-

85794-21-7. str.186. ČERNOHLÁVKOVÁ, Kateřina. Informační hygiena. Brno : Masarykova

Univerzita, 2006. SHENK, David. Data Smog : Surviving the Information Glut. 1 st ed. San

Francisco : Harper Edge,1997. 250 s. ISBN 0060187018. ARMS, W. Key Concepts in the Architecture of the Digital Library. D-Lib

Magazine [online]. July 1995 [cit. 2007-10-22]. Dostupný z WWW: < http://www.dlib.org/dlib/July95/07arms.html>. ISSN 1082-9873.

Brin S., Page, L. The Anatomy of a Large-Scale Hypertextual Web Search Engine. Stanford University [online] 2000 [cit. 2010-03-22]. Dostupný z WWW: http://infolab.stanford.edu/~backrub/google.html

SKLENÁK (2000). Data informace znalosti BUKH, P.N. Larsen H.T., Mouritsen J. (2001) Constructing intellectual capital

statements. Scandinavian Journal of managemennt roč. 17, s. 87-108

Page 53: Vyhledávání v prostředí internetu

Literatura VLASÁK, R. (2000). Informační povolání a informační společnost PILECKÁ, Věra Kognitivní aspekty vyhledávání. Dostupný z WWW:

<http://www.ikaros.cz/node/3592>. Pilecká, Věra (2010) Kognitivní přístupy k vyhledávání informací. Praha :

Univerzita Karlova. Mírková, Miluše (2009) Bibliografická a rešeršní činnost. Dostupný z WWW:

http://home.czu.cz/~mirkova/ Portál pro podporu informační gramotnosti – www.inforgram.cz