27
Tefko Saracevic Tefko Saracevic A relevancia egyik A relevancia egyik legnevesebb legnevesebb könyvtártudományi könyvtártudományi teoretikusa”* teoretikusa”* *Koltay Tibor: Szöveg, információ, relevancia: néhány adalék a témakörhöz. In: Könyvtári Figyelő, 51. évf. 2005. 3. sz.

Tefko Saracevic

  • Upload
    kiet

  • View
    45

  • Download
    1

Embed Size (px)

DESCRIPTION

„A relevancia egyik legnevesebb könyvtártudományi teoretikusa”*. Tefko Saracevic. *Koltay Tibor: Szöveg, információ, relevancia: néhány adalék a témakörhöz. In: Könyvtári Figyelő, 51. évf. 2005. 3. sz. Életrajzából. 1930. nov. 24-én Zágrábban született. Tanulmányai - PowerPoint PPT Presentation

Citation preview

Page 1: Tefko Saracevic

Tefko SaracevicTefko Saracevic

„„A relevancia egyik legnevesebb A relevancia egyik legnevesebb könyvtártudományi teoretikusa”*könyvtártudományi teoretikusa”*

*Koltay Tibor: Szöveg, információ, relevancia: néhány adalék a témakörhöz. In: Könyvtári Figyelő, 51. évf. 2005. 3. sz.

Page 2: Tefko Saracevic

ÉletrajzábólÉletrajzából

1930. nov. 24-én Zágrábban született.

Tanulmányai•1952-1957 - Zágrábi Egyetem Műszaki Karán mérnöki végzettséget szerzett

•1962 - Master of Science in Library Science (MSLS) School of Library Science Western Reserve University

•1970 - Ph.D., School of Graduate Studies Case Western Reserve University

Page 3: Tefko Saracevic

MunkásságaMunkássága

Oktatási tevékenysége:

1969-1985 Case Western Reserve University

1985-től napjainkig Rutgers University professzora

Nemzetközi tevékenysége:aktív, sokrétű pl. a fejlődő országok egészségügyi információs rendszereivel kapcsolatban, fejlesztett, értékelt információs rendszereket számos szervezet felkérésére nemzetközi előadásokon és konferenciákon a világ 46 országában jártPl. a CoLIS3 konferencia(Dubrovnik, 1999) elnöke stb.

Page 4: Tefko Saracevic

MunkásságaMunkásságaKutatási területe széleskörű: •információkereső rendszerek tesztelése, értékelése•ember- számítógép interakciók•digitális könyvtárak értékelése, •könyvtári és információs szolgáltatások, stb.•kutatásait  több nemzetközi szervezet támogatta: pl. National Science Foundation, Rockefeller Alapítvány, UNESCO stb. Nevéhez fűződik a „relevancia filozófiája”

Page 5: Tefko Saracevic

Munkássága Munkássága

A kutatás és oktatás összekapcsolására hatékony módszert dolgozott ki(a Case Western Reserve Egyetem Könyvtártudományi Tanszékén, 1968.) Célja : az információkereső rendszerek elemeinek analizálása,a rendszerek hatékonyságának összehasonlítása,az elméleti alapok gyakorlati felhasználása,korlátozott számú hallgatónak kutatási lehetőséget biztosítva.

Page 6: Tefko Saracevic

RelevanciaRelevancia

A A relevanciarelevancia latin szó, jelentése: latin szó, jelentése: fontosság, fontosság, jelentőség, jelentékenységjelentőség, jelentékenység..Hétköznapi „releváns” formában leginkább a fontos, Hétköznapi „releváns” formában leginkább a fontos, lényeges jelentéssel rendelkezik, elméleti használata lényeges jelentéssel rendelkezik, elméleti használata ennél valamivel szűkebb. Rendszerint ha valami ennél valamivel szűkebb. Rendszerint ha valami releváns, akkor az valamihez releváns, vagy a releváns, akkor az valamihez releváns, vagy a megértéshez, vagy a magyarázathoz. Így a relevancia megértéshez, vagy a magyarázathoz. Így a relevancia kifejezést arra használják, hogy leírják valamilyen kifejezést arra használják, hogy leírják valamilyen információ mennyire helyénvaló, mennyire információ mennyire helyénvaló, mennyire kapcsolódik, illetve mennyire alkalmazható egy adott kapcsolódik, illetve mennyire alkalmazható egy adott kérdésben. kérdésben.

Page 7: Tefko Saracevic

RelevanciaRelevancia

• A tudományos kommunikáció kulcsfogalma, központi A tudományos kommunikáció kulcsfogalma, központi problémájaproblémája

• A tudományos ismeretek nagy és gyors növekedése, A tudományos ismeretek nagy és gyors növekedése, specializálódása következtében a tudomány specializálódása következtében a tudomány eredményes műveléséhez nem csak egyszerűen eredményes műveléséhez nem csak egyszerűen információkra, hanem releváns információkra van információkra, hanem releváns információkra van szükség.szükség.

• A relevancia fogalma alapvetően a tudományos A relevancia fogalma alapvetően a tudományos kommunikáció keretébe tartozik. Az a mérték, amely az kommunikáció keretébe tartozik. Az a mérték, amely az információ forrása és rendeltetése (felhasználója) közötti információ forrása és rendeltetése (felhasználója) közötti érintkezés (kapcsolat) hatékonyságát fejezi ki a érintkezés (kapcsolat) hatékonyságát fejezi ki a kommunikáció folyamatában; s mivel minden mérték kommunikáció folyamatában; s mivel minden mérték viszony, a relevancia is viszonyt kifejező fogalom.viszony, a relevancia is viszonyt kifejező fogalom.

Page 8: Tefko Saracevic

A relevancia fogalmának vizsgálata A relevancia fogalmának vizsgálata különféle nézőpontokból különféle nézőpontokból

A tudományos kommunikáció és a hozzá kapcsolódó információs A tudományos kommunikáció és a hozzá kapcsolódó információs rendszerek mindig valamely társadalmi környezetben működnek. rendszerek mindig valamely társadalmi környezetben működnek. Ebből következően a relevanciát sokféle szempontból lehet és kell Ebből következően a relevanciát sokféle szempontból lehet és kell vizsgálni.vizsgálni.

szempontok: szempontok:

• szaktudomány (szakterület, szakismeret, szaktudás)szaktudomány (szakterület, szakismeret, szaktudás)

• szakirodalom (dokumentációk, publikációk összessége, típusai)szakirodalom (dokumentációk, publikációk összessége, típusai)

• egyéb nyelvi vagy szimbolikus (tartalmi) ábrázolásokegyéb nyelvi vagy szimbolikus (tartalmi) ábrázolások

• információs forrás információs forrás

• információ rendeltetési helyeinformáció rendeltetési helye

• információs rendszerekinformációs rendszerek

• környezeti tényezőkkörnyezeti tényezők

• értékrendszerek (társadalmi, kulturális, erkölcsi, stb.)értékrendszerek (társadalmi, kulturális, erkölcsi, stb.)

Page 9: Tefko Saracevic

A relevancia fogalmának vizsgálata A relevancia fogalmának vizsgálata különféle nézőpontokbólkülönféle nézőpontokból

A relevancia különféle rendszerei más-más A relevancia különféle rendszerei más-más tényezőket vesznek figyelembe, de ezek annyira tényezőket vesznek figyelembe, de ezek annyira összefonódnak, hogy más rendszerek nélkül nem összefonódnak, hogy más rendszerek nélkül nem mérlegelhetők A felsorolt szempontok mind fontos mérlegelhetők A felsorolt szempontok mind fontos szerepet játszanak, és nem függenek egymástól.szerepet játszanak, és nem függenek egymástól.

Page 10: Tefko Saracevic

Informatika és relevanciaInformatika és relevancia

A relevancia az informatika (information science) A relevancia az informatika (information science) kulcsfogalma lett.kulcsfogalma lett.

Az információ, az újabb tudományos eredmények Az információ, az újabb tudományos eredmények egyre növekvő mennyisége szükségessé tette a egyre növekvő mennyisége szükségessé tette a válogatást: a tudás, az ismeretek válogatva válogatást: a tudás, az ismeretek válogatva kumulálódnak. Ezért a tudomány csakis a releváns kumulálódnak. Ezért a tudomány csakis a releváns információkkal foglalkozik, ha hatékony akar lenni. információkkal foglalkozik, ha hatékony akar lenni. Az információs keresőrendszerek kialakítása is ezt Az információs keresőrendszerek kialakítása is ezt a célt szolgálja.a célt szolgálja.

Page 11: Tefko Saracevic

A relevancia fogalmaA relevancia fogalma

A relevancia fogalmát Bradford használta először A relevancia fogalmát Bradford használta először (1948). A relevancia a kommunikációs (1948). A relevancia a kommunikációs folyamatban vizsgálva a forrás (source) és a folyamatban vizsgálva a forrás (source) és a címzett (destination) közötti kapcsolat címzett (destination) közötti kapcsolat hatékonyságának mértéke. A kommunikációs hatékonyságának mértéke. A kommunikációs folyamat forrása és címzettje egy vagy több folyamat forrása és címzettje egy vagy több adattárral (file) rendelkezik (pl. emberi emlékezet, adattárral (file) rendelkezik (pl. emberi emlékezet, könyvtári gyűjtemény, számítógépes adattár, stb.), könyvtári gyűjtemény, számítógépes adattár, stb.), amelyben az ismereteket szervezetten tárolják.amelyben az ismereteket szervezetten tárolják.

Page 12: Tefko Saracevic

A relevancia fogalmaA relevancia fogalma

Az ismeretek kommunikációja akkor hatékony, ha Az ismeretek kommunikációja akkor hatékony, ha az egyik adattárból átjuttatott információ egy az egyik adattárból átjuttatott információ egy másikban változásokat idéz elő; a relevanciát másikban változásokat idéz elő; a relevanciát tekinthetjük a változások mértékének. Figyelembe tekinthetjük a változások mértékének. Figyelembe kell venni a kommunikációs folyamatba beágyazott kell venni a kommunikációs folyamatba beágyazott különféle információs rendszereket is, az adott különféle információs rendszereket is, az adott környezetet, erkölcsi, szociális, vallási, filozófiai környezetet, erkölcsi, szociális, vallási, filozófiai stb. hajtóerőket is.stb. hajtóerőket is.

Page 13: Tefko Saracevic

A relevancia A relevancia az információs rendszerek felőlaz információs rendszerek felől

Fő kérdés a mérés módszertana. Már Fő kérdés a mérés módszertana. Már kezdetben is a visszahívás és a pontosság kezdetben is a visszahívás és a pontosság aránya volt a mérőegység.aránya volt a mérőegység.

(Recall: a visszahívott releváns válaszok és (Recall: a visszahívott releváns válaszok és az adattárban lévő összes releváns válasz az adattárban lévő összes releváns válasz aránya;aránya;

precision: a visszahívott releváns válaszok precision: a visszahívott releváns válaszok és az összes visszahívott válasz aránya)és az összes visszahívott válasz aránya)

Page 14: Tefko Saracevic

A relevancia a címzett felőlA relevancia a címzett felől

A címzett szubjektív volta nagyban befolyásolja a relevanciát (a pszichológiai elem belépése az informatikába).

Különböző hipotézisek születtek a relevancia megítélésére hatást gyakorló tényezők számbavételére és osztályozására (Rees és Saracevic 1966, O’Connor 1967, Cuadra és Katter 1967)

A relevanciának kizárólag a címzett szempontjából való megítélése nem inkorrekt, csak éppúgy nem ad teljes eredményt, mint a rendszer szempontjából való megítélés.

Page 15: Tefko Saracevic

A relevancia a szakirodalom felőlA relevancia a szakirodalom felől

A legtöbb bibliometriai tanulmány mélyén a relevancia problémája rejtezik. (pl. Bradfod szóródási törvénye (1948), Lotka megállapítása: a szakirodalom nagy részét aránytalanul kevés szerző írja le (1926), Zipf felismerése, hogy bizonyos szavak adott műben vagy szakterületen sokszor fordulnak elő (1949), Price vizsgálata a gyakran idézett művekről(1965), Urquhart felmérése: a nagy folyóiratgyűjteményeknek viszonylag kis részét használják intenzíven (1959))

Ezek a vizsgálatok a szakirodalom szerkezetét derítik fel, és mindezen kommunikációs jelenségek mögött a relevancia fogalma áll, vagy amit a relevancia szakirodalmi metszetének nevezhetünk.

Page 16: Tefko Saracevic

A relevancia a szakmai ismeretek felőlA relevancia a szakmai ismeretek felől

Ebben az összefüggésben a relevancia a megfogalmazott kérdéshez illő dokumentumokat jelzi. Mivel a kérdés nem tükrözi pontosan az információs igényt, be kellett vezetni a pertinencia fogalmát. (A relevancia fogalma a tárgyhoz tartozás elemét hangsúlyozza, a pertinenciáé pedig inkább a helyénvalóságét, odaillőségét.

Több szakember, pl. Goffman (1964), Price (1963), Ziman (1968, 1969) is foglalkozott a relevancia szakismeretek felőli megközelítésével.

Page 17: Tefko Saracevic

A relevancia a pragmatizmus felőlA relevancia a pragmatizmus felől

Az információs kereső rendszerek hasznosság szerint való megítélése, a visszakeresés hatékonyságának mértéke (Cooper tanulmányai (1971, 1973)

A pragmatikus nézőpont tovább osztotta a relevancia fogalmát: többféle relevancia van, amelyek más-más viszonyokat tükröznek. (pl. Wilson (1973) megkülönböztetett pszichológiai és logikai relevanciát, kifejlesztette a helyzeti relevancia fogalmát. Kochen(1974) a hasznosság elméletét alkalmazva megállapította, hogy adott használó adott kérdése szerint egy gyűjtemény minden dokumentumához meghatározott hasznossági fokot lehet hozzárendelni.)

Page 18: Tefko Saracevic

RelevanciaelméletekRelevanciaelméletek

Sarasevic szerint itt is érvényes a mondás: „semmi sem gyakorlatibb, mint egy jó elmélet”.Az informatika relevanciával kapcsolatos elméleteiből néhány: • Maron és Kuhn (1960) – bevezetik a valószínűség

fogalmát a relevanciát befolyásoló viszonyok leírásába• Goffman (1964) vizsgálta, hogy a matematikai

mértékelmélet alkalmazható-e a relevanciamegállapítására

• Goffman és Newill (1967, 1970) kidolgozta akommunikáció járványelméletét a kommunikációs folyamat dinamikájának bemutatására

Page 19: Tefko Saracevic

RelevanciaelméletekRelevanciaelméletek

Sperber és Wilson (1995) a relevancia két elvét, a kognitív elvet és a kommunikatív elvet különbözteti meg.A kognitív elv lényege, hogy az emberi megismerés a maximális relevancia elérésének érdekében szerveződik. A kommunikatív elv szerint az optimális relevancia vélelmét tartalmi következtetések útján kommunikáljuk.Saracevic szerint a két elv megkülönböztetése és összekapcsolása fontos a könyvtártudomány számára, és felhasználható arra, hogy megmagyarázzuk, mi a különbség és hasonlóság aközött, amit egy személy relevánsnak ítél, vagy amit egy információkereső rendszer ad ki.Ez az elmélet a relevanciát, mint egymással interakcióban álló relevancia-típusok rendszerét kezeli, szoros kapcsolatot teremt a megismerés és a kommunikáció között.

Page 20: Tefko Saracevic

A relevancia további kutatásárólA relevancia további kutatásáról

A relevanciát nem lehet egyetlen nézőpontból megközelíteni, ezért a további kutatása négy irányban lehetséges:

1. Egy relevanciametszet minden elemének részletekbe menő vizsgálata;

2. egy-egy elem egy vagy több metszetben való meghatározása és összehasonlítása;

3. Néhány elem egymásra való hatásának kimutatása;

4. Néhány relevanciametszet – végső soron minden metszet – egymásra való hatásának kimutatása

Page 21: Tefko Saracevic

Könyvtártudomány és információtudományKönyvtártudomány és információtudomány

Saracevic szerint:A könyvtárosság az ember által készített grafikus rekordok szervezésével, megőrzésével és felhasználásával foglalkozó szakterület.

Az információtudomány az információ társadalmi, intézményi és/vagy egyéni használatának, illetve szükségességének, az emberek között folytatott kommunikáció problémáinak tudományos kutatásával és szakmai gyakorlatával foglalkozó terület.

Page 22: Tefko Saracevic

Könyvtártudomány és információtudományKönyvtártudomány és információtudományA könyvtár – és információtudomány közös alapja a társadalmi szerep és általános elkötelezettség a grafikus rekordok hatékony hasznosításának problémái iránt.

A lényeges eltérések:

1. A vizsgálandó problémák kiválasztása és meghatározása.

2. Az elméleti kérdések felvetése és a struktúrák felvázolása.

3. A kísérletek és az empirikus fejlesztés természete és mértéke, valamint az ebből levont gyakorlati következtetések.

4. A felhasznált eszközök és megközelítési szempontok.

5. A kialakított interdiszciplináris kapcsolatok természete és erőssége, az előrehaladás és az eredmények függősége az interdiszciplináris megközelítéstől.

Page 23: Tefko Saracevic

Könyvtártudomány és információtudományKönyvtártudomány és információtudomány

Saracevic számára ezek a különbségek igazolják a következtetést, hogy a könyvtártudomány és az információtudomány két különálló terület, amelyek szoros interdiszciplináris kapcsolatban vannak – nem azonosak, illetve az egyik nem a másiknak speciális formája.

Page 24: Tefko Saracevic

A digitális könyvtárakrólA digitális könyvtárakról

Saracevic szerint: a digitális könyvtárak logikus kiterjesztései a hagyományos könyvtáraknak. Az általuk szolgált közösség igényeiből, a maguk elé tűzött átfogó célból egyenesen következik ez az átalakulás/bővülés. Egy konferencia megnyitóján összehasonlítva a kéziraton dolgozó egykori szerzetest a számítógép előtt görnyedő könyvtárossal megállapította, hogy „Töretlen vonal mentén dolgozunk már az ókor óta…”

Page 25: Tefko Saracevic

Tefko Saracevic honlapja Tefko Saracevic honlapja http://comminfo.rutgers.edu/~tefko/http://comminfo.rutgers.edu/~tefko/

Page 26: Tefko Saracevic

Az információkeresés értékeléseAz információkeresés értékeléseA keresés szempontjából az adatbázisban egyrészt releváns és nem releváns, másrészt megtalált és

nem megtalált információ létezik. Táblázatban:

  releváns nem releváns

Megtalált A B

nem megtalált C D

1. táblázat - Információk a relevancia szempontjából

A (megtalált releváns információk) = találatok (hits)

B (megtalált nem releváns információk) = zaj (noise, fals drop)

C (releváns nem talált információk) = veszteség (misses, losses)

D (nem releváns, nem talált információk) = érdektelen információk

A keresés tökéletes, ha a B és a C halmaz üres. Nem ennyire eszményi, de még mindig optimális, ha minden releváns információt kiadott a rendszer, de kiadott irreveláns információkat is, azaz csak a C halmaz üres. A tökéletesség mértékét a teljességgel (recall, ratio) és a pontossággal (precision) jellemzik.

A két fogalmat először William Perry használta a szemantikai kódok használhatóságának elemzésével kapcsolatban (ő még pertinencia-tényezőknek, Cleverdon 1963-ban relevancia-tényezőknek nevezte a kettőt; mai nevüket Gerard Salton adta 1965-ben).

A keresés teljessége (recall ratio) a megtalált releváns dokumentumok aránya az összes (akár talált, akár nem) releváns dokumentumhoz viszonyítva. Azaz

T = talált releváns dokumentumok száma / releváns dokumentumok száma az adatbáziban; 0lTl1

A keresés pontossága a talált dokumentumok összességén belül a releváns dokumentumok aránya. Azaz

P = talált releváns dokumentumok száma / talált összes dokumentumok száma; 0lPl1

Page 27: Tefko Saracevic

Tudományos munkásságárólTudományos munkásságáról

JASIST http://garfield.library.upenn.edu/histcomp/jasis-t/list/au-lcs.html

All-Author List (4065)

Records: 4590, Authors: 4065,

Journals: 3,

http://www.worldcat.org/identities/lccn-n80-63369