30
PREDMETNE ANALIZE PREDMETNE ANALIZE I REPREZENTACIJA I REPREZENTACIJA , , Predmet: Napredne metode u pretraživanju Predmet: Napredne metode u pretraživanju informacija informacija prof. Cvetana Krstev prof. Cvetana Krstev prezentacija Mirjana Nešić prezentacija Mirjana Nešić master studije, index 930232M master studije, index 930232M februar 2011. februar 2011.

PREDMETNE ANALIZE I REPREZENTACIJA ,

  • Upload
    tareq

  • View
    76

  • Download
    4

Embed Size (px)

DESCRIPTION

PREDMETNE ANALIZE I REPREZENTACIJA ,. Predmet: Napredne metode u pretraživanju informacija prof. Cvetana Krstev prezentacija Mirjana Nešić master studije, index 930232M februar 2011. - PowerPoint PPT Presentation

Citation preview

Page 1: PREDMETNE ANALIZE I REPREZENTACIJA  ,

PREDMETNE ANALIZE PREDMETNE ANALIZE I REPREZENTACIJAI REPREZENTACIJA , ,

Predmet: Napredne metode u pretraživanjuPredmet: Napredne metode u pretraživanjuinformacija informacija

prof. Cvetana Krstevprof. Cvetana Krstevprezentacija Mirjana Nešićprezentacija Mirjana Nešić

master studije, index 930232Mmaster studije, index 930232M februar 2011.februar 2011.

Page 2: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Uskladjivanje sadržaja dokumenta sa Uskladjivanje sadržaja dokumenta sa korisnikovim upitomkorisnikovim upitom jeste jedna od glavnih jeste jedna od glavnih funkcija funkcija Sistema pretraživanja informacijaSistema pretraživanja informacija (Information retrieval system).(Information retrieval system).

Sadržaj svakog dokumenta, kojim se dopunjava Sadržaj svakog dokumenta, kojim se dopunjava kolekcija, mora biti analiziran i predstavljen na kolekcija, mora biti analiziran i predstavljen na takav način da bude pogodan za uparivanje takav način da bude pogodan za uparivanje (matching).(matching).

Za svaki dokument mora se pripremiti Za svaki dokument mora se pripremiti surogatsurogat i svi ti surogati moraju se i svi ti surogati moraju se održavati na organizovan način.održavati na organizovan način. Proces stvaranja surogata dokumenta, Proces stvaranja surogata dokumenta,

dodeljivanjem identifikatora, naziva se dodeljivanjem identifikatora, naziva se indeksiranjeindeksiranje..

Page 3: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Kada je zadatak indeksiranja zasnovan na Kada je zadatak indeksiranja zasnovan na konceptualnoj analizi predmeta dokumenta, konceptualnoj analizi predmeta dokumenta, onda se on naziva onda se on naziva predmetnim predmetnim indeksiranjemindeksiranjem..

Indeksiranje je dugo vremena vršio ljudski Indeksiranje je dugo vremena vršio ljudski faktor. U poslednje vreme taj zadatak obavljaju faktor. U poslednje vreme taj zadatak obavljaju automatski sistemi – računari.automatski sistemi – računari.

Ipak, glavni zadaci u vezi sa indeksiranjem u Ipak, glavni zadaci u vezi sa indeksiranjem u osnovi su isti – analiziranje sadržaja odredjenog osnovi su isti – analiziranje sadržaja odredjenog dokumenta i predstavljanje dobijenih analiza, dokumenta i predstavljanje dobijenih analiza, putem identifikatora ili ključnih reči.putem identifikatora ili ključnih reči.

Lankaster smatra da proces predmetne analize Lankaster smatra da proces predmetne analize čine dva posebna intelektualna koraka:čine dva posebna intelektualna koraka:

- konceptualna analizakonceptualna analiza i i - reprezentacijareprezentacija

Page 4: PREDMETNE ANALIZE I REPREZENTACIJA  ,

U predmetnoj klasifikaciji glavni ciljU predmetnoj klasifikaciji glavni cilj je je kreirati kreirati dokumente u skladu sa njihovim predmetnim dokumente u skladu sa njihovim predmetnim sadržajemsadržajem, a rezultat konceptualne analize je , a rezultat konceptualne analize je predstavljen odredjenim predstavljen odredjenim veštačkim jezikom ili veštačkim jezikom ili simboličnim oznakamasimboličnim oznakama. Razne vrste ovakvih . Razne vrste ovakvih sistema su dugo u upotrebi: Djuijeva sistema su dugo u upotrebi: Djuijeva decimalna klasifikacija, Univerzalna decimalna decimalna klasifikacija, Univerzalna decimalna klasifikacija, Klasifikacija Kongresne biblioteke, klasifikacija, Klasifikacija Kongresne biblioteke, Kolon klasifikacija.Kolon klasifikacija.

U predmetnom indeksiranju glavni ciljU predmetnom indeksiranju glavni cilj je je upariti sadržaj dokumenta sa upitom korisnikaupariti sadržaj dokumenta sa upitom korisnika i tako je produkt konceptualne analize i tako je produkt konceptualne analize predmeta predstavljen u formi predmeta predstavljen u formi prirodnog prirodnog jezikajezika. Godinama su razvijani brojni sistemi za . Godinama su razvijani brojni sistemi za pripremanje predmetnih indeksnih odrednica pripremanje predmetnih indeksnih odrednica dokumenata: Chain, PRECIS, POPSI, Relational dokumenata: Chain, PRECIS, POPSI, Relational Indexing, itd.Indexing, itd.

Page 5: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Jedan od glavnih Jedan od glavnih problemaproblema u procesu u procesu predmetnog indeksiranja odnosi se na predmetnog indeksiranja odnosi se na izbor izbor odgovarajućih ključnih reči ili deskriptoraodgovarajućih ključnih reči ili deskriptora, , kroz koje bi indeksna odrednica trebalo da bude kroz koje bi indeksna odrednica trebalo da bude predstavljena. Indekseri preferiraju ne samo predstavljena. Indekseri preferiraju ne samo one ključne reči koje predstavljaju predmet one ključne reči koje predstavljaju predmet jasno, već i one koje su često birane od strane jasno, već i one koje su često birane od strane korisnika, koji traže taj predmet.korisnika, koji traže taj predmet.

Iz potrebe da se standardizuje zadatak odabira Iz potrebe da se standardizuje zadatak odabira odgovarajućih ključnih reči za generaciju odgovarajućih ključnih reči za generaciju indeksnih odrednica–razvijani su brojni brojni indeksnih odrednica–razvijani su brojni brojni rečnički instrumenti, kao što su tezaurusi, rečnički instrumenti, kao što su tezaurusi, klasaurusi, tezaurofaceti, itd. klasaurusi, tezaurofaceti, itd.

Page 6: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Ovi alati pomažu indekserima u odabiru pojma Ovi alati pomažu indekserima u odabiru pojma koji u najvećoj meri predstavlja predmet u fazi koji u najvećoj meri predstavlja predmet u fazi indeksiranja, dok korisnicima pomažu u indeksiranja, dok korisnicima pomažu u odabiru najadekvatnijih pojmova za odabiru najadekvatnijih pojmova za formulaciji upita. Ipak, svi ovi alati i tehnike - formulaciji upita. Ipak, svi ovi alati i tehnike - budući da su bazirani na intelektualnim budući da su bazirani na intelektualnim sposobnostima indeksera – pokazuju se sposobnostima indeksera – pokazuju se neefikasnim na mnogim mestima. neefikasnim na mnogim mestima.

Da bi se izbegla potpuna zavisnost od ljudskog Da bi se izbegla potpuna zavisnost od ljudskog intelekta – istraživači su zamislili da intelekta – istraživači su zamislili da automatizuju ceo proces predmetnog automatizuju ceo proces predmetnog indeksiranja i klasifikacije. indeksiranja i klasifikacije.

Page 7: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Većina sistema za automatsku analizu Većina sistema za automatsku analizu sadržaja, razvijenih do sada, zasniva se na sadržaja, razvijenih do sada, zasniva se na statističkom proračunustatističkom proračunu ključnih reči u ključnih reči u dokumentu. Ukazujući na očigledne dokumentu. Ukazujući na očigledne nedostatke ovakvih sistema, baziranih na nedostatke ovakvih sistema, baziranih na statistici, neki istraživači ukazali su na statistici, neki istraživači ukazali su na potrebu za sintaksičkom i semantičkom potrebu za sintaksičkom i semantičkom analizom teksta, korišćenjem računarske analizom teksta, korišćenjem računarske lingvistike u procesu analize sadržaja.lingvistike u procesu analize sadržaja.

Page 8: PREDMETNE ANALIZE I REPREZENTACIJA  ,

KLASIFIKACIJAKLASIFIKACIJA

Prva bibliotečku klasifikacionu šemu razvio je Prva bibliotečku klasifikacionu šemu razvio je Melvil Djui 1876. godine. (DDC).Melvil Djui 1876. godine. (DDC).

Univerzalna decimalna klasifikacija (UDC) je Univerzalna decimalna klasifikacija (UDC) je druga glavna klasifikaciona šema koja se druga glavna klasifikaciona šema koja se pojavila. Kao i DDK, UDK je u osnovi brojčana pojavila. Kao i DDK, UDK je u osnovi brojčana šema, ali ima dosta sintetičkih elemenata, šema, ali ima dosta sintetičkih elemenata, nakalemljenih na svoje osnovno jezgro, što nakalemljenih na svoje osnovno jezgro, što doprinosi velikoj fleksibilnosti.doprinosi velikoj fleksibilnosti.

Primeri gradjenja UDK brojeva:Primeri gradjenja UDK brojeva:

53(038) – Rečnik iz fizike 53(038) – Rečnik iz fizike

622 + 629 - Rudarstvo i metalurgija622 + 629 - Rudarstvo i metalurgija

Page 9: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Ranganatanova Ranganatanova Kolon klasifikacija (CC)Kolon klasifikacija (CC)

Primer analitičko-sintetičke klasifikacione Primer analitičko-sintetičke klasifikacione šeme, koja dozvoljava klasifikatoru da, u šeme, koja dozvoljava klasifikatoru da, u samom radu, utvrdi različite aspekte samom radu, utvrdi različite aspekte predmeta, a zatim napravi klasni broj predmeta, a zatim napravi klasni broj korišćenjem sintetičkih elemenata. korišćenjem sintetičkih elemenata.

Primeri:Primeri:

Matematika BMatematika B Hemija EHemija E

Vatra E:2131Vatra E:2131

Page 10: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Klasifikacija Kongresne biblioteke (LC)Klasifikacija Kongresne biblioteke (LC)

Primer polu-brojčane šeme klasifikacije, koja Primer polu-brojčane šeme klasifikacije, koja obezbedjuje dugu listu svih klasa u obezbedjuje dugu listu svih klasa u univerzumu predmeta; ona dozvoljava manje univerzumu predmeta; ona dozvoljava manje fleksibilnosti za utvrdjivanje klasnih brojeva fleksibilnosti za utvrdjivanje klasnih brojeva sintezom. sintezom.

Primeri:Primeri: Inženjerstvo HD8039.E5Inženjerstvo HD8039.E5 Ljubav BF575.L8Ljubav BF575.L8

Ostale klasifikacione šeme: Blisova Ostale klasifikacione šeme: Blisova Bibliografska Klasifikacija (BC), Braunova Bibliografska Klasifikacija (BC), Braunova Predmetna klasifikacija (SC), Rajderova Predmetna klasifikacija (SC), Rajderova Medjunarodna klasifikacija, itd.Medjunarodna klasifikacija, itd.

Page 11: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Djuijeva decimalna klasifikacija Djuijeva decimalna klasifikacija (DDC) 1876.(DDC) 1876.

DDC je najrasprostranjeniji klasifikacioni DDC je najrasprostranjeniji klasifikacioni sistem na svetu. Koristi se u oko 135 zemalja i sistem na svetu. Koristi se u oko 135 zemalja i preveden je na preko 30 jezika. U SAD-u oko preveden je na preko 30 jezika. U SAD-u oko 95% svih javnih i školskih, 25% visokoškolskih 95% svih javnih i školskih, 25% visokoškolskih i univerzitetskih i oko 20% specijalnih i univerzitetskih i oko 20% specijalnih biblioteka koristi DDC.biblioteka koristi DDC.

U ovoj klasifikaciji celokupno znanje je U ovoj klasifikaciji celokupno znanje je podeljeno na 10 oblasti, od kojih je svaka podeljeno na 10 oblasti, od kojih je svaka glavna klasa,glavna klasa, a svaka klasa je potom a svaka klasa je potom podeljena u 10 glavnih oblasti, i tako podeljena u 10 glavnih oblasti, i tako sukcesivno, vodeći do oblasti i podoblasti sukcesivno, vodeći do oblasti i podoblasti različitih disciplina, predmeta i koncepata, različitih disciplina, predmeta i koncepata, odakle i izraz decimalna klasifikacija. odakle i izraz decimalna klasifikacija.

Page 12: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Glavne smernice za DDC klasifikaciju:Glavne smernice za DDC klasifikaciju: Dokument klasifikovati Dokument klasifikovati po predmetu, pa onda po predmetu, pa onda

po formi, osim u polju književnostipo formi, osim u polju književnosti. Na primer, . Na primer, rečnik bibliotečke nauke će biti klasifikovan u rečnik bibliotečke nauke će biti klasifikovan u bibliotečku nauku, a ne medju rečnike. Ovde bibliotečku nauku, a ne medju rečnike. Ovde je predmet mnogo bitniji nego forma u kojoj je je predmet mnogo bitniji nego forma u kojoj je predstavljen.predstavljen.

Dela književnosti klasifikovati prvo po jeziku Dela književnosti klasifikovati prvo po jeziku na kojem su, a onda po formi u kojoj se na kojem su, a onda po formi u kojoj se nalaze. (npr. engleska drama – prvo kao engl. nalaze. (npr. engleska drama – prvo kao engl. književnost, a potom kao drama).književnost, a potom kao drama).

Kada se radi o dva ili više predmeta u delu:Kada se radi o dva ili više predmeta u delu: - prednost se daje onom predmetu na kojem je - prednost se daje onom predmetu na kojem je

akcenatakcenat - ako je akcenat na oba podjednak – prednost - ako je akcenat na oba podjednak – prednost

se daje prvom (prvi-od-dva-pravilo),se daje prvom (prvi-od-dva-pravilo), ......

Page 13: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Glavne klaseGlavne klase

000 Opšta000 Opšta 100 Filozofija100 Filozofija 200 Religija200 Religija 300 Društvene nauke300 Društvene nauke 400 Jezik400 Jezik 500 Prirodne nauke500 Prirodne nauke 600 Tehnologija (primenjene nauke)600 Tehnologija (primenjene nauke) 700 Umetnost700 Umetnost 800 Književnost800 Književnost 900 Geografija i istorija900 Geografija i istorija

Page 14: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Glavne oblasti za klasu tehnologijeGlavne oblasti za klasu tehnologije

600 Tehnologija600 Tehnologija 610 Medicina610 Medicina 620 Inženjerstvo620 Inženjerstvo 630 Poljoprivreda630 Poljoprivreda 640 Ekonomija640 Ekonomija 650 Menadžment 650 Menadžment 660 Hemija660 Hemija 670 Industrija670 Industrija 680 Industrija za odredjene oblasti680 Industrija za odredjene oblasti 690 Gradjevinarstvo690 Gradjevinarstvo

Page 15: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Glavne oblasti za klasu InženjerstvaGlavne oblasti za klasu Inženjerstva

620 Inženjerstvo i primenjene operacije620 Inženjerstvo i primenjene operacije 621 Primenjena fizika621 Primenjena fizika 622 Rudarstvo i srodne grane622 Rudarstvo i srodne grane 623 Vojno i nautičko inženjerstvo623 Vojno i nautičko inženjerstvo 624 Gradjevina624 Gradjevina 625 Železnica, putevi i autoputevi625 Železnica, putevi i autoputevi 626 neupotrebljeno626 neupotrebljeno 627 Hidraulično inženjerstvo627 Hidraulično inženjerstvo 628 Sanitarno i komunalno inženjerstvo628 Sanitarno i komunalno inženjerstvo 629 Ostale grane inženjerstva629 Ostale grane inženjerstva

Page 16: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Tablice iz prvog toma se ne mogu koristiti samostalno, već se Tablice iz prvog toma se ne mogu koristiti samostalno, već se kombinuju sa glavnim klasnim brojevima:kombinuju sa glavnim klasnim brojevima:

Tablica 1: standardna podoblast (studiranje i učenje Tablica 1: standardna podoblast (studiranje i učenje bibliotečke i informacione nauke 020.7)bibliotečke i informacione nauke 020.7)

Tablica 2: područje (inostrana politika Etiopije 327.63)Tablica 2: područje (inostrana politika Etiopije 327.63) Tablica 3: podoblast za različite književnostiTablica 3: podoblast za različite književnosti (Istorija (Istorija

nemačke književnosti 830.9)nemačke književnosti 830.9) Tablica 4: podoblast za posebne jezike (Izgovor Tablica 4: podoblast za posebne jezike (Izgovor

finskih reči 494.54181)finskih reči 494.54181) Tablica 5: rasne, etničke, nacionalne grupe (Umetnost Tablica 5: rasne, etničke, nacionalne grupe (Umetnost

keramike u Kini 738.089951)keramike u Kini 738.089951) Tablica 6: jezici (Prevod Biblije Tablica 6: jezici (Prevod Biblije

na holandski jezik 220.53931)na holandski jezik 220.53931) Tablica 7: osobe (Deca kao umetnici 704.054)Tablica 7: osobe (Deca kao umetnici 704.054)

Page 17: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Klasifikacija internet izvoraKlasifikacija internet izvora

Iako su klasifikacione šeme uglavnom bile Iako su klasifikacione šeme uglavnom bile razvijane za organizovanje bibliografskih razvijane za organizovanje bibliografskih jedinica na bibliotečkim policama, mnogi jedinica na bibliotečkim policama, mnogi istraživači su koristili bibliotečke klasifikacione istraživači su koristili bibliotečke klasifikacione šeme za organizaciju informacionih izvora na šeme za organizaciju informacionih izvora na internetu. Evo nekoliko tipičnih primera.internetu. Evo nekoliko tipičnih primera.

BUBL LINKBUBL LINK Bubl link obezbedjuje pristup katalogu od Bubl link obezbedjuje pristup katalogu od

preko 11.000 odabranih izvora, iz oblasti svih preko 11.000 odabranih izvora, iz oblasti svih akademskih predmeta, katalogiziranih u akademskih predmeta, katalogiziranih u skladu sa DDC.skladu sa DDC.

Može se pretraživati po Djuijevim klasama ili Može se pretraživati po Djuijevim klasama ili odabirom pojma/fraze iz alfabetskog indeksa.odabirom pojma/fraze iz alfabetskog indeksa.

Page 18: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Sledeći primer pokazuje listu stavki/članaka o Sledeći primer pokazuje listu stavki/članaka o digitalnim bibliotekama, po klasama:digitalnim bibliotekama, po klasama:

Page 19: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Sledeći primer pokazuje rezultate pretrage na upit Sledeći primer pokazuje rezultate pretrage na upit “searching and use of digital libraries”:“searching and use of digital libraries”:

Page 20: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Sledeći primeri pokazuju pretragu po predmetu:Sledeći primeri pokazuju pretragu po predmetu:

Page 21: PREDMETNE ANALIZE I REPREZENTACIJA  ,

.. i konkretno o digitalnim bibliotekama:.. i konkretno o digitalnim bibliotekama:

Page 22: PREDMETNE ANALIZE I REPREZENTACIJA  ,

CyberDeweyCyberDewey

Ovo je još jedan primer korišćenja DDC u Ovo je još jedan primer korišćenja DDC u organizaciji digitalnih inormatičkih resursa i organizaciji digitalnih inormatičkih resursa i datira iz 1995. godine. Takodje se može datira iz 1995. godine. Takodje se može pretraživati kroz Djuijeve klase ili kroz alfabetski pretraživati kroz Djuijeve klase ili kroz alfabetski indeks.indeks.

ScorpionScorpion

Ovo je projekat OCLC (Online Computer Library Ovo je projekat OCLC (Online Computer Library Center) Sektora za istraživanja indeksiranja i Center) Sektora za istraživanja indeksiranja i katalogizovanja internet resursa. Njegov cilj bio katalogizovanja internet resursa. Njegov cilj bio je da izgradi alate za automatsko prepoznavanje je da izgradi alate za automatsko prepoznavanje predmeta, kombinujući bibliotečku nauku i predmeta, kombinujući bibliotečku nauku i tehnike pronalaženja informacija. Počeo je kao tehnike pronalaženja informacija. Počeo je kao istraživački projekat sa osvrtom na:istraživački projekat sa osvrtom na:

Page 23: PREDMETNE ANALIZE I REPREZENTACIJA  ,

izgradivanje alata za automatsko odredjenje izgradivanje alata za automatsko odredjenje predmetapredmeta

izgradivanje alata za smanjenje troškova izgradivanje alata za smanjenje troškova katalogizacije od strane ljudikatalogizacije od strane ljudi

bolje razumevanje toga koji kataloški koncepti mogu bolje razumevanje toga koji kataloški koncepti mogu biti automatizovanibiti automatizovani

dalju upotrebu i poboljšanje DDCdalju upotrebu i poboljšanje DDC pronalaženje načina za poboljšane pretragepronalaženje načina za poboljšane pretrage

CyberStacksCyberStacks Ovo je centralizovana, integrisana i jedinstvena Ovo je centralizovana, integrisana i jedinstvena

kolekcija odabranih internet resursa, kolekcija odabranih internet resursa, kategorizovanih po klasifikacionoj šemi Kongresne kategorizovanih po klasifikacionoj šemi Kongresne biblioteke. Ona dozvoljava korisnicima da pretražuju biblioteke. Ona dozvoljava korisnicima da pretražuju memoriju virtuelne biblioteke, koja sadrži memoriju virtuelne biblioteke, koja sadrži monografske i serijske publikacije, datoteke, baze monografske i serijske publikacije, datoteke, baze podataka, ili da pretražuju servise da bi pronašli podataka, ili da pretražuju servise da bi pronašli potencijalno vredne informacione resurse. potencijalno vredne informacione resurse.

Page 24: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Scout ReportScout Report

Osnovan je kao istraživački projekat US Osnovan je kao istraživački projekat US nacionalne naučne fondacije (1996-2000).nacionalne naučne fondacije (1996-2000).

Primarni cilj ovog projekta bio je da pokaže da Primarni cilj ovog projekta bio je da pokaže da internet resursi mogu da budu katalogizovani, internet resursi mogu da budu katalogizovani, klasifikovani i uredjeni, korišćenjem klasifikovani i uredjeni, korišćenjem postojećih preglednih rečnika i klasifikacija, postojećih preglednih rečnika i klasifikacija, kao što je klasifikacija Kongresne biblioteke u kao što je klasifikacija Kongresne biblioteke u skladu sa standardom Dablin jezgra (Dublin skladu sa standardom Dablin jezgra (Dublin core) meta podataka. Projekat se završio core) meta podataka. Projekat se završio 2000. godine, a materijali su sada dostupni u 2000. godine, a materijali su sada dostupni u Scout Report arhivama, koje su pretražive Scout Report arhivama, koje su pretražive baze podataka koje sadrže 12.711 kritičkih baze podataka koje sadrže 12.711 kritičkih beleški o izabranim sajtovima i mejling liste. beleški o izabranim sajtovima i mejling liste.

Page 25: PREDMETNE ANALIZE I REPREZENTACIJA  ,

EELS i EEVLEELS i EEVL EELSEELS (Engineering E-Library, Sweden) je kapija za (Engineering E-Library, Sweden) je kapija za

kvalitetno ocenjene inženjerske informacione izvore kvalitetno ocenjene inženjerske informacione izvore na intenetu. Glavni deo EELS-a je strukturiran u na intenetu. Glavni deo EELS-a je strukturiran u skladu sa EI (Engineering Information) predmetnom skladu sa EI (Engineering Information) predmetnom klasifikacionom šemom.klasifikacionom šemom.

EEVLEEVL (Enhanced and Evaluated Virtual library) (Enhanced and Evaluated Virtual library)

Još jedan vodič kroz inženjerske predmete, koji Još jedan vodič kroz inženjerske predmete, koji takodje koristi EI klasifikacionu šemu. Stvoren je i takodje koristi EI klasifikacionu šemu. Stvoren je i održavan je od strane tima informacionih stručnjaka održavan je od strane tima informacionih stručnjaka sa različitih univerziteta i institucija u Velikoj Britaniji, sa različitih univerziteta i institucija u Velikoj Britaniji, da bi obezbedio pristup digitalnim informacijama iz da bi obezbedio pristup digitalnim informacijama iz oblasti inženjerstva, matematike i računarstva.oblasti inženjerstva, matematike i računarstva.

Page 26: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Predmetne analizePredmetne analize

Pod terminom Pod terminom predmetne analize predmetne analize podrazumevamo podrazumevamo analize zamišljenog sadržaja otelotvorenog u analize zamišljenog sadržaja otelotvorenog u dokumentu. Autori plasiraju svoje ideje u dokumentu. Autori plasiraju svoje ideje u dokumentima, a indekseri moraju da odrede dokumentima, a indekseri moraju da odrede suštinu onoga što su autori rekli. Predmetne suštinu onoga što su autori rekli. Predmetne analize podrazumevaju prisustvo, identifikaciju i analize podrazumevaju prisustvo, identifikaciju i izraz predmeta u tekstu dokumenta, baze izraz predmeta u tekstu dokumenta, baze podataka, kontrolisani i prirodni jezik, zahteve za podataka, kontrolisani i prirodni jezik, zahteve za informacijama i strategije za pretragu.informacijama i strategije za pretragu.

Najteži deo predmetnog indeksiranja ili Najteži deo predmetnog indeksiranja ili klasifikacije jeste faza kada indekser, koji ne klasifikacije jeste faza kada indekser, koji ne mora nužno da bude i predmetni ekspert, mora nužno da bude i predmetni ekspert, pokuša da sumira sadržaj celog dokumenta u pokuša da sumira sadržaj celog dokumenta u nekoliko rečinekoliko reči. .

Page 27: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Indekser treba da se, dok ispituje dokument, Indekser treba da se, dok ispituje dokument, drži smernica, koje se nalaze u pitanjima:drži smernica, koje se nalaze u pitanjima:

Da li se dokument bavi odredjenim proizvodom, Da li se dokument bavi odredjenim proizvodom, stanjem ili fenomenom?stanjem ili fenomenom?

Da li predmet sadrži neki akcioni koncept, neku Da li predmet sadrži neki akcioni koncept, neku operaciju ili proces?operaciju ili proces?

Da li je objekat ili trpilac radnje identifikovan?Da li je objekat ili trpilac radnje identifikovan? Da li ukazuje na odredjene načine izvršavanja Da li ukazuje na odredjene načine izvršavanja

akcije, kao npr. specijalne instrumente, tehnike ili akcije, kao npr. specijalne instrumente, tehnike ili metode?metode?

Gde se ovi faktori nalaze u kontekstu pojedine Gde se ovi faktori nalaze u kontekstu pojedine lokacije ili okruženja?lokacije ili okruženja?

Da li se uočavaju nezavisne ili zavisne varijable?Da li se uočavaju nezavisne ili zavisne varijable? Da li se predmet posmatra iz specijalnog ugla, Da li se predmet posmatra iz specijalnog ugla,

koji nije uobičajen za to polje izučavanja, kao npr. koji nije uobičajen za to polje izučavanja, kao npr. sociološko izučavanje religije?sociološko izučavanje religije?

Page 28: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Bilo kako bilo, mora se primetiti da ovi koraci Bilo kako bilo, mora se primetiti da ovi koraci traže intelektualnu angažovanost indeksera; traže intelektualnu angažovanost indeksera; zato, moguće je da će dva različita indeksera zato, moguće je da će dva različita indeksera analizirati sadržaj datog dokumenta na dva analizirati sadržaj datog dokumenta na dva različita načina, što će rezultirati sa dve različite različita načina, što će rezultirati sa dve različite indeksne odrednice.indeksne odrednice.

U stvari, ovo je ozbiljan nedostatak ručnog U stvari, ovo je ozbiljan nedostatak ručnog indeksiranja. Sledeća opservacija Kleverdona indeksiranja. Sledeća opservacija Kleverdona pokazuje dva nedostatka ručnog predmetnog pokazuje dva nedostatka ručnog predmetnog sistema analiziranja:sistema analiziranja:

Ako dva čoveka ili dve grupe ljudi naprave Ako dva čoveka ili dve grupe ljudi naprave tezaurus iz iste oblasti – samo tezaurus iz iste oblasti – samo 60% indeksnih 60% indeksnih termina će se nalaziti u oba tezaurusatermina će se nalaziti u oba tezaurusa..

Ako dva iskusna indeksera indeksiraju isti Ako dva iskusna indeksera indeksiraju isti dokumet, koristeći isti tezaurus – dokumet, koristeći isti tezaurus – samo 30% samo 30% indeksnih termina biće zajedničkoindeksnih termina biće zajedničko..

Page 29: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Salton naglašava da potreba za indeksnim Salton naglašava da potreba za indeksnim ekspertima u manuelnom indeksnom okruženju ekspertima u manuelnom indeksnom okruženju uvodi u neželjenu varijabilnost i nesigurnost, koje uvodi u neželjenu varijabilnost i nesigurnost, koje mogu negativno uticati na efektivnost pretrage. On mogu negativno uticati na efektivnost pretrage. On dodaje da u automatizovanom indeksnom okruženju dodaje da u automatizovanom indeksnom okruženju nedostatak ljudske stručnosti može biti prevazidjen nedostatak ljudske stručnosti može biti prevazidjen inteligentnom upotrebnom rečnika slobodnog teksta inteligentnom upotrebnom rečnika slobodnog teksta u uskladištenim zapisimau uskladištenim zapisima i informacionim i informacionim zahtevima.zahtevima.

Različiti aspekti predmetnih analiza i indeksiranja su Različiti aspekti predmetnih analiza i indeksiranja su razmatrani u Godišnjem časopisu informacione razmatrani u Godišnjem časopisu informacione nauke i tehnologije. Tu se pominje, 1989. godine da nauke i tehnologije. Tu se pominje, 1989. godine da iako je mnogo napisano o različitim aspektima iako je mnogo napisano o različitim aspektima indeksiranja – ipak je potrebna obimna knjiga indeksiranja – ipak je potrebna obimna knjiga predmeta.predmeta.

Od tada Lankaster sam je napisao takvu knjigu, Od tada Lankaster sam je napisao takvu knjigu, trenutno dostupnu u 3. izdanju.trenutno dostupnu u 3. izdanju.

Page 30: PREDMETNE ANALIZE I REPREZENTACIJA  ,

Hvala na pažnji!Hvala na pažnji!