Göttingen10./11.1.2000
Kerstin Zimmermann
TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
2
Inhaltsverzeichnis
Rechtliches
• Promotionsordnung• Musterverträge• Parallelveröffentlichung• Copyrightnote• DC.Rights
Retrieval
• Dissertationsaufkommen• PhysDis• Verteilung• Harvest• Netzwerk• Installation
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
3
Rechtliches
• Promotionsordnungen
• Musterverträge- zwischen Kandidatin und UB / DDB- zwischen Kandidatin und FBhttp://elfikom.physik.uni-oldenburg.de/dissonline/vertrag.html
§
4
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
5
Rechtliches
• Promotionsordnungen
• Musterverträge- zwischen Kandidatin und UB / DDB- zwischen Kandidatin und FBhttp://elfikom.physik.uni-oldenburg.de/dissonline/vertrag.html
§
• Beispiele Online- und Verlagsveröffentlichung parallel
• Diskussion in DC.Rights- rights der resource (un-)restricted access / use - rights der Metadaten
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
6
Retrieval
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
7
Retrieval in der Physik
Phys Dis
Ire lan d
Ita ly
N eth erlan d s
N orw ay
P o lan d
P h ysD is
WWW
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
8
Online Theses in Europe
many theses at several places
up to 10 links for theses
some theses found mostly at one place
no theses found yet
updated: December 1999
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
9
Arten der Archive (PhysDis)
a) Liste mit Einträgen (Name, Titel, Datum)
b) zusätzlich mit Abstract
c) Volltexte unkommentiert
d) Metadaten und Volltexte
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
10
Existente Gatherer und Broker
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
11
Abdeckung der Daten
RDF
Dokumente
Dissertationen in EU
Metadaten
D
eprint, Fachbereich Physik, CvO Universität Oldenburg
12
Harvest
WWW-SERVER
http://www.physik...
Dissertation GATHERER
BROKER
HARVEST
User
Internal Area
NWWW Browser
Result...................................
Request
Result
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
13
Warum Harvest?
• dezentrales System
• heterogene Einträge
• plattformunabhängig
• Software public domain (-> Kostenersparnis)
• open sourcecode ( -> offene Schnittstellen)
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
14
Globale Harvest Serverstruktur
global
national
fach-spezifisch
europaweit
D D BO P A C
N D L TD
C h em ieS U B
E rz ieh u n g sw issen sch a ftenU B
In fo rm atikR Z
F ach b ere ich / In s titu tU B
M ath em atikIM P R E S S
F ach b ere ich / In s titu tU B
P h ys ikP h ysD is
D iss B roke rD issN et
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
15
Harvest Anleitung• indexierbare Formate
• Softwarelink
• Handbuch
• Installationshilfe
• Fehlerquellen
http://www.dissonline.org/harvest.html
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
16
Indexierbare Formate• html X
• ps X Text, Vorsicht bei einigen Druckertreibern kein
Grafikmodus sondern ASCII erforderlich • pdf X Text, bei folgenden Destiller-Optionen:
asciipdf=on, commpressed Text= off im exchange darf die optimize Einstellung nicht verweden werden
• doc X
• rtf X
• tex X
• dvi X
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
17
<tags> und MetadatenHTML Element SOIF-Element
<A HREF> url-reference{}
<ADDRESS> address{}
<H1 ... H6> headings{}
<TITLE> title{}
...
Metadaten SOIF-Element
DC.title dc.title{}
DC.author dc.author{}
...
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
18
Harvest-Sources:
ftp://ftp.tardis.ed.ac.uk/pub/harvest/develop/snapshots/
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
19
Requirements for Harvest-Servers
Hardware:• fast processor (e.g. Sparc5...)• fast I/O• much MEMORY ( > 64 MB)• 1-2 GB free disk-space (sources take approx 25 MB)
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
20
Requirements for Harvest-Servers
Platforms:• DEC OSF/1 2.0 or newer• SunOS 4.1.x or newer• SunSolaris 2.3 or newer• HPUX• AIX 3.x or newer• Linux all Kernel from 1999 on...• ... beginning with Version 1.5 Harvest should run under all Unix-Platforms, but WindowsNT
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
21
Requirements for Harvest-Servers
Software:• Perl v4.0 or higher (v5.0 preferred)• gzip• tar• HTTP-Server (may be on remote machine)• GNU gcc v2.5.8 or higher• flex v2.4.7• bison v1.22
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
22
Harvest-Configuration
Provider
Provider
Provider
Gatherer
Broker
Broker
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
23
Harvest-Configuration
Provider
Provider
Provider
Gatherer
Broker
Broker
gdbm
objects
glimpse
SOIF
SOIFHTTP
HTTP
HTTP
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
24
Harvest-Configuration
Provider
Provider
Provider
Gatherer
Broker
Broker
gdbm
objects
glimpse
SOIF
SOIFHTTP
HTTP
HTTP
CGIPORT
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
25
Harvest-Configuration
Gatherer
Broker
Broker
gdbm
objects
glimpse
CGIPORT2
PORT1
PORT3
Port-Numbers mustbe unique !!!!
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
26
Port-Nummern• Harvest 8500
• Webserver http 80
• ftp 21 tcp
• telnet 23
• smtp (email) 25
• pop3 110
• time-server 123
27
@FILE { http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/metadocs/ebs.shell.structure.htmlupdate-time{9}: 938935362url-references{208}: http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdfmailto:[email protected]://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdftitle{59}: Shell Structure and Stability of Very Neutron-Rich Isotopeskeywords{97}:
and author date eberhard ebs files hilf isotopes neutron pdf rich shell stability structure very
head{16}: -Version 1.0 -->dc.type{59}: InProceedings(SCHEME=Freetext)publication-status=publisheddc.title{59}: Shell Structure and Stability of Very Neutron-Rich Isotopesdc.publisher{18}: IKDA, TH Darmstadtdc.language{18}: (SCHEME=Z39.53)ENGdc.format{15}: application/pdfdc.date{75}: (SCHEME=ANSI.X3.30-1985)1975(SCHEME=ANSI.X3.30-1985)(TYPE=current)19990408dc.creator{126}: Eberhard R. Hilf(TYPE=email)[email protected](TYPE=phone)+49-(0)441-798-2543(TYPE=fax)+49-(0)441-798-3201body{190}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:Eberhard R. Hilf Phone: +49-(0)441-798-2543 Fax:+49-(0)441-798-3201 Files: ebs.shell.structure.pdf Date: 1975md5{32}: bc1f2750a042a8175cce710030c60d76file-size{4}: 2440type{4}: HTMLgatherer-version{6}: 1.5.19gatherer-host{31}: egoiste.physik.uni-oldenburg.degatherer-name{17}: Physics Oldenburgrefresh-rate{5}: 86400time-to-live{7}: 3888000last-modification-time{9}: 928224570description{186}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:Eberhard R. Hilf Phone: +49-(0)441-798-2543 Fax:+49-(0)441-798-3201Files: ebs.shell.structure.pdf Date: 1975}
SOIF: Example
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
28
Installationrlogin
Password:
cp harvest-1.5.20.tar.gz
gunzip harvest-1.5.20.tar.gz
tar -xf harvest-1.5.20.tar
cd harvest-1.5.20
login on remote machine
type in and forget...
copy source...
uncompress sources
unpack sources
change into sources dir
Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg
29
Installation
RunHarvest
•Tuning:• Gatherer
• Editing the Gatherername.cf• Editing the RunGatherer and RunGatherd
• Broker• Editing the admin/Collection.conf• Editing the CGI-Files
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
30
Fehlermeldungen / -quellen
Broker findet nichts
-> Glimpse-Server läuft nicht
Gatherer tut nicht
-> port-Nummer belegt
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
31
Laufzeit und DatenmengenDFN-Netz 3 Doks pro Minute
Ladezeit vgl. Browser
indizieren [ms]
Speicherplatz 9 MB
PhysDis (Jan.‘00) 306 ‚echte‘ links
1475 Dokumente
112 Server
Gatherer 2h 4min
Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg
32
Zusammenfassung
Dissertation an Beispielfachbereichen
Suchdienst in der Physik (Prototyp)
geplante Suchdienststruktur
bundesweit / weltweit
Harvest
technische Details
Installationshilfen