Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO...

Post on 05-Apr-2015

116 views 1 download

Transcript of Göttingen 10./11.1.2000 Kerstin Zimmermann TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO...

Göttingen10./11.1.2000

Kerstin Zimmermann

TP 2 : Rechtliches und Retrieval Fachbereich Physik, CvO Universität Oldenburg

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

2

Inhaltsverzeichnis

Rechtliches

• Promotionsordnung• Musterverträge• Parallelveröffentlichung• Copyrightnote• DC.Rights

Retrieval

• Dissertationsaufkommen• PhysDis• Verteilung• Harvest• Netzwerk• Installation

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

3

Rechtliches

• Promotionsordnungen

• Musterverträge- zwischen Kandidatin und UB / DDB- zwischen Kandidatin und FBhttp://elfikom.physik.uni-oldenburg.de/dissonline/vertrag.html

§

4

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

5

Rechtliches

• Promotionsordnungen

• Musterverträge- zwischen Kandidatin und UB / DDB- zwischen Kandidatin und FBhttp://elfikom.physik.uni-oldenburg.de/dissonline/vertrag.html

§

• Beispiele Online- und Verlagsveröffentlichung parallel

• Diskussion in DC.Rights- rights der resource (un-)restricted access / use - rights der Metadaten

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

6

Retrieval

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

7

Retrieval in der Physik

Phys Dis

Ire lan d

Ita ly

N eth erlan d s

N orw ay

P o lan d

P h ysD is

WWW

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

8

Online Theses in Europe

many theses at several places

up to 10 links for theses

some theses found mostly at one place

no theses found yet

updated: December 1999

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

9

Arten der Archive (PhysDis)

a) Liste mit Einträgen (Name, Titel, Datum)

b) zusätzlich mit Abstract

c) Volltexte unkommentiert

d) Metadaten und Volltexte

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

10

Existente Gatherer und Broker

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

11

Abdeckung der Daten

RDF

Dokumente

Dissertationen in EU

Metadaten

D

eprint, Fachbereich Physik, CvO Universität Oldenburg

12

Harvest

WWW-SERVER

http://www.physik...

Dissertation GATHERER

BROKER

HARVEST

User

Internal Area

NWWW Browser

Result...................................

Request

Result

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

13

Warum Harvest?

• dezentrales System

• heterogene Einträge

• plattformunabhängig

• Software public domain (-> Kostenersparnis)

• open sourcecode ( -> offene Schnittstellen)

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

14

Globale Harvest Serverstruktur

global

national

fach-spezifisch

europaweit

D D BO P A C

N D L TD

C h em ieS U B

E rz ieh u n g sw issen sch a ftenU B

In fo rm atikR Z

F ach b ere ich / In s titu tU B

M ath em atikIM P R E S S

F ach b ere ich / In s titu tU B

P h ys ikP h ysD is

D iss B roke rD issN et

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

15

Harvest Anleitung• indexierbare Formate

• Softwarelink

• Handbuch

• Installationshilfe

• Fehlerquellen

http://www.dissonline.org/harvest.html

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

16

Indexierbare Formate• html X

• ps X Text, Vorsicht bei einigen Druckertreibern kein

Grafikmodus sondern ASCII erforderlich • pdf X Text, bei folgenden Destiller-Optionen:

asciipdf=on, commpressed Text= off im exchange darf die optimize Einstellung nicht verweden werden

• doc X

• rtf X

• tex X

• dvi X

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

17

<tags> und MetadatenHTML Element SOIF-Element

<A HREF> url-reference{}

<ADDRESS> address{}

<H1 ... H6> headings{}

<TITLE> title{}

...

Metadaten SOIF-Element

DC.title dc.title{}

DC.author dc.author{}

...

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

18

Harvest-Sources:

ftp://ftp.tardis.ed.ac.uk/pub/harvest/develop/snapshots/

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

19

Requirements for Harvest-Servers

Hardware:• fast processor (e.g. Sparc5...)• fast I/O• much MEMORY ( > 64 MB)• 1-2 GB free disk-space (sources take approx 25 MB)

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

20

Requirements for Harvest-Servers

Platforms:• DEC OSF/1 2.0 or newer• SunOS 4.1.x or newer• SunSolaris 2.3 or newer• HPUX• AIX 3.x or newer• Linux all Kernel from 1999 on...• ... beginning with Version 1.5 Harvest should run under all Unix-Platforms, but WindowsNT

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

21

Requirements for Harvest-Servers

Software:• Perl v4.0 or higher (v5.0 preferred)• gzip• tar• HTTP-Server (may be on remote machine)• GNU gcc v2.5.8 or higher• flex v2.4.7• bison v1.22

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

22

Harvest-Configuration

Provider

Provider

Provider

Gatherer

Broker

Broker

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

23

Harvest-Configuration

Provider

Provider

Provider

Gatherer

Broker

Broker

gdbm

objects

glimpse

SOIF

SOIFHTTP

HTTP

HTTP

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

24

Harvest-Configuration

Provider

Provider

Provider

Gatherer

Broker

Broker

gdbm

objects

glimpse

SOIF

SOIFHTTP

HTTP

HTTP

CGIPORT

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

25

Harvest-Configuration

Gatherer

Broker

Broker

gdbm

objects

glimpse

CGIPORT2

PORT1

PORT3

Port-Numbers mustbe unique !!!!

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

26

Port-Nummern• Harvest 8500

• Webserver http 80

• ftp 21 tcp

• telnet 23

• smtp (email) 25

• pop3 110

• time-server 123

27

@FILE { http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/metadocs/ebs.shell.structure.htmlupdate-time{9}: 938935362url-references{208}: http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdfmailto:hilf@merlin.physik.uni-oldenburg.dehttp://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdftitle{59}: Shell Structure and Stability of Very Neutron-Rich Isotopeskeywords{97}:

and author date eberhard ebs files hilf isotopes neutron pdf rich shell stability structure very

head{16}: -Version 1.0 -->dc.type{59}: InProceedings(SCHEME=Freetext)publication-status=publisheddc.title{59}: Shell Structure and Stability of Very Neutron-Rich Isotopesdc.publisher{18}: IKDA, TH Darmstadtdc.language{18}: (SCHEME=Z39.53)ENGdc.format{15}: application/pdfdc.date{75}: (SCHEME=ANSI.X3.30-1985)1975(SCHEME=ANSI.X3.30-1985)(TYPE=current)19990408dc.creator{126}: Eberhard R. Hilf(TYPE=email)hilf@merlin.physik.uni-oldenburg.de(TYPE=phone)+49-(0)441-798-2543(TYPE=fax)+49-(0)441-798-3201body{190}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:Eberhard R. Hilf Phone: +49-(0)441-798-2543 Fax:+49-(0)441-798-3201 Files: ebs.shell.structure.pdf Date: 1975md5{32}: bc1f2750a042a8175cce710030c60d76file-size{4}: 2440type{4}: HTMLgatherer-version{6}: 1.5.19gatherer-host{31}: egoiste.physik.uni-oldenburg.degatherer-name{17}: Physics Oldenburgrefresh-rate{5}: 86400time-to-live{7}: 3888000last-modification-time{9}: 928224570description{186}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:Eberhard R. Hilf Phone: +49-(0)441-798-2543 Fax:+49-(0)441-798-3201Files: ebs.shell.structure.pdf Date: 1975}

SOIF: Example

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

28

Installationrlogin

Password:

cp harvest-1.5.20.tar.gz

gunzip harvest-1.5.20.tar.gz

tar -xf harvest-1.5.20.tar

cd harvest-1.5.20

login on remote machine

type in and forget...

copy source...

uncompress sources

unpack sources

change into sources dir

Thomas Severiens, Fachbereich Physik, CvO Universität Oldenburg

29

Installation

RunHarvest

•Tuning:• Gatherer

• Editing the Gatherername.cf• Editing the RunGatherer and RunGatherd

• Broker• Editing the admin/Collection.conf• Editing the CGI-Files

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

30

Fehlermeldungen / -quellen

Broker findet nichts

-> Glimpse-Server läuft nicht

Gatherer tut nicht

-> port-Nummer belegt

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

31

Laufzeit und DatenmengenDFN-Netz 3 Doks pro Minute

Ladezeit vgl. Browser

indizieren [ms]

Speicherplatz 9 MB

PhysDis (Jan.‘00) 306 ‚echte‘ links

1475 Dokumente

112 Server

Gatherer 2h 4min

Kerstin Zimmermann, Fachbereich Physik, CvO Universität Oldenburg

32

Zusammenfassung

Dissertation an Beispielfachbereichen

Suchdienst in der Physik (Prototyp)

geplante Suchdienststruktur

bundesweit / weltweit

Harvest

technische Details

Installationshilfen