Was wir HEUTE beachten müssen
...um die Wissenschaftler in 10 Jahren nicht zu enttäuschen
Dipl. Sozw. Ralf Stockmann, SUB Göttingen
TheseDer Umgang mit digitalen Daten wird die Wissenschaften genauso verändern wie der Buchdruck
Aber: es gibt nicht „DIE Wissenschaft“ sondern viele Disziplinen mit teils gegensätzlichen Anforderungen und Erwartungen
Zoologie vs. Wissenschaftsgeschichte
ZoologieVerzeichnis der Erstbeschreibungen von Tieren
Sehr schneller Zugriff auf gut ausgezeichnete Seiten (nicht: Seitenzahlen, Kapitel)
Best practice: kleine bitonale Scans, <1 Sekunde für Seitenwechsel, kein Download
WissenschaftsgeschichteDetailanalye einzelner Seiten, Feinheiten wie Wasserzeichen interessant
Best practice: hochauflösende Farbscans, Downloadmöglichkeit der vollen Auflösung, Online-Editor für Bildmanipulationen (MPI für Wiss.Gesch.)
Digital != Digital
Astrophysik: die NASA hat bereits alles digitalisiert
Medizin: digitalisierte Bücher töten Menschen
Dimensionen der Digitalisierung
Verfügbarkeit„Es ist da, ich kann es finden und nutzen“
24 / 7
Fehler werden auftreten und sind nicht zu verhindernEuropeana
Internet-Manifest
Klare Kommunikationsstrategien über Ausfälle
Indexierbar / Harvestbar denn: verfügbar ist das, was ich finde ohne es gesucht zu haben
Reaktion auf Nutzereingaben: < 1 Sek, max. 3 Sek
Bedienung
Bedienung ist ein Teil von Verfügbarkeit!
10% für GUI / Design
Projektkosten
Broken by Design
Attention to Detail!
Dimensionen der Digitalisierung
Qualität
Orientierung an Praxisregeln der DFG
300 dpi Farbe, 600 dpi bitonal„echte“ optisch aufgelöste dpi!
Farbkalibrierung?Farbkeil reicht
Bestmögliche Bildqualität pro Kilobyte Dateigröße
JPG2000 ?
Bildoptimierung nur wo es sinnvoll istEntzerrung fragwürdig
Qualitätskontrolle: Vollständigkeit, dem Ziel angemessen
Dimensionen der Digitalisierung
Semantik
Korrigierte bibliographische DatenDigitalisierung als Maßnahme der Katalogshygiene
Volltexte zu vertretbaren Preisen< 1 Cent pro Seite
Fraktur OCR läuft uns nicht weg: 5 Jahre warten
Keine händischen Korrekturen, lieber regelmäßig Fortschritte der Technik nutzen
Kollaborative Ansätze unterstützen (Wiki Source)
„kluger“ Volltext
Nicht in Suchindex verstecken, sondern neben Digitalisat präsentieren
Beurteilung von Qualität der OCR und damit der Verlässlichkeit der Suche
Wortkoordinaten
Download im TEI Format
Adressierbarkeit beliebig granularer Einheiten (Kapitel, Absatz, Satz, ...)
Erschlossen durch NormdatenPND,
Experiment: Erschließung
Einheitlicher Suchraum (GDZ Bestand, 10.000 Bände)
Einheitliche Suchstrategien
Verschiedene Suchindizes:Bibliographische Daten
Strukturmetadaten
Volltexte
Fragestellungen:Signifikante Unterschiede?
Komplementäre Treffersets?
Treffersets Teilmengen voneinander?
Ergebnisse: Anfang 2010
Bibliog
raph
ische
Met
adat
en
Strukt
urm
etad
aten
Vollte
xt
Dimensionen der Digitalisierung
Verwertbarkeit
Flexible AusgabeformatePDF
Online-Pageturner
Zoom-Funktion
AdressierbakeitPersistente Identifier / PURLs
Markups
Augumented Reality
Überwindung der Provinienz
Es interessiert keinen Wissenschaftler, in welcher Bibliothek seine Forschungsliteratur steht.
Noch viel weniger interessiert ihn, in welchem Repository er die digitale Fassung gefunden hat.
Digitale Werkzeuge MÜSSEN system- und applikationsübergreifend funktionieren:
Bookmarking
Vernetzung
Kommentierung
Kollaboration
ACHTUNG!
Wir versündigen uns an einer ganzen Generation von Wissenschaftlern, wenn wir Produktkonkurrenz auf dem Rücken der Forscher austragen
Wir brauchen keinen Wettbewerb um lokal implementierte Features, sondern einen Wettbewerb um die beste Implementierung offener Standards
Im Zweifelsfall werden die Wissenschaftler in Zukunft dahin gehen wo Vernetzung funktioniert (Google)
Rundumlösung vs. vernetze Dienste
Google:Suche
Maps
Kalender
News
Docs
Picasa (Bilder)
Nur durch ein Single Sign On verbunden
ToDo‘s
Digitalisierung in hoher Qualität (Digital Master)
Mehrere Derivate für unterschiedliche Nutzungsszenarien anbieten
So viele (Meta)Daten wie möglich freigeben
Systematisch „kluge“ OCR vorantreiben
Softwareentscheidungen nicht (nur) danach treffen welche Features angeboten werden sondern welche Schnittstellen
Vielen Dank
Top Related