Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX · Der oXygen-XML-Editor und das...
-
Upload
truonghanh -
Category
Documents
-
view
230 -
download
0
Embed Size (px)
Transcript of Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX · Der oXygen-XML-Editor und das...

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Der oXygen-XML-Editor
und das DTA-oXygen-Framework DTAoX
Matthias Boenig & Susanne Haaf

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Der oXygen-XML-Editor:
Erste Schritte

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Unicode und Schriften
• Der Text sollte im Unicode-Standard kodiert sein
• Häufige Zeichen können von der Tastatur eingegeben werden
• Seltenere Sonderzeichen werden mittels Unicode-Entitäten
wiedergegeben
• Unicode-basierte Fonts:
– http://sourceforge.net/projects/junicode/?source=dlp
– http://unifoundry.com/unifont.html
• Hilfe bei der Suche nach Unicode-Kodierungen (Beispiele)
– BabelMap: http://www.babelstone.co.uk/software/babelmap.html
– http://shapecatcher.com/
– http://www.charbase.com/
– http://www.decodeunicode.org/

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Einstellung der Kodierung
Sie gelangen in diesen Dialog, über das Menü: Optionen → Einstellungen → Kodierung des Dokuments

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Einstellung der Kodierung
Der Oxygen-Editor ist in den meisten Fällen in dieser Art bezüglich Kodierung eingestellt. Die Einstellung ist zu ändern auf: 1. UTF-8 2. Nicht schreiben 3. Berichten Gespeichert werden die Einstellungen erst, wenn der Button „Anwenden“ betätigt wurde. Das Fenster wird mit dem Button „OK“ geschlossen.

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Unicode-Zeichen
in DTAQ gibt es zur Identifikation der Unicode-Entitäten auf der Startseite eine extra-Suche und eine Übersicht über die im DTA verwendeten Zeichen

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Unicode-Zeichen im oXygen-Editor
Sie gelangen in diesen Dialog über das Menü: Optionen → Einstellungen → Code-Vorlagen
Möchten Sie eine neue Vorlage anlegen, drücken Sie auf diesen Button.
Möchten Sie eine vorhan-dene Vorlage benutzen, um eine gleichartige Vorlage zu erstellen, bietet sich das Duplizieren an.
• häufige einzelne Zeichen oder -folgen können im Oxygen-Editor als Code-Vorlagen (Textbaustein) gespeichert werden

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Unicode-Zeichen im oXygen-Editor
• Formulierung einer neuen Code-Vorlage
• Achtung: Leerzeichen und Return sind relevant, d.h. werden ggf. mit eingefügt

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
• Ex- und Import der Vorlagen Die Vorlagen können untereinander ausgetauscht werden. Zu beachten ist: 1. evtl. ist es sinnvoll, dass
alle Mitarbeiter die gleichen Vorlagen verwenden
2. Beim Anlegen neuer Vorlagen sollte man sich entsprechend abstimmen
Um die eigenen Vorlagen zu exportieren, wird der Button "Exportieren" verwendet. Es werden immer alle Vorlagen exportiert. Gespeichert werden die Vorlagen in Form einer XML-Datei.
Um die Vorlagen aus anderen oXygen-Instanzen (von PC zu PC) zu importieren, wird der Button "Import" verwendet. Es werden immer alle Vorlagen importiert.
Unicode-Zeichen im oXygen-Editor

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
• Verwendung der Vorlage
Mit der Tastenkombination STRG+Shift+Leerzeichen/Space öffnet sich das Code-Vorlagen-Fenster im Editor. Mit den Pfeiltasten oder Anfangsbuchstaben der jeweiligen Vorlagen kann in der Liste navigiert werden.
Unicode-Zeichen im oXygen-Editor

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
• Alle Leerzeichen anzeigen
Hilfreiche Einstellungen im oXygen-Editor
Mit dieser Option werden im Textfenster beim
Bearbeiten eines Dokuments alle
Leerzeichen durch farbige (hier: rote) Hochpunkte
angezeigt.

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
• Zwischenspeichern und Sicherungskopien anlegen
Sicherungs-kopie
Zwischen-speichern
oXygen-Menü: Optionen >
Einstellungen > (links) Editor >
Öffnen/Speichern
Hilfreiche Einstellungen im oXygen-Editor

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Das DTA-oXygen-Framework (DTAoX)

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Problemstellung (1)
XML-TEI schreiben ist sperrig …
… und fehleranfällig Bildquelle: Wikipedia (http://commons.wikimedia.org/wiki/File:Amelita_galli-curci.jpg)

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Problemstellung (1)
• XML-Editoren wie z.B. oXygen bieten Unterstützung bei der Vermeidung von Fehlern, oXygen z.B. durch:
– Wohlgeformtheits- und Validierungs-Parser
– Sprechende Fehlermeldungen
– Funktionen zur Auto-Vervollständigung
– Hilfreiche Ansichten (z.B. XML-Struktur-Ansicht)
– …

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Trotzdem kann man sich im TEI-Wald schnell verlieren …
Problemstellung (1)

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Problemstellung (2)
• Editoren wünschen sich oft während ihrer Arbeit eine Visualisierung der TEI/XML-Kodierung zu Korrekturzwecken
• Diese Visualisierung soll:
– gegenüber dem XML-Code mehr Übersichtlichkeit gewährleisten
– für jeden schnell zugänglich sein
– möglichst sämtliche TEI-Kodierungen ihrer Bedeutung entsprechend umsetzen

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Ausgangslage
• Autor-Ansicht des oXygen-Editors ermöglicht WYSIWYG-nahe Darstellungen
• oXygen bietet eine default-Visualisierung für TEI-Dateien im Autor-Modus: das TEI-Framework

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Ausgangslage
TEI-
Framework
des oXygen-
Editors
Hierfür sind
individuelle
Anpassungen
möglich …

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
DTA-oXygen-Framework

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Installieren von DTAoX
• Download unter: http://www.deutschestextarchiv.de/doku/software#dtaox
DTAoX-1.1.1.zip speichern und entpacken
Windows: setup.exe ausführen; als Installationsverzeichnis das aktuelle oXygen-Hauptverzeichnis (in der Regel im "Programme"-Ordner) auswählen
Linux/Mac OS: Verzeichnis "DTAoX" im oXygen-Hauptverzeichnis in das Unterverzeichnis "frameworks" kopieren; die Fonts im Verzeichnis "Fonts" installieren

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
DTAoX: Erste Schritte
1. oXygen öffnen
2. TEI-Datei in der Editor-Ansicht öffnen
3. in den TEI-Wurzelknoten das Attribut-Wert-Paar
@xml:id="dtabf" eintragen:

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
DTAoX: Erste Schritte
1. oXygen öffnen
2. TEI-Datei in der Editor-Ansicht öffnen
3. in den TEI-Wurzelknoten das Attribut-Wert-Paar
@xml:id="dtabf" eintragen
4. Umschalten auf die Autor-Ansicht

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Exkurs: Begriffe
• Framework: – eine Sammlung von Vorlagen – eine Sammlung von Stylesheet für Druckausgabe, Internet oder
Mobilgeräte – eine spezielle Menüanpassung und Symbolleisten
• Ansichten – Text Code-Ansicht – Raster XML-Tags werden als Raster angezeigt – Autor WYSIWYG-ähnliche Ansicht des Textes
(„What You See Is What You Get“ (englisch für „Was du siehst, ist [das,] was du bekommst.)
• Tag oder Element
– ist ein Bezeichner für einen bestimmten Inhalt – <Anfangstag>Inhalt</Endtag> – <leeresTag/>

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Die DTAoX-Menüleiste
• lb (Zeilenumbruch): ohne weitere Unterelemente. Mit einem Klick auf „lb (Zeilenumbruch)“ wird ein Zeilenumbruch an der Stelle eingefügt, an der sich der Cursor befindet.
• Brief: Elemente, die briefspezifische Texteinheiten kennzeichnen, z. B. <dateline>, <signed> etc.
• Dokumentstruktur: Elemente, die Strukturierungen der Vorlage kennzeichnen, welche den äußeren Zugang zur Quelle ermöglichen, z. B. <back>, <body>, <div> etc.
• Drama: dramenspezifische Elemente, z. B. <stage>, <speaker> etc. • Eingriffe: Elemente, die editorische Eingriffe kennzeichnen (<gap> sowie <supplied>) und
Elemente, die dazu beitragen, einen Druckfehler, eine Normalisierung oder eine Abkürzung anzuzeigen.
• Einschübe: Elemente, die Blöcke kennzeichnen, welche den Fließtext auf Dokument- oder Elementebene unterbrechen, z. B. <figure>, <floatingText>, <note> etc.
• Lyrik: Elemente, die lyrikspezifische Texteinheiten kennzeichnen (<lg> und <l>). • Phrasenstruktur: Elemente, die die Funktion oder das Erscheinungsbild einzelner Wörter
oder Phrasen spezifizieren, also z. B. <date>, <formula> etc. • Tabelle: Elemente, die die Struktur von Tabellen beschreiben, z. B. <cell>, <row> etc. • Textstruktur: Elemente, die die Semantik oder die Erscheinung von Textteilen beschreiben
sollen, z. B. <cb>, <cit>, <list>. • Titelseite: Elemente, die Textabschnitte auf der Titelseite eines Werkes beschreiben, z. B.
<docTitle>, <docAuthor>, <publisher> etc. • Zitate: Elemente, die Zitate u. ä. kennzeichnen, z. B. <epigraph>, <quote> etc. • Darüber hinaus kann das gesuchte Element nach seinem Level ausgesucht werden. Dafür
stehen die drei Kategorien Level 1, Level 2, Level 3 zur Verfügung.

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
DTAoX: Die Farben
• Level 1: Grün
– Elemente, die verwendet werden müssen, um das DTA-
Basisformat zu erfüllen. Diese Elemente werden konsequent
im DTA-Kernkorpus verwendet.
• Level 2: Blau
– Elemente, deren Verwendung lt. DTA-Basisformat empfohlen
wird, auf die jedoch verzichtet werden kann. Diese Elemente werden in allen Texten des DTA-Kernkorpus verwendet.
• Level 3: Violett
– Elemente, die im DTA-Basisformat enthalten sind, jedoch
nicht konsequent in den Texten des DTA-Kernkorpus
angewandt werden. Die Verwendung dieser Elemente ist
fakultativ.

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
DTAoX: Darstellung des Layouts
• Zeilenumbrüche werden durch ↵ dargestellt.
• Kapitelüberschriften werden durch größere Schrift gekennzeichnet.
• Dünne, schwarze, durchbrochene Linien kennzeichnen horizontale Linien im
Text. Falls erforderlich, können darüber hinaus rote und blaue Linien durch
die @rendition-Werte "#hrRed" bzw. "#hrBlue" dargestellt werden.
• Fuß- und Endnoten werden an der Stelle im Text angezeigt, an der sie
eingewiesen sind, d.h. nicht am Ende einer Seite bzw. eines Kapitels. Sie
werden in kleinerer Schrift dargestellt.
• Spaltenumbrüche werden ebenfalls durch einen gelben durchbrochenen
Balken gekennzeichnet.
• Eingriffe in den Text werden folgendermaßen dargestellt: Bei Korrekturen
von Druckfehlern erscheint der korrigierte Text in grüner Schrift. Die falsche
Form wird durch kursives „(sic!)“ gekennzeichnet. Im Fall von
Normalisierungen bzw. Auflösungen von Abkürzungen wird der Inhalt der
Elemente <reg> bzw. <expan> neben der ursprünglichen Form (in <orig> bzw.
<abbr>) im Kursivdruck angezeigt.

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
DTAoX: Formatierungen

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Im Menü „DTABf“ > „Tags-Anzeigemodus“ kann zwischen verschiedenen möglichen Darstellungsweisen der Textannotation gewählt werden:
• Ganze Tags mit Attributen zeigt jedes Tag mit seinem Namen sowie dem Namen und Wert aller Attribute an.
• Volle Tags zeigt jedes Tag mit seinem Namen an, allerdings ohne Attribute.
• Block Tags zeigt nur die Tags vollständig an, die einen gesamten Textblock umschließen.
• Inline Tags zeigt nur die Tags vollständig an, die nicht einen gesamten Textblock umschließen, sondern innerhalb von Zeilen beginnen und/oder enden.
• Partielle Tags zeigt durch kleine Dreiecke an, wo sich Tags befinden, ohne jedoch die Elementnamen mit darzustellen.
• Keine Tags zeigt den reinen Text ohne Tags an.
Anzeige von Tags und Attributen in der oXygen-Autor-Ansicht

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Anzeige von Tags und Attributen in der oXygen-Autor-Ansicht

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Einfügen eines neuen Elements
• Cursor positionieren und die Eingabetaste drücken
oder
• die Tastenkombination Strg+E drücken.
In beiden Fällen erscheint ein Fenster mit allen Elementen, die an dieser Stelle erlaubt sind, in alphabetischer Reihenfolge.

Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX
Attribute-Vergabe und Korrektur
• Alt + Return
oder
• Fenster > Ansicht zeigen > Attribute