Scannen von grafischen Elementen Empfehlung zum Speichern der Bilder Scannen zur Texterkennung (OCR)...
-
Upload
bathildis-schipper -
Category
Documents
-
view
106 -
download
0
Transcript of Scannen von grafischen Elementen Empfehlung zum Speichern der Bilder Scannen zur Texterkennung (OCR)...
Scannen von grafischen Elementen
Empfehlung zum Speichern der Bilder
Scannen zur Texterkennung (OCR)
So viel wie nötig, so wenig wie möglich...
ÜBERSICHTÜBERSICHT
Links zum Thema „Scannen“
zurück Übersicht vor
Folgende Faktoren sind für die Auflösung eines Scanners relevant:
dpi
Pixel
OptischeAuflösung
zurück Übersicht vor
dpi
Die Auflösung eines Scanners wird üblicherweise angegeben in
dpi = dots per inch = Bildpunkte pro Zoll
Typische Werte: 1200, 600 dpi (Flachbett), 2700 dpi (Dia)
(1 inch = 1 Zoll = 2,54 cm)
Faktoren die für die Auflösung eines Scanners relevant Faktoren die für die Auflösung eines Scanners relevant sind:sind:
zurück Übersicht vor
Einige Quellen sprechen von Pixeln statt von Punkten - und verwenden die Einheit ppi = pixels per inch, weil zu einem Pixel immer ein Grauwert
oder drei Grundfarbwerte gehören. Pixel
Faktoren die für die Auflösung eines Scanners relevant Faktoren die für die Auflösung eines Scanners relevant sind:sind:
zurück Übersicht vor
Entscheidend ist die sog. optische Auflösung. Dieser physikalische Wert
macht in erste Linie die Leistung des Scanners aus. In Bewegungsrichtung der
Abtastleiste ist die Auflösung meist doppelt so groß wie in der Querrichtung. Mit einer
höheren Auflösung zu Scannen, macht keinen Sinn.
OptischeAuflösung
Faktoren die für die Auflösung eines Scanners relevant Faktoren die für die Auflösung eines Scanners relevant sind:sind:
Verschiedene Scann-Verschiedene Scann-ArtenArten
zurück Übersicht vor
mögliche Werte Bit / Bildpunkt
Schwarz-Weiß-Zeichnung Max. 21 = 2 1
Schwarz-Weiß-Foto(Graustufen)
Max. 28 = 256 8
Farb-Foto Max. 224 = 16 777 216 24
(je 8 Bit f ür Rot, Grün, Blau; Truecolor)
Größe von Größe von ScanndateienScanndateien
zurück Übersicht vor
Bild, das eingescannt werden soll
Überlegung: Für welchen Zweck brauche ich das Bild
Anpassung der Auflösung beim Scan an das
geplante Ausgabemedium
Beachten Sie folgende Punkte um die Größe von Scan-Dateien niedrig zu Beachten Sie folgende Punkte um die Größe von Scan-Dateien niedrig zu halten:halten:
zurück Übersicht vor
• Scan-Dateien, vor allem in Farbe, werden leicht sehr groß. Beispiel: Bild, 10 cm x 10 cm, in Farbe (24 Bit) mit 300 dpi gescannt -> Dateigröße: 4
MByte.
• Sie sollten sich im Klaren sein, was Sie mit der Datei machen wollen. Passen Sie die Auflösung beim Scan dem geplanten Ausgabemedium an, um keine unnötig großen Dateien zu erhalten. Dies wäre reine Verschwendung!
• Bedenken Sie: Eine Verdoppelung der Scann-Auflösung (z. B. von 150 dpi auf 300 dpi)
vervierfacht die Dateigröße.
Tipp: Da der Schärfebereich nicht direkt über der Glasplatte endet, lassen sich auch viele
Objekte direkt einscannen.
Vergrößern und Vergrößern und VerkleinernVerkleinern
Sollen gescannte Bilder vor dem Ausdruck vergrößert oder verkleinert werden, ist bereits beim Scannen die Scanauflösung entsprechend
anzupassen.
zurück Übersicht vor
Vergrößerung Verkleinerung
Wird das Bild in doppelter Größe ausgegeben, ist auch beim Scan die doppelte Auflösung zu wählen. Beachten Sie, dass sich dabei die Größe der
Datei vervierfacht.
zurück Übersicht vor
Vergrößerung
Bei einer starken Vergrößerung kann es sinnvoll sein, zuerst vom Original eine Vergrößerung auf photographischem Weg herstellen zu lassen und diese
dann zu scannen.
Bei einer Verkleinerung auf die Hälfte der Bildgröße kann auch die Scanauflösung halbiert werden. Damit wird die Bilddatei um ¾ kleiner.
zurück Übersicht vor
Verkleinerung
Scannen von grafischen Elementen
Empfehlung zum Speichern der Bilder
Scannen zur Texterkennung (OCR)
So viel wie nötig, so wenig wie möglich...
ÜBERSICHTÜBERSICHT
Links zum Thema „Scannen“
2. SchrittDurch Untersuchung dieser
Informationen findet die Erkennung der Zeichen statt.
zurück Übersicht vor
Prinzip OCR
1. SchrittErfassung als grafische
Pixelinformation
Den zweiten Schritt bezeichnet man auf englisch als
OCROCR (Optical Character Recognition), (Optical Character Recognition),
zu deutsch optische Zeichenerkennung.
zurück Übersicht vor
"Text"
Beachten Sie folgende Hinweise beim Scannen von Texten:
• Normale Schrift: Auflösung 300 dpi • Kleine Schrift: Auflösung 400 dpi
• Testen Sie ob mit einer höheren Auflösung weniger Fehler auftreten, wählen Sie aber keine zu hohe Auflösung.
Scannen von grafischen Elementen
Empfehlung zum Speichern der Bilder
Scannen zur Texterkennung (OCR)
So viel wie nötig, so wenig wie möglich...
ÜBERSICHTÜBERSICHT
Links zum Thema „Scannen“
Scannen zur Bildschirmanzeige
zurück Übersicht vor
Hintergrundbild
Scannen zur Ausgabe auf Druckern
Hintergrundbild
zurück Übersicht vor
Die ideale Scann-Auflösung bei gegebener Vorlagengröße und Bildschirmauflösung für den Fall, dass jedem Bildschirmpunkt ein
Scanpunkt mit 24 Bit Farbtiefe (16,7 Mio. Farben) zugeordnet werden und
das Bild den gesamten Bildschirm einnehmen soll, ist wie folgt:
5 cm x 3,75 cm 10 cm x 7,5 cm 20 cm x 15 cm
640 x 480 Pixel 300 dpi 150 dpi 75 dpi
800 x 600 Pixel 400 dpi 200 dpi 100 dpi
1024 x 768 Pixel 500 dpi 300 dpi 150 dpi
zurück Übersicht vor
Scannen zur Ausgabe auf Druckern
Beachten Sie folgende Hinweise beim Scannen zur Ausgabe auf Druckern:
• Auch Schwarzweiß-Zeichnungen sollten (wie Schwarzweiß-Fotos) mit Graustufen eingelesen werden. Damit lässt sich im Ausdruck eine deutlich
höhere Endqualität erreichen. Dies geht allerdings auf Kosten der Dateigröße.
• Scannen Sie nur in Farbe, wenn der Ausdruck auch in Farbe erfolgt, da Farbdateien die dreifache Größe von entsprechenden S/W-Dateien
haben.
• Ein S/W-Laser- oder -Tintenstrahldrucker kann nur schwarze Punkte drucken, keine grauen. Abhilfe: Dithern, Rastern.
• Die Auflösung eines Druckers wird wie beim Scanner in
dpi = dots per inch = Bildpunkte pro Zoll angegeben.
Ein Scan-Pixel mit einem bestimmten Farbwert wird einem Bildschirmpixel mit den gleichen Farbwert zugeordnet. Physikalisch handelt es sich hierbei
um drei Bildschirmpunkte in den Grundfarben Rot, Grün und Blau. (Bedenken Sie jedoch, dass ältere Graphikkarten bei höheren Auflösungen oft
keine 16,7 Mio. Farben (24 Bit) darstellen können.)
Für die Abbildung in Originalgröße reicht das Scannen mit 90 dpi.
(Dies entspricht einer Rasterweite von 0,28 mm.)
zurück Übersicht vor
Scannen zur Bildschirmanzeige
Scannen von grafischen Elementen
Empfehlung zum Speichern der Bilder
Scannen zur Texterkennung (OCR)
So viel wie nötig, so wenig wie möglich...
ÜBERSICHTÜBERSICHT
Links zum Thema „Scannen“
Da eingelesene Bilder meist nicht direkt am Scanner-Arbeitsplatz ausgedruckt, sondern in andere Dokumente (Text, Graphik) eingebunden werden, müssen die Dateien in einem Format gespeichert werden, das die
im weiteren benutzte Software verarbeiten kann.
Wenn Sie eine größere Serie von Dateien zum ersten Mal für eine bestimmte Bearbeitung erfassen wollen, testen Sie die Einzelschritte erst
einmal mit einer oder wenigen Dateien.
zurück Übersicht vor
TIFF PNG (Portable Network Graphics)
Folgende universelle Formate haben sich durchgesetzt:
zurück Übersicht vor
Universelle Formate
unkomprimiert
LZW CITT 3
Für TIFF gibt es die folgenden Varianten:
Als universelles Format für verlustfreie Speicherung hat sich Als universelles Format für verlustfreie Speicherung hat sich das Format:das Format:
durchgesetzt.
Die Dateiendung ist meist "tif". Obwohl es viele Varianten dieses Formats gibt, können die meisten Programme damit umgehen.
zurück Übersicht vor
komprimiert
TIFF (Tag Image File Format)
LZW
LZW ist das beste TIFF-Komprimierungsformat.
Beispiel für ein Tiff-Bild mit LZW-Komprimierung (92 KB)
zurück Übersicht vor
CITT 3CITT 3 komprimiert Bilder in Schwarz/Weiß und ist daher nicht so gut für
Bilder sondern eher für Faxe geeignet.
Beispiel für ein Tiff-Bild mit CITT3-Komprimierung (3,88 KB)
zurück Übersicht vor
Im Kommen ist das Format:Im Kommen ist das Format:PNG
(Portable Network Graphics)
Beispiel für ein PNG Bild (47 KB)
Dieses Format umfasst sehr viele Varianten. Es wir allerdings noch nicht von vielen Programmen unterstützt.
zurück Übersicht vor
Komprimierungsstufe und
Kodierungsformat
einstellbar
Grafikdateien sind oft sehr groß. Kleinere Dateien erhalten Sie, wenn Sie den folgenden Empfehlungen folgen. Bedenken Sie auch, dass WWW-Browser (Netscape
Comm./Nav., Internet Explorer, ...) im Allgemeinen nur GIF und JPG (JPEG) unterstützen.
Speicherplatz Speicherplatz sparensparen
GrafikenGrafiken FotosFotos
zurück Übersicht vor
BildtypBildtyp
zurück Übersicht vor
Ausgabe in Farbe Ausgabe in s/w
Grafiken
zurück Übersicht vor
Farbige Grafiken
Reduktion der Farben auf 256 (8 Bit) oder 16 (4 Bit). Speichern als GIF. (Format unterstützt max. 256 Farben. Komprimiert verlustfrei und etwas besser als TIF/LZW.)
Beispiel für ein GIF Bild (2 KB)
zurück Übersicht vor
Schwarz/Weiß Grafiken
Reduktion der Farben auf 256 oder 16 Graustufen. Speichern als GIF.
Beispiel für ein GIF Bild S/W (1 KB)
zurück Übersicht vor
Ausgabe in Farbe Ausgabe in s/w
Fotos
Farbfotos
zurück Übersicht vor
Speichern als JPG (24 Bit; sehr Platz sparend (Kompressionsstufe wählbar), dafür nicht verlustfrei; fällt aber dem menschlichen Auge kaum auf).
Beispiel für ein JPG Bild (7 KB)
Schwarz/Weiß Fotos
zurück Übersicht vor
Speichern ebenfalls als JPG.
Durch vorherige Reduktion auf Graustufen lässt sich hier nur wenig sparen.
Beispiel für ein JPG Bild Graustufen (6,8 KB)
Scannen von grafischen Elementen
Empfehlung zum Speichern der Bilder
Scannen zur Texterkennung (OCR)
So viel wie nötig, so wenig wie möglich...
ÜBERSICHTÜBERSICHT
Links zum Thema „Scannen“
• Tipps zum Scannen 1
• Tipps zum Scannen 2
• Wie man Bilder die für das Internet geeignet sind, scannt
zurück Übersicht vor
Scannen von grafischen Elementen
Empfehlung zum Speichern der Bilder
Scannen zur Texterkennung (OCR)
So viel wie nötig, so wenig wie möglich...
ÜBERSICHTÜBERSICHT
Links zum Thema „Scannen“
Laserdrucker mit fester Punktmatrix benutzen das Dithern. Dabei werden Graustufen durch eine Anordnung mehrerer Druckpunkte simuliert. Je mehr Druckpunkte in einem bestimmten Gebiet (z.B. einer Druckfläche von 10 x 10 Punkten) schwarz sind, um so dunkler erscheint das Gebiet. Abbildung 1
zeigt, wie mit einer Matrix aus 4 x 4 Druckpunkten 17 Graustufen (inkl. Weiß) dargestellt werden können:
DithernDithern
Abb. 1: Dithern von 17 Graustufen
mit 4 x 4 Druckpunkten
zurück Übersicht vor
Beim Offsetdruck (z. B. Abbildungen in Tageszeitungen) wird das Rastern benutzt.
(Laserdrucker haben eine feste Punktgröße und sind daher schlecht zum Rastern geeignet.)
Graustufen werden durch unterschiedlich dicke Punkte simuliert.
Der Abstand zwischen den Punkten bleibt stets derselbe. Mit zu nehmendem Grauwert können sich die Punkte sogar überlappen:
RasternRastern
Abb. 2: Rastern mit
unterschiedlich dicken Punkten
zurück Übersicht vor