Zeichenerkennung ALGORITHMISCHE GEOMETRIE LEONID ZAVODNIK,
2014
Folie 2
Gliederung Was ist die Zeichenerkennung Anwendungen
Schwierigkeiten Techniken der Erkennung Alternativen LEONID
ZAVODNIK, 2014
Folie 3
Was ist Zeichenerkennung LEONID ZAVODNIK, 2014
Folie 4
Was ist Zeichenerkennung Klassifizierung des Eingangssymbols
gem einer vorbestimmten Klasse LEONID ZAVODNIK, 2014
Folie 5
Anwendungen Digitalisierung von Bchern und Dokumenten
Automatische berprfung von Klausuren Erkennung von Autokennzeichen
Verkehrszeichenerkennung Chipkartenverarbeitungssystemen Adressen
und Postleitzahl Erkennung LEONID ZAVODNIK, 2014
Folie 6
Schwierigkeiten hnliche Symbolen knnen in Gre, Form und Stil
variieren Verschiedene Verzerrungen Keine klaren und strengen
Zeichenbildungsregeln LEONID ZAVODNIK, 2014
Folie 7
Techniken LEONID ZAVODNIK, 2014 Online Direction Based, k-NN
Classifier Offline ClusteringK-means, Hierarchical, SOM, EM Feature
ExtractionProjection, Zoning, Border Transition, Graph Matching
Pattern MatchingDirectional Artificial Neural NetworkBPNN, RBFNN,
Parallel BPNN
Folie 8
Online-Methoden LEONID ZAVODNIK, 2014
Folie 9
Direction Based Algorithm Zeichen durch einen regulren Ausdruck
modellieren Bewegungsrichtungen beschreiben 3 LEONID ZAVODNIK,
2014
Folie 10
Direction Based Algorithm LEONID ZAVODNIK, 2014
Folie 11
K-NN Classifier and DTW-Based Dissimilarity Measure
Unhnlichkeit bewerten Alle Striche vergleichen Abstaende messen
nchste-Nachbarn Regel benutzen Beste Probe auswhlen LEONID
ZAVODNIK, 2014
Folie 12
Offline-Erkennung LEONID ZAVODNIK, 2014
Folie 13
Clustering Trennung der Daten in Gruppen Homogenitt innerhalb
der Cluster Daten sind sehr hnlich in demselben Cluster
Heterogenitt zwischen den Cluster Daten von unterschiedlichen
Clustern haben maximale Unterschiede LEONID ZAVODNIK, 2014
Folie 14
K-Means-Algorithm Am hufigsten verwendeten Techniken zur
Gruppierung von Objekten Optimiert die quadratischen Abweichungen
von einem Mittelwert Nur mit numerischen Attributen verwendet
werden LEONID ZAVODNIK, 2014
Folie 15
K-Means-Algorithm Clusterzentren werden zufllig gewhlt LEONID
ZAVODNIK, 2014
Folie 16
K-Means-Algorithm Alle andere Punkte werden jeweils dem Cluster
mit dem nchsten Clusterzentrum zugeordnet LEONID ZAVODNIK,
2014
Folie 17
K-Means-Algorithm Die Zentren der Cluster werden neu berechnet
LEONID ZAVODNIK, 2014
Folie 18
K-Means-Algorithm Wiederholen alle Schritte LEONID ZAVODNIK,
2014
Folie 19
K-Means-Algorithm LEONID ZAVODNIK, 2014
Folie 20
Hierarchische Algorithmen Divisiven Agglomerativen LEONID
ZAVODNIK, 2014
Folie 21
Hierarchische Algorithmen Vorteile Flexibilitt durch Verwendung
komplexer Distanzmae Keine eigenen Parameter Ergebnis als Cluster-
Hierarchie LEONID ZAVODNIK, 2014
Folie 22
Hierarchische Algorithmen Eingabe Ergebnis LEONID ZAVODNIK,
2014
Folie 23
Self Organizing Map (SOM) Algorithm Flexibel, stark und
parallelisierbar Bilderkennung, Signalverarbeitung, Visualisierung
Struktur 2 Schichten: Input und Mapping, vollstndig verbunden Jeder
Mapping knoten initialisiert mit zuflligen Zahlen Lernen Der
Unterschied zwischen Input-knoten und Mapping-knoten wird in einem
Adaptionsschritt verringert Alle benachbarten Knoten proportional
adaptiert LEONID ZAVODNIK, 2014
Folie 24
Self Organizing Map (SOM) Algorithm Ergebnis: rumliche
Anordnung der Eingangsdaten, bei den hnlichen Regionen gruppiert
LEONID ZAVODNIK, 2014
Folie 25
Expectation Maximization Algorithm 2 Schritte
Expectation-Schritt die Punkte werden besser zugeordnet
Maximization-Schritt das Modell wird so verndert, dass es besser zu
den Daten passt LEONID ZAVODNIK, 2014
Folie 26
Expectation Maximization Algorithm LEONID ZAVODNIK, 2014
Folie 27
Feature Extraction Extraktion der wichtige Merkmale
Seitenverhltnis Prozentuale Anzahl der Pixel Anzahl der Striche
Durchschnittliche Entfernung von der Mitte Symmetrie bezglich der
Koordinatenachsen Mehr Kontrolle ber die Merkmale Entwicklungzeit
wchst LEONID ZAVODNIK, 2014
Folie 28
Projection Method Schwarzen Pixel auf Achsen projizieren
Feature: die Anzahl der Pixel g LEONID ZAVODNIK, 2014
Folie 29
Zoning Symbol in kleine Fragmente teilen Feature: Anzahl
(Durschnitt) der Pixel in jedem Fragment LEONID ZAVODNIK, 2014
g
Folie 30
Border Transition Technique (BTT) Symbol in vier Quadranten
teilen Feature: Anzahl der zero to one transitions in jedem
Quadrant LEONID ZAVODNIK, 2014
Folie 31
Graph Matching Method End point verbindet nur ein Pixel Curve
point verbindet zwei Pixel Branch point verbindet drei oder mehr
Pixel LEONID ZAVODNIK, 2014 3
Folie 32
Pattern Matching Zeichen durch die Analyse von Form und der
Vergleich der Merkmale identifiziert Photometric pattern matching
Arbeitet mit Bild als eine Matrix von Intensittswerten oder
Funktionen Geometric pattern matching Arbeitet mit der Geometrie
des Objekts LEONID ZAVODNIK, 2014
Folie 33
Pattern Matching Hohe Bearbeitungsgeschwindigkeit Unwirksam,
wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unntige
Verbindungen oder zerrissene Striche gibt Vorgehensweise Symbol auf
eine normierte Gre bringen In Blcke gruppiert (z.B. 8x8), um die
Anzahl der Merkmale zu reduzieren Die Kanten mit Lowpassfiltering
und Downsampling gltten Die Merkmale vergleichen LEONID ZAVODNIK,
2014
Artificial Neural Network Lernfhig, flexibel Niedrige
Reaktionszeit Hohe Geschwindigkeit Fr Echtzeitsysteme gut geeignet
Verbindungen mit Gewichte Zusammenhnge zwischen Eingngen und
Ausgngen Korrekte Ergebnis bei unvollstndigen (verzerrten) Daten
LEONID ZAVODNIK, 2014
Folie 37
Alternative OCR Ungenauigkeit >30% reCAPTCHA fr
Digitalisierung der Bcher 1 000 000 Wrter pro Tag 2 500 000 Bcher
pro Jahr 2009 - Google gekauft Fr Googlemaps benutzt
http://www.ted.com/talks/luis_von_ahn_ma
ssive_scale_online_collaboration LEONID ZAVODNIK, 2014
Folie 38
Quellen Suruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M.
Sapkal: Survey of Methods for Character Recognition, S. 180-189,
ISSN: 2277-3754 http://ijeit.com/vol 1/Issue
5/IJEIT1412201205_36.pdf (17.06.2014)http://ijeit.com/vol 1/Issue
5/IJEIT1412201205_36.pdf Faisal Mohammad, Jyoti Anarase, Milan
Shingote, Pratik Ghanwat: Optical Character Recognition
Implementation Using Pattern Matching, S. 2089, ISSN: 0975-9646
http://www.ijcsit.com/docs/Volume
5/vol5issue02/ijcsit20140502254.pdf
(17.06.2014)http://www.ijcsit.com/docs/Volume
5/vol5issue02/ijcsit20140502254.pdf
http://de.wikipedia.org/wiki/K-Means-Algorithmus
(17.06.2014)http://de.wikipedia.org/wiki/K-Means-Algorithmus
http://de.wikipedia.org/wiki/EM-Algorithmus
(17.06.2014)http://de.wikipedia.org/wiki/EM-Algorithmus
http://de.wikipedia.org/wiki/Selbstorganisierende_Karte
(17.06.2014)http://de.wikipedia.org/wiki/Selbstorganisierende_Karte
LEONID ZAVODNIK, 2014