Zeichenerkennung ALGORITHMISCHE GEOMETRIE LEONID ZAVODNIK, 2014.

38
Zeichenerkennung ALGORITHMISCHE GEOMETRIE LEONID ZAVODNIK, 2014

Transcript of Zeichenerkennung ALGORITHMISCHE GEOMETRIE LEONID ZAVODNIK, 2014.

  • Folie 1
  • Zeichenerkennung ALGORITHMISCHE GEOMETRIE LEONID ZAVODNIK, 2014
  • Folie 2
  • Gliederung Was ist die Zeichenerkennung Anwendungen Schwierigkeiten Techniken der Erkennung Alternativen LEONID ZAVODNIK, 2014
  • Folie 3
  • Was ist Zeichenerkennung LEONID ZAVODNIK, 2014
  • Folie 4
  • Was ist Zeichenerkennung Klassifizierung des Eingangssymbols gem einer vorbestimmten Klasse LEONID ZAVODNIK, 2014
  • Folie 5
  • Anwendungen Digitalisierung von Bchern und Dokumenten Automatische berprfung von Klausuren Erkennung von Autokennzeichen Verkehrszeichenerkennung Chipkartenverarbeitungssystemen Adressen und Postleitzahl Erkennung LEONID ZAVODNIK, 2014
  • Folie 6
  • Schwierigkeiten hnliche Symbolen knnen in Gre, Form und Stil variieren Verschiedene Verzerrungen Keine klaren und strengen Zeichenbildungsregeln LEONID ZAVODNIK, 2014
  • Folie 7
  • Techniken LEONID ZAVODNIK, 2014 Online Direction Based, k-NN Classifier Offline ClusteringK-means, Hierarchical, SOM, EM Feature ExtractionProjection, Zoning, Border Transition, Graph Matching Pattern MatchingDirectional Artificial Neural NetworkBPNN, RBFNN, Parallel BPNN
  • Folie 8
  • Online-Methoden LEONID ZAVODNIK, 2014
  • Folie 9
  • Direction Based Algorithm Zeichen durch einen regulren Ausdruck modellieren Bewegungsrichtungen beschreiben 3 LEONID ZAVODNIK, 2014
  • Folie 10
  • Direction Based Algorithm LEONID ZAVODNIK, 2014
  • Folie 11
  • K-NN Classifier and DTW-Based Dissimilarity Measure Unhnlichkeit bewerten Alle Striche vergleichen Abstaende messen nchste-Nachbarn Regel benutzen Beste Probe auswhlen LEONID ZAVODNIK, 2014
  • Folie 12
  • Offline-Erkennung LEONID ZAVODNIK, 2014
  • Folie 13
  • Clustering Trennung der Daten in Gruppen Homogenitt innerhalb der Cluster Daten sind sehr hnlich in demselben Cluster Heterogenitt zwischen den Cluster Daten von unterschiedlichen Clustern haben maximale Unterschiede LEONID ZAVODNIK, 2014
  • Folie 14
  • K-Means-Algorithm Am hufigsten verwendeten Techniken zur Gruppierung von Objekten Optimiert die quadratischen Abweichungen von einem Mittelwert Nur mit numerischen Attributen verwendet werden LEONID ZAVODNIK, 2014
  • Folie 15
  • K-Means-Algorithm Clusterzentren werden zufllig gewhlt LEONID ZAVODNIK, 2014
  • Folie 16
  • K-Means-Algorithm Alle andere Punkte werden jeweils dem Cluster mit dem nchsten Clusterzentrum zugeordnet LEONID ZAVODNIK, 2014
  • Folie 17
  • K-Means-Algorithm Die Zentren der Cluster werden neu berechnet LEONID ZAVODNIK, 2014
  • Folie 18
  • K-Means-Algorithm Wiederholen alle Schritte LEONID ZAVODNIK, 2014
  • Folie 19
  • K-Means-Algorithm LEONID ZAVODNIK, 2014
  • Folie 20
  • Hierarchische Algorithmen Divisiven Agglomerativen LEONID ZAVODNIK, 2014
  • Folie 21
  • Hierarchische Algorithmen Vorteile Flexibilitt durch Verwendung komplexer Distanzmae Keine eigenen Parameter Ergebnis als Cluster- Hierarchie LEONID ZAVODNIK, 2014
  • Folie 22
  • Hierarchische Algorithmen Eingabe Ergebnis LEONID ZAVODNIK, 2014
  • Folie 23
  • Self Organizing Map (SOM) Algorithm Flexibel, stark und parallelisierbar Bilderkennung, Signalverarbeitung, Visualisierung Struktur 2 Schichten: Input und Mapping, vollstndig verbunden Jeder Mapping knoten initialisiert mit zuflligen Zahlen Lernen Der Unterschied zwischen Input-knoten und Mapping-knoten wird in einem Adaptionsschritt verringert Alle benachbarten Knoten proportional adaptiert LEONID ZAVODNIK, 2014
  • Folie 24
  • Self Organizing Map (SOM) Algorithm Ergebnis: rumliche Anordnung der Eingangsdaten, bei den hnlichen Regionen gruppiert LEONID ZAVODNIK, 2014
  • Folie 25
  • Expectation Maximization Algorithm 2 Schritte Expectation-Schritt die Punkte werden besser zugeordnet Maximization-Schritt das Modell wird so verndert, dass es besser zu den Daten passt LEONID ZAVODNIK, 2014
  • Folie 26
  • Expectation Maximization Algorithm LEONID ZAVODNIK, 2014
  • Folie 27
  • Feature Extraction Extraktion der wichtige Merkmale Seitenverhltnis Prozentuale Anzahl der Pixel Anzahl der Striche Durchschnittliche Entfernung von der Mitte Symmetrie bezglich der Koordinatenachsen Mehr Kontrolle ber die Merkmale Entwicklungzeit wchst LEONID ZAVODNIK, 2014
  • Folie 28
  • Projection Method Schwarzen Pixel auf Achsen projizieren Feature: die Anzahl der Pixel g LEONID ZAVODNIK, 2014
  • Folie 29
  • Zoning Symbol in kleine Fragmente teilen Feature: Anzahl (Durschnitt) der Pixel in jedem Fragment LEONID ZAVODNIK, 2014 g
  • Folie 30
  • Border Transition Technique (BTT) Symbol in vier Quadranten teilen Feature: Anzahl der zero to one transitions in jedem Quadrant LEONID ZAVODNIK, 2014
  • Folie 31
  • Graph Matching Method End point verbindet nur ein Pixel Curve point verbindet zwei Pixel Branch point verbindet drei oder mehr Pixel LEONID ZAVODNIK, 2014 3
  • Folie 32
  • Pattern Matching Zeichen durch die Analyse von Form und der Vergleich der Merkmale identifiziert Photometric pattern matching Arbeitet mit Bild als eine Matrix von Intensittswerten oder Funktionen Geometric pattern matching Arbeitet mit der Geometrie des Objekts LEONID ZAVODNIK, 2014
  • Folie 33
  • Pattern Matching Hohe Bearbeitungsgeschwindigkeit Unwirksam, wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unntige Verbindungen oder zerrissene Striche gibt Vorgehensweise Symbol auf eine normierte Gre bringen In Blcke gruppiert (z.B. 8x8), um die Anzahl der Merkmale zu reduzieren Die Kanten mit Lowpassfiltering und Downsampling gltten Die Merkmale vergleichen LEONID ZAVODNIK, 2014
  • Folie 34
  • Patternerkennung A 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 LEONID ZAVODNIK, 2014
  • Folie 35
  • Patternerkennung Mitte der Matrix finden Radius berechnen Durch die Anzahl der Spuren teilen Sektoren bestimmen Trek-Sector Matrix generieren Anzahl von 1 auf jedem Schnittpunkt des Sektors und der Spur zhlen Die resultierende Matrix mit Vorlagen aus der Datenbank vergleichen LEONID ZAVODNIK, 2014 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1
  • Folie 36
  • Artificial Neural Network Lernfhig, flexibel Niedrige Reaktionszeit Hohe Geschwindigkeit Fr Echtzeitsysteme gut geeignet Verbindungen mit Gewichte Zusammenhnge zwischen Eingngen und Ausgngen Korrekte Ergebnis bei unvollstndigen (verzerrten) Daten LEONID ZAVODNIK, 2014
  • Folie 37
  • Alternative OCR Ungenauigkeit >30% reCAPTCHA fr Digitalisierung der Bcher 1 000 000 Wrter pro Tag 2 500 000 Bcher pro Jahr 2009 - Google gekauft Fr Googlemaps benutzt http://www.ted.com/talks/luis_von_ahn_ma ssive_scale_online_collaboration LEONID ZAVODNIK, 2014
  • Folie 38
  • Quellen Suruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M. Sapkal: Survey of Methods for Character Recognition, S. 180-189, ISSN: 2277-3754 http://ijeit.com/vol 1/Issue 5/IJEIT1412201205_36.pdf (17.06.2014)http://ijeit.com/vol 1/Issue 5/IJEIT1412201205_36.pdf Faisal Mohammad, Jyoti Anarase, Milan Shingote, Pratik Ghanwat: Optical Character Recognition Implementation Using Pattern Matching, S. 2089, ISSN: 0975-9646 http://www.ijcsit.com/docs/Volume 5/vol5issue02/ijcsit20140502254.pdf (17.06.2014)http://www.ijcsit.com/docs/Volume 5/vol5issue02/ijcsit20140502254.pdf http://de.wikipedia.org/wiki/K-Means-Algorithmus (17.06.2014)http://de.wikipedia.org/wiki/K-Means-Algorithmus http://de.wikipedia.org/wiki/EM-Algorithmus (17.06.2014)http://de.wikipedia.org/wiki/EM-Algorithmus http://de.wikipedia.org/wiki/Selbstorganisierende_Karte (17.06.2014)http://de.wikipedia.org/wiki/Selbstorganisierende_Karte LEONID ZAVODNIK, 2014