Zeichenerkennung

38
Zeichenerkennung ALGORITHMISCHE GEOMETRIE LEONID ZAVODNIK, 2014

description

Zeichenerkennung. Algorithmische Geometrie. Gliederung. Was ist die Zeichenerkennung Anwendungen Schwierigkeiten Techniken der Erkennung Alternativen. Was ist Zeichenerkennung. Was ist Zeichenerkennung. Klassifizierung des Eingangssymbols gemäß einer vorbestimmten Klasse. Anwendungen. - PowerPoint PPT Presentation

Transcript of Zeichenerkennung

Zeichen-Erkennung

ZeichenerkennungAlgorithmische GeometrieLeonid Zavodnik, 20141GliederungWas ist die ZeichenerkennungAnwendungenSchwierigkeiten Techniken der ErkennungAlternativenLeonid Zavodnik, 2014Was ist Zeichenerkennung

Leonid Zavodnik, 2014Was ist ZeichenerkennungKlassifizierung des Eingangssymbols gem einer vorbestimmten Klasse

Leonid Zavodnik, 2014AnwendungenDigitalisierung von Bchern und DokumentenAutomatische berprfung von KlausurenErkennung von AutokennzeichenVerkehrszeichenerkennungChipkartenverarbeitungssystemenAdressen und Postleitzahl ErkennungLeonid Zavodnik, 2014Schwierigkeitenhnliche Symbolen knnen in Gre, Form und Stil variierenVerschiedene VerzerrungenKeine klaren und strengen ZeichenbildungsregelnLeonid Zavodnik, 2014TechnikenLeonid Zavodnik, 2014Online-Methoden

Leonid Zavodnik, 2014Direction Based AlgorithmZeichen durch einen regulren Ausdruck modellierenBewegungsrichtungen beschreiben3Leonid Zavodnik, 2014Direction Based Algorithm

Leonid Zavodnik, 2014K-NN Classifier and DTW-Based Dissimilarity MeasureUnhnlichkeit bewertenAlle Striche vergleichenAbstaende messennchste-Nachbarn Regel benutzenBeste Probe auswhlen

Leonid Zavodnik, 2014Offline-Erkennung

Leonid Zavodnik, 2014ClusteringTrennung der Daten in Gruppen Homogenitt innerhalb der ClusterDaten sind sehr hnlich in demselben ClusterHeterogenitt zwischen den ClusterDaten von unterschiedlichen Clustern haben maximale UnterschiedeLeonid Zavodnik, 2014K-Means-AlgorithmAm hufigsten verwendeten Techniken zur Gruppierung von ObjektenOptimiert die quadratischen Abweichungen von einem MittelwertNur mit numerischen Attributen verwendet werdenLeonid Zavodnik, 2014K-Means-AlgorithmClusterzentren werden zufllig gewhlt

Leonid Zavodnik, 2014K-Means-AlgorithmAlle andere Punkte werden jeweils dem Cluster mit dem nchsten Clusterzentrum zugeordnetLeonid Zavodnik, 2014

K-Means-AlgorithmDie Zentren der Cluster werden neu berechnetLeonid Zavodnik, 2014

K-Means-AlgorithmWiederholen alle SchritteLeonid Zavodnik, 2014

K-Means-AlgorithmLeonid Zavodnik, 2014Hierarchische AlgorithmenDivisiven

AgglomerativenLeonid Zavodnik, 2014Hierarchische AlgorithmenVorteileFlexibilittdurch Verwendung komplexer DistanzmaeKeine eigenen ParameterErgebnis als Cluster-Hierarchie Leonid Zavodnik, 2014Hierarchische AlgorithmenEingabe

ErgebnisLeonid Zavodnik, 2014

Self Organizing Map (SOM) AlgorithmFlexibel, stark und parallelisierbarBilderkennung, Signalverarbeitung, VisualisierungStruktur2 Schichten: Input und Mapping, vollstndig verbundenJeder Mapping knoten initialisiert mit zuflligen ZahlenLernenDer Unterschied zwischen Input-knoten und Mapping-knoten wird in einem Adaptionsschritt verringertAlle benachbarten Knoten proportional adaptiertLeonid Zavodnik, 2014Self Organizing Map (SOM) AlgorithmErgebnis: rumliche Anordnung der Eingangsdaten, bei den hnlichen Regionen gruppiert

Leonid Zavodnik, 2014

Expectation Maximization Algorithm2 SchritteExpectation-Schrittdie Punkte werden besser zugeordnetMaximization-Schrittdas Modell wird so verndert, dass es besser zu den Daten passtLeonid Zavodnik, 2014Expectation Maximization AlgorithmLeonid Zavodnik, 2014

Feature ExtractionExtraktion der wichtige MerkmaleSeitenverhltnisProzentuale Anzahl der PixelAnzahl der StricheDurchschnittliche Entfernung von der MitteSymmetrie bezglich der KoordinatenachsenMehr Kontrolle ber die MerkmaleEntwicklungzeit wchstLeonid Zavodnik, 2014Projection MethodSchwarzen Pixel auf Achsen projizierenFeature: die Anzahl der PixelgLeonid Zavodnik, 2014ZoningSymbol in kleine Fragmente teilenFeature: Anzahl (Durschnitt) der Pixel in jedem Fragment Leonid Zavodnik, 2014gBorder Transition Technique (BTT)Symbol in vier Quadranten teilenFeature: Anzahl der zerotoone transitions in jedem QuadrantLeonid Zavodnik, 2014gGraph Matching MethodEnd point verbindet nur ein Pixel Curve point verbindet zwei PixelBranch point verbindet drei oder mehr PixelLeonid Zavodnik, 20143Pattern MatchingZeichen durch die Analyse von Form und der Vergleich der Merkmale identifiziertPhotometric pattern matchingArbeitet mit Bild als eine Matrix von Intensittswerten oder Funktionen Geometric pattern matchingArbeitet mit der Geometrie des ObjektsLeonid Zavodnik, 2014Pattern MatchingHohe BearbeitungsgeschwindigkeitUnwirksam, wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unntige Verbindungen oder zerrissene Striche gibtVorgehensweiseSymbol auf eine normierte Gre bringenIn Blcke gruppiert (z.B. 8x8), um die Anzahl der Merkmale zu reduzierenDie Kanten mit Lowpassfiltering und Downsampling glttenDie Merkmale vergleichenLeonid Zavodnik, 2014PatternerkennungA0 0 0 0 0 0 1 1 0 0 0 0 0 0 00 0 0 0 0 0 1 1 0 0 0 0 0 0 00 0 0 0 0 1 1 1 1 0 0 0 0 0 00 0 0 0 0 1 1 0 1 0 0 0 0 0 00 0 0 0 1 1 0 0 1 1 0 0 0 0 00 0 0 0 1 1 0 0 1 1 0 0 0 0 00 0 0 1 1 0 0 0 0 1 1 0 0 0 00 0 0 1 1 0 0 0 0 1 1 0 0 0 00 0 0 1 1 0 0 0 0 1 0 1 0 0 00 0 1 0 0 1 1 1 1 0 0 1 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 00 1 1 0 0 0 0 0 0 0 0 1 1 0 00 1 1 0 0 0 0 0 0 0 0 0 1 1 01 1 0 0 0 0 0 0 0 0 0 0 1 1 01 1 0 0 0 0 0 0 0 0 0 0 0 1 1Leonid Zavodnik, 2014PatternerkennungMitte der Matrix findenRadius berechnenDurch die Anzahl der Spuren teilenSektoren bestimmenTrek-Sector Matrix generierenAnzahl von 1 auf jedem Schnittpunkt des Sektors und der Spur zhlenDie resultierende Matrix mit Vorlagen aus der Datenbank vergleichenLeonid Zavodnik, 20140 0 0 0 0 0 1 1 0 0 0 0 0 0 00 0 0 0 0 0 1 1 0 0 0 0 0 0 00 0 0 0 0 1 1 1 1 0 0 0 0 0 00 0 0 0 0 1 1 0 1 0 0 0 0 0 00 0 0 0 1 1 0 0 1 1 0 0 0 0 00 0 0 0 1 1 0 0 1 1 0 0 0 0 00 0 0 1 1 0 0 0 0 1 1 0 0 0 00 0 0 1 1 0 0 0 0 1 1 0 0 0 00 0 0 1 1 0 0 0 0 1 0 1 0 0 00 0 1 0 0 1 1 1 1 0 0 1 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 00 1 1 0 0 0 0 0 0 0 0 1 1 0 00 1 1 0 0 0 0 0 0 0 0 0 1 1 01 1 0 0 0 0 0 0 0 0 0 0 1 1 01 1 0 0 0 0 0 0 0 0 0 0 0 1 1Artificial Neural NetworkLernfhig, flexibelNiedrige Reaktionszeit Hohe GeschwindigkeitFr Echtzeitsysteme gut geeignet

Verbindungen mit GewichteZusammenhnge zwischen Eingngen und AusgngenKorrekte Ergebnis bei unvollstndigen (verzerrten) Daten

Leonid Zavodnik, 2014AlternativeOCR Ungenauigkeit >30%reCAPTCHA fr Digitalisierung der Bcher1 000 000 Wrter pro Tag2 500 000 Bcher pro Jahr2009- Google gekauftFr Googlemaps benutzthttp://www.ted.com/talks/luis_von_ahn_massive_scale_online_collaboration

Leonid Zavodnik, 2014QuellenSuruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M. Sapkal: Survey of Methods for Character Recognition, S. 180-189, ISSN: 2277-3754http://ijeit.com/vol 1/Issue 5/IJEIT1412201205_36.pdf (17.06.2014)Faisal Mohammad, Jyoti Anarase, Milan Shingote, Pratik Ghanwat: Optical Character Recognition Implementation Using Pattern Matching, S. 2089, ISSN: 0975-9646http://www.ijcsit.com/docs/Volume 5/vol5issue02/ijcsit20140502254.pdf (17.06.2014)http://de.wikipedia.org/wiki/K-Means-Algorithmus (17.06.2014)http://de.wikipedia.org/wiki/EM-Algorithmus (17.06.2014)http://de.wikipedia.org/wiki/Selbstorganisierende_Karte (17.06.2014)Leonid Zavodnik, 2014