Kantenerkennung in Bildern

39
Leopold-Franzens-Universit¨ at Innsbruck Institut f¨ ur Informatik Gruppe Infmath Imaging Bakkalaureatsarbeit Kantenerkennung in Bildern Thomas Zangerl Betreuer: Dr. Andreas Obereder Pfons, den 3. Juni 2007

description

Kantenerkennung ist einer der wichtigsten Schritte im menschlichen und automatisierten Erkennen von Bildinhalten. Es existiert eine dementsprechend fast überwältigend große Anzahl an Herangehensweisen und Algorithmen.Die meisten dieser Annäherungen an das Thema fußen auf der ersten und/oder zweiten Ableitung der Bildintensitätswerte, kombiniert mit allgemein anerkannten Schritten zur Verbesserung der Ergebnisse, wie Nonmaxima-Unterdrückung oder Hysterese. Diese Arbeit versucht einen Querschnitt durch einen Großteil kürzlich vorgestellter und allgemein bekannter Verfahren zu geben und konzentriert sich ferner auf alternative Zugänge, wie sie von Haralick und Smith und Brady vorgestellt wurden.

Transcript of Kantenerkennung in Bildern

Page 1: Kantenerkennung in Bildern

Leopold-Franzens-UniversitatInnsbruck

Institut fur InformatikGruppe Infmath Imaging

Bakkalaureatsarbeit

Kantenerkennung in Bildern

Thomas Zangerl

Betreuer: Dr. Andreas Obereder

Pfons, den 3. Juni 2007

Page 2: Kantenerkennung in Bildern

Zusammenfassung

Kantenerkennung ist einer der wichtigsten Schritte im menschlichenund automatisierten Erkennen von Bildinhalten. Es existiert eine dement-sprechend fast uberwaltigend große Anzahl an Herangehensweisen und Al-gorithmen. Die meisten dieser Annaherungen an das Thema fußen auf derersten und/oder zweiten Ableitung der Bildintensitatswerte, kombiniertmit allgemein anerkannten Schritten zur Verbesserung der Ergebnisse, wieNonmaxima-Unterdruckung oder Hysterese. Diese Arbeit versucht einenQuerschnitt durch einen Großteil kurzlich vorgestellter und allgemein be-kannter Verfahren zu geben und konzentriert sich ferner auf alternativeZugange, wie sie von Haralick in [1] und Smith und Brady in [2] vorgestelltwurden.

Abstract

Edge detection is one of the most important steps in human andmachine-driven low level image processing. Accordingly, there is an amaz-ing number of algorithms and problem solution proposals. Most of theseapproaches deal with the first and/or second derivative of the image pixelintensity values, combined with steps like non-maximal suppression orhysteresis, which are generally considered useful in improving the results.This paper gives a synopsis over both methods introduced lately and gen-erally known, while furtherly concentrating on alternative approaches, asintroduced by Haralick in [1] and Smith and Brady in [2].

1

Page 3: Kantenerkennung in Bildern

Inhaltsverzeichnis

1 Uberblick uber aktuelle Kantenerkennungsverfahren 4

1.1 Klassische gradientenbasierte Kantendetektoren . . . . . . . . . . 4

1.1.1 Sobel-Operator . . . . . . . . . . . . . . . . . . . . . . . . 4

1.1.2 Prewitt-Operator . . . . . . . . . . . . . . . . . . . . . . . 5

1.1.3 Roberts-Operator . . . . . . . . . . . . . . . . . . . . . . . 5

1.1.4 Kompass-Operatoren . . . . . . . . . . . . . . . . . . . . . 5

1.2 Detektoren auf Basis der zweiten Ableitung . . . . . . . . . . . . 6

1.2.1 Laplacian of Gaussian (LoG) . . . . . . . . . . . . . . . . 6

1.2.2 Difference of Gaussians (DoG) . . . . . . . . . . . . . . . 9

1.3 Kantenerkennung nach dem Canny-Muster . . . . . . . . . . . . 10

1.3.1 Canny-Filter . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.2 Rothwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.3 Edison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.4 Iverson-Zucker . . . . . . . . . . . . . . . . . . . . . . . . 14

1.4 Kantenerkennung mithilfe neuronaler Netze . . . . . . . . . . . . 16

1.4.1 Bezdek . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.5 Kantenerkennung mittels anisotroper Diffusion . . . . . . . . . . 17

1.5.1 Black . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2 Kantenerkennung abseits des ”Mainstreams“ 20

2.1 Parametrische Kantenmodelle . . . . . . . . . . . . . . . . . . . . 20

2.1.1 Sloped Facet Models . . . . . . . . . . . . . . . . . . . . . 20

2.1.2 Integrierter Gradientendetektor . . . . . . . . . . . . . . . 21

2.1.3 Nulldurchgange der 2. Ableitung mit Cubic Facet Models 24

2.2 Kantenerkennung ohne Ableitung . . . . . . . . . . . . . . . . . . 25

2.2.1 SUSAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3 Zusammenfassung und Ausblick 28

A Qualitativer und quantitativer Vergleich von Kantendetektoren 30

2

Page 4: Kantenerkennung in Bildern

A.1 Pratt-Metrik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

A.2 Rosenfeld-Metrik . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

B Methoden zur Konturaufbesserung 31

B.1 Nonmaxima-Unterdruckung . . . . . . . . . . . . . . . . . . . . . 31

B.2 Hysterese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

B.3 Thinning-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . 32

C Interpolation durch Polynome 33

3

Page 5: Kantenerkennung in Bildern

1 Uberblick uber aktuelle Kantenerkennungsver-fahren

1.1 Klassische gradientenbasierte Kantendetektoren

1.1.1 Sobel-Operator

Der Sobel-Operator gehort gemeinsam mit dem Prewitt-Operator, dem Roberts-Cross-Operator und den Kompass-Operatoren zu den einfachsten, altesten undwohl auch, gemessen an den meisten Metriken, qualitativ schwachsten Algo-rithmen. Dennoch wird er in der Realitat haufig eingesetzt, was aber auch mitseiner Implementierungseinfachheit zu tun haben durfte. Prinzipiell bildet dasVerfahren nur die Richtungsableitungen in x und y Richtung mit Hilfe einerFaltungsmatrix und errechnet sich so eine geschatzte Kantenstarke.Die Faltungsmatrizen, die Annaherungen an die jeweiligen Richtungsableitungendarstellen, sehen dann so aus:

HSx =

−1 0 1−2 0 2−1 0 1

HSy =

−1 −2 −10 0 01 2 1

Die Kantenstarke kann durch die L2-Norm der Faltungen berechnet werden:

E (u, v) =√

(Dx(u, v))2 + (Dy(u, v))2

wobei D(u, v) den Wert des Pixels mit Index uv nach der Faltung mit denoben vorgestellten Matrizen darstellt. Oft beschrankt man sich darauf, nur dieSumme der Betrage der Ableitungen als Annaherung an die Kantenstarke zubetrachten.

Oftmals erweist es sich als nutzlich, wenn man Informationen uber die ge-schatzte Kantenrichtung in einem Kantenpixelkandidaten gewinnen kann, sozum Beispiel in Schritten die zur Konturaufbesserung verwendet werden (sieheB.1).Ein Vorteil des Sobel-Verfahrens ist, dass diese leicht mit folgender Formel zugewinnen sind:

φ(u, v) = tan−1

(Dy(u, v)Dx(u, v)

)Der Sobel Operator ist zwar recht einfach zu implementieren und relativ schnell,hat aber einige Nachteile:

• Schmale Kanten werden durch die Glattung oft verbreitert.

• Der Algorithmus ist relativ rauschanfallig, da er vor allem hochfrequenteAnteile verstarkt.

• Kanten, deren Kontrastanderungen uber einen zu großen Bereich verlaufen(”feine“ Ubergange), um in einer 3 x 3 Umgebung ersichtlich zu sein,

4

Page 6: Kantenerkennung in Bildern

werden von dem Filter nicht erkannt. Allerdings kann dieser Vorwurfjedem Filter, das mit kleinen Masken arbeitet, gemacht werden und istsomit eher Teil eines allgemeinen Kompromisses zwischen Maskengroßeund Erkennungsleistung.Auch wird man leicht argumentieren konnen, dass prozentuell gesehen eineher geringer Anteil der Kanten solche Eigenschaften aufweist.

• Der Operator ist eigentlich obsolet und nur aufgrund seiner Einfachheitbeliebt. Will man auf ein gut dokumentiertes Standardverfahren zuruck-greifen, so ware der Canny-Algorithmus auf jeden Fall zu bevorzugen.

1.1.2 Prewitt-Operator

Der Prewitt-Operator verwendet exakt die gleiche Technik, wie der Sobel-Operator, der einzige Unterschied sind die Masken, die als Annaherung an dieBerechung des Gradienten der Bildfunktion verwendet werden. Diese legen weni-ger Wert auf die zentrale Zeile bzw. Spalte und stellen, separiert dargestellt, eineeinfache Glattung uber drei Zeilen mit anschließender Gradientenberechnungdar.Da der Prewitt-Operator gleich funktioniert, wie der Sobel-Operator, aber schlech-tere Ergebnisse liefert, wird er in der Praxis praktisch nicht mehr eingesetzt. Hiersei er nur der Vollstandigkeit halber erwahnt.

1.1.3 Roberts-Operator

Dieser Operator gilt als einer der altesten Kantenoperatoren uberhaupt undverwendet lediglich 2x2 Filter, was angesichts heutiger Kantenerkennungsmas-ken als durchaus exotisch betrachtet werden darf.Die Filter schatzen den Gradienten in Richtung der Diagonalen - die Erken-nungsleistung des Operators halt dem Vergleich mit neueren und neuesten Tech-niken allerdings bei weitem nicht stand.

1.1.4 Kompass-Operatoren

Die Idee, die hinter der Schaffung von Kompass-Operatoren stand, war, dassviele Filter in ihrer Erkennungsleistung oft stark richtungsabhangig sind. Daherlag der Versuch, einen Satz ”engerer“ Filter zu verwenden, die dafur fur mehrereRichtungen ausgelegt sind, recht nahe.

Die Faltungsmatrizen, die man verwenden soll, sind nicht vorgeschrieben;prinzipiell konnen beliebige zur Kantenerkennung geeignete Matrizen verwendetwerden, die jeweils in 45◦ Winkeln gedreht werden.Ein Beispiel mit dem Sobel-Operator wurde folgendermaßen aussehen:

HK0 =

−1 0 1−2 0 2−1 0 1

HK1 =

−2 −1 0−1 0 1

0 1 2

5

Page 7: Kantenerkennung in Bildern

HK2 =

−1 −2 −10 0 01 2 1

HK3 =

0 −1 −21 0 −12 1 0

Eine angenehme Eigenschaft ist, dass die Filtermasken H4 bis H7 −H0 bisH3 entsprechen, denn so muss aufgrund der Linearitat der Faltung auch dasgefilterte Bild zur Errechnung von D4 bis D7 nur mit -1 multipliziert werden.

Bezeichnen D0 . . . D7 die einzelnen Filterergebnisse, dann ist die eigentlicheKantenstarke EK definiert als die L8-Norm der Faltungen:

EK(u, v) = max(|D0(u, v)|, |D1(u, v)|, D2(u, v)|, |D3(u, v)|),

Auch bei diesem Verfahren kann man sich die Kantenrichtung einfach errechnen;dargestellt durch das am starksten ansprechende Filter:

φK(u, v) =π

4j

wobei j dem Di mit dem jeweils großten Wert entspricht.Eine Eigenschaft, die sich bei Kompassoperatoren erstmals bemerken lasst, sichaber wie ein roter Faden durch zahlreiche Vorschlage, die zur Kantenerkennunggemacht werden, zieht, ist, dass sich ein theoretisch formulierbares Verbesse-rungspotenzial nicht unbedingt auf die Praxis auswirken muss. (Am starkstensichtbar wird dies in [3], wo sich der Canny-Operator gegenuber all seinenWeiterentwicklungen mit der besten Erkennungsleistung behauptet).So verfugen auch die Kompassoperatoren uber wenig reelle Vorteile gegenuberdem Sobel-Operator:

• Ein nennenswerter Vorteil ist, dass ein Kompass-Operator aufgrund derbesseren Abdeckung verschiedener Richtungen auf Kanten, die fur denreinen Sobel-Operator ungunstig gelegen sind, besser reagiert.

• Jedoch mussen hier vier Faltungsoperationen auf jeden Pixel angewandtwerden, wahrend der z.B. der Sobel Operator mit zwei auskommt.

• Kompass-Operatoren sind ebenfalls stark rauschanfallig.

• Es ergeben sich oft nur fur klare, starke Linien eindeutige Muster.

• Die Qualitat des Ergebnisses des Operators ist oft abhangig von der Großedes Objekts bzw. der Abruptheit der Kante.

1.2 Detektoren auf Basis der zweiten Ableitung

1.2.1 Laplacian of Gaussian (LoG)

Geschichtlich betrachtet sind Kantendetektoren auf Basis der zweiten Ablei-tung sozusagen die nachste Evolutionsstufe nach den einfachen Gradientenfil-

6

Page 8: Kantenerkennung in Bildern

tern und haben sich vor Cannys viel beachteter Arbeit sehr großer Popularitaterfreut.

In [5] entwickeln Marr und Hildreth einen Operator, den sie auf die Sehvor-gange des Menschen zuruckfuhren (es wurde allerdings gezeigt, dass die Techniknur ein Teil menschlicher Bilderkennung ist).Dieser Operator, der die zweite Ableitung einer Gauß-Funktion darstellt, wirdmeistens unter der aussagekraftigen Bezeichnung Laplacian of Gaussian ange-fuhrt (allerdings sind manchmal auch die Bezeichnungen Marr-Hildreth-Operatorund ”Mexican-Hat“ anzutreffen).

Der Grundgedanke ist, dass die zweite Ableitung die lokale Krummung einerFunktion misst und man deshalb die Nulldurchgange der zweiten Ableitungals Kantenkriterium betrachten kann. Allerdings ist die zweite Ableitung starkanfallig gegenuber Bildrauschen, weshalb eine Glattung des Bildes mit demGauß-Filter zur Rauschunterdruckung vorangehen sollte.Der Laplace-Operator, im folgenden L(x, y) genannt, ist als Kantendetektorisotrop (d.h. er arbeitet in allen Richtungen gleich gut) und stellt die zweiteRichtungsableitung nach x und y eines Bildes I(x, y) dar:

L(x, y) =∂2I

∂x2+∂2I

∂y2

Die Funktion ist prinzipiell als Faltungsmatrix approximierbar; es sollte abervorher noch eine Glattung mit einer (glucklicherweise ebenfalls isotropen) Gauß-schen Normalverteilung erfolgen. Von diesem Zeitpunkt an G(x) genannt, er-rechnet sich deren Dichtefunktion folgendermaßen:

G(x) =1√2πσ

e−x2

2σ2

wobei σ die Standardabweichung darstellt und sich auf die Streuung der Gauß-schen Glockenkurve auswirkt, und der Erwartungswert µ, der die Position groß-ter Dichte kennzeichnet, hier 0 ist.

Fur eine Glattung unseres Bildes benotigen wir die Normalverteilung in zweiDimensionen, deren Dichtefunktion G(x, y) sich als

G(x, y) =1√

2πσ2e−

x2+y2

2σ2

definiert.

Die Idee ist (und hier unterstutzt uns die Assoziativitat der Faltung), nureinen Operator zu verwenden, der Laplace-Operator und Gauß-Glattung insich vereint. Es reicht also, die zweite Ableitung in beiden Richtungen der 2D-Gaußfunktion zu verwenden.Dieser Operator sei hier fur eine Standardabweichung σ = 1, 4 veranschaulicht:

7

Page 9: Kantenerkennung in Bildern

(a) Die 2D-Gaußfunktion mit σ = 1.4 undµ = 0

(b) Der Laplaceoperator auf die Gauß-funktion angewandt

Abbildung 1: Der Gaußoperator und dessen zweite Ableitung

Wir wollen nun die Gaußsche Normalverteilung als Faltung auf die Pixel einesBildes anwenden. Da die Normalverteilung zwar nie 0 ist, aber bereits dreiSchritte vom Mittelpunkt entfernt nahe 0 ist, kann man die Funktion mit einer5 × 5 Filtermaske approximieren, die einen ”gewichteten“ Durchschnitt einesPixels mit seinen Nachbarpixeln bildet, wobei des großte Gewicht naturlich aufdem zentralen Pixel liegt.

Beschleunigen lasst sich dieser Vorgang durch das Aufspalten der zweidimen-sionalen Glattung auf zwei 1D-Filtermasken. Als weiterer Vorteil erweist sich,dass die Frequenzkurve von Bildern selbst einer (halbierten) 1D-Gaußschen-Normalverteilung entspricht und man deshalb gute Kontrolle uber die verblei-benden Frequenzen hat.Aufgrund der bereits angesprochenen Assoziativitat der Faltung konnen wir nundas Gauß-Filter mit dem Laplace-Filter falten und uns so Rechenzeit ersparen,da wir diesen Vorgang nur einmal durchfuhren mussen und das Bild fortan mitdem ”vereinten“ Operator falten konnen.Nach der Faltung bleibt uns folgende Funktion:

LoG(x, y) = − 1πσ4

[1− x2 + y2

2σ2

]e−

x2+y2

2σ2

Diese Funktion kann z.B. durch folgende Filtermaske approximiert werden (Bei-spiel mit σ = 1.4):

0 0 3 2 2 2 3 0 00 2 3 5 5 5 3 2 23 3 5 3 0 3 5 3 32 5 3 −12 −23 −12 3 5 22 5 0 −23 −40 −23 0 5 22 5 0 −12 −23 −12 0 5 23 3 5 3 0 3 5 3 30 2 3 5 5 5 3 2 20 0 3 2 2 2 3 0 0

8

Page 10: Kantenerkennung in Bildern

Eventuell sollte man auf das Ergebnis noch einen Schwellwertoperator anwen-den, da sonst beliebig kleine Nulldurchgange in die Bewertung miteinfließen unddas Filter auch auf eventuell unerwunscht schwache Kanten anspricht.Eine Bewertung von Laplacian of Gaussian:

• Das Verfahren ist isotrop - es ist daher nur eine Maske notwendig...

• ... die entsprechend groß sein muss, um die Funktion nicht abzuschneiden.

• Es lassen sich eben wegen der Isotropie keine Informationen uber Kan-tenrichtung extrahieren.

• Die Position der Kanten muss aufgrund der vorangehenden Glattung mitdem Gauß-Filter nicht immer exakt sein.

• Es bleiben False-Positives im Bild.

• LoG erzeugt immer geschlossene Konturen - was nicht realistisch ist.

• Das Verfahren wurde und wird immer noch vielfach implementiert, gene-rell ist aber eine Tendenz zu anderen, neueren Verfahren, die insbesondersauf Canny basieren, zu beobachten.

• Fur alle Verfahren, die auf der zweiten Ableitung basieren, gilt, dass daserzeugte Kantenstarkebild sehr dunne Kanten aufweist.

Somit gelten sie als pradestiniert fur Linienextraktion, wie sie in etwa inder Schrifterkennung eingesetzt wird.

1.2.2 Difference of Gaussians (DoG)

Das Laplacian of Gaussian Filter lasst sich recht einfach approximieren, indemman die Differenz zweier verschieden großer Gauß-Filter berechnet.Experimentell wurde herausgefunden, dass eine gute Approximation auftritt,wenn das σ der großeren Maske circa das 1,6-fache des σ der kleineren Maskeist.In der Praxis wird die Difference-of-Gaussians-Methode allerdings selten einge-setzt; beliebt ist sie jedoch unter anderem zur Anwendung in schnellen Stereobild-Vergleichsalgorithmen.

9

Page 11: Kantenerkennung in Bildern

1.3 Kantenerkennung nach dem Canny-Muster

1.3.1 Canny-Filter

Bis hierher wurden Kantenerkennungsalgorithmen behandelt, die sich dergrundlegenden Prinzipien der Kantenerkennung bedienen; eine recht gute Zu-sammenfassung dieser Verfahren findet sich in [4].

Der Canny Algorithmus wird im Gegensatz dazu haufig zu den ”optimalen“Kantenerkennungsverfahren gerechnet, da er selbst heute noch - immerhin 20Jahre nach seiner Erfindung - konkurrenzfahige Ergebnisse liefert. Auch bauendie meisten weitergehenden Vorschlage unmittelbar auf Cannys Technik auf.

Canny versuchte den Operator von einer formal spezifizierten objektiven Funk-tion ausgehend zu minimieren, fur die er drei Hauptziele formulierte:

• Minimierung der Anzahl falscher Kantenmarkierungen

• Moglichst gute Lokalisierung von Kanten

• Erzeugung von nur einer Markierung pro Kante

Canny errechnete sich auf Basis dieser Kriterien eine Funktion, die als Summevon vier Exponentialtermen dargestellt wurde. Allerdings ahnelte diese Funktionsehr stark der ersten Ableitung einer Gaußschen Normalverteilung, weshalb imEndeffekt diese eingesetzt wurde.Zur Berechnung der Ableitungen kann man auf beliebige Standardprozedurenzuruckgreifen, wie in etwa den Sobeloperator. Also faltet man die Gaußsche-Glattungsfunktion mit der Ableitungsmaske und wendet den dabei entstehendenOperator auf das Bild an. Dies sollte in vier Richtungen erfolgen, wobei dieRichtung, die am starksten anspricht, hervorgehoben wird.Zusammenfassend wir folgendermaßen vorgegangen:

• 1. Schritt: Glattung der Bilddaten mit Hilfe einer Gauß Faltungsmatrix.

• 2. Schritt: Anwendung eines einfachen Ableitungsfilters in 2D, Hervorhe-bung von Regionen mit Nullstellen in der 2. Ableitung (in Richtung desGradienten - um Kanten mit Subpixelgenauigkeit zu finden).

• 3. Schritt: Es entstehen Grate im Gradientstarkebild. Der Algorithmussetzt nun alle Pixel, die sich nicht direkt auf dem Grat befinden auf 0(Nonmaxima-Unterdruckung, siehe B.1).

• 4. Schritt: Wende auf die verbleibenden Kantenpixelkandidaten noch einHystereverfahren an, um ”unwichtige“ Kanten zu unterdrucken (fur eineErklarung der Vorgangsweise, siehe B.2)

Durch Variation von σ bei der Glattung kann die Granularitat der Kanten-suche beeinflusst werden, wobei hohere σ Werte zwar weniger Details im Bildlassen, dafur aber die Rauschempfindlichkeit abschwachen.Somit werden die Filterergebnisse von σ und den Schwellwerten der Hysterese,

10

Page 12: Kantenerkennung in Bildern

T1 und T2, beeinflusst. Ein zu niedriges T1 bewirkt, dass zu viele unnotige Kan-ten im Bild verbleiben, ein zu hohes T2, dass verrauschte Kanten unterbrochenwerden.Bewertung des Canny-Filters:

• Das Filter erkennt Kanten selbst bei starkem Rauschen relativ zuverlassig.

• Ein großes Problem, welches immer wieder erwahnt wird, sind die Schwie-rigkeiten, die mit Y-formigen Kanten auftreten - diese behalten nichtzu 100% ihre Form und konnen ”Locher“ bekommen. Dieses Problemkann allerdings gelost werden, indem man solche Verbindungen bei derGratsuche berucksichtigt (ein Losungsvorschlag, der die Bildtopologie mit-berucksichtigt, wurde von Rothwell in [6] gemacht; siehe dazu 1.3.2).

• Die Hysterese (Schritt 3 des Algorithmus) bremst das Verfahren starkein. Im schlimmsten Fall (und das ware, wenn die Hysterese eine Kanteerkennt, die durch das ganze Bild lauft), steigt die Komplexitat durchdiesen Schritt auf O(n).

• In [3] vergleichen die Autoren 8 durchwegs ”moderne“ Detektoren anhandgeologischer Bilder eines Vulkans auf die Erkennungsleistung bezuglichder Kanten der geotektonischen Oberflache. Als Vergleichsbasis ziehendie Autoren die Rosenfeld und Pratt Metrik heran (zur Erklarung derFunktionsweise, siehe A.1 und A.2).Der Vergleich mag zwar nicht reprasentativ sein, erlaubt aber einen Uber-blick und ist der einzige auffindbare seiner Art, der sich explizit mit sehrmodernen Verfahren beschaftigt. Getestet werden Canny, Rothwell, Black,SUSAN, Edison, Iverson-Zucker, Bezdek und Fitton-Cox, wobei es sich beiletzterem lediglich um eine modifizierte HOUGH-Transformation handelt.Hinsichtlich der Kriterien des Vergleichs schneidet Canny am besten ab.

1.3.2 Rothwell

Der bei weitem am haufigsten anzutreffende Kritikpunkt am Canny-Filter istdessen Versagen bei Y-formigen Kantenstrukturen. Als einen der Grunde dafurfuhrt Rothwell in [6] an, dass das Extrahieren der Normalen zur Kantenrichtung,das ja bei der Nonmaxima-Unterdruckung des Canny-Algorithmus stattfindet,sehr unzuverlassig ist - vor allem bei Verbindungsstucken.Deswegen schlagt er ein Verfahren vor, das dem von Canny zwar prinzipiellahnlich ist, jedoch beim Hysterese-Schritt nur eine untere Schranke T2 festlegt,bis zu der eine Kante verfolgt werden soll, um im Kantenstarkebild noch ent-halten zu sein. Der obere Schwellwert T1 wird dynamisch, abhangig vom Bild,festgelegt. Zu diesem Zweck gewinnt der Algorithmus Topologieinformationenaus dem Bild, indem er zuerst ein Thinning nach dem Tsao-Fu-Algorithmusdurchfuhrt und dann Ecken aus der verbleibenden Kantenmenge konstruiert.

Dies geschieht, indem Ecken entweder auf Kantenpixel(kandidaten) platziertwerden, die nur einen Nachbarn haben (und deswegen das Ende einer Kante seinmussen) oder auf Kantenpixel(kandidaten), die mehr als zwei Nachbarn haben(und deswegen eine Verbindungsstelle sein mussen).

11

Page 13: Kantenerkennung in Bildern

Die Kanten befinden sich nun konsequenterweise zwischen den so platziertenEcken; auf diese Weise verfugt man uber Topologieinformationen, die man nut-zen kann, um eine ”Schwellwertebene“ T zu generieren.Diese Topologieinformationen haben sozusagen den doppelten Vorteil, dass maneinerseits uber die erwahnte Schwellwertebene verfugt und andererseits bessereGrundlagen zur Bildung von lokalen Normalen zur Kantenrichtung verfugt, wasder Verbesserung der Ergebnisse der Nonmaxima-Unterdruckung zutraglich ist.Kantenpixelkandidaten werden nun zu Kantenpixeln, falls gilt:

Nx,y ≥ αTx,y

wobei Nx,y die Intensitat des jeweiligen Pixel ist.

Bewertung von Rothwells Verfahren:

• Rothwell et al. bezeichnen das Verfahren als bottom-up Technik, da dasExtrahieren von Topologieinformationen wahrend der Kantenfindung er-folgt.

• Zur weiteren Verarbeitung stehen schon sinnvolle Topologiedaten zur Ver-fugung.

• Die Erkennungsleistung an Verbindungsstucken (und zumindest gemessenanhand synthetischer Bilder auch allgemein) ist der des Canny Verfahrensuberlegen.

• Der Zeitaufwand ist aber sicherlich auch hoher; es ist nicht nur ein per seaufwandiger Hysterese-Schritt erforderlich; sondern auch noch ein Tsao-Fu-Thinning und das Extrahieren von Topologieinformationen.

• Die Topologieinformationen mussen auch nicht vollstandig sein und solltendeshalb von aufbauenden Anwendungen, die stark davon abhangig sind,durchaus uberpruft werden.

• Das Rothwell-Verfahren erreicht in [3] Platz 2, noch vor SUSAN, Edisonund Iverson-Zucker.

1.3.3 Edison

In [7] betrachten Meer und Georgescu die klassischen drei Schritte, die invielen Detektoren, so auch bei Canny, verwendet werden und verallgemeinernsie auf einen linearen Vektorraum.So erhoffen sie, mit wenig zusatzlichem Rechenaufwand (ganz ahnlich wie beiRothwell sozusagen bottom-up) Informationen uber die Zuverlassigkeit der ge-fundenen Kanten zu gewinnen. Am klassischen Vorgehen kritisieren sie unteranderem, dass die Gradientenstarke, die ja als Kantenkriterium gilt, eine mehr-deutige Information darstellt, da sie aus dem Einfluss des Kantenmusters undder Kantendicke zusammengesetzt ist.

12

Page 14: Kantenerkennung in Bildern

Demonstrieren lasst sich das verfolgte Konzept am besten anhand eines kon-kreten Faltungsbeispieles von Bilddaten. Multipliziert man z.B. ein n×n-Fenstervon Bilddaten a mit einer Maske w, so erhalt man:

Ergebnis =m∑

i=−m

m∑j=−m

wijaij (1)

Als inneres Matrizenprodukt wird (1) zu:

Ergebnis = spur[WTA] = spur[WAT ]

Wenn man die Spalten dieser Matrix nun untereinander in einer Spalte an-schreibt, kann man das Ergebnis des Operators auch als inneres Vektorproduktberechnen:

Ergebnis = wTa = aTw

Im n·n-dimensionalen Vektorraum ist w ein 1D-Unterraum,W sei das (n·n−1)-dimensionale Komplement von w.Dann ergibt der Fensteroperator fur jedes beliebige b ∈ W 0; deshalb giltFolgendes:

Ergebnis = wT (a+ b) = wTa

So sieht man, dass eine große Zahl an Vektoren das gleiche Ergebnis liefert;in der Praxis wirkt sich das als false-positives in offensichtlich unstrukturierterNachbarschaft des Fensters aus.

Seien nun (o.E.d.A.) die Daten normalisiert, d.h. es gelte ‖ a ‖= 1.In diesem Fall schlagen Meer und Georgescu die nachfolgende Vorgehensweisevor:

A Den Gradienten stelle man sich als zwei Masken vor (eine fur jede Rich-tungsableitung), welche einen zweidimensionalen Unterraum bilden:

E =w1w

T1

wT1 w1

+w2w

T2

wT2 w2

Die Projektion Ea der Bilddaten a auf diese Ebene entspricht der ge-schatzten Gradientenrichtung θ.

B Konstruiere nun eine ideale Kantenschablone t mit der gleichen Gradien-tenrichtung - die sich zwangslaufig außerhalb des durch E dargestelltenUnterraums befindet (innerhalb < a,Ea >).

C Berechne nun

η = |tTa|

13

Page 15: Kantenerkennung in Bildern

D Dann ist η der Cosinus des Winkels zwischen den Daten a und der idealenKante t - und somit der Betrag des Korrelationskoeffizienten zwischendiesen beiden Vektoren.

Bewertung von Edison:

• η ist ein wirklich unabhangiger Schatzer fur das Vorhandensein der ver-muteten Kanten, da es nur aus Vektoren außerhalb der Gradientenebenezusammengesetzt ist.

• Dennoch gibt es Kanten, die sich nicht an das vorgestellte Modell halten- diese werden vom Verfahren diskriminiert.

• Verfahren auf hoherem Niveau, die von einer sehr detailgenauen Kantener-kennung abhangig sind, sollten dem Zuverlassigkeitsschatzer daher auchnicht uneingeschrankt vertrauen.

• In der Theorie ist der Algorithmus wirkungsvoller als das Verfahren vonCanny.

• Jedoch fuhrt einen zusatzlichen Schritt ein, der das Verfahren noch re-chenintensiver macht.

• Eine Open-Source Implementierung findet sich unter:http://www.caip.rutgers.edu/riul/research/code/EDISON/.

• In [3] erreicht der Algorithmus lediglich Platz 7.

1.3.4 Iverson-Zucker

Iverson und Zucker glauben, dass, obwohl Kantendetektoren zu wenig globaleKriterien berucksichtigen, diese immer noch Spielraum fur Verbesserungen imlokalen Teil lassen.Daher versuchen sie, den Prozess auf strikt formale Beine zu stellen; ihre Idee in[8] legt nahe, einen linearen Operator in einen Satz logischer Vorbedingungen zuzerlegen. Dazu teilt man diesen Operator in eine Menge Operatoren auf, derenSumme identisch zum ursprunglichen Operator ist.Diese linearen Teiloperatoren stellen nun eine Messmoglichkeit fur die Erful-lung der logischen Vorbedingungen dar. Allerdings muss die Konstruktion unterBerucksichtigung folgender beiden Bedingungen erfolgen:

• Der Operator soll nur dann reagieren, wenn die Vorbedinungen erfullt sind

• Falls die Vorbedingungen erfullt sind, soll das Ergebnis exakt das Gleiche,wie das des ursprunglichen Operators sein

Damit soll die Zahl der false-positives, die laut Iverson und Zucker unteranderem durch falschliches Erkennen von Kontrastlinien als Kanten, Erkennenvon Kanten auf die der Operator im Durchlauf gar nicht ausgerichtet ist, oder

14

Page 16: Kantenerkennung in Bildern

Erkennen von Kantenpixeln, die nicht im Zentrum des Operators liegen entste-hen, verringert werden.

Bei dem linearen Operator, der verwendet wird, handelt es sich Richtungs-ableitungen hoheren Grades des Gauß-Operators. Hat man sich auf den linearenOperator festgelegt, bleibt noch die Zerlegung in logische Vorbedingungen. Zudiesem Zweck haben Iverson und Zucker Verknupfungen entwickelt, um nume-rische Werte auf logische abzubilden. Analog zu den logischen Verknupfungenkann man diese als ∧+ und ∨+ bezeichnen. Dabei sei

x ∧+ y =

x+ y, falls x > 0 ∧ y > 0y, falls x > 0 ∧ y ≤ 0;x, falls x ≤ 0 ∧ y > 0;x+ y, falls x ≤ 0 ∧ y ≤ 0;

Wieder analog zur Logik liefert ∨+ den positiven Wert, falls ein Wert von x odery positiv ist. Mithilfe dieser Verknupfungen kann nun endlich der logisch/lineareOperator definiert werden:Ein logisch/linearer Operator auf dem Vektorraum X (x ∈ X) sei eine beliebigeFunktion L : X → R in der Sprache L, die sich durch die folgende Grammatikdefiniert:

L→ ψ(x); L→ aiL; L→ L ∧+ L; L→ L ∨+ L

wobei ψ(x) eine beschrankte, reelle, lineare Funktion ist und ai eine reelleKonstante.Solche logisch-linearen Operatoren kann man nun punktweise auf das Bild an-wenden. So wird z.B. aus dem (fiktiven) Operator F:

∀x ∈ X : F (I1, I2)(x) = I1(x) ∧+ I2(x), I1, I2 : X → R

Zuruckkommend auf fur unsere Anwendungszwecke konkret nutzliche Funktio-nen, sei nun D2

x die zweite Richtungsableitung von diskreten Bilddaten. Dannlasst sich eine Faltungsoperation die den Effekt des Laplace-Operators hat,folgendermaßen darstellen:

φ(I) = (−D2x ∧+ −D2

y) ∗ I

Mithilfe der Verknupfung der Operatoren mittels logischer Kombinatoren (undder Bedingung, dass bei positiver Entscheidung das Ergebnis des Operators dasgleiche sein muss, wie ohne die Zerlegung) uberprufen Iverson und Zucker dieBedingungen die sie an eine Bildkurve stellen quasi wahrend des Kantenfin-dungsprozesses.

Den Begriff der Bildkurve definieren sie im Zuge der Formalisierung selbstund legen ihn folgendermaßen fest:Eine Bildkurve ist eine Abbildung α : S → I, so dass gilt:

(Tangentenbedingung) α sei stetig in S

15

Page 17: Kantenerkennung in Bildern

(Normalenbedingung) N(βs) gelte fur alle s ∈ S

wobei S die Menge aller Punkte auf einer Kurve zwischen zwei Punkten istund die Bedingung N(βs) von der Art der Kurve abhangt.

Von diesen Bildkurven legen sie drei verschiedene Typen fest, die sich durchihre Normalenbedinung N(βs) unterscheiden (die drei Typen bezeichnen sie alsKanten, positive Kontrastlinien und negative Kontrastlinien).Die Beschreibung auf [8] geht hiervon ausgehend noch weiter und beschreibt un-ter anderem die Anwendung des Prinzips auf das Canny-Verfahren. Da eine solchdetaillierte Beschreibung den Rahmen dieser Arbeit sprengen wurde, sei auf dieangefuhrte Original-Publikation verwiesen. Bewertung von Iverson-Zucker:

• Das Verfahren legt klar und formal (in Form der Bildkurve) fest, was einKantenfindungsalgorithmus auffinden muss und was nicht.

• Die Effizienz bei T-Verbindungsstucken und Fenstern mit mehr als einerKante ist großer, da das Modell die Moglichkeit des Auftretens mehrererKanten berucksichtigt.

• Der Algorithmus findet Kontrastlinien, die er im Gegensatz zu den meis-ten anderen Algorithmen explizit behandelt, besser auf als dies z.B. derCanny-Algorithmus macht - die Entwerfer des Algorithmus geben zahlrei-che Anwendungsbeispiele an, wo dies sinnvoll ist, so z.B. beim Erkennenvon Fingerabdrucken.

• Der zeitaufwandige Hysterese Schritt entfallt, die Komplexitat (auf einermaximal parallelisierten Umgebung) ist O(1).

• Mithilfe der Zerlegung in logische Bedingungen, sind die Ableitungen ho-heren Grades nicht nur stabil sondern auch sehr effizient.

• In [3] kann das Verfahren jedoch nur Platz 5 erreichen.

1.4 Kantenerkennung mithilfe neuronaler Netze

1.4.1 Bezdek

Bezdek verwendet in [9] den Sobel-Operator als Ausgangslage, um ein neu-ronales Netz zur Kantenerkennung zu trainieren. Der Operator erzeugt ”Trai-ningsmengen“ aus allen moglichen binaren Fenstermengen. Fur ein 3 × 3 Fens-ter existieren 29 solcher verschiedener Inhaltsmengen, deren Ausgabe mit demSobel-Verfahren auf Werte zwischen 0 und 1 skaliert werden.Diese Ausgabewerte werden nun durch eine fuzzy Zugehorigkeitsfunktion be-schrieben, die den Grad der Zugehorigkeit des Pixels zur Kantenpixelmengeoder zur Menge der Pixel mit anderen Eigenschaften im Bild ausdruckt.

Die ”Kantenheit“ eines Pixels kann, wendet man den Sobeloperator auf dasBinarbild an, die Werte 0, 1

3 , 23 und 1 annehmen. Diese ”Kantenheit“ kann

man als Maßzahl fur die unscharfe Zugehorigkeits-Funktion verwenden - das

16

Page 18: Kantenerkennung in Bildern

neuronale Netzwerk muss nur mehr darauf trainiert werden, fur jedes Fensterden angemessenen Wert zuruckzugeben.Analog zur Schwellwertanwendung beim originalen Sobel-Operator wird auchhier eine Entscheidung auf die Ausgabe angewandt, die festlegt, ob das ”bisschenKante“ aus der unscharfen Zugehorigkeit nun ganz Kante oder gar nicht Kanteist.

Bewertung von Bezdek:

• Das Ergebnis ist fur Binarbilder gleich, wie das des Sobel-Operators.

• Bei niedrig-konstrastierten Graustufenbildern sind die Ergebnisse des Bezdek-Operators allerdings besser.

• Eine starke Beschrankung des Verfahrens ist jedoch in der wahlbarenMaskengroße zu sehen: Wahrend man das neuronale Netzwerk mit einem3× 3 Filter auf 29 verschiedener Inhaltsmengen trainieren muss, benotigtman fur eine 5× 5 Faltungsmatrix bereits 225 Kombinationen.

• In [3] erreicht das Verfahren Platz 6 - den vorletzten Platz vor Edison.

1.5 Kantenerkennung mittels anisotroper Diffusion

1.5.1 Black

Ganz im Gegensatz zu den vielen Verfahren, die Verbesserungen der Grun-didee von Canny darstellen, beschreiben die Autoren in [10] ein Moglichkeit,anisotrope Diffusion zur Kantenfindung einzusetzen. Verwendet wird dabei eine

”Kantenstoppfunktion“ die nahe verwandt mit der Einflussfunktion und derFehlernorm in der sogenannten ”robusten Schatzung“ ist.Kanten zwischen stuckweise konstanten Regionen werden dabei im robustenSchatzsystem als ”Ausreißer“ erkannt (wobei Ausreißer Stichprobenwerte sind,die sich außerhalb eines gewissen, realistischen Wertebereichs befinden bzw.deren Normalverteilungsdichte fast 0 ist).

Die Autoren gehen von einem anisotropem Diffusionsfilter, konkret dem dis-kreten Perona-Malik-Filter aus:

It+1s = It

s +λ

|ηs|∑p∈ηs

g(∇Is,p)∇Is,p (2)

wobei λ ∈ R+ die Diffusionsrate festlegt, Is die diskreten Bildintensitatswerte,ηs die raumliche Nachbarschaft des Pixel s darstellt und |ηs| die Anzahl derNachbarn von s ist.Nun wird versucht, ein statistisches Modell der Perona-Malik Funktion zu ent-werfen, unter der Annahme, dass es sich bei Bildern um stuckweise konstanteFunktionen handelt, die durch Rauschen verfalscht wurden.In diesem statistischen Modell sollte die Differenz einer Bildintensitat und seinerNachbarintensitaten normalverteilt sein. Dies trifft jedoch nicht zu, wenn sich

17

Page 19: Kantenerkennung in Bildern

in der Bildregion ein Kantenpixelkandidat befindet, da dieser in der konstantenFunktion eine Unstetigkeit darstellt.

Zuerst versucht man nun ein stuckweise konstantes Bild aus verrauschtenDaten zu schatzen; dabei sollte folgendes Optimierungskriterium erfullt sein:

minI

∑s∈I

∑p∈ηs

ρ(Ip − Is, σ) (3)

wobei ρ (· ) eine Fehlernorm und σ ein Skalierungsparameter ist.Die Ableitung einer beliebigen ρ-Funktion ist dabei proportional zur Einfluss-funktion, welche den systematischen Fehler charakterisiert, den eine Messungauf das Ergebnis hat.So lasst sich auch feststellen, dass z.B. eine quadratische ρ-Funktion ”Ausrei-ßern“ zuviel Einfluss gibt - daher sollte die ρ Funktion toleranter auf ”Ausreißer“reagieren und diese gegebenenfalls verwerfen.Eine fur diese Zwecke gut geeignete ρ-Funktion ist die Lorentz-Fehlernorm:

ρ(x, σ) = log[1 +

12

(xσ

)2]

Betrachtet man hier die Ableitung ρ′, so sieht man, dass der Einfluss einerGradientenstarke die uber dem festgelegten Wert σ liegt, schwacher wird.

Als nachsten Schritt leiten Black et al. eine Beziehung zwischen Bildrekon-struktion uber ”robuste Schatzung“ und anisotrope Diffusion aus den kontinu-ierlichen Formen von (2) und (3) ab:

∂I(x, y, t)∂t

= div[ρ′(‖ ∇I ‖) ∇I

‖ ∇I ‖

]wobei div die Divergenz bezeichnet und folgende Beziehung gilt:

g(x) .=ρ′(x)x

Von hier ausgehend gilt nur noch, die ”Kantenstoppfunktion“ g(· ) und damit ρzu optimieren - im folgenden lasst sich das vorgestellte Verfahren dazu nutzen,wirklich Kantenbilder zu gewinnen, indem man eine penalty Funktion einfuhrt,die fur ”Ausreißer“ (in einem zusatzlich eingefuhrten, sogenannten line-process)niedrige Werte liefert (siehe [10]).

Bewertung des Black-Verfahrens:

• Auch bei diesem Verfahren ist anschließend eine Nonmaxima-Unterdruckungund vor allem ein zeitaufwandiger Hysterese-Schritt notwendig.

• In [3] erreicht das Verfahren Platz 3.

• Es bestehen keine qualitativen Absicherungen, die in etwa bei Edison, Ro-thwell oder Iverson-Zucker im Verfahren zusatzlich mitermittelt werden.

18

Page 20: Kantenerkennung in Bildern

• Es werden wahrend des Verfahrens keine der weiteren Verarbeitung zu-traglichen Informationen ermittelt, wie in etwa bei Rothwell oder auchEdison.

• Das Verfahren ist unabhangig von den sonst meist grundlagenbildendenIdeen von Canny.

19

Page 21: Kantenerkennung in Bildern

2 Kantenerkennung abseits des”Mainstreams“

2.1 Parametrische Kantenmodelle

Vor allem Robert Haralick engagiert sich in dem ansonsten wenig beachtetenSegment der Kantenerkennung ausgehend von parametrischen Kantenmodellen.Die zugrundeliegende Idee ist, dass es den Kantenfindungsprozess vereinfacht,wenn man uber eine mathematisch-deterministische Beschreibung verfugt. Da-bei wird angenommen, dass die diskreten Bildinformationen, die vorliegen, einedurch Rauschen verfalschte Approximation an die darunter liegende Bildinten-sitatsfunktion sind.Um diese Intensitatsfunktion zu gewinnen, zerlegt man das Bild in kleine, recht-eckige Bildausschnitte, die man Facets nennt und im Folgenden durch Polynomezu approximieren versucht.Abhangig des Grades der Polynome gibt es auch verschiedene Methoden, Kan-teninformationen zu gewinnen. Haralicks-Methode, die Polynome uberhaupt zubestimmen, widmet sich Abschnitt C.

2.1.1 Sloped Facet Models

Die Polynome, die hier verwendet werden, stellen geneigte Ebenen (”slopedfacets“) dar, dabei wird folgendes Modell angenommen:

g(r, c) = α · r + β · c+ γ + θ(r, c)

wobei r: Zeilenindex (row)c: Spaltenindex (column)α: Steigung der Ebene in r-Richtungβ: Steigung der Ebene in c-Richtungγ: Hohe der Ebene im Ursprungθ(r, c): Rauschen (Zufallsvariable, normal verteilt)

Es wird angenommen, dass die Rauschvorgange der einzelnen Pixel unabhan-gig voneinander sind. Darauf aufbauend wird der Bildauschnitt g(r, c) durcheine unverrauschte geneigte Ebene interpoliert:

p(r, c) = αr + βc+ γ

Dabei wahlt man α, β und γ so, dass der mittlere quadratische Fehler ε2

minimiert wird, wobei:

ε2 =∑r∈R

∑c∈C

(p(r, c)− g(r, c))2

Ableiten nach den Winkeln und Nullsetzen von ε2 ergibt die Ergebnisse

α =∑

r∈R

∑c∈C rg(r, c)∑

r∈R

∑c∈C r

2

20

Page 22: Kantenerkennung in Bildern

β =∑

r∈R

∑c∈C cg(r, c)∑

r∈R

∑c∈C c

2

γ =∑

r∈R

∑c∈C g(r, c)∑

r∈R

∑c∈C 1

Durch Zerlegung von ε in zwei Terme und geschicktes Einsetzen, erhalt manzwei Terme, die beide χ2-verteilt sind. Insbesonders ist somit ε2/σ2 χ2-verteilt.Nun kann man die Nullhypothese H0 (α = β = 0) durch folgende F-Statistikuberprufen:

F =α2

∑∑r2 + β2

∑∑c2)/2

ε2/(∑∑

1− 3)Es handelt sich dabei um die Neigung der geschatzten Ebene normalisiert durchden mittleren quadratischen Fehler.

Folgende Ereignisse fuhren nun zum Verwerfen der Null-Hypothese:

1. Die geschatzte Neigung ist zu groß. Vermutlich ist eine Kante vorhanden.

2. Der mittlere quadratische Fehler ist zu klein.

Bewertung des Sloped-Facet-Modells zur Kantenfindung:

• Sloped-Facets werden kaum eingesetzt, meistens greift man auf die Null-durchgange von kubischen Polynominterpolationen zuruck.

• Folglich existieren kaum Aussagen zur Komplexitat und Erkennungsleis-tung.

• Das Verfahren hat unter anderem den Nachteil, das es verrauschte Facettenals flach betrachtet.

2.1.2 Integrierter Gradientendetektor

Der integrierte Gradientendetektor basiert nun nicht mehr auf Polynomenzweiten Grades, sondern auf solchen dritten Grades (auf die Interpolation solcherPolynome geht Abschnitt C genauer ein, die Masken die man dazu verwendenkann folgen spater in diesem Abschnitt). Somit versteht es sich als Cubic FacetModel im Sinne von Haralicks ”Facet Models“.

Die Zielsetzung des integrierten Gradientendetektors ist, die Operationen ei-nes Gradientendetektors anzunahern. Haralick verwendet dazu in [11] folgendeskubisches Polynom:

f(x, y) = k1 +k2r+k3c+k4r2 +k5rc+k6c

2 +k7r3 +k8cr

2 +k9c2r+k10c

3 (4)

21

Page 23: Kantenerkennung in Bildern

Ein Verfahren, um ein Gradientenfilter (dessen prinzipielle Funktionsweise schonausfuhrlich unter anderem in den Abschnitten 1.1.1 bzw. 1.3.1 vorgestellt wur-de), mithilfe der parametrisierten Facets umzusetzen, entwickelten Haralick undZuniga in [12].Dazu berechnen sie die partiellen Ableitungen der ersten Zeile und Spalte desinterpolierten Polynoms (4) mit Zentrum (0,0):

∂I(r, c)∂r

= k2

∂I(r, c)∂c

= k3

Nun gilt fur die Richtungsableitung in eine beliebige Richtung φ, dass die Funkti-on I ′φ(r, c), die diese Ableitung reprasentiert, folgendermaßen berechnet werdenkann:

I ′φ(r, c) =∂I(r, c)∂r

sinφ+∂I(r, c)∂c

cosφ

Integriert man diese Richtungsableitung, so erhalt man die integrierte Rich-tungsableitung Fφ (fur eine Fenstergroße von N ×N):

Fφ =1

4N2

∫ L

−L

∫ W

−W

I ′φ(r, c)

Das Verfahren erzielt mit Werten fur L und W , die wenig kleiner als die halbeMaskengroße sind, die besten Resultate (wobei L = W = 0 einer einfachenGradientenfilterung des kubischen Polynoms entspricht).

Das φ, das Fφ hier maximiert, entspricht der Schatzung der Gradientenrich-tung, d.h. der geschatzte integrierte Gradient ist

G = Fφmaxuφmax

wobei uφmax der Einheitsvektor in Richtung des maximalen Gradienten ist.Fur L = W ist das φ, das Fφ maximiert

φ = tan−1 B

A

und Fφmax errechnet sich dann durch

Fφmax =√A2 +B2

wobei A = L2k7 + 13L

2k9 + k2 und B = L2k10 + 13L

2k8 + k3.

Die einzelnen ki erhalt man, indem man die Bilddaten mit Linearkombina-tionen der Gewichtungskernel fur die diskreten orthogonalen Polynome faltet.Haralick erlautert dies genauer in [13].

Berechnet man die einzelnen Faltungskernel auf Grundlage von Tschebyscheff-Polynomen, so erhalt man folgende zehn Filtermasken, die als Ergebnis einer

22

Page 24: Kantenerkennung in Bildern

Faltung mit den Bilddaten die einzelnen ki ergeben (wobei aufgrund der symme-trisch gewahlten Stutzstellen und der Zeilen- und Spaltenindizierung die MaskenM3, M6, M9 bzw. M10 jeweils den transponierten Matrizen M2, M4, M8 bzw.M7 entsprechen):

M1 =125

1 1 1 1 11 1 1 1 11 1 1 1 11 1 1 1 11 1 1 1 1

M2 =

−0, 0743 0, 0114 0, 0400 0, 0114 −0, 0743

0, 0114 0, 0971 0, 1257 0, 0971 0, 01140, 0400 0, 1257 0, 1543 0, 1257 0, 04000, 0114 0, 0971 0, 1257 0, 0971 0, 0114

−0, 0743 0, 0114 0, 0400 0, 0114 −0, 0743

M4 =170

2 2 2 2 2

−1 −1 −1 −1 −1−2 −2 −2 −2 −2−1 −1 −1 −1 −1

2 2 2 2 2

M5 =1

100

4 2 0 −2 −42 1 0 −1 −20 0 0 0 0

−2 −1 0 1 2−4 −2 0 2 4

M7 =1

360

−6 −6 −6 −6 −612 12 12 12 120 0 0 0 0

−12 −12 −12 −12 −126 6 6 6 6

M8 =1

140

−4 −2 0 2 4

2 1 0 −1 −24 2 0 −2 −42 1 0 −1 −2

−4 −2 0 2 4

Bewertung des integrierten Gradientdetektors:

• Als Gradientenverfahren verliert der Operator seinen exotischen Statusund steht - trotz Parametermodell - in Konkurrenz mit dem Canny-Algorithmus

23

Page 25: Kantenerkennung in Bildern

und seinen Derivaten.

• Tendenziell erzeugt der integrierte Gradientendetektor weniger false-negativesals der Canny-Algorithmus...

• ... dafur allerdings auch mehr false-positives.

• Die Rauschanfalligkeit kann in bestimmten Situationen weit niedriger sein,als die des Canny-Algorithmus.

• Das Ergebnis des Algorithmus kann auch schon ohne aufwandige Nachbe-arbeitungsschritte, wie in etwa Hysterese oder Non-Maxima Unterdruckungin etwa mit dem des Canny-Filters konkurrieren. Verzichtet man auf dieKantenrichtungsinformationen kommt man aufgrund der Distributivitatder Faltung und der Tatsache, dass A und B Linerkombinationen vonKoeffizienten sind, mit zwei Faltungen und einer L2-Norm aus.

2.1.3 Nulldurchgange der 2. Ableitung mit Cubic Facet Models

Liegt die Polynomdarstellung der diskreten Bilddaten einmal vor (zur eigent-lichen Interpolation, siehe C), ist es vergleichsweise einfach, die Nulldurchgangeder zweiten Ableitung zu untersuchen.

Da das parametrische Kantenmodell bereits als Annaherung an eine als ver-rauscht angenommene Oberflache gilt, verwendet man hier statt des LoG nurden Laplace-Operator.Von der kubischen Interpolation, die in 4 dargestellt ist, ausgehend, ist die zweiteAbleitung

2k4 + 2k6

Eine Kante tritt genau dann auf, wenn mit diesem ”cubic fit“ ein Nulldurchgangstattfindet. In der Prototypimplementierung hat es sich als praktikabel undeffizient erweisen, hier einfach zu testen, ob k4 und k6 einen gewissen Wertubersteigen, was aufgrund des Kurvenverlaufs des Nullduchgangs, zum Zielfuhrt.

Bewertung des Haralick-Kantendetektors:

• Das Verfahren ist das bekannteste, das auf dem Facet Model basiert undwird deswegen wegen seines Erfinders oft auch Haralick-Kantendetektorgenannt.

• Die Eigenschaften sind weitgehend mit denen von LoG identisch; Unter-schiede entstehen nur durch die Art der Glattung (uber einen Gauß-Filterbei LoG unter uber die Anpassung der Facets bei diesem Detektor).

• Als Vorteil gegenuber dem LoG-Verfahren wird angefuhrt, dass die Varianzeiner Faltungsoperation mit der Maske geringer ist (”Haralicks Kriteri-um“). Dies ist insofern ein Vorteil, als großere Varianzen in der Faltungs-operation auch zu hoheren false-positive- und false-negative-Raten fuhren.

24

Page 26: Kantenerkennung in Bildern

2.2 Kantenerkennung ohne Ableitung

2.2.1 SUSAN

SUSAN (”Smallest Univalue Segment assimilating Nucleus“) ist ein isotropischarbeitendes Filter, bei dem man eine Maske auf dem Bild platziert und dieHelligkeit jedes Pixels in dieser Maske mit dem Nukleus (dem Wert in der Mitteder Maske) vergleicht.Fur diesen Vergleich kann man nun eine Funktion definieren, die abhangig voneinem Schwellwert t den Wert 0 oder 1 annimmt:

c(−→r ,−→r0) =

{1 falls |I(−→r )− I(−→r0)| ≤ t

0 falls |I(−→r )− I(−→r0)| > t

wobei −→r0 die Position des Nukleus bezeichnet, −→r die Position des gerade be-trachteten Pixels und I sich auf die (diskrete) Intensitatsfunktion (die Helligkeitdes gerade gewahlten Pixels) bezieht.Davon ausgehend kann man nun die Flache des USAN aus der Summe der Pixel,die verglichen mit dem Nukleus uber dem Schwellwert liegen, errechnen:

n(−→r0) =∑−→r

c(−→r ,−→r0)

Als nachsten Schritt wendet man einen ”geometrischen Schwellwert“ auf n an,der eigentlich nicht der Kantenfindung selbst, sondern der Rauschunterdruckungdient. Dieser Schwellwert g ist auf der Basis von Erfahrungswerten als 3nmax/4festgelegt. Es kann gezeigt werden, dass so keine Kanten verloren gehen (insbe-sondere ist im Kantenfall das USAN immer kleiner als nmax/2) und optimaleRauschunterdruckung erzielt wird.

Man wendet nun g auf die einzelnen USANs-Flachen an:

R(−→r0) =

{g − n(−→r0) falls n(−→r0) < g

0 sonst

Darin spiegelt sich das SUSAN-Prinzip: Je kleiner das USAN, desto starker dieKante.Die Gleichung fur c kann hingegen noch verbessert werden, insbesonders umstabilere Ergebnisse zu liefern:

c(−→r ,−→r0) = e−( dt )6

wobei d = |I(−→r )| − |I(−→r0)|Dem typisches Problem isotroper Kantendetektoren entgeht man jedoch auchhier nicht: Man hat keine Informationen uber die Kantenrichtung. Z.B. furNonmaxima-Unterdruckung und Kantenerkennung auf Sub-Pixel-Genauigkeitbenotigt man diese aber.

Zumindest die Kantenrichtung kann man aus dem USAN rekonstruieren. Beieiner Stufenkante, die sich genau zwischen zwei Pixeln befindet, hier inter-pixel

25

Page 27: Kantenerkennung in Bildern

edge genannt, ist der Vektor zwischen dem Gravitationszentrum −→r des USANund dem Nukleus genau senkrecht zur lokalen Kantenrichtung. −→r berechnet sichaus:

−→r =∑

−→r−→r c(−→r ,−→r0)∑−→r c(

−→r ,−→r0)

Etwas schwieriger wird es bei Kanten, die sehr nahe dem Zentrum eines Pixelsliegen. Das USAN ist nun eine Linie, auf der sich die Kante befindet, der Restder Maske wird unterdruckt. Man kann die Kantenrichtung aber finden, indemman die langste Symmetrieachse berechnet:

(x− x0)2(−→r0) =∑−→r

(x− x0)2c(−→r ,−→r0)

(y − y0)2(−→r0) =∑−→r

(y − y0)2c(−→r ,−→r0)

und

(x− x0)(y − y0)(−→r0) =∑−→r

(x− x0)(y − y0)c(−→r ,−→r0)

Das Verhaltnis zwischen (x− x0)2 und (y − y0)2 bestimmt die Ausrichtung derKante, das Vorzeichen von (x− x0)(y − y0), legt fest, ob eine Diagonalkanteeinen positiven oder negativen Gradienten hat.Zum Kategorisieren des Typs der Kante erweist sich ein heuristisches Vorgehenals nutzlich:

• Falls die USAN-Flache kleiner als der Maskendurchmesser ist, handelt essich wahrscheinlich um eine intra-pixel Kante.

• Sonst handelt es sich um eine inter-pixel-Kante, außer das Gravitations-zentrum ist weniger als einen Pixel vom Nukleus entfernt.

Es bleibt aber auf jeden Fall individuell zu entscheiden, ob die Kantenrich-tungsinformation den Aufwand rechtfertigt, was fur jedes Anwendungsgebietabzuwagen sein wird.Hat man die Richtungsinformationen extrahiert, konnte nun noch eine Nonmaxima-Unterdruckung folgen.

Bewertung von SUSAN:

• Unscharfere Kanten werden mit einer geringeren USAN-Flache im Kan-tenzentrum bestraft. Das kann sich als Vorteil erweisen.

• Im Gegensatz zu Canny braucht SUSAN keinen abschließenden (zeit-aufwandigen) Hysterese Schritt. Deswegen ist der Algorithmus um einVielfaches schneller.

• Die Erkennungsleistung von SUSAN hangt nicht von der Maskengroße ab(naturlich ab einer 3× 3 Maske).

26

Page 28: Kantenerkennung in Bildern

• Rauschunterdruckung ist durch den geometrischen Schwellwertschritt gut.

• Auch Y-formige Kanten werden, im Gegensatz zu Canny, gut verbunden.

• SUSAN platziert sich hinsichtlich der quantitiven Kriterien von [3] souve-ran auf Platz 4.

27

Page 29: Kantenerkennung in Bildern

3 Zusammenfassung und Ausblick

Im Rahmen dieser Arbeit wurde ein Uberblick uber die popularsten sowieausgewahlte neuere Kantendetektoren gegeben.Welche der vorgestellten Detektoren die ”besten“ Ergebnisse liefern, lasst sichallerdings, wenn uberhaupt, nur tendenziell festlegen. Zwar war Cannys De-tektor der erste, der merkbare Verbesserungen gegenuber einfachen Richtungs-ableitungen brachte und wird auch heute noch sehr oft eingesetzt; jedoch darftrotzdem nicht davon ausgegangen werden, dass ein Verfahren unter allen Um-standen optimales Verhalten liefert. Ganz abgesehen davon ist Cannys Verfahrenaufgrund des zeitaufwandigen Hystereseschrittes bei geschwindigkeitskritischenAnwendungen reinen Faltungsoperatoren unterlegen.

Aus diesem Grund - und auch, weil es sich immer lohnt, Alternativen zubetrachten - wurden in dieser Arbeit auch weniger bekannte Verfahren, wieSUSAN, Haralicks integrierter Gradientendetektor und Weiterentwicklungen desCanny-Verfahrens betrachtet. Von SUSAN, Haralicks integriertem Gradienten-detektor und dem Haralick-Kantendetektor wurden Prototypen in Matlab er-stellt.Die nachfolgenden Kantenstarkebilder wurden mit diesen Prototypen aus demOriginalbild errechnet, es fehlen jedoch eventuelle Nachbearbeitungsschritte;insbesonders findet kein Thinning statt (d.h. die gefunden Kanten sind fallweisebreiter als einen Pixel).1

(a) Das Originalbild (b) Nach Kantenfindung mit integrier-tem Gradientendetektor

1Das Copyright des Bildes liegt bei Playboy Enterprises, Inc.. Die Verwendung wird vonPlayboy mittlerweile toleriert (Quelle: http://www.cs.cmu.edu/˜chuck/lennapg/editor.html).Das Bild ist der de-facto Industriestandard zum Testen von Bildverarbeitungsalgorithmen.

28

Page 30: Kantenerkennung in Bildern

(c) Nach Kantenfindung mit demHaralick-Kantendetektor

(d) Nach Kantenfindung mit demSUSAN-Kantendetektor

Abbildung 2: Ergebnisse der Prototypen

In einer zweiten Arbeit wird nun daher die Umsetzung dieser Prototypen ineinem eigenstandigen Programm mit grafischer Oberflache als Ziel dienen. Dabeiist geplant, die Algorithmen in Form von C(++)-Dateien in die Oberflache, diein der Sprache C++, unterstutzt durch die QT-Bibliothek, gestaltet werdenwird, einzubinden, was sich gleichzeitig als Test fur die tatsachliche Praxistaug-lichkeit der Algorithmen anbietet.

Dabei kann als grobe Hilfestellung auf die wahrend der Implementierung derMatlab-Prototypen gesammelte Erfahrung zuruckgegriffen werden; ein Haupt-augenmerk muss bei der Umsetzung der Verfahren aber auf der effizienten Im-plementierung liegen, die sich in Matlab leicht mit Hilfe (effizienter) integrierterRoutinen bewerkstelligen lasst, in C(++) aber selbst erarbeitet werden muss.

29

Page 31: Kantenerkennung in Bildern

A Qualitativer und quantitativer Vergleich vonKantendetektoren

Wahrend es eine Vielzahl an Losungsvorschlagen fur das Problem der Kan-tenerkennung in Bildern selbst gibt, existiert weit weniger Material uber denVergleich bereits entwickelter Methoden.Die wohl naheliegendste Moglichkeit, die Ergebnisse eines Kantenfindungsalgo-rithmus auszuwerten, ist der visuelle Vergleich von Bildern durch einen Betrach-ter. Es wird jedoch oft die mangelnde Objektivitat und die Abhangigkeit vomEmpfinden des jeweiligen Betrachters an diesem Vorgehen kritisiert, weshalb furden Vergleich von Kantenstarkebildern Metriken geschaffen wurden.

Reprasentativ sollen hier zwei dieser Metriken vorgestellt werden:

A.1 Pratt-Metrik

Die Pratt-Matrik bezieht sich auf eine ideale Kantenabbildung, die man zueinem Bild zusatzlich zu dem Ergebnis des Algorithmus vorliegen hat.Ob man hier die ideale Kantenabbildung selbst findet oder beispielsweise Er-gebnisse des Canny-Algorithmus schrittweise durch Nachbearbeitung verbessert,wird offen gelassen. Die Referenzkanten in der idealen Kantenabbildung solltenjedoch moglichst einen Pixel breit sein.Dann ist das Bewertungskriterium fur den Algorithmus

E1 =1

max{nd, nt}

nd∑i=1

11 + ad2

i

wobei nd die Anzahl der durch den Kantenfindungsalgorithmus gefundenenKanten und nt die Anzahl der in der idealen Kantenabbildungen vorhandenenKanten ist. Bei di handelt es sich um den Abstand einer durch den Algorithmuserkannten Kante zu der nachsten (vom Pixel der erkannten Kante ausgehend)moglichen Kante.Durch max{nd, nt} werden false-positives und false-negatives bestraft, mithilfedes Skalierfaktors a kann man regeln, ob man zu ”dicke“ Kanten oder dunne,aber falsche gelegene Kanten mehr bestrafen mochte.

Eine hohere Pratt-Metrik bedeutet demzufolge ein besseres Ergebnis, ge-messen anhand des Abstandes der gefundenen zu den erwarteten Kanten undauch ausgehend von der Anzahl der false-positives und false-negatives. Eineausfuhrlichere Zusammenfassung des Messverfahrens findet sich in [14].

A.2 Rosenfeld-Metrik

Wahrend die Pratt-Metrik hauptsachlich lokale Kanteneigenschaften wie dieEigenschaft als false-positive oder das Fehlen der Kante an der zu erwartendenStelle bzw. den Abstand der Kante zur tatsachlich auftretenden untersucht,betrachtet die Rosenfeld-Metrik vornehmlich die Kantenkoharenz.

30

Page 32: Kantenerkennung in Bildern

Somit ist die Rosenfeld-Metrik kein ausreichendes aber zusatzlich zu einer an-deren Metrik eventuell ein aussagekraftiges Bewertungskriterium.Bevor man jedoch das eigentlich Prinzip der Rosenfeld-Metrik betrachten kann,muss man noch einige Vorbereitungen treffen: Mochte man wissen, wie gut sichein Kantenpixel im Bild nach links fortsetzt, kann man dafur eine Funktion L(k)definieren:

L(k) =

{a(d, dk)a(kπ

4 , d+ π2 ) falls Nachbar k ein Kantenpixel ist

0 sonst(5)

d kennzeichnet dabei die Kantenrichtung des getesteten Pixels, di die Richtungder Nachbarpixel vom rechten Pixel ausgehend im Gegenuhrzeigersinn.a ist eine Metrik fur den Winkelunterschied:

a(α, β) =π − |α− β|

π

Ersetzt man in (5) d+ π2 durch d− π

2 , so erhalt man eine analoge Funktion R(k)fur die Kantenstetigkeit nach rechts.

Sei C nun der Durchschnitt des großten Wertes von R(k) und des großtenWertes von L(k).Davon ausgehend kann man sich sehr einfach eine Kennzahl T fur die Dunnheitder Kante errechnen; diese besteht aus den sechs ubrigen Pixeln innerhalb derbetrachteten 3×3 Maske (alle Pixel außer dem Zentrum und den jeweils großtenL(k) und R(k)).So erhalt man die Metrik aus den beiden gewonnenen Kenngroßen:

E2 = γC + (1− γ)T

wobei γ frei wahlbar ist, aber naturlich großer 0 und kleiner 1 sein sollte.

B Methoden zur Konturaufbesserung

B.1 Nonmaxima-Unterdruckung

Zum Entfernen von durch den Kantenerkennungsalgorithmus gefundenen Fehl-informationen, die in etwa durch ein verrauschtes Ausgangsbild entstanden sind,erfreut sich die Nonmaxima-Unterdruckung aufgrund ihrer relativen Einfachheitals Nachbearbeitungsschritt großer Beliebtheit.Man vergleicht den Betrag der Kante mit quer zu Ihrer Richtung gelegenenPixeln und geht dabei in etwa nach folgendem Algorithmus vor:

(A) Ermittle zwei Nachbarn (aus den 8 umherliegenden Pixel) des aktuellenPixels, so dass ”quer zur Kantenrichtung“ gilt. Wahle dazu aus den Rich-tungsmasken auf Basis der Gradientrichtung α des aktuellen Pixels.

31

Page 33: Kantenerkennung in Bildern

(B) Uberprufe ob sich die Gradientenrichtung des Pixels und seiner beidenNachbarn um weniger als einen Schwellwert unterscheidet. Ist der Unter-schied großer als, wahlweise ±15◦, ±45◦ oder ±90◦, nimm den nachstenPixel und beginne wieder bei (A).

(C) Falls der Gradientenbetrag des aktuellen Pixels nicht großer ist, als derbeider Nachbarn, wird er auf 0 gesetzt.Beginne mit dem nachsten Pixel wieder bei (A)

(D) Eventuell kann man noch alle Pixel, die einen gewissen Schwellwert unter-schreiten, auf 0 setzen.

Dasselbe Verfahren kann auch mit 4 Nachbareintragen durchgefuhrt werden.Man wahlt, je nach lokal Kantenrichtung (in 45◦ Schritten) z.B. die links undlinks unten und rechts und rechts oben gelegenen Eintrage.

B.2 Hysterese

Das Hystereseverfahren wird durch zwei Schwellwerte T1 und T2 gesteuert.T1 legt den Schwellwert fest, der benotigt wird, damit ein Grat als Kante imBinarbild bestehen bleibt und T2 denjenigen (quasi unteren) Schwellwert, biszu dessem Erreichen der Algorithmus der Kante folgt. Die Schwellwerte sindentweder statisch vorgegeben und mussen bereits vor der Durchfuhrung desVerfahrens als zumindest fur den Großteil der erwarteten Bilder sinnvolle Wertegewahlt werden oder werden wie bei 1.3.2 dynamisch aus im Bild vorhandenenInformationen gewonnen. Dies ist insbesonders deswegen sinnvoll, weil Bilderoft nicht uber das gleiche Helligkeits- oder Kontrastverhaltnis verfugen.

Als sehr großer Nachteil des Hystereseschritts wird immer dessen große Re-chenintensitat angefuhrt, die sich im schlimmsten Fall im Bereich von O(n)bewegt. Das klingt zwar nach einer geringen Komplexitat, relativiert sich aber,wenn man bedenkt, dass die allermeisten Methoden der Kantenerkennung O(1)als Komplexitatsmaß haben.

B.3 Thinning-Verfahren

Sehr viele Kantenfindungsalgorithmen besitzen die unangenehme Eigenschaft,dass sie im Kantenstarkebild, das sie aus dem Originalbild erzeugen, viele Kan-ten kunstlich verbreitern.Werden die Kanteninformationen dabei so stark beeintrachtigt, dass auf demProzess aufbauende Schritte diese nicht ohne Zwischenverarbeitungsschritt ver-wenden konnen oder benotigt man exakte Linieninformationen (etwa zur Schrif-terkennung oder zum Verarbeiten von Fingerabdrucken), so ist man auf einenThinning-Schritt in der Nachbearbeitung angewiesen.

Ahnlich wie in der Kantenerkennung selbst, existiert auch hier eine erschla-gende Vielfalt an Verfahren, die jedoch nicht immer dasselbe Ziel verfolgen, danie exakt festgelegt wurde, welche Aufgabe ein Thinning-Algorithmus zu erfullen

32

Page 34: Kantenerkennung in Bildern

hat.Davon unabhangig bringen Thinning-Verfahren oft unerwunschte Storeffekte indas Bild ein. Exemplarisch soll hier dennoch das bekannteste Verfahren, erortertvon Zhang und Suen in [15], vorgestellt werden.Fur den Kantenpixelkandidaten P1, uber dem die Maske zentriert ist, gilt dabeifolgende Nachbarschaft:

P9 P2 P3

P8 P1 P4

P7 P6 P5

Das Verfahren folgt zwei Iterationen. Im ersten Schritt wird P1 geloscht (ineinem Binarbild auf 0 gesetzt), falls folgende vier Bedingungen erfullt sind:

1) 2 ≤ B(P1) ≤ 6

2) A(P1) ≤ 1

3) P2 · P4 · P6 = 0

4) P4 · P6 · P8 = 0

wobei A(P1) die Anzahl der 01-Ubergange in der geordneten Menge P2 . . . P9 istund B(P1) die Anzahl der Nachbarn von P1, deren Intensitatswert nicht 0 ist.In der zweiten Iteration erfolgt genau dieselbe Prozedur, mit dem einzigenUnterschied, dass sich die Loschbedingungen 3 und 4 andern:

3’) P2 · P4 · P8 = 0

4’) P2 · P6 · P8 = 0

Die erste Iteration entfernt dabei sudostliche Kantenbegrenzungen und nord-westliche Eckpunkte, wahrend die zweite Iteration nordwestliche Kantenbegren-zungen und sudostliche Eckpunkte behandelt.Das Verfahren terminiert, wenn keine Punkte mehr entfernt werden konnen;durch die Bedingungen 1 und 2 bleibt das Skelett erhalten.Man sieht, dass dieser Nachbearbeitungsprozess die besonders angenehme Ei-genschaft hat, keinerlei Kantenrichtungsinformationen zu benotigen.

C Interpolation durch Polynome

Vor allem zur Kantenfindung in den sogenannten Facet-Models wurde mangerne Polynome aus den diskreten Bilddaten erzeugen, deren integrierten Gra-dienten oder zweite Ableitung man gerne betrachten wurde, beziehungsweise dieman gerne innerhalb eines statistischen Zusammenhanges, wie zum Beispiel beiHaralicks Sloped Facets, betrachten wurde.Man versucht dazu die Bilder, die als diskrete Matrixeintrage vorliegen, durchfolgendes Polynom zu interpolieren:

33

Page 35: Kantenerkennung in Bildern

f(r, c) = k1 + k2r + k3c+ k4r2 + k5rc+ k6c

2 + k7r3 + k8r

2c+ k9rc2 + k10c

3

Da das Ausrechnen der Polynomkoeffizienten aus 10 Gleichungen viel zu aufwan-dig ware, schlagt Haralick vor, Masken zu verwenden, um diese zu berechnen.Es gilt Koeffizienten fur das Polynom

k1 + k2xi + k3x2i = fi

zu finden.

Man kann sich nun der Eigenschaft bedienen, dass man die Stutzstellen furdie Interpolation frei wahlen darf. Wahlt man diese symmetrisch um die 0, soergeben sich prinzipbedingt einige Vereinfachungen. Lost man nun namlich einGleichungssystem mit i diskreten Funktionswerten nach den Koeffizienten auf,so entfallen einige Glieder der Gleichungen aus Symmetriegrunden.

Hat man diese vorbereitenden Maßnahmen getroffen, verwendet man nun, umdie Koeffizienten zu interpolieren, ein Verfahren, das auf orthogonalen Polyno-men fußt. Die hier gewahlten Polynome sind so beschaffen, dass gilt:

∫ b

a

gm(x)gn(x)dx ={h2

n 6= 0 falls m = n0 sonst (6)

wobei hn die Norm der Funktion g ist.

Es gilt also, fur f(x) = k0+k1g1(x)+. . . eine Koeffizienteninterpolation durch-zufuhren. Man kann nun beide Seiten mit gn(x) multiplizieren und integrierenund erhalt:

∫ b

a

f(x)gn(x) = k0

∫ b

a

gn(x)dx+ k1

∫ b

a

g1(x)gn(x)dx+ . . . (7)

Wegen (6) verschwinden aus (7) alle Glieder der rechten Seite, außer:∫ b

a

gn(x)gn(x)dx = knh2n

Somit gilt nun

kn = (1/h2n)

∫ b

a

f(x)gn(x)dx (8)

Es bleibt noch die Entscheidung, welche Polynome, die die oben angefuhrteOrthogonalitatseigenschaft erfullen, man wahlen soll. Besonders gunstig fur In-terpolationsaufgaben sind unter den orthogonalen Polynomen die so genanntenTschebyscheff-Polynome, die charakterisiert sind durch

w(x) =1√

1− x2

34

Page 36: Kantenerkennung in Bildern

h2n =

{π/2 falls n 6= 0π sonst

Die Koeffizienten der Polynome bestimmen sich nun durch:

kn = (1/h2n)

∫ 1

−1

f(x)√1− x2

Tn(x)dx

Ein Vorteil, den uns solche orthogonalen Polynome bieten, ist, dass zur Ver-kleinerung des Naherungsfehlers einfach eine gewisse Anzahl von Polynomenaufzuaddieren ausreicht.Haralick betrachtet (im eindimensionalen Fall) ein Polynom n-ten Grades furReihen (in der Bildintensitatsmatrix) r und P (0) := 1

Pn(r) = rn + an−1rn−1 + . . .+ a1r + a0

Das jeweils nachste unbekannte Polynom bekommt man uber die bereits er-wahnte Orthogonalitatsbedingung.Zum Beispiel errechnet sich P1(r) folgendermaßen:

∑r∈R

P0(r)P1(r) =∑r∈R

(r + a0) = 0

Fur die Reihenindizierung greifen wir wieder auf den alten Trick des symmetri-schen Koordinatensystems zuruck und wahlen zum Beispiel {-2,-1,0,1,2}.Dann ist

∑r = 0, folglich muss a0 = 0 sein. Also ist

P1(r) = r

Analog kann man nun weitere Polynome bestimmen, indem man auf bereitsbestimmte Polynome, die Orthogonalitatseigenschaft und die Vorteile, die sichdurch die gewahlte Reihenindizierung ergeben, zuruckgreift.So erhalt man die Polynome

P0(r) = 1P1(r) = rP2(r) = r2 − µ2/µ0

P3(r) = r3 − (µ4/µ2)rP4(r) = r4 + (µ2µ4−µ0µ6)r

2+(µ2µ6−µ24)

µ0µ4−µ22

wobeiµk =

∑r∈R

rk

Die so gewonnenen Pi konnen nun als Koeffizienten fur Zeilen- und Spaltenein-trage genutzt werden (indem man Pi(r) und Pi(c) berechnet).

Erinnern wir uns an (8). Die Koeffizienten fur eindimensionale Interpolationvon Bildintensitatsdaten waren nun:

35

Page 37: Kantenerkennung in Bildern

km =∑r∈R

Pm(r)∑s∈R P

2m(s)

f(r)

wobei f(r) den Grauwert des Pixels r darstellt.In der zweiten Dimension stellt sich der Term dar als:

Mm(r, c) =Pm(r, c)∑

s∈R

∑t∈C P

2m(s, t)

Daraus lassen sich Masken zur Polynom-Koeffizienten-Interpolation ableiten, dieneun 3 × 3 Masken fur den quadratischen Fit finden sich (in einer gegenuberdes Originaltextes korrigierten Version) in [16], die zehn 5 × 5 Masken fur denkubischen Fit finden sich in Abschnitt 2.1.2.

Jedoch ist die Faltung des Bildes mit einer 2D-Faltungsmatrix zur Koef-fizienteninterpolation immer noch rechenintensiv. Deswegen schlagen Ji undHaralick in [13] vor, zwei 1D Faltungsmatrizen zu verwenden. Dabei greifensie auf die Eigenschaft zuruck, dass diskrete orthogonale Polynome auch alsTensorprodukte zweier 1D Polynome gebildet werden konnen.Sei zum Beispiel (wieder in unserem symmetrischen Koordinatensystem) die 1DGewichtungsmatrix w1

0 0-ten Grades 15 [1 1 1 1 1]′ und die 1D Gewichtungsmatrix

w11 1-ten Grades 1

10 [−2 − 1 0 1 2]′ so erhalt man w12 aus dem Tensorprodukt

der beiden Vektoren und w13 aus deren Kreuzprodukt.

36

Page 38: Kantenerkennung in Bildern

Literatur

[1] Robert M. HaralickEdge and region analysis for digital image dataComputer Graphics and Image Processing 12 (1980) 60-73

[2] S.M. Smith, J.M. BradySUSAN - A new approach to low level image processingTechnical Report TR95SMS1c, Oxford University, 1995

[3] D.P. Argialas, O.D. MavrantzaComparison of Edge Detection and Hough Transform Techniques for theExtraction of Geologic FeaturesInternational Society for Photgrammetry and Remote Sensing, Commis-sion III, WG4, Istanbul 2004

[4] Wilhelm Burger, Mark J. BurgeDigitale BildverarbeitungSpringer-Verlag-Berlin, 2005

[5] D. Marr, E. HildrethTheory of Edge DetectionProceedings Royal Society of London, vol. B207, pp. 187-217, 1980

[6] C.A. Rothwell, J.L. Mundy, W.Hoffmann, V.D. NguyenDriving Vision by TopologyProceedings IEEE Symposium on Computer Vision, pp. 395-400, 1995

[7] Peter Meer, Bogdan GeorgescuEdge Detection with Embedded ConfidenceIEEE Transactions on Pattern Analysis and Machine Intelligence, Volu-me 23, pp. 1351 - 1365, 2001

[8] L. Iverson, S.W. ZuckerLogical/Linear Operators for Image CurvesIEEE Transactions on Pattern Analysis and Machine Intelligence, Volu-me 17, pp. 982 - 996, 1995

[9] J.C. Bezdek, M. ShirvaikarEdge detection using the fuzzy control paradigmProc 2nd European Congress on Intelligent Techniques and Soft Com-puting, Verlag der Augustinus Buchhandlung, Aachen, 1994, Vol 1, pp1-12.

[10] M.J. Black et alRobust Anisotropic DiffusionIEEE Transactions on Image Processing, Volume 7/3, 1998

[11] Robert M. HaralickDigital step edges from zero crossings of second directional derivativesIEEE Transactions on Pattern analysis and machine intelligence, Volume6, pp. 58-68, 1984

37

Page 39: Kantenerkennung in Bildern

[12] O.A. Zuniga, Robert M. HaralickIntegrated directional derivative gradient operatorIEEE Transactions on Systems, Man and Cybernetics, pp. 508 - 517,1987

[13] Qiang Ji, Robert M. Haralick.Efficient Facet Edge Detection and quantitative performance evaluation. The Journal Of The Pattern Recognition Society. 2002 (35), pp 689-700

[14] I. Avcıbas, B. Sankur, K. SayoodStatistical evaluation of image quality measuresJournal of Electronic Imaging 11(2), pp. 206 - 223, 2002

[15] T.Y. Zang, C.Y. SuenA Fast Parallel Algorithm for Thinning Digital PatternsCommunications of the ACM, Volume 27, pp. 236 - 239, 1984

[16] Henning Bassmann, Philipp W. BesslichKonturorientierte Verfahren in der digitalen BildverarbeitungSpringer-Verlag-Berlin, 1989

38