Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . ....

253
Skriptum Lineare Algebra Prof. Dr. Ren´ e Grothmann Stand: Oktober 2009

Transcript of Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . ....

Page 1: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Skriptum Lineare Algebra

Prof. Dr. Rene Grothmann

Stand: Oktober 2009

Page 2: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2

Page 3: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Inhaltsverzeichnis

1 Grundlagen der Mathematik 11

1.1 Einfuhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2 Mathematische Logik . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.2.1 Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.2.2 Axiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.2.3 Satze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.2.4 Logische Aussagen . . . . . . . . . . . . . . . . . . . . . . 16

1.2.5 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.2.6 Beweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.3 Mengen und Abbildungen . . . . . . . . . . . . . . . . . . . . . . 25

1.3.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.3.2 Gleichheit von Mengen . . . . . . . . . . . . . . . . . . . . 26

1.3.3 Potenzmenge . . . . . . . . . . . . . . . . . . . . . . . . . 28

1.3.4 Vereinigung und Schnitt . . . . . . . . . . . . . . . . . . . 28

1.3.5 Relationen und Abbildungen . . . . . . . . . . . . . . . . 32

1.3.6 Bild, Urbild, Umkehrabbildung . . . . . . . . . . . . . . . 34

1.4 Die naturlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 41

1.4.1 Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

1.4.2 Rekursive Konstruktion . . . . . . . . . . . . . . . . . . . 45

1.4.3 Endliche Mengen . . . . . . . . . . . . . . . . . . . . . . . 47

1.4.4 Abzahlbare Mengen . . . . . . . . . . . . . . . . . . . . . 52

1.4.5 Das Auswahlaxiom . . . . . . . . . . . . . . . . . . . . . . 55

3

Page 4: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4 INHALTSVERZEICHNIS

2 Vektorraume 57

2.1 Korper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

2.1.1 Definition, Eigenschaften und Beispiele . . . . . . . . . . . 57

2.1.2 Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . 61

2.2 Vektorraume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

2.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

2.2.2 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

2.2.3 Unterraume . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.2.4 Aufgespannter Unterraum . . . . . . . . . . . . . . . . . . 68

2.2.5 Basen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

2.2.6 Endlich-Dimensionale Vektorraume . . . . . . . . . . . . . 75

2.2.7 Summen von Unterraumen . . . . . . . . . . . . . . . . . 79

2.3 Analytische Geometrie . . . . . . . . . . . . . . . . . . . . . . . . 81

2.3.1 Affine Unterraume . . . . . . . . . . . . . . . . . . . . . . 82

2.3.2 Geraden und Ebenen . . . . . . . . . . . . . . . . . . . . . 85

2.3.3 Strecken und konvexe Mengen . . . . . . . . . . . . . . . 88

3 Lineare Abbildungen 93

3.1 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . 93

3.1.1 Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . 93

3.1.2 Dimensionsformel . . . . . . . . . . . . . . . . . . . . . . . 97

3.1.3 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

3.1.4 Matrizenrechnung . . . . . . . . . . . . . . . . . . . . . . 108

3.2 Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . 112

3.2.1 Gaußscher Algorithmus . . . . . . . . . . . . . . . . . . . 112

3.2.2 Berechnung von Basen . . . . . . . . . . . . . . . . . . . . 119

3.2.3 Rang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

3.2.4 Berechnung der inversen Matrix . . . . . . . . . . . . . . 121

3.2.5 Elementarmatrizen . . . . . . . . . . . . . . . . . . . . . . 122

3.2.6 Basiswechsel . . . . . . . . . . . . . . . . . . . . . . . . . 124

3.3 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

3.3.1 Analytische Geometrie . . . . . . . . . . . . . . . . . . . . 131

3.3.2 Affine Abbildungen . . . . . . . . . . . . . . . . . . . . . . 133

3.3.3 Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . 136

3.4 Quotientenraume . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

3.5 Dualraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

Page 5: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

INHALTSVERZEICHNIS 5

4 Das Skalarprodukt 145

4.1 Skalarprodukte und Normen . . . . . . . . . . . . . . . . . . . . . 145

4.1.1 Skalarprodukte . . . . . . . . . . . . . . . . . . . . . . . . 145

4.1.2 Normen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

4.2 Orthogonalitat . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

4.2.1 Senkrechte Vektoren . . . . . . . . . . . . . . . . . . . . . 154

4.2.2 Orthogonale Projektion . . . . . . . . . . . . . . . . . . . 161

4.2.3 Orthogonale Abbildungen . . . . . . . . . . . . . . . . . . 167

4.2.4 Orthogonale Unterraume . . . . . . . . . . . . . . . . . . 171

4.2.5 Die adjungierte Abbildung . . . . . . . . . . . . . . . . . . 172

4.3 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

4.3.1 Ausgleichsrechung und Lineare Regression . . . . . . . . . 174

5 Determinanten 179

5.1 Definition und Eigenschaften . . . . . . . . . . . . . . . . . . . . 179

5.1.1 Determinante als Flache . . . . . . . . . . . . . . . . . . . 179

5.1.2 Permutationen . . . . . . . . . . . . . . . . . . . . . . . . 180

5.1.3 Die Determinante . . . . . . . . . . . . . . . . . . . . . . 182

5.2 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

5.2.1 Cramersche Regel . . . . . . . . . . . . . . . . . . . . . . 191

5.2.2 Das Kreuzprodukt . . . . . . . . . . . . . . . . . . . . . . 192

5.2.3 Volumen und Flache . . . . . . . . . . . . . . . . . . . . . 194

5.2.4 Positiv definite Matrizen . . . . . . . . . . . . . . . . . . . 195

5.2.5 Dreieckstraversalen . . . . . . . . . . . . . . . . . . . . . . 197

6 Eigenwerte 203

6.1 Definition und Eigenschaften . . . . . . . . . . . . . . . . . . . . 203

6.1.1 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

6.1.2 Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . 208

6.1.3 Diagonalisierbarkeit . . . . . . . . . . . . . . . . . . . . . 212

6.1.4 Selbstadjungierte Endomorphismen . . . . . . . . . . . . . 219

6.1.5 Das Minimalpolynom . . . . . . . . . . . . . . . . . . . . 220

6.2 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230

6.2.1 Positiv definite Matrizen . . . . . . . . . . . . . . . . . . . 230

6.2.2 Quadriken . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

6.2.3 Singularwerte . . . . . . . . . . . . . . . . . . . . . . . . . 241

6.2.4 Drehungen . . . . . . . . . . . . . . . . . . . . . . . . . . 245

6.2.5 Differenzengleichungen . . . . . . . . . . . . . . . . . . . . 247

Page 6: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6 INHALTSVERZEICHNIS

Page 7: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Vorwort

Das Skript

Dieses Skript entstand fur eine Vorlesung uber ”‘Lineare Algebra und Analyti-sche Geometrie”’ im Winter- und Sommersemester 2004/2005 an der Katholi-schen Universitat Eichstatt.

Mit dem Aufkommen der Massenuniversitaten im 19. Jahrhundert etabliertesich der noch heute ubliche Stil der Vorlesung mit begleitenden Ubungen. In deroft uberfullten Vorlesung tragt der Dozent aus einem vorbereiteten Skript vor.Die Studenten schreiben so weit wie moglich mit und machen sich zusatzlicheNotizen. In der Mathematik fuhrt dies dazu, dass der Dozent ein vollstandi-ges Skript an der Tafel entwirft und die Studenten dieses Skript mitschreiben,ohne Zeit zu haben, den Stoff gedanklich zu begleiten. Erst durch eine Nach-bereitung (wenn sie erfolgt) und durch das Bearbeiten der Ubungen wird derStoff verstanden. Die offensichtliche Ineffizienz eines bloßen Mitschreibens solldas vorliegende Skript vermeiden helfen. Der Student kann sich auf zusatzlicheNotizen beschranken. Er soll damit in die Lage versetzt werden, der Vorlesungzu folgen. Gedankenloses Mitschreiben wird vermieden.

Naturlich wird es immer Dinge geben, die der Dozent dem Skript hinzufugt.Zum einen geht er vielleicht auf Zwischenfragen ein, zum anderen rechnet ermoglicherweise zusatzliche Beispiele vor, oder er fertigt Skizzen an, die nicht imSkript enthalten sind.

Nicht alles, was im Skript steht, muss auch in der Vorlesung detailliert be-handelt werden. Stattdessen sollte der Dozent Wert auf das Vermitteln vonVerstandnis, Motivation und auf die beispielhafte Demonstration von Beweis-und Rechentechniken setzen. Es ist besser ein Detail genau und verstandlichvorzutragen, oder einen Gedanken zu vertiefen, als durch den Stoff zu hetzen.An anderen Stellen kann eventuell auf eine oberflachliche Darstellung zuruckge-griffen werden.

Ein Skript ist kein Lehrbuch. Lehrbucher unterscheiden sich von Skriptendurch langere Texte und durch kurzere Rechnungen. Sie eignen sich nicht alsVorlesungsskripte. Naturlich nimmt man in ein gedrucktes Skript zur Erhohungder Lesbarkeit auch Texte auf, die der Dozent normalerweise nicht an die Tafelschreibt, sondern nur als Kommentar sagt.

7

Page 8: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

8 INHALTSVERZEICHNIS

Studium der Mathematik

Wahrend die Schule sich mehr auf Rechentechniken und deren Anwendung kon-zentriert, steht in der Universitat die Abstraktion und das Beweisen im Vor-dergrund. Dieser Kulturschock ist fur die angehenden Mathematiker nur schwerverdaulich.

In Wirklichkeit gibt es aber zahlreiche Uberlappungen. Der Dozent der Hoch-schule sollte sich im Gesprach um das Vorwissen der Studenten bemuhen, unddie bekannten Dinge zum Stoff in Beziehung setzen. Dadurch entstehen fur denStudenten gedankliche Anknupfungspunkte und er fuhlt sich weniger verloren.Leider tendiert auch der Autor dieser Zeilen dazu, den Schulstoff zu sehr zuvernachlassigen. Umgekehrt sollte sich die Schule bemuhen, mehr als bisher Be-weise und Grundlagen in den Unterricht aufzunehmen. In der Tat gibt es vieleLehrer, die sich dieser Herausforderung bewusst sind.

Man muss sich daruber im Klaren sein, dass das Studium der Mathematikauf verschiedensten Ebenen stattfindet.

• Auf der untersten Sprosse steht das sachliche Verstandnis der Tatsachen,die in der Vorlesung gelehrt werden. Dies allein ist eine Herausforderung,da die Aussagen logisch verstanden werden mussen, ebenso wie die kor-rekte Definition der mathematischen Objekte.

• Die direkte Anwendung der Vorlesung und der dort vorgestellten Me-thoden ist der nachste Schritt. Ubungen sollten einen großen Anteil anRechenaufgaben enthalten, ebenso wie die Beispiele der Vorlesung. DieAnwendung der Mathematik ist auch motivationsfordernd.

• Schwieriger ist es schon, Beweise und Begrundungen nachvollziehen zukonnen. Es ist aber fur einen Mathematiker nicht nur wichtig zu wissen,was gilt, sondern auch warum.

• Das nachste Level ist das Auffinden eigener Beweise zu vorgegebenen Zu-sammenhangen. Knobelaufgaben sind ein wichtiger Bestandteil der Ubun-gen, die sich nicht nur auf Rechenaufgaben beschranken durfen.

• Auf der obersten Sprosse steht das Entdecken neuer Zusammenhage. Dieswird leider zu sehr vernachlassigt, obwohl schon auf niedrigem Niveau neueFragen aufgeworfen werden konnten. Selbst viele Diplomarbeiten enthal-ten keine vom Studenten selbst entdeckte und begrundete neue Zusam-menhange.

Ziel des Mathematikstudiums sind nicht nur mathematische Satze, sondernauch Grundlagen, systematisches und logisches Denken, sowie Hartnackigkeitbeim Losen von Problemen.

Lineare Algebra

Lineare Algebra beschaftigt sich im Kern mit dem Studium linearer Gleichun-gen, also Gleichungen, in denen die Variablen nur linear vorkommen (nicht qua-driert oder ahnliches). In der Schule werden neben Geradengleichungen auch

Page 9: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

INHALTSVERZEICHNIS 9

Systeme lineare Gleichungen behandelt. Außerdem werden Ebenengleichungenbehandelt (Hessesche Normalform). Diese Theorie wird ausgebaut, die Losungs-menge von linearen System beschrieben, und es werden andere Koeffizienten-mengen behandelt (zum Beispiel Gleichungen mit komplexen Koeffizienten). DieMatrizenrechnung vereinfacht weiter den Umgang mit linearen Gleichungen.

Daruber hinaus werden Determinanten, Skalarprodukte und Eigenwerte be-handelt. Die ersten beiden Stoffgebiete tauchen moglicherweise auch schon inder Schule auf, zumindest in Spezialfallen. Eigenwerte sind normalerweise volligneu.

Eine wichtige Anwendung der Techniken der linearen Algebra ist die analy-tische Geometrie, also das Studium von geometrischen Objekten in der Ebeneoder im Raum mit Hilfe von Koordinaten. Auch hier gibt es reiche Anknupfungs-punkte mit der Schule, wie etwa Geraden- und Ebenengleichungen, sowie senk-rechten Vektoren. Aus der Schule stammt die Bezeichnung ”‘Vektorrechnung”’.Ein spezieller Gegenstand sind Quadriken, die in der Schule moglicherweise inForm von Ellipsen auftauchen.

Das vorliegende Skript legt aber auch Wert auf algebraische Strukturen, alsoMengen, in denen man nach vorgegeben Gesetzen rechnen kann. Die wichtigs-ten behandelten Strukturen sind Korper und Vektorraume. In dem Kapitel uberGrundlagen werden Gruppen als Beispiel behandelt. Nichtkommutative Grup-pen kommen in Form von Abbildungsraumen vor. Aber auch Skalarprodukteund Determinanten sind wichtige algebraische Strukturen.

Literatur

Gerd Fischer, Lineare Algebra, Vieweg Verlag.Gerd Fischer, Analytische Geometrie, Vieweg Verlag.

Page 10: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

10 INHALTSVERZEICHNIS

Page 11: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Kapitel 1

Grundlagen derMathematik

1.1 Einfuhrung

Oft wird Mathematik mit Rechnen gleichgesetzt. Naturlich ist das Berechnenvon Werten oder das numerische Losen von Gleichungen eine der Hauptanwen-dungen der Mathematik. Aber Mathematik ist mehr. Sie ist daruber hinaus dieFahigkeit, zu abstrahieren. Das bedeutet, dass wir ein konkretes Problem in einemathematische Welt ubersetzen und dort studieren.

Dabei werden sehr unterschiedliche Probleme mit denselben mathematischenMethoden behandelt.

• Losen von Gleichungen. Schon in der Schule wird das Losen von Glei-chungen in verschiedenen Zusammenhangen angewendet. Man kann damitBewegungsprobleme losen, Geldbetrage oder Zinsen berechnen, oder auchgeometrische Großen, wie Flachen, Strecken oder Winkel, bestimmen.

• Wahrscheinlichkeitsrechung. Die Wahrscheinlichkeitsrechnung uberallangewandt, wo der Zufall mathematisch erfasst werden soll, vom Wurfelnbis zur Umfrage. Immer wird dieselbe mathematische Theorie verwendet.

• Differential- und Integralrechnung. Diese schon in der Schule ver-wendeten Kalkule haben ebenfalls vielfaltige Anwendungen, von der Be-stimmung der Extremwerte von Funktionen bis zur Berechnung des freienFalls in der Physik.

Solche Theorien mit breitem Anwendungsspektrum zeigen die Nutzlichkeitder mathematischen Abstraktion.

Der Nutzen der mathematischen Abstraktion besteht dar-in, dass die unterschiedlichsten Probleme in denselben ma-thematischen Rahmen gestellt werden und dort exakt undallgemeingultig losbar sind.

11

Page 12: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

12 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Eine mathematische Theorie abstrahiert also von einem konkreten Pro-blem, indem sie die wichtigsten Eigenschaften und Zusammenhange erfasst undfur andere, ahnlich gelagerte Probleme zur Verfugung stellt. Außerdem werdenso die wesentlichen Dinge herausgehoben, und Unwesentliches weggelassen.

In Abbildung 1.1 ist das schematisch festgehalten. Dort wird fur ein konkre-tes Problem das Wort ”‘Modell”’ verwendet. Man konnte stattdessen von auch”‘Realisierung”’ oder ”‘Anwendung”’ einer mathematischen Theorie sprechen.

Abbildung 1.1: Mathematische Theorie und ihre Modelle

1.2 Mathematische Logik

Wie funktioniert nun diese Ubertragung von konkreten Modellen in mathema-tische Theorien?

1.2.1 Modelle

Ein Modell fur eine mathematische Theorie ist eine gedachte Gesamtheit (wirwollen noch nicht ”‘Menge”’ sagen) von Objekten. Dies kann eine endliche Ge-samtheit oder eine unendliche Gesamtheit sein. Die Zahlen der Zahlgerade Rbilden zum Beispiel eine unendliche Gesamtheit.

Wir sind in einer mathematischen Theorie interessiert an gewissen Eigen-schaften, die die Objekte haben oder nicht haben. Fur ein Objekt x konnten wir

Page 13: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.2. MATHEMATISCHE LOGIK 13

diese Eigenschaft als A(x) schreiben, und fur jedes konkrete Objekt x nehmenwir an, dass A(x) entweder wahr ist oder falsch.

1.1. Beispiel: Fur die reellen Zahlen ist x > 0 so eine Eigenschaft, die entwederwahr ist oder falsch.

Es kann auch Beziehungen zwischen zwei oder mehr Objekten geben, dieerfullt sind oder nicht erfullt sind. Fur zwei Objekte x und y konnten wir dieBeziehung als R(x, y) schreiben, und fur je zwei Objekte ist diese Beziehungentweder erfullt oder nicht.

1.2. Beispiel: Eine Beziehung zwischen zwei reellen Zahlen ist etwa x < y, undeine Beziehung zwischen drei reellen Zahlen ist x+ y = z.

Außerdem kann es sein, dass wir gewisse Objekte als Konstante auszeichnenund mit einem eindeutigen Namen versehen. Ein Objekt mit diesem Namenmuss dann in jedem Modell unserer Theorie vorhanden sein.

1.3. Beispiel: Bei den reellen Zahlen konnten wir die Konstanten 0 und 1festlegen.

Wir sind in unseren Modellen an Eigenschaften von Objek-ten, Beziehungen zwischen Objekten und speziellen Objek-ten, den Konstanten, interessiert.

1.4. Beispiel: Wir treffen oft Gesamtheiten von Objekten an, in denen manaddieren kann. Als Beziehung betrachten wir dann eine Beziehung zwischen jedrei Objekten x, y, z, die besagt, dass die Summe von x und y gleich z ist. Manschreibt das, wie gewohnt, als

x+ y = z.

Beispiele fur Additions-Modelle aus der Schule sind die naturlichen Zahlen, dieBruche, die reellen Zahlen und die Vektoren. Man kann daruber hinaus aberauch Funktionen addieren, oder Matrizen. Diese Schreibweise ist also universelleinsetzbar.

1.2.2 Axiome

Axiome sind Aussagen, die in jedem Modell der Theorie gelten sollen. JedesModell der Theorie muss also alle Axiome erfullen. Durch die Axiome werdenunsere Theorien exakt festgelegt.

Wir legen Axiome fest, die in allen fur uns interessantenModellen gelten sollen.

1.5. Beispiel: Wir kehren zuruck zu unserem Beispiel mit der Addition. Dafurlegen wir nun Axiome fest, die schon aus der Schule bekannt sein sollten.

Page 14: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

14 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

1. Das erste Axiom erscheint selbstverstandlich, verdient es aber, festgehaltenwerden.

Fur alle x, y existiert genau ein z mit x+ y = z.

Dies entspricht unserer Vorstellung von Addition. Aufgrund dieses Axiomsmachen Ausdrucke wie (a+ b) + c erst Sinn und wir konnen wie gewohntrechnen. Wenn namlich a+b nicht eindeutig bestimmt ware, was soll dann(a+ b) + c bedeuten?

2. Als nachstes Axiom haben wir

Fur alle x, y gilt x+ y = y + x.

Dies ist das Kommutativgesetz.

3. WeiterFur alle x, y, z gilt (x+ y) + z = x+ (y + z).

Dies ist das Assoziativgesetz.

4. Wir nehmen auch die Existenz eines neutralen Elements und des In-versen an. Es gibt ein Element 0, so dass gilt

x+ 0 = x fur alle x,

undFur alle x existiert ein y mit x+ y = 0.

Diese Axiome nennt man Axiome einer Gruppe (engl.: group) (genauer, einerkommutativen Gruppe). Wie wir wissen, erfullen die reellen Zahlen diese Axio-me, aber auch die Vektoren. Es gibt aber noch zahlreiche andere interessanteGruppen, denen wir in dieser Vorlesung begegnen werden.

Axiome sollen unabhangig sein. Das heißt, dass man kein Axiom weglassenkann. Das ist der Fall, wenn es ein Modell gibt, dass die anderen Axiome erfullt,aber das wegzulassende Axiom nicht.

Axiome sollen widerspruchsfrei sein. Das bedeutet, dass kein Axiom denubrigen widerspricht. Dies ist genau dann der Fall, wenn es uberhaupt ein Modellfur die Theorie gibt.

1.2.3 Satze

Ein Satz einer Theorie ist eine Aussage, die in allen Modellen der Theorie wahrist. Das heißt, in jedem denkbaren Modell, in dem die Axiome erfullt sind, giltauch der Satz. Damit wird die Theorie allgemein gultig. Solange die Vorausset-zungen erfullt sind, stimmen die Resultate der Theorie.

1.6. Beispiel: Kehren wir zu den Gruppen zuruck. Die folgende Aussage istein Satz der Gruppentheorie.

Es gibt genau ein neutrales Element.

Page 15: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.2. MATHEMATISCHE LOGIK 15

Das bedeutet ausgeschrieben: Wenn 0 und 0 beide die Eigenschaften eines neu-tralen Elementes erfullen, dann ist 0 = 0.

Ein Satz muss bewiesen werden. Dazu verwenden wir logische Argumentedie zeigen, dass der Satz in jedem Modell gelten muss, in dem die Axiome gelten.Man darf dabei keine zusatzlichen Annahmen machen, oder nur Spezialfallebetrachten.

Satze sind allgemein gultige Aussagen. Ihre Aussagen sindin jedem Modell gultig, in dem die Voraussetzungen gelten.Ein Beweis ist eine Argumentation, die die Allgemeingultig-keit nachweist.

1.7. Beispiel: Beweisen wir den oben erwahnten Satz uber die Eindeutigkeitdes neutralen Elements. In einer kommutativen Gruppe ist das nicht schwer.Seien also 0 und 0 neutrale Elemente. Dann gilt

0 + 0 = 0,

weil 0 neutrales Element ist. Außerdem gilt

0 + 0 = 0,

weil 0 neutrales Element ist. Aufgrund des Kommutativgeseztes hat man also

0 = 0 + 0 = 0 + 0 = 0.

Damit ist 0 = 0 bewiesen. Wir haben dazu lediglich das Kommutativgesetzbenotigt.

1.8. Beispiel: Wir zeigen, dass in einer Gruppe auch inverse Elemente eindeutigbestimmt sind. Das ist schon schwerer. Sei x also ein Element der Gruppe undy zu x invers, also

x+ y = 0.

Sei y ebenfalls ein inverses Element, also

x+ y = 0.

Dann addieren wir in der ersten Gleichung y auf beiden Seiten und in der zweiteny. Also

y + (x+ y) = y + 0 = y,

y + (x+ y) = y + 0 = y.

Die beiden linken Seiten sind aber gleich. Denn

y + (x+ y) = (y + x) + y = y + (y + x) = y + (x+ y).

Also folgt y = y. Bei dieser Argumentation haben wir alle Axiome verwendet!

1.9. Bemerkung: Die beiden Aussagen uber die Eindeutigkeit bleiben richtig,wenn man das Kommutativgesetz streicht. Aber sie sind dann nur mit deutlichmehr Aufwand zu beweisen.

Page 16: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

16 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

1.2.4 Logische Aussagen

Da es erfahrungsgemaß am Anfang schwierig ist, in Beweisen exakt und logischzu argumentieren, lohnt es sich, logische Aussagen etwas genauer unter die Lupezu nehmen.

Elementare Aussagen (Pradikate)

Die in unserem Modell betrachteten Eigenschaften und Beziehungen sind dieelementaren Aussagen unserer Theorie. Bei den Gruppen ist die einzige elemen-tare Aussage x+ y = z.

Die Gleichheit v = w ist in jedem Modell eine elementare Aussage, die furje zwei Objekte v und w wahr ist oder falsch. Man sagt, die Objekte seienunterscheidbar.

Boolesche Aussagen

Und. Zwei Aussagen A und B lassen sich mit ”‘und”’ verknupfen. Die Aussage”‘A und B gelten”’ ist genau dann wahr, wenn die Aussagen A und B beide wahrsind.

Oder. Zwei Aussagen A und B lassen sich auch mit ”‘oder”’ verknupfen. ImGegensatz zur Umgangssprache bedeutet dies, dass eine der beiden Aussagenoder auch beide wahr sind.

Nicht. Die Bedeutung der Aussage ”‘A gilt nicht”’ ist klar.

Implikation. Uber die Aussage ”‘Aus A folgt B”’ herrschen dagegen oftUnklarheiten. Die Aussage ist richtig, wenn in jedem Modell, in dem A giltauch B gelten muss. Wenn A in einem Modell nicht gilt, ist es egal, ob B giltoder nicht. Das bedeutet, dass die Aussage gleichbedeutend ist mit ”‘A giltnicht, oder B gilt”’. Wenn die Aussage A immer, also in jedem Modell, falschist, dann ist die Aussage ”‘Aus A folgt B”’ richtig, wenngleich sinnlos (ex falsoquodlibet).

1.10. Beispiel: Ein Satz einer Theorie wird gewohnlich in der Form

Aus A1 und A2 und . . . und An folgt B

wiedergegeben. B muss gelten, wenn alle Voraussetzungen A1, . . . , An gelten.Wenn eine der Voraussetzungen immer falsch ist, dann ist der Satz richtig, abersinnlos. Man nennt A1 bis An die Pramissen des Satzes und B die Konklu-sion.

Aquivalenz. Die Bedeutung der Aussage ”‘A gilt genau dann, wenn Bgilt”’ ist offensichtlich. Die Aussage beweist man in zwei Teilen. Zuerst zeigtman, dass aus A die Aussage B folgt, und dann zeigt man, dass aus B dieAussage A folgt. Man sagt auch oft, dass die Aussagen A und B aquivalentsind.

Page 17: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.2. MATHEMATISCHE LOGIK 17

In der Booleschen Algebra werden fur diese Verknupfungen Zeichen ein-gefuhrt, die wir hier aber bis auf ⇒ und ⇔ nur selten verwenden. DieseZeichen sind

A ∧B, A und B,A ∨B, A oder B,A ⇒ B, Aus A folgt B,A ⇔ B, A und B sind aquivalent,¬A, Nicht A.

Außerdem lernt man, mit booleschen Ausdrucken zu rechnen. In Wahrheits-tafeln wird fur einen booleschen Ausdruck der Wahrheitswert, abhangig vomWahrheitswert der Variablen festgehalten. Hier ist die Wahrheitstafel fur diebisher behandelten booleschen Ausdrucke.

A B A ∨B A ∧B A ⇒ B A ⇔ Bw w w w w ww f w f f ff w w f w ff f f f w w

1.11. Beispiel: Wann ist die Aussage ”‘A und B”’ falsch? Das Gegenteil derAussage ”‘A und B”’ ist offensichtlich die Aussage ”‘Nicht A oder nicht B”’.In der booleschen Algebra stellt sich mit Hilfe von Wahrheitstafeln heraus, dassdie Aussage

¬(A ∧B) ⇔ (¬A) ∨ (¬B).

immer wahr ist. Man nennt solche Aussagen Tautologien.

1.12 Aufgabe: Vervollstandigen Sie die folgende Wahrheitstafel.

A B ¬A ¬B A ∧B (¬A) ∨ (¬B)

w ww ff wf f

1.13 Aufgabe: Wann ist die Aussage ”‘A oder B”’ falsch?

1.14 Aufgabe: Angenommen, alle Kreter sind Lugner. Wenn nun Sokrates ein Kreter

ist, muss er Lugner sein. Was kann daraus geschlossen werden, dass Sokrates Lugner

ist? Was kann daraus geschlossen werden, dass Sokrates kein Lugner ist?

1.15 Aufgabe: Welche der folgenden Aussagen sind Tautologien?

A ⇒ B ⇔ B ⇒ A

A ⇒ B ⇔ ¬B ⇒ ¬A(A ⇒ B) ∧A ⇒ B

(A ⇒ B) ∧ ¬B ⇒ ¬A(A ⇒ B) ∧ ¬A ⇒ ¬B

Page 18: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

18 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Quantoren

Allquantor. Wir betrachten die Aussage ”‘Fur alle x gilt A(x)”’. Dabeiist A(x) eine Aussage, die x als freie Variable enthalt. Eine freie Variable isteine Variable, die nicht schon durch einen anderen Quantor gebunden ist. DieAussage ist in einem Modell richtig, wenn A(x) in dem Modell immer richtigist, egal welches konkrete Objekt x man einsetzt. Man schreibt

∀xA(x).

1.16. Beispiel: Das Kommutativgesetz in einer Gruppe schreibt sich dann als

∀x∀y (x+ y = y + x) .

Dies sind eigentlich zwei ineinander geschachtelte Allquantoren. Man schreibtdas einfach als

∀x,y (x+ y = y + x) ,

da es auf die Reihenfolge der Allquantoren offenbar nicht ankommt.

Existenzquantor. Die Aussage ”‘Es gibt ein x mit A(x)”’ ist genau dannin einem Modell erfullt, wenn es dort ein konkretes Objekt x gibt, fur das A(x)wahr ist. Wir schreiben

∃xA(x).

1.17. Beispiel: Die Existenz des Inversen in einer Gruppe lasst sich damit als

∀x∃y (x+ y = 0)

schreiben, wobei 0 das neutrale Element der Gruppe sei. Hier kommt es naturlichschon auf die Reihenfolge der Quantoren an!

1.18 Aufgabe: Schreiben Sie das Axiom von der Existenz des neutralen Elements

mit Hilfe von Quantoren.

1.19. Beispiel: In der Graphentheorie betrachtet man Modelle mit der Bezie-hung

x→ y

zwischen x und y. In Abbildung 1.2 ist das durch Pfeile angedeutet. Die Punktestellen die Objekte des Modells dar. Wie man sieht, geht von jedem Punkt einPfeil aus. Also ist die Aussage

∀x∃y (x→ y)

in diesem Modell wahr.

1.20 Aufgabe: Uberprufen Sie im Graphen 1.2 die folgenden Aussagen.

(1)

∃x∀y (x→ y)

(2)

∀x∃y (y → x)

Page 19: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.2. MATHEMATISCHE LOGIK 19

Abbildung 1.2: Ein Graph

(3) Es gibt x, y, z, v mit

x→ y, y → z, z → v, v → x.

Wann ist die Aussage ∀xA(x) falsch? Das ist genau dann der Fall, wenn dieAussage ”‘Es gibt kein x, fur das A(x) falsch ist”’ richtig ist. In Zeichen

¬∀xA(x) ⇔ ∃x¬A(x).

Umgekehrt ist die Aussage ∃xA(x) falsch, wenn fur alle x die Aussage ¬A(x)richtig ist.

Sehr oft formuliert man auch die Aussage ”‘Es gibt genau ein x mit A(x)”’.Diese Aussage zerlegt sich in zwei Teile, namlich die Existenz

∃xA(x)

und die Eindeutigkeit

∀x,y (A(x) und A(y) ⇒ x = y) .

Beispielsweise haben wir schon gezeigt, dass es in einer Gruppe genau ein neu-trales Element gibt. Im Beweis haben wir angenommen, dass es zwei solcheElemente gibt, und gezeigt, dass diese Elemente gleich sein mussen.

1.21 Aufgabe: Gibt es in Abbildung 1.2 zu jedem x genau ein y mit x→ y?

1.22 Aufgabe: Formulieren Sie die folgenden Aussagen in logischen Ausdrucken, dienur All- und Existenzquantoren, sowie die Booleschen Grundelemente enthalten. Aund B seien hier beliebige Aussagen, die fur x bzw. y gelten oder nicht gelten.

Page 20: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

20 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

(1) Es gibt mindestens zwei Objekte x und y, fur die die Aussage A gilt.

(2) Es gibt genau zwei Objekte x und y, fur die die Aussage A gilt.

(3) Es gibt hochstens ein Objekt x, fur das die Aussage A gilt.

(4) Kein x, fur das A gilt, erfullt auch B.

(5) Obwohl A nicht gilt, gilt die Aussage B.

(6) Entweder gilt A oder B.

1.2.5 Definitionen

Definitionen sind einfach Abkurzungen fur haufig verwendete Eigenschaften oderObjekte.

1.23. Beispiel: Da es zu jedem Gruppenelement x ein eindeutig bestimmtesinverses Element gibt, kann man fur das Inverse das Zeichen −x definieren unddann damit rechnen. Ebenfalls definiert man

x− y := x+ (−y).

Das Zeichen ”‘:=”’ steht fur ”‘definiert als”’.

Definitionen von Zeichen machen nur Sinn, wenn diese Zei-chen eindeutig bestimmte Objekte angeben.

1.24. Beispiel: Wir zeigen, dass in jeder Gruppe fur alle x, y

−(x+ y) = (−x) + (−y)

gilt. Dazu rechnen wir nach, dass

(x+ y) + ((−x) + (−y)) = 0

gilt. Dies ist eine leichte Aufgabe, die wir dem Leser uberlassen. Wenn wir dasnachgerechnet haben, ist also (−x) + (−y) ein inverses Element zu x + y. DieBehauptung folgt also aus der Eindeutigkeit des inversen Elementes, die wir jaschon bewiesen haben.

1.25 Aufgabe: Zeigen Sie −(−x) = x fur alle Elemente x in einer Gruppe.

Man kann auch Eigenschaften von Objekten definieren. In den Voraussetzungeines Satzes braucht man dann nur noch zu sagen, dass das Objekt die definierteEigenschaft hat, anstatt diese Eigenschaft explizit auszuschreiben.

1.26. Beispiel: Ein Punkt x in einem Graphen heiße erreichbar, wenn es ein ygibt mit y → x. Dies ist eine Definition der Eigenschaft ”‘Erreichbarkeit”’, dieein Punkt hat oder nicht hat.

Page 21: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.2. MATHEMATISCHE LOGIK 21

1.2.6 Beweise

Auch korrektes Beweisen fallt anfangs oftmals schwer. Naturlich gewinnt manmit der Zeit Ubung. Wir wollen hier aber dennoch einige allgemeine, und immerwiederkehrende Beweisstrategien behandeln.

Die normale Formulierung eines Satzes besteht darin, gewisse Vorausset-zungen anzugeben und eine Behauptung, die aus diesen Voraussetzungenfolgt. Implizit werden immer die Axiome der Theorie als Voraussetzungen an-genommen.

Mit logischen Zeichen ist ein mathematischer Satz also von der Form

V1, . . . , Vn ⇒ A

Dabei sind V1, . . . , Vn die Voraussetzungen des Satzes (einschließlich der Axio-me) und A die Behauptung. Wir haben das Komma als Abkurzung fur ”‘und”’verwendet.

Ein Beweis eines Satzes muss fur den Leser zwingend dar-legen, warum die Behauptung des Satzes aus den Voraus-setzungen folgt.

Abbildung 1.3: Mathematische Satze

Es ist dabei immer hilfreich, an ein beliebiges Modell zu denken, von demman nichts weiß, außer, dass dort die Voraussetzungen des Satzes gelten mussen.Man muss lediglich der Versuchung widerstehen, zusatzliche Annahmen zu ma-chen, obwohl sie vielleicht naheliegend erscheinen.

Page 22: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

22 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Implikation

Behauptungen vom Typ A1 ⇒ A2 beweist man, indem man zusatzlich zu denVoraussetzungen des Satzes annimmt, dass A1 gilt, und daraus schließt, dassA2 gilt.

Bei Aquivalenzen A1 ⇔ A2 sind zwei Richtungen zu beweisen, also

A1 ⇒ A2, A2 ⇒ A1.

1.27. Beispiel: In der Schule werden oft Gleichungen einfach untereinandergeschrieben. Es ist dabei wichtig zu beachten, ob die nachste Gleichung imRechengang aus der vorigen Folgt, oder ob die Gleichungen aquivalent sind.Innerhalb der reellen Zahlen folgt zum Beispiel aus x = y immer x2 = y2, aberder umgekehrte Schluss ist falsch. Das Wurzelziehen auf beiden Seiten einerGleichung ist keine erlaubte Operation, wenn man Aquivalenz aufrecht erhaltenwill. Gleiches gilt fur das Kurzen von Faktoren auf beiden Seiten, von denennicht sichergestellt ist, dass sie ungleich 0 sind.

Aussagen mit Allquantoren

Wenn die Aussage vom Typ ∀xA(x) ist, so nimmt man ein ”‘beliebiges, aberfestes”’ x in einem beliebigen Modell der Theorie und beweist die Aussage A(x)fur dieses x. Dabei darf man naturlich keine speziellen Annahmen uber x oderdas Modell machen.

1.28. Beispiel: In einer Gruppe gilt fur alle x, y, y die folgende Aussage

y + x = y + x ⇒ y = y.

Diesen Satz beweisen wir, indem wir x, y, y als beliebig vorgegeben annehmen.Dann gilt, wenn wir die Notation −x fur das Inverse von x verwenden,

y = y + 0 = y + (x+ (−x)) = (y + x) + (−x)= (y + x) + (−x) = y + (x+ (−x)) = y + 0 = y.

Wir haben also de facto −x auf beiden Seiten der Gleichung y + x = y + xaddiert.

1.29. Beispiel: Die Umkehrung

y = y ⇒ y + x = y + x.

fur alle x, y, y in einer Gruppe braucht nicht bewiesen zu werden. Sie ist einelogische Selbstverstandlichkeit.

Fur gleiche Objekte gelten dieselben Beziehungen.

1.30. Beispiel: In einer Gruppe gilt fur alle x, y, z die Aquivalenz

x+ y = z ⇔ x = z − y.

Page 23: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.2. MATHEMATISCHE LOGIK 23

Zum Beweis haben wir zwei Richtungen zu zeigen, nachdem wir x, y, und zbeliebig aus der Gruppe festgelegt haben.

”‘ ⇒ ”’: Nimmt man x+ y = z an, so gilt

x = x+ (y + (−y)) = (x+ y) + (−y) = z − y.

Man beachte, dass wir praktisch auf beiden Seiten der Gleichung x+ y = z denWert −y addiert haben. Diese Idee haben wir dann nur kompakt aufgeschrieben.

”‘⇐”’: Nimmt man x = z − y an, so gilt

x+ y = (z − y) + y = (z + (−y)) + y = z + ((−y) + y)= z + (y + (−y)) = z + 0 = z.

Fallunterscheidungen

Moglicherweise ist in einem Beweis fur x eine Fallunterscheidung notig. Indiesem Fall ist es wichtig, dass man alle Falle vollstandig behandelt.

1.31. Beispiel: Innerhalb der reellen Zahlen gilt fur alle x die Aussage

x2 ≥ 0.

Der Beweis geht uber die Fallunterscheidung x ≥ 0 und x < 0, die alle moglichenFalle umfasst. Im ersten Fall folgt aus den Regeln fur ”‘≥”’ direkt x2 = x·x ≥ 0.Im zweiten Fall folgt −x > 0 und daher

x2 = (−x)2 > 0.

Aussagen mit Existenzquantoren

Eine Aussage vom Typ ∃xA(x) kann man konstruktiv beweisen. Dazu kon-struiert man aus anderen Objekten, deren Existenz aus den Voraussetzungenfolgt, das gewunschte x. Die Konstruktion muss naturlich mit den Axiomen oderden Voraussetzungen moglich sein.

1.32. Beispiel: In den reellen Zahlen existiert ein Element x > 0 mit

x2 = 2.

Diese Aussage wird in der Analysis konstruktiv bewiesen, indem eine Folge kon-struiert wird, die gegen

√2 konvergiert.

Es ist aber auch moglich, die Existenzaussage dadurch zu beweisen, dassman das Gegenteil widerlegt. Man zeigt also, dass die Aussage

∀x¬A(x)

falsch ist, zum Beispiel durch einen Widerspruchsbeweis, den wir im folgendenAbschnitt behandeln.

1.33. Beispiel: Beispiele fur nicht-konstruktive Existenzbeweise tauchen in derAnalysis erst recht spat auf. Man kann zum Beispiel zeigen, dass es tranzendenteZahlen (Zahlen, die nicht Nullstellen von ganzzahligen Polynomen sind) gibt,ohne eine solche Zahl konkret angeben zu konnen. Allerdings gibt es dafur in-zwischen auch konstruktive Beweise, denn π und e wurden als transzendenterkannt.

Page 24: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

24 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Widerspruchsbeweise

Dieser Beweistyp tritt recht haufig auf, wird aber oft falsch verstanden. Umeine Aussage A zu beweisen, nehmen wir an, dass A nicht gilt. Man zeigt dann,dass sich ein Widerspruch zu einer der Voraussetzungen ergibt, dass also dieseVoraussetzung doch nicht gelten kann. Da jede Aussage aber entweder gilt odernicht gilt, kann das nicht sein. Daher muss A doch gelten.

Noch besser versteht man den Widerspruchsbeweis, wenn man an Modelledenkt. Angenommen, alle Voraussetzungen gelten in einem Modell, da sonstja nichts zu zeigen ist. Es gibt nun zwei Falle. Falls A gilt, sind wir fertig.Falls A nicht gilt, so zeigen wir im Widerspruchsbeweis, dass auch eine derVoraussetzungen nicht gelten kann. Daher kann dieser Fall nicht eintreten.

Man kann dass mit logischen Zeichen so ausdrucken. Wenn V1 bis Vn Vor-aussetzungen einer Behauptung A sind, und

V1, . . . , Vn,¬A ⇒ ¬Vi

fur eine der Voraussetzungen Vi, dann ist

V1, . . . , Vn ⇒ A

bewiesen.

1.34. Beispiel: Der beruhmte Beweis dafur, dass es unendlich viele Primzahlengibt, wird am einfachsten als Widerspruchsbeweis formuliert. Angenommen, esgabe nur endlich viele Primzahlen p1, . . . , pn. Dann teilt keine dieser Primzahlendie Zahl

x = p1 · . . . · pn + 1.

Da wir wissen, dass x eine Primfaktorzerlegung hat, ist x selbst eine Primzahl.x ist aber verschieden von p1, . . . , pn. Dies ist ein Widerspruch dazu, dass p1

bis pn die einzigen Primzahlen sind.

1.35. Beispiel: Ein anderes bekanntes Beispiel ist der Beweis dafur, dass√

2kein Bruch ist. Wir nehmen das Gegenteil an. Also

√2 =

p

q

mit teilerfremden p, q. Dann folgt

2q2 = p2.

Also ist p2 gerade, und damit auch p. Also ist p2 durch 4 teilbar. Da p und qteilerfremd sind, ist q ungerade. Nun hat man den Widerspruch, da 2q2 nichtdurch 4 teilbar ist. Aus diesem Widerspruch schließt man, dass die Annahmefalsch war, dass

√2 ein Bruch ist.

Viele Beweise, die auch direkt gefuhrt werden konnten, werden manchmalunnotigerweise als Widerspruchsbeweise aufgeschrieben.

Das Problem ist, dass sich die Voraussetzungen auch gegenseitig widerspre-chen konnen. In diesem Fall fuhrt ein Widerspruchsbeweis naturlich immer zumErfolg. Wir haben dann einen wahren, aber sinnlosen Satz bewiesen, dessenVoraussetzungen niemals alle erfullt sind.

Page 25: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.3. MENGEN UND ABBILDUNGEN 25

1.3 Mengen und Abbildungen

1.3.1 Mengen

Die Sprache der Mengenlehre dominiert heute die Mathematik. In vielen Fallen,vor allem bei endlichen Mengen, ist sie lediglich eine Sprechvereinfachung furlogische Ausdrucke. Insbesondere bei unendlichen Mengen verselbstandigt sichaber die Mengenlehre und bringt neue Objekte hervor. Diese Objekte sind zumTeil wahre Monster, deren Existenz nicht jeder Mathematiker akzeptiert. Wirversuchen, in diesem Skript so konstruktiv und endlich wie moglich zu bleiben.

Wenn wir uns ein konkretes Modell vorstellen, so kann man in diesem Modelldie Gesamtheit aller Elemente mit einer gewissen Eigenschaft A(x) aussondern.Man erhalt die Gesamtheit aller Objekte x, die die Eigenschaft A(x) erfullen,die wir als Menge (engl.: set)

M = {x : A(x)},

bezeichnen. Wenn x Element der Menge M ist, so schreiben wir

x ∈M.

Es gilt alsox ∈M ⇔ A(x).

x ∈ M ist quasi nur eine Abkurzung fur A(x). Diese Art, Mengen zu bilden,nennt man naive Mengenlehre. Jede Menge ist erlaubt, solange nur ihre de-finierende Eigenschaft klar gegeben ist.

1.36. Beispiel: Es ist in einer Gruppe moglich, dass x+x = 0 ist, obwohl x 6= 0ist. Solche Gruppen werden wir spater kennen lernen. In den reellen Zahlen istdas naturlich nicht der Fall. Wir konnen nun

M := {x : x+ x = 0}

definieren. In den reellen Zahlen enthalt M nur das Element 0.

1.37 Aufgabe: Beweisen Sie

x, y ∈M ⇒ x+ y ∈M

fur die oben definierte Menge M einer Gruppe.

Wir konnen nun Mengen wieder als Objekte betrachten. Damit entstehtdie Moglichkeit, diese Mengen zu neuen Mengen zusammen zu fassen. Mengenkonnen damit wieder Elemente von Mengen werden. Es gibt eine Vielzahl vonneuen Konstruktionsmoglichkeiten. Diese neuen Moglichkeiten wollen wir in die-sem Abschnitt genauer betrachten. Auch Abbildungen werden hier als Mengendargestellt.

Mengenlehre beginnt dann, wenn wir die Mengen selbst wie-der als Objekte unserer Modells betrachten, und Mengenvon Mengen bilden.

Page 26: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

26 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

1.38. Bemerkung: Dass diese Art der Mengenbildung innere Widerspruchehervorbringt, ist schon lange bekannt. Nehmen wir an, Mengen konnen sichauch selbst als Element enthalten. Dann konnten wir die Menge M aller Mengenbilden, die sich nicht selbst als Element enthalten. Nun kann aber weder M ∈M ,noch M /∈ M gelten. Dieses Pradoxon nennt man Russelsches Paradoxon.Man kann die Aussage dieses Paradoxon so deuten, dass es kein Modell fur diesenaive Mengenlehre geben kann.

Ein ahnliches Paradoxon tritt auch in endlichen Mengen auf. Wenn ein Bar-bier behauptet, dass er alle Manner im Dorf rasiert, die sich nicht selbst rasieren,so kann er diese Behauptung nicht einhalten. Rasiert er sich selbst, so darf ersich nicht selbst rasieren. Fur dieses Axiom gibt es also kein Modell.

1.39 Aufgabe: Uberlegen Sie sich, warum im Russelschen Paradoxon weder M ∈M ,

noch M /∈M gelten kann.

Die Konstruktionsmoglichkeiten, die wir hier kennenlernen werden, fasstman als Axiome der Mengenlehre (engl.: set theory) zusammen. Akzeptiertman diese Axiome, so besteht ein Modell nicht mehr nur aus den Objekten, andie man zunachst gedacht hat, sondern auch aus Mengen von Objekten, Mengenvon Mengen, Abbildungen und Mengen von Abbildungen.

In der Praxis werden wir dann von der Menge der Objekte in unserem Mo-dell sprechen. Eigenschaften von Objekten entsprechen dann Teilmengen die-ser Menge und Beziehungen zwischen Objekten entsprechen Abbildungen. Alleswird in der Sprache der Mengenlehre ausgedruckt.

Der Vorteil der Mengenlehre ist die einheitliche Sprechwei-se, die man damit gewinnt. ”‘Die Mengenlehre ist ein Pa-radies, aus dem uns niemand vertreiben kann.”’

Die axiomatische Mengenlehre geht sogar einen Schritt weiter und bil-det einen Rahmen, in den samtliche denkbaren Modelle hinein passen. Genaudie Dinge, die dort konstruierbar sind, existieren mathematisch. Wir wollen hierpragmatischer bleiben und eine fur viele Mathematiker zweifelhafte mathema-tische Gesamttheorie vermeiden.

Auch werden wir die Konstruktionsmechanismen der Mengenlehre sparsamanwenden. Es gibt einen konstruktiven Ansatz zur Mathematik, in dem vieleder hier wie selbstverstandlich vorausgesetzten Mengebildungen nicht akzeptiertwerden.

1.3.2 Gleichheit von Mengen

Als wichtigstes Axiom der Mengenlehre halten wir fest, dass zwei Mengen genaudann gleich sind, wenn sie dieselben Elemente enthalten. Das heißt, A und Bsind genau dann gleich, wenn

∀x (x ∈ A ⇔ x ∈ B)

gilt.

Page 27: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.3. MENGEN UND ABBILDUNGEN 27

Es ist klar, dass gleiche Mengen dieselben Elemente enthalten. Schließlichhaben gleiche Objekte dieselben Eigenschaften. Die Umkehrung ist von der An-schauung her selbstverstandlich, muss aber festgehalten werden.

1.40. Definition: Eine Menge A heißt Teilmenge (engl.: subset) von B,wenn jedes Element aus A auch in B ist. Das heißt

∀x (x ∈ A ⇒ x ∈ B) .

Der folgende Satz ist aufgrund unseres Axioms uber die Gleichheit von Mengenoffensichtlich.

1.41 Satz: Zwei Mengen A und B sind genau dann gleich, wenn A ⊆ B undB ⊆ A gilt.

Ein weiteres Axiom der Mengenlehre erlaubt uns, aus einer gegebenen Men-ge A aller Elemente mit einer gewissen Eigenschaft A(x) auszusondern. Esentsteht die Teilmenge

M := {x ∈ A : A(x)}.

Das bedeutetx ∈M ⇔ (x ∈ A und A(x)) .

Da M durch seine Elemente festgelegt ist, ist diese Menge eindeutig definiert.

1.42. Bemerkung: Wir haben hier ”‘:=”’ fur die Definition eines Objektesverwendet. Dies wollen wir in Zukunft zur Verdeutlichung, dass es sich um einedefinitionsgemaße und nicht um eine behauptete Gleichheit handelt, beibehal-ten. Dabei muss naturlich immer gesichert sein, dass das Objekt auf der rechtenSeite eindeutig bestimmt ist.

1.43. Definition: Die leere Menge ∅ ist die Menge, die keine Elemente enthalt.Sie ist dadurch eindeutig charakterisiert, dass

x /∈ ∅

fur alle x gilt. Sie ist folglich Teilmenge jeder anderen Menge, also

∅ ⊆ A.

fur jede Menge A.

1.44 Aufgabe: Schreiben Sie die leere Menge in der Form

∅ = {x ∈ A : . . .},

wobei A eine beliebige vorgegebene Menge ist.

1.45. Bemerkung: Die Elemente einer Menge konnen wieder Mengen sein. Wirmachen bei allen Mengenoperationen keinen Unterschied zwischen Mengen undden Grundobjekten, von denen wir ausgehen. Der einzige Unterschied ist, dasswir uns nicht fur die Elemente der Grundobjekte interessieren. Grundobjektetauchen nur auf der linken Seite der Elementbeziehung auf und werden nie alsMenge betrachtet.

Page 28: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

28 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Ein weiteres Axiom erlaubt uns, aus zwei oder mehr Elementen eine neueMenge durch Aufzahlung zu bilden. Wenn also x und y gegeben sind, so istdie Menge

M = {x, y}

dadurch festgelegt, dass die Elemente von M genau x oder y sind. Also

t ∈M ⇔ t = x oder t = y.

Dasselbe gilt fur ein Element, oder auch fur drei oder mehr Elemente. Naturlichgilt

{x, y} = {y, x}.

1.3.3 Potenzmenge

1.46. Definition: Die Potenzmenge P(A) einer Menge A ist die Menge allerTeilmengen von A. Also

M ∈ P(A) ⇔ M ⊆ A.

Ein weiteres, sehr machtiges Axiom der Mengenlehre garantiert die Existenzder Potenzmenge einer beliebigen Menge. Dadurch werden sehr machtige undunvorstellbar große Mengen geschaffen. Die Potenzmenge einer endlichen Mengeist allerdings endlich.

1.47. Beispiel: Sei x 6= y und

M = {x, y}.

Dann besteht P(M) aus 4 Elementen, denn jedes der beiden Elemente kann inder Menge sein oder nicht, was 4 Moglichkeiten ergibt. Es ist

P(M) = {∅, {x}, {y}, {x, y}}.

Denn die angezeigten Mengen sind genau alle Teilmengen von {x, y}.

1.48 Aufgabe: Geben Sie P{x, y, z} fur drei verschiedene Elemente x, y, z an.

1.3.4 Vereinigung und Schnitt

1.49. Definition: Zu je zwei MengenA undB definieren wir die Vereinigung(engl.: union)

A ∪B := {x : x ∈ A oder x ∈ B}.

Die Existenz der Vereinigung gilt per Axiom der Mengenlehre. Man hat

x ∈ A ∪B ⇔ (x ∈ A oder x ∈ B) . (1.1)

1.50. Beispiel: Fur alle Mengen A und B gilt

A ⊆ A ∪B, B ⊆ A ∪B.

Page 29: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.3. MENGEN UND ABBILDUNGEN 29

Denn jedes Element, dass in A (bzw. B) ist, ist nach Definition offenbar auchin A ∪B.

1.51. Definition: Aus der Vereinigung konnen wir die Elemente aussondern,die in beiden Mengen liegen. Man bezeichnet diese Menge als Schnitt (engl.:intersection) von A und B. Also

A ∩B := {x ∈ A ∪B : x ∈ A und x ∈ B}. (1.2)

Abbildung 1.4: Vereinigung und Schnitt

1.52. Bemerkung: Die Skizze in Abbildung 1.4 bezeichnet man als Venn-Diagramm. Fur zwei Mengen A,B entstehen vier Flachen, die den vier Fallen

x ∈ A, x ∈ B,x /∈ A, x ∈ B,x ∈ A, x /∈ B,x /∈ A, x /∈ B

entsprechen. Bei drei Mengen entstehen dann 8 Flachen usw. Man kann aufdiese Art Beweise uber die Gleichheit von Mengenrelationen fur endlich vielenMengen beweisen, indem man das Venn-Diagramm fur die linke und die rechteSeite der Gleichung zeichnet. Es handelt sich um einen nicht-verbalen Beweisdurch Fallunterscheidung. Wir ziehen hier verbale Beweise vor.

1.53. Bemerkung: Wegen (1.1) und (1.2) ist das Rechnen mit Vereinigungund Schnitt identisch zum Rechnen mit Booleschen Ausdrucken.

Als erstes Beispiel fur einen etwas komplexeren Sachverhalt beweisen wirden folgenden Satz.

1.54 Satz: Fur drei Mengen A,B,C gelten die beiden Beziehungen

A ∪ (B ∩ C) = (A ∪B) ∩ (A ∪ C),A ∩ (B ∪ C) = (A ∩B) ∪ (A ∩ C).

Beweis: Wir zeigen nur die erste Gleichheit. Um eine Mengengleichheit zuzeigen, mussen wir aufgrund von Satz 1.41 zwei Teilmengenbeziehungen bewei-sen.

Page 30: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

30 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

”‘⊆”’: Seix ∈ A ∪ (B ∩ C). (1.3)

”‘beliebig, aber fest”’. Dann ist x ∈ A oder x ∈ (B ∩ C). Wir unterscheidendiese beiden Falle.

1. Fall: x ∈ A. Dann ist x ∈ A ∪B und x ∈ A ∪ C. Also

x ∈ (A ∪B) ∩ (A ∪ C). (1.4)

2. Fall: x ∈ (B ∩C). Dann ist x ∈ B und x ∈ C. Also x ∈ A∩B und x ∈ A∩C.Folglich haben wir wieder (1.4).

”‘⊇”’: Es gelte (1.4). Dann ist x ∈ A∪B und x ∈ A∪C. Wieder unterscheidenwir zwei Falle.

1. Fall: x ∈ A. Man erhalt (1.3).

2. Fall: x /∈ A. Wegen x ∈ A ∪ B muss dann x ∈ B sein. Analog muss auchx ∈ C gelten. Also x ∈ B ∩ C. Es folgt wieder (1.3). 2

1.55 Aufgabe: Beweisen Sie die zweite Mengengleichheit mit denselben Methoden.

Zeichnen Sie fur beide Mengengleichheiten Venn-Diagramme der linken und der rech-

ten Seite.

1.56. Definition: Die Differenz zweier Mengen A und B ist die Menge

A \B = {x ∈ A : x /∈ B}.

A \B ist offenbar eine Teilmenge von A. Es gilt

A = (A \B) ∪B,

und diese Vereinigung ist disjunkt (disjoint), das heißt

(A \B) ∩B = ∅.

Disjunkte Vereinigungen werden manchmal mit dem Zeichen ”‘∪”’ notiert.

1.57 Aufgabe: Welche der folgenden Aussagen sind allgemein richtig (also Satze)und welche nicht? Beweisen Sie die richtigen Aussagen, und widerlegen Sie die falschendurch ein Gegenbeispiel. Die richtigen Aussagen beweisen Sie einmal verbal, und einanderes Mal mit Venn-Diagrammen.

(1) Fur alle Mengen A,B,C gilt

A \ (B ∪ C) = (A \B) ∩ (A \ C)

(2) Fur alle Mengen A,B,C gilt

(A \B) \ C = A \ (B \ C).

(3) Definiert man fur zwei Mengen A,B die symmetrische Differenz

∆(A,B) := (A \B) ∪ (B \A)

Page 31: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.3. MENGEN UND ABBILDUNGEN 31

so gilt∆(A,B) = ∆(B,A).

(4) Es gilt fur alle Mengen A,B

∆(A,B) = ∅ ⇔ A = B.

(5) Fur drei Mengen A,B,C gilt

∆(∆(A,B), C) = ∆(A,∆(B,C)).

Unendliche Schnitte und Vereinigungen

Schwieriger zu verstehen ist die Vereinigung und der Schnitt uber eine Mengevon Mengen (die auch unendlich vielen Mengen enthalten kann). Mengen vonMengen nennt man auch Mengensysteme. Sei alsoA ein Mengensystem. Danndefiniert man ⋃

A := {x : x ∈ A fur ein A ∈ A},⋂A := {x : x ∈ A fur alle A ∈ A}.

Die Vereinigung existiert per Axiom, der Schnitt ist eine Teilmenge der Verei-nigung und kann aus dieser ausgesondert werden. Man schreibt auch⋃

A∈AA,

⋂A∈A

A

1.58. Beispiel: Seien x, y, z verschiedene Elemente und

A = {{x, y}, {y, z}, {x, z}}.

Dann ist ⋃A = {x, y, z}.

Es ist sozusagen die Vereinigung uber alle drei Mengen in A.

1.59 Satz: Fur ein Mengensystem A und eine Menge M gilt

M \⋃A =

⋂A∈A

(M \A).

Beweis: ”‘⊆”’: Sei x Element der linken Seite. Dann ist

x ∈M, x /∈⋃A.

Das bedeutet, nach der Definition von ”‘⋃

”’

x /∈ A, fur alle A ∈ A.

Page 32: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

32 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Alsox ∈M \A, fur alle A ∈ A.

Daher ist x Element der rechten Seite.

”‘⊇”’: Sei umgekehrt x Element der rechten Seite, also x ∈M \A fur alle A ∈ A.Es folgt x ∈M , aber x /∈ A fur alle A ∈ A. Also ist x Element der linken Seite.2

1.60 Aufgabe: Zeigen Sie analog zu diesem Satz

M \⋂A =

⋃A∈A

(M \A).

Zeigen Sie auch (⋃A)\M =

⋃A∈A

(A \M).

1.3.5 Relationen und Abbildungen

1.61. Definition: Zu je zwei Objekten a und b definieren wir das Paar

(a, b) := {{a}, {a, b}}.

1.62. Bemerkung: Wichtig fur uns ist hier lediglich, wann zwei Paare gleichsind. Es gilt

(a, b) = (a, b) ⇔(a = a und b = b

). (1.5)

Wenn a 6= b ist, ist insbesondere (a, b) 6= (b, a). Man darf das Paar (a,b) alsonicht mit der Menge {a, b} verwechseln.

1.63. Bemerkung: Um (1.5) zu beweisen, benotigt man ein weiteres Axiomder Mengenlehre, dass pathologische Mengen verhindert. Genauer darf niemalsA ∈ A gelten, oder auch A ∈ B und B ∈ A und ahnliche Zyklen. Wir gehendarauf hier nicht weiter ein.

1.64. Definition: Die Menge aller Paare (a, b) mit a ∈ A und b ∈ B bezeich-nen wir als Kreuzprodukt (engl.: product) von A und B, in Zeichen

A×B := {(a, b) : a ∈ A und b ∈ B}.

Eine Teilmenge R von A× B bezeichnen wir als Relation zwischen A und B.Eine Relation f heißt Abbildung (mapping) von A nach B, wenn fur alle xgenau ein y existiert mit (x, y) ∈ f . Wir schreiben in diesem Fall

y = f(x),

und, als Zeichen dafur, dass f eine Abbildung von A nach B ist

f : A→ B.

Gelegentlich schreiben wir auch

x 7→ f(x).

Page 33: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.3. MENGEN UND ABBILDUNGEN 33

Relationen R zwischen einer Menge M und sich selbst nennt man Relationenauf M .

1.65. Bemerkung: Die Schreibweise f(x) macht fur Abbildungen Sinn, da jay mit (x, y) ∈ f eindeutig bestimmt ist, wenn x gegeben ist.

1.66. Beispiel: Der gerichtete Graph in Abbildung 1.2 kann als eine Relationauf M , wobei M die Menge der dort abgebildeten Punkte ist. (x, y) ∈ R sollgenau dann gelten, wenn ein Pfeil von x nach y geht.

1.67. Beispiel: In Abbildung 1.5 ist eine Abbildung

f : A→ B

mit Pfeilen dargestellt. Man beachte, dass von jedem a ∈ A genau ein Pfeilausgeht. Sonst ware diese Relation keine Abbildung.

Abbildung 1.5: Eine Abbildung zwischen endlichen Mengen

1.68. Beispiel: Eine typische Relation ist

R := {(x, y) ∈ R× R : x ≤ y}.

Naturlich schreiben wir niemals (x, y) ∈ R, sondern einfach x ≤ y.

1.69. Beispiel: Die Addition in Gruppen kann als Abbildung

+ : G×G→ G

gedeutet werden. Dabei ist G die Menge aller Gruppenobjekte. Man schreibtnaturlich nicht

+(x, y) = z,

Page 34: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

34 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

sondern einfachx+ y = z.

Man bezeichnet eine solche Abbildung als Operator auf G. Dieses Beispielzeigt, wie universell die Sprache der Mengenlehre ist.

1.70. Bemerkung: Als Funktionen (function) bezeichnet man reellwertigeAbbildungen, gewohnlich durch eine Rechenvorschrift festgelegt.

1.71. Beispiel: Die Relation

R := {(x, y) ∈ R× R : x2 = y}

auf R ist eine Abbildung von R nach R. Man hat

x 7→ x2.

Die RelationR := {(x, y) ∈ R× R : y2 = x}

ist dagegen keine Abbildung, weil es zum Beispiel zu x = 1 zwei Elemente ygibt mit (x, y) ∈ R, denn

(1,−1) ∈ R, (1, 1) ∈ R.

Beide Relationen sind Teilmengen von R2 und konnen daher wie aus der Schulegewohnt in ein Koordinatensystem eingezeichnet werden. Falls die RelationR eine Abbildung ist, so bezeichnet man R als Graph der Abbildung.

1.72 Aufgabe: Zeichnen Sie die beiden Relation R und R aus dem Beispiel in ein

Koordinatensystem ein.

1.73 Aufgabe: Ist die Relation

R := {(x, y) ∈ R× R : |y|+ 2y = x}

eine Abbildung? Beweisen Sie Ihre Entscheidung! Zeichnen Sie diese Relation in ein

Koordinatensystem ein.

1.3.6 Bild, Urbild, Umkehrabbildung

1.74. Definition: Bei einer Abbildung

f : A→ B

nennen wir A den Definitionsbereich und B den Bildbereich. Schrankt manden Definitionsbereich auf eine Teilmenge M ⊆ A ein, so erhalt man die Ein-schrankung (engl.: restriction)

f |M : M → B.

Alsof |M (x) = f(x) fur alle x ∈M.

Page 35: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.3. MENGEN UND ABBILDUNGEN 35

Es ist manchmal interessant, eine Abbildung f : M → B von einer TeilmengeM ⊂ A zu einer Fortsetzung (engl.: continuation) g : A→ B auf ganz A fort-zusetzen. Es soll also g|M = f gelten. Meist sollen dabei gewisse Eigenschaften,wie Stetigkeit oder Differenzierbarkeit erhalten bleiben. Die interessante Frageist immer, ob das moglich ist.

1.75. Beispiel: Seien a, b zwei verschiedene reelle Punkte. Dann lasst sich jedeAbbildung

f : {a, b} → R

eindeutig zu einer Geraden g(x) = mx + c fortsetzen. Es gilt also fur dieseGerade

g(a) = f(a), g(b) = f(b).

Es ist interessant zu fragen, wann man die Gleichung

f(x) = y

nach y auflosen kann, also y = g(x), und wann diese Auflosung eindeutig ist.

1.76. Definition: Sei f : A→ B eine Abbildung. Wenn f(x) = y ist, so heißtx ein Urbild von y.

(1) Wenn jedes y ∈ B hochstens ein Urbild hat, so nennt man f injektiv (engl.:injective, one-to-one).

(2) Wenn jedes y ∈ B mindestens ein Urbild hat, so nennt man f surjektiv(engl.: surjective, mapping onto).

(3) Wenn f injektiv und surjektiv ist, so nennt man f bijektiv (engl.: bijectiv,one-to-one and onto).

Bijektive Abbildungen sind also dadurch gekennzeichnet, dass jedes y ∈ Bgenau ein Urbild hat.

1.77. Bemerkung: Um nachzuweisen, dass f : A→ B injektiv ist, muss manoffenbar fur alle x1, x2 ∈ A zeigen

f(x1) = f(x2) ⇒ x1 = x2.

Um nachzuweisen, dass f surjektiv ist, muss man zu jedem y ∈ B ein x ∈ Afinden mit f(x) = y.

1.78. Beispiel: Die Funktion f : R→ R, definiert durch

f(x) = x2

ist weder injektiv, noch surjektiv. Denn einerseits ist

f(−1) = f(1) = 1.

Also ist f nicht injektiv, weil y = 1 zwei Urbilder hat. Andererseits hat y = −1gar kein Urbild.

1.79 Satz: Wenn f : A → B bijektiv ist, dann existiert eine eindeutig be-stimmte Umkehrabbildung (engl: inverse mapping) f−1 : B → A, so dassgelten

f−1(f(x)) = x fur alle x ∈ A,

Page 36: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

36 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

undf(f−1(y)) = y fur alle y ∈ B.

Beweis: Nach unserer Definition ist die bijektive Abbildung f dadurch ge-kennzeichnet, dass jedes y ∈ B genau ein Urbild hat. Dieses eindeutig bestimmteUrbild definieren wir als f−1(y). Als Relation geschrieben, konnen wir f−1 ubri-gens einfach als

f−1 = {(y, x) : (x, y) ∈ f}.

definieren. Mit dieser Definition sind die beiden verlangten Beziehungen offenbarerfullt. 2

1.80. Beispiel: Wir betrachten dieselbe Funktion f(x) = x2 wie im vorigenBeispiel als Abbildung

f : [0,∞)→ [0,∞).

Wir schranken also den Definitionsbereich und die Bildmenge ein. Dann ist fbijektiv. Die Umkehrabbildung

f−1 : [0,∞)→ [0,∞).

istf−1(y) =

√y.

1.81 Aufgabe: Geben Sie zwei moglichst große Intervalle ein, auf denen die Funktion

f(x) = x2 + x+ 1

injektiv ist. Schranken Sie auf diesen beiden Intervallen den Bildbereich ein, so dass f

bijektiv ist, und geben Sie die beiden Umkehrfunktionen an.

1.82 Aufgabe: Fur welche a ∈ R ist die Abbildung

f(x) = |x|+ ax

bijektiv? Geben Sie jeweils die Umkehrabbildung an.

1.83. Beispiel: Sei G eine Gruppe und a ∈ G fest gewahlt. Die Umkehrabbil-dung der Abbildung f : G→ G, definiert durch

f(x) := x+ a,

ist offenbarf−1(y) = y − a.

Dennf−1(f(x)) = f−1(x+ a) = (x+ a)− a = x.

Außerdemf(f−1(y)) = f−1(y) + a = (y − a) + a = y.

1.84. Bemerkung: Es ist ohne Differentialrechnung nicht so leicht zu klaren,ob eine Funktion wie

f(x) := x+ ex

Page 37: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.3. MENGEN UND ABBILDUNGEN 37

eine Umkehrabbildung hat, oder nicht. Die Frage ist aquivalent damit, die Glei-chung

y = x+ ex

nach x aufzulosen. Mit Hilfe der Differentialrechnung gelingt der Nachweis al-lerdings sehr leicht, indem man die Monotonie nachpruft und die Grenzwertein ±∞. Noch schwieriger wird dies bei Gleichungen, in denen y nur implizitgegeben ist, wie

xy = yx.

1.85 Aufgabe: Finden Sie Mengen A und B, eine Abbildung f : A → B und eineAbbildung g : B → A, so dass

g(f(x)) = x fur alle x ∈ A

gilt, aber f nicht bijektiv ist. Zeigen Sie, dass f aber injektiv sein muss, wenn dieseBedingung erfullt ist. Zeigen Sie ebenfalls, dass f surjektiv sein muss, wenn

f(g(y)) = y fur alle y ∈ A

gilt.

1.86. Definition: Sei f : A → B eine Abbildung und M ⊆ A. Dann ist dasBild (engl.: image) der Menge M unter der Abbildung f definiert als

f(M) := {f(x) : x ∈M}.

Sei umgekehrt N ⊆ B. Dann ist das Urbild (engl.: preimage) der Menge Nunter f die Menge aller Urbilder von Elementen von N , also die Menge

f−1(N) := {x ∈ A : f(x) ∈ N}.

Dies entspricht der Menge aller Urbilder von Elementen y ∈ N .

1.87. Bemerkung: Verwechseln Sie nicht f−1(N) mit der Umkehrabbildung.Das Urbild von Mengen hat damit zunachst nichts zu tun. Wenn allerdings fbijektiv ist, so ist das Urbild von N in der Tat das Bild unter der Umkehr-abbildung. Also ist in diesem f−1(N) gleich, egal wie man diesen Ausdruckinterpretiert.

Wir werden uns in der linearen Algebra sehr haufig mit Bildern und Ur-bildern von Mengen beschaftigen. Es lohnt sich also, sich mit diesen Begriffengenau auseinander zu setzen. Es gilt

y ∈ f(M) ⇔ ∃x∈Mf(x) = y,

undx ∈ f−1(N) ⇔ f(x) ∈ N,

Als Beispiel fur die Argumentation mit diesen Begriffen beweisen wir den fol-genden Satz.

1.88 Satz: Sei f : A→ B eine Abbildung und M ⊆ A. Dann gilt

M ⊆ f−1(f(M)).

Page 38: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

38 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Abbildung 1.6: f−1(f(M))

Sei N ⊆ B. Dann giltf(f−1(N)) ⊆ N.

.

Beweis: Sei x ∈M . Dann ist f(x) ∈ f(M). Also ist x ein Urbild von f(x) ∈f(M) und es folgt x ∈ f−1(f(M)). Dies ist die erste Teilmengenrelation.

Sei y ∈ f(f−1(N)). Dann existiert nach Definition ein x ∈ f−1(N) mitf(x) = y. Wenn x ∈ f−1(N) ist, dann ist nach Definition f(x) ∈ N . Also

y = f(x) ∈ N.

2

1.89 Aufgabe: Betrachten Sie wieder die Funktion f : R → R definiert durch

f(x) = x2 + x+ 1. Berechnen Sie f [−1, 1] und f−1[−1, 1].

1.90 Aufgabe: Sei f : R→ R die Funktion

f(x) = x3 − x.

Zeichnen Sie den Graph der Funktion, berechnen Sie die lokalen Extrema mit IhremSchulwissen, und lesen Sie am Graph die folgenden Mengen ab.

f [1, 2], f [0, 1], f−1[0, 5].

Page 39: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.3. MENGEN UND ABBILDUNGEN 39

1.91 Aufgabe: Geben Sie fur die folgenden Funktionen Intervalle I1, I2 ⊆ R an, sodass die Funktionen als Abbildung f : I1 → I2 bijektiv sind, und geben Sie jeweils dieUmkehrfunktion an.

f(x) = x2 + x, f(x) = |x|+ x, f(x) = sin(x).

1.92 Satz: Sei f : A→ B eine Abbildung und M1,M2 ⊆ A. Dann gilt

f(M1 ∪M2) = f(M1) ∪ f(M2),f(M1 ∩M2) ⊆ f(M1) ∩ f(M2).

Sei N1, N2 ∈ B. Dann gilt

f−1(N1 ∪N2) = f−1(N1) ∪ f−1(N2),

f−1(N1 ∩N2) = f−1(N1) ∩ f−1(N2).

Beweis: Wir zeigen die erste Gleichheit.

”‘⊆”’: Seiy ∈ f(M1 ∪M2).

Dann gibt es ein x ∈M1 ∪M2 mit f(x) = y. Falls x ∈M1 ist, so ist

y = f(x) ∈ f(M1)

Also y ∈ f(M1) ∪ f(M2). Falls x ∈M2 ist, gilt dasselbe.

”‘⊇”’: Seiy ∈ f(M1) ∪ f(M2).

Falls y ∈ f(M1) ist, so existiert ein x ∈M1 mit f(x) = y. Also y ∈ f(M1∪M2).Falls y ∈ f(M2) ist, so gilt dasselbe.

Wir zeigen nun die erste Gleichheit fur die Umkehrabbildung

”‘⊆”’: Seix ∈ f−1(N1 ∪N2).

Dann gilt f(x) ∈ N1 ∪N2. Falls f(x) ∈ N1 ist, so ist x ∈ f−1(N1), also

x ∈ f−1(N1) ∪ f−1(N2).

Falls f(x) ∈ N2 ist, so gilt dasselbe.

”‘⊇”’: Falls x ∈ f−1(N1) ist, so ist f(x) ∈ N1 und daher f(x) ∈ N1 ∪ N2. Esfolgt

x ∈ f−1(N1 ∪N2).

Falls x ∈ f−1(N2) ist, so gilt dasselbe. 2

Page 40: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

40 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

1.93 Aufgabe: Beweisen Sie auf dieselbe Art und Weise die fehlenden Mengenrelatio-

nen. Geben Sie ein Gegenbeispiel dafur an, dass die Gleichheit in der zweiten Relation

nicht gilt.

1.94. Definition: Zwei Abbildungen

f : A→ B, g : B → C

lassen sich verketten. Man definiert die Verkettung (engl.: concetanation)(Hintereinanderausfuhrung) der Abbildungen als die Abbildung

g ◦ f : A→ C,

x 7→ g(f(x)).

1.95. Beispiel: Die Verkettung der reellen Funktionen f(x) = x+1 und g(x) =x2 ist

(g ◦ f)(x) = g(f(x)) = (x+ 1)2.

Man beachte, dass diese Abbildung verschieden von

(f ◦ g)(x) = f(g(x)) = x2 + 1.

ist. Die Verkettung ist also nicht kommutativ.

1.96 Aufgabe: Uberlegen Sie sich, dass die Verkettung assoziativ ist. Das heißt

h ◦ (g ◦ f) = (h ◦ g) ◦ f.

fur Abbildungen

f : A→ B, g : B → C, h : C → D.

1.97. Beispiel: Wennf : A→ A

bijektiv ist, so gibt es die Umkehrabbildung

f−1 : A→ A.

Dann giltf ◦ f−1 = f−1 ◦ f = id.

wobei id : A→ A die identische Abbildung (engl.: identity)

id : A→ A

x 7→ x

ist. Fur diese beiden Abbildungen gilt also das Kommutativgesetz.

1.98 Satz: Fur invertierbare Abbildungen f, g : A → A gilt, dass auch f ◦ ginvertierbar ist und

(g ◦ f)−1 = f−1 ◦ g−1.

Page 41: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.4. DIE NATURLICHEN ZAHLEN 41

1.99 Aufgabe: Beweisen Sie diesen Satz.

1.100. Beispiel: Betrachtet man die Menge S(A) aller bijektiven Abbildungeneiner Menge A in sich selbst, so ist die Verkettung zweier Elemente in S(A) wie-der in S(A). Es gilt das Assoziativgesetz und jedes Element f ∈ S(A) hat eininverses Element bezuglich der Multiplikation ”‘◦”’. Allerdings gilt das Kom-mutativgesetz nicht. S(A) ist das typische Beispiel einer nicht-kommutativenGruppe.

1.101 Aufgabe: Geben Sie die Mengen

S({1}), S({1, 2}), S({1, 2, 3})

an.

1.102. Definition: Fur eine endliche Menge M heißt eine bijektive Abbildungπ : M →M eine Permutation von M .

1.103. Definition: Die Menge aller Abbildungen von A nach B bezeich-nen wir mit A(A,B).

1.104 Aufgabe: Geben Sie fur

A = {1}, A = {1, 2}, A = {1, 2, 3}

die Mengen A(A,A) an.

1.105. Bemerkung: Fur eine Menge A ist die Verkettung zweier Abbildungenaus A(A,A) wieder in A(A,A). Wir konnen zwei solche Abbildungen also wiedermit ”‘◦”’ multiplizieren. Allerdings hat nicht jedes Element von A(A,A) einInverses. Eine solche Struktur, in der das Assoziativgesetz gilt. bezeichnet manals Halbgruppe. In diesem Fall hat unsere Halbgruppe ein neutrale Elementid. Das Kommutativgesetz gilt nicht.

1.4 Die naturlichen Zahlen

1.4.1 Induktion

Wir nehmen hier an, dass die naturlichen Zahlen in der Vorlesung uber Analysisals Teilmenge der reellen Zahlen eingefuhrt werden. Uns steht also schon eineAddition ”‘+”’, eine Multiplikation ”‘·”’ und eine Ordnung ”‘≤”’ zur Verfugung.In diesem Abschnitt beschaftigen wir uns mit der wesentliche Eigenschaft dernaturlichen Zahlen, namlich der Induktion.

Zunachst jedoch geben wir auf einem abstrakten Niveau die Peano-Axiomewieder, die die naturlichen Zahlen festlegen. Inspiriert sind diese Axiome durchden Zahlprozess

1 7→ 2 7→ 3 7→ . . .

der alle naturlichen Zahlen durchlaufen soll, aber keine doppelt.

Page 42: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

42 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Die Idee der naturlichen Zahlen ist, dass der Zahlprozessalle Zahlen genau einmal durchlauft.

1.106. Definition: Eine induktive Menge ist eine Menge N mit einer Ab-bildung

N : N→ N,n 7→ N(n)

die jedem n ∈ N einen Nachfolger N(n) zuordnet. Außerdem gibt es ein festesElement 1 ∈ N. Es sollen die folgenden Beziehungen gelten.

(1) Es gibt kein n ∈ N mit N(n) = 1.

(2) Die Abbildung N ist injektiv, also

N(n) = N(m) ⇒ n = m fur alle n,m ∈ N

1.107. Definition: Die naturlichen Zahlen N sind eine minimale indukti-ve Menge. Das heißt, wenn M ⊂ N ebenfalls eine induktive Menge ist mitderselben 1 und der Nachfolgerabbildung, dann ist M = N.

Dies bedeutet, dass alle Teilmengen M ⊂ N, die 1 enthalten, und fur die gilt

n ∈M ⇒ N(n) ∈M fur alle n ∈M

gleich N sind.

1.108. Bemerkung: Die Eigenschaften (1) und (2) stellen sicher, dass kein Ele-ment vom Zahlprozess doppelt durchlaufen wird. Die Minimalitat stellt sicher,dass jede Zahl einmal durchlaufen wird, wenn man mit 1 beginnt.

1.109. Bemerkung: Die reellen Zahlen enthalten, wie jeder andere angeordneteKorper, eine minimale induktive Teilmenge. Die Nachfolgeabbildung ist dort

N(n) = n+ 1.

Details dazu werden in der Vorlesung uber Analysis gegeben. Man kann aberauch umgekehrt die Existenz der naturlichen Zahlen axiomatisch fordern, unddaraus die reellen Zahlen konstruieren. Diese Konstruktion gehort in eine Vor-lesung ”‘Aufbau des Zahlensystems”’, und sie benotigt den vollen Apparat derMengenlehre.

1.110. Definition: Unser N ⊆ R enthalt die 0 nicht. Man schreibt

N0 = N ∪ {0}.

Dies ist eine Vereinbarung, die oft auch anders getroffen wird.

Wir werden im folgenden annehmen, dass wir die naturlichen Zahlen alsTeilmenge der reellen Zahlen haben, und schreiben daher einfach n+ 1 fur denNachfolger von n.

Page 43: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.4. DIE NATURLICHEN ZAHLEN 43

Aus der Minimalitat folgt das wichtigste Prinzip in N, die vollstandigeInduktion.

1.111 Satz: (Vollstandige Induktion) Sei A(n) eine beliebige Aussage mit frei-er Variable n. Es gelte A(1) und

A(n) ⇒ A(n+ 1) fur alle n ∈ N

Dann gilt A(n) fur alle n ∈ N.

Beweis: SeiM := {n ∈ N : A(n) gilt}.

durch Aussonderung gewonnen. Dann ist M nach Voraussetzung induktiv. Esfolgt M = N. 2

Man bezeichnet die Aussage A(1) als Induktionsanfang. Die FolgerungA(n) ⇒ A(n+ 1) bezeichnet man als Induktionsschritt.

1.112. Beispiel: Wir geben zunachst ein Beispiel aus der Analysis. Es gilt

(1 + x)n ≥ 1 + nx. fur alle x ≥ −1 und n ∈ N.

Dazu fixieren wir x ≥ −1 und zeigen die Behauptung fur alle n ∈ N.

Induktionsanfang: Fur n = 1 ist die Behauptung offensichtlich richtig.

Induktionsschritt: Die Behauptung gelte fur n ∈ N, also

(1 + x)n ≥ 1 + nx.

Wegen 1 + x ≥ 0 bleibt diese Ungleichung richtig, wenn man sie mit 1 + xmultipliziert. Es gilt also

(1 + x)n+1 ≥ (1 + nx)(1 + x) = 1 + (n+ 1)x+ nx2 ≥ 1 + (n+ 1)x.

Damit gilt die Behauptung auch fur n+ 1.

Nun beweisen wir einige Aussagen eher technischer Natur mit vollstandigerInduktion.

1.113. Beispiel: Als simpelstes Beispiel fur vollstandige Induktion zeigen wir,dass jedes n ∈ N, n 6= 1 einen Vorganger hat. Unsere Aussage A(n) ist also

∀n∈N,n6=1∃m∈N n = m+ 1.

Man beachte, dass wir die Operation ”‘−”’ in den reellen Zahlen nicht verwendenwollen. Sie wurde uns auch nicht helfen, da zunachst unklar ist, ob n−1 ebenfallseine naturliche Zahl ist. Das ist namlich gerade die Aussage, die wir beweisenwollen.

Induktionsanfang: Die Aussage ist fur n = 1 wahr, denn dort ist die Voraus-setzung n 6= 1 nicht erfullt,

Page 44: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

44 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Induktionsschritt: Die Aussage gelte fur n. Wir mussen zeigen, dass n + 1einen Vorganger hat. Das ist aber offensichtlich richtig, weil n der Vorgangervon n+ 1 ist.

1.114 Aufgabe: Zeigen Sie n ≥ 1 fur alle n ∈ N durch vollstandige Induktion.

1.115. Beispiel: Der Nachteil des vorigen Beispiels liegt in seiner Einfachheit.Schwieriger ist schon der folgende Sachverhalt.

Zwischen n ∈ N und n+ 1 liegt keine weitere naturliche Zahl. Das heißt, es gibtkein m ∈ N mit

n < m < n+ 1.

Nun beweisen wir unsere Aussage durch Induktion nach n.

Induktionsanfang: Wir fuhren den Beweis durch Widerspruch. Angenommen,

1 < m < 2 := 1 + 1

fur m ∈ N. Aufgrund der Aussage des vorigen Beispiels hat m einen Vorgangerk = m−1. Aufgrund der Rechenregeln fur angeordnete Korper folgt k < 1. Dieswiderspricht der obigen Aufgabe.

Induktionsschritt: Angenommen,

n+ 1 < m < n+ 2.

fur n,m ∈ N. Dann ist 1 ≤ n + 1 < m, also 1 6= m und m hat daher einenVorganger m− 1 = k ∈ N. Es folgt

n < k < n+ 1.

Dies widerspricht der Induktionsannahme.

Es gibt eine Reihe weiterer Satze uber N, die in ahnlicher Weise anschaulichklar sind. Wir verzichten hier auf eine weitere Diskussion, und werden solcheSachverhalte als gegeben voraussetzen.

Der folgende Satz ist bisweilen nutzlich. Er dient als Ersatz fur das Indukti-onsprinzip.

1.116 Satz: Jede nicht-leere Teilmenge M ⊆ N enthalt ein kleinstes Element,also ein Minimum. Das heißt, es gibt ein n ∈M mit

n ≤ m fur alle m ∈M.

Beweis: Sei alsoM ⊆ N nicht leer. Wir fuhren den Beweis durch Widerspruch.Angenommen,M hat kein kleinstes Element. Dann zeigen wir durch vollstandigeInduktion nach n, dass fur alle n ∈ N gilt

n ≤ m, fur alle m ∈M.

Daraus folgt naturlich sofort der Widerspruch, da dann jedes n ∈M minimalesElement von M ware.

Page 45: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.4. DIE NATURLICHEN ZAHLEN 45

Induktionsanfang: Es gilt 1 ≤ m fur alle m ∈ N, also insbesondere fur allem ∈M .

Induktionsschritt: Die Behauptung gelte fur n ∈ N. Da M kein kleinstesElement hat, folgt n /∈M . Aus der Behauptung in Beispiel 1.115 folgt

n+ 1 ≤ m fur alle m ∈ N.

2

1.117. Bemerkung: Damit lasst das Induktionsprinzip erweitern. Sei A(n)eine Aussage, die wir fur alle n ∈ N beweisen wollen.

Wenn man nun zu jedem n ∈ N, fur das die Aussage A(n) nicht gilt, ein m ∈N mit m < n finden kann, so dass A(m) ebenfalls nicht gilt (unendlicherAbstieg), dann muss A(n) fur alle n ∈ N gelten.

Denn die Menge der Elemente fur die A(n) nicht gilt, kann dann kein kleinstesElement enthalten. Sie muss also leer sein.

1.4.2 Rekursive Konstruktion

Wir konnen mit Hilfe von Induktion nicht nur Aussagen beweisen, sondern auchObjekte konstruieren.

1.118. Definition: Sei M eine beliebige Menge. Eine Abbildung a : N → Mheißt Folge (engl: sequence) in M . Man schreibt

an := a(n).

Fur die gesamte Folge schreibt man

(an)n∈N

Aufgrund des Zahlprinzips ist eine Folge also durch

a1, a2, a3, . . .

festgelegt.

1.119. Beispiel: Die einfachsten Folgen sind durch eine Rechenvorschrift ge-geben. Also etwa

xn =(

12

)n.

Wir werden nun Folgen rekursiv konstruieren. Dazu legen wir zunachst a1

fest. Danach legen wir an+1 mit Hilfe von an fest. Aufgrund unserer Vorstellungvom Zahlprozess, ist damit die Folge vollstandig festgelegt.

1.120. Bemerkung: Sei g : M →M eine Abbildung. Dann existiert zu jedemfest vorgegebenem a1 ∈M genau eine Folge in m mit

an+1 = g(an) fur alle n ∈ N.

Page 46: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

46 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Die Existenz dieser Folge kann mit einer cleveren Mengenkonstruktion bewiesenwerden, auf die wir hier nicht eingehen. Fur die Folge an = (1/2)n lautet dierekursive Definition

a1 =12, an+1 =

an2.

In den meisten Fallen wird allerdings das Glied an+1 außer von an auch von nabhangen, also

an+1 = g(an, n),

wobei g eine Abbildung auf M ×N ist. Auch in diesem Fall ist die Existenz unddie Eindeutigkeit der Folge fur jedes gewahlte Anfangsglied a1 ∈ M gesichert.Man kann sogar Folgen konstruieren, die von mehr als einem oder von allenvorigen Gliedern abhangen, etwa

an+1 = g(an, an−1)

In diesem Fall benotigt man fur eine korrekte Definition naturlich 2 Anfangs-werte a1, a2 ∈M .

Dieses Konstruktionsprinzip ist sehr machtig. Wir verwenden es oft in sa-lopper Weise.

1.121. Beispiel: (1) Anstatt etwa die Fakultat n! rekursiv durch

0! = 1! = 1, (n+ 1)! = n! · (n+ 1)

zu definieren, schreiben wir einfach

0! = 1, n! := 1 · 2 · . . . · n.

(2) Als Beispiel fur eine zweigliedrige rekursive Folge sei die Fibonacci-Folgegenannt, die durch a1 = a2 = 1 und

an+1 = an + an−1

festgelegt ist.

1.122. Beispiel: Sei (an)n∈N eine Folge in einer Gruppe G. Dann definiert mandie Summenschreibweise, bzw. die Produktschreibweise

n∑i=1

ai := a1 + . . .+ an

n∏i=0

ai := a1 · . . . · an

in naheliegender Weise rekursiv durch

0∑i=1

ai = 0,n+1∑i=1

ai =

(n∑i=1

ai

)+ an+1,

0∏i=1

ai = 1,n+1∏i=1

ai =

(n∏i=1

ai

)· an+1.

Page 47: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.4. DIE NATURLICHEN ZAHLEN 47

Die leere Summe ist also vereinbarungsgemaß gleich 0, das leere Produkt gleich1. Man beachte, dass dies der Klammerung

n∑i=1

ai = (. . . (a1 + a2) + a3) + . . .) + an

entspricht, also von links nach rechts ausgewertet ist. Allerdings ist aufgrunddes Assoziativgesetzes die Klammerung gleichgultig. Das heißt, es gilt

a1 +

(n∑i=2

ai

)=

(n−1∑i=1

ai

)+ an.

Zieht man noch das Kommutativgesetz heran, so gilt fur jede Permutation πvon {1, . . . , n}

n∑i=1

ai =n∑i=1

aπ(i).

Dies Aussage beweist man per Induktion (Ubung).

1.123 Aufgabe: Zeigen Sie durch vollstandige Induktion

1 + . . .+ n =n(n+ 1)

2.

1.124 Aufgabe: (1) Definieren Sie die Folge qn fur q ∈ R, n ∈ N rekursiv.

(2) Schreiben Sie fur q ∈ R die Folge

an = 1 + q + . . .+ qn

in der Summenschreibweise und definieren Sie sie rekursiv.

(3) Zeigen Sie fur q 6= 1 durch vollstandige Induktion

an =qn+1 − 1

q − 1

1.125 Aufgabe: Was ist an folgendem Induktionsbeweis falsch? Wir zeigen, dass alle

naturlichen Zahlen gleich sind, indem wir per Induktion nach n zeigen, dass die Zahlen

von 1 bis n gleich sind. Fur n = 1 ist nichts zu zeigen. Die Induktionsvoraussetzung

besagt, dass 1 = . . . = n ist, insbesondere n− 1 = n. Also ist auch n = n+ 1 und wir

erhalten 1 = . . . = n = n+ 1, konnen also den Induktionsschritt durchfuhren.

1.4.3 Endliche Mengen

1.126. Definition: Fur n ∈ N ist die Menge

{1, . . . , n} := {k ∈ N : 1 ≤ k ≤ n}

definiert. Eine Menge M heißt endlich (engl.: finite), wenn es eine bijektiveAbbildung

φ : {1, . . . , n} →M

Page 48: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

48 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

gibt, oder wenn M = ∅ ist. Man nennt

|M | = ]M = n

die Machtigkeit von M .

Naturlich muss man dazu beweisen, dass die Machtigkeit einer Menge ein-deutig bestimmt ist. Dies ist Inhalt des folgenden, sehr intuitiven Satzes.

1.127 Satz: Es gibt keine bijektive Abbildung

φ : {1, . . . , n} → {1, . . . ,m}

wenn n,m ∈ N und n 6= m ist.

Beweis: Der Beweis ist sehr technisch. Wir zeigen den Satz fur n < m durchInduktion nach n. Fur n = 1 ist die Behauptung klar. Angenommen, n+ 1 < mist und

φ : {1, . . . , n+ 1} → {1, . . . ,m}

bijektiv. Die folgende Aufgabe zeigt, dass es dann eine bijektive Abbildung

ψ : {1, . . . , n} → {1, . . . ,m− 1}

gibt. Dies ist aber nicht nach Induktionsvoraussetzung nicht moglich. 2

1.128 Aufgabe: Sei φ : {1, . . . , n + 1} → M bijektiv und m ∈ M . Konstruieren Sie

dann eine bijektive Abbildung von {1, . . . , n} nach M \ {m}.

1.129 Aufgabe: Wieso folgt aus diesem Satz, dass die Machtigkeit einer Menge

eindeutig bestimmt ist?

1.130 Satz: Teilmengen von endlichen Mengen sind endlich.

Beweis: Auch diesen Satz kann man durch Induktion nach n = |N | beweisen,wobei M ⊂ N und N endlich sei. Fur n = 1 ist nichts zu zeigen. Ansonstensei |N | = n + 1. Wenn M = N ist, ist nichts zu zeigen. Sei m ∈ M \ N .Aufgrund der obigen Aufgabe ist M \ {m} endlich mit der Machtigkeit n. NachInduktionsvoraussetzung ist M endlich. 2

1.131 Aufgabe: (1) Seien M1,M2 endliche Mengen, die disjunkt (engl.: disjoint)sind, das heißt es gilt

M1 ∩M2 = ∅.Zeigen Sie, dass dann M1 ∪M2 endlich ist, und

|M1|+ |M2| = |M1 ∪M2|

(2) Folgern Sie fur alle endlichen Mengen M1,M2

|M1 ∪M2| = |M1 \M2|+ |M2 \M1|+ |M1 ∩M2|

(3) Folgern Sie fur alle endlichen Mengen M1,M2

|M1 ∪M2| = |M1|+ |M2| − |M1 ∩M2|

Page 49: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.4. DIE NATURLICHEN ZAHLEN 49

1.132 Aufgabe: (1) Zeigen Sie fur endliche Mengen M1, . . . ,Mn

|M1 ∩ . . . ∩Mn| ≥n∑i=1

|Mi| − (n− 1)|M1 ∪ . . . ∪Mn|.

Hinweis: Verwenden Sie

(V \M1) ∪ . . . ∪ (V \Mn) = V \ (M1 ∩ . . . ∩Mn).

wobei V = M1 ∪ . . . ∪Mn sei.

(2) Seien nun die Großen

|M1|, . . . , |Mn|, |M1 ∪ . . . ∪Mn|

vorgegeben und sei

n∑i=1

|Mi| − (n− 1)|M1 ∪ . . . ∪Mn| ≥ 0.

Geben Sie ein Beispiel an, in dem in (1) Gleichheit auftritt.

(2) Seien nun drei Mengen der Machtigkeit 10 gegeben, deren Vereinigung die Machtig-keit 14 hat. Zeigen Sie, dass dann der Schnitt nicht leer ist.

(3) Konstruieren Sie umgekehrt drei Mengen mit je 10 Elementen, deren Vereinigung15 Elemente hat, so dass der Schnitt der drei Mengen leer ist.

(4) Seien 10 Mengen der Machtigkeit 10 gegeben, deren Vereinigung 11 Elementeenthalt. Zeigen Sie, dass dann der Schnitt ein Element enthalten muss.

(5) Zeigen Sie, dass dies bei 11 Mengen nicht mehr der Fall zu sein braucht.

1.133 Aufgabe: Seien M1,M2 endlich. Zeigen Sie

|M1 ×M2| = |M1| · |M2|.

1.134 Aufgabe: Zeigen Sie per Induktion nach |M |, dass jede endliche Teilmenge

M ⊆ N ein maximales Element haben muss.

1.135. Definition: Eine bijektive Abbildung

f : {1, . . . , n} → {1, . . . , n}

heißt Permutation von {1, . . . , n}. Die Menge aller solcher Permutationen wirdmit Sn bezeichnet.

Wir werden uns spater mit Permutationen genauer beschaftigen. Hier inter-essieren uns nur Machtigkeiten, also Ergebnisse der Kombinatorik.

1.136 Satz: Es gilt fur alle n ∈ N

|Sn| = n!

Page 50: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

50 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Beweis: Sei f ∈ Sn. Dann gibt es anschaulich gesehen fur f(1) genau nMoglichkeiten, fur f(2) noch n − 1 etc. Man sollte diese Idee aber auch alsinduktiven Beweis formulieren konnen. 2

1.137 Aufgabe: Beweisen Sie Sn = n! durch Induktion nach n.

1.138. Definition: Eine Klassenaufteilung einer Menge M ist ein System(eine Menge) S ⊆ P(M) von nicht-leeren Teilmengen von M , so dass je zweiMengen in S disjunkt sind und ⋃

S = M

ist.

1.139 Aufgabe: Zeigen Sie, dass ein System

{S1, . . . , Sn}

von nicht-leeren Teilmengen einer endlichen Menge M genau dann eine Klassenauftei-lung von M ist, wenn

|S1|+ . . .+ |Sn| = |M |

ist und die Mengen S1, . . . , Sn paarweise disjunkt sind.

1.140. Definition: Fur n ∈ R und m ∈ N0 ist der Binomialkoeffizientdefiniert als ( n

m

)=n(n− 1) · . . . · (n− (m− 1))

m!, fur m ≥ 1,

und (n0

)= 1.

1.141. Bemerkung: Diese Definition ist auch fur n /∈ N geeignet. Sie lautetrekursiv (n

0

)= 1,

(n

m+ 1

)=( nm

)· n−mm+ 1

.

Es gilt ( nm

)= 0, fur alle n ∈ N0, m ∈ N, m > n

Wir definieren außerdem( nm

)= 0, fur alle n ∈ R, m ∈ Z, m < 0

1.142. Bemerkung: Fur n ∈ N0 und m ∈ N0, m ≤ n kann man den Binomi-alkoeffizienten auch als ( n

m

)=

n!m!(n−m)!

schreiben.

1.143 Aufgabe: Zeigen Sie per Induktion nach m(n+ 1

m

)=( nm

)· n+ 1

n+ 1−m

Page 51: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.4. DIE NATURLICHEN ZAHLEN 51

fur alle n ∈ R, m ∈ N, m 6= n+ 1.

1.144 Aufgabe: Zeigen Sie( nm

)+

(n

m+ 1

)=

(n+ 1

m+ 1

)fur alle n ∈ R, m ∈ Z. Fur m ≥ 1 verwenden Sie dabei Induktion nach m. Fur m = 0

und m < 0 verwenden Sie die speziellen Festlegungen fur diese Werte.

1.145. Definition: Eine bijektive Abbildung

x : {1, . . . ,m} →M

definierte ein m-Tupel(x1, . . . , xm)

in M , wobei es ublich ist xi = x(i) zu schreiben.

1.146 Satz: Es gibt genau

n(n− 1) · . . . · (n−m+ 1) =( nm

)m!

m-Tupel ohne Wiederholungen in einer n-elementigen Menge M . Insgesamt gibtes nm verschiedene m-Tupel, wenn man Wiederholungen zulasst.

Ein Tupel hat genau dann keine Wiederholungen, wenn die zugrunde liegen-de Abbildung injektiv ist.

Beweis: Der Beweis dieses Satzes ist ganz analog zur Herleitung der Machtig-keit von Sn. In der Tat ist Sn die Menge aller n-Tupeln ohne Wiederholungenin {1, . . . , n}. 2

1.147 Satz: Es gibt genau ( nm

)verschiedene Teilmengen der Machtigkeit m in einer n-elementigen Menge M .

Beweis: Wir teilen alle m-Tupel in M in Klassen auf, die dieselben Elementeenthalten. Jede Klasse entspricht eindeutig einer Teilmenge der Machtigkeit m.Wenn allerdings zwei m-Tupel ohne Wiederholungen

(x1, . . . , xm), (x1, . . . , xm)

dieselben Elemente enthalten, so gibt es eine bijektive Abbildung mit

φ : {x1, . . . , xm} → {x1, . . . , xm}φ(xi) = xi

also eine Permutation von {x1, . . . , xm}. Umgekehrt fuhrt jede solche Permuta-tion ein Tupel in ein anderes mit denselben Elementen uber. Die Große einerKlasse ist also m!. Die Anzahl der Klassen ist der Quotient aus der Gesamtan-zahl der Tupel

n(n− 1) · . . . · (n−m+ 1)

Page 52: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

52 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

und der Große jeder Klasse m! nach Aufgabe 1.139. 2

Man kann diesen Satz auch anders formulieren. Es gibt genau(nm

)verschie-

dene geordnete Tupel1 ≤ x1 < . . . < xm ≤ n.

Bildet man die Differenzen dieser Zahlen, so kann man die folgende Aufgabelosen.

1.148 Aufgabe: Auf wieviele verschiedene Arten kann man eine Zahl n ∈ N in mSummanden zerlegen? Dabei soll nach der Reihenfolge der Summanden unterschiedenwerden. In anderen Worten, wieviele verschiedene Tupel

(n1, . . . , nm)

in N gibt es, so dassn1 + . . .+ nm = n

ist.

1.149 Aufgabe: Zeigen Sie fur eine endliche Menge M

|P(M)| = 2|M|.

1.4.4 Abzahlbare Mengen

1.150. Definition: Eine Menge M heißt abzahlbar (engl.: countable), wennes eine bijektive Abbildung

x : N→M

gibt. Wir schreiben, wie bei Tupeln, xi = x(i) und

M = {x1, x2, x3, . . .}.

1.151. Bemerkung: Endliche Mengen sind nicht abzahlbar in obigem Sinn.Denn wenn T endlich ist und gleichzeitig abzahlbar, dann gibt es bijektive Ab-bildungen

{1, . . . , n} ↔ T ↔ N,

also eine bijektive Abbildung von {1, . . . , n} to N. Dies ist aber nicht moglich,da das Bild von {1, . . . , n} als endliche Teilmenge von N ein Maximum habenmuss.

Wir fassen die wesentlichen Resultate uber abzahlbare Mengen in folgendenSatz zusammen, den wir allerdings nur zum Teil beweisen.

1.152 Satz: (1) Das Bild einer abzahlbaren Menge ist abzahlbar oder endlich.

(2) Jede Teilmenge einer abzahlbaren Menge ist abzahlbar oder endlich.

(3) Das Kreuzprodukt zweier abzahlbaren Mengen ist abzahlbar.

(4) Die Vereinigung von abzahlbar vielen abzahlbaren Mengen ist abzahlbar.

Page 53: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.4. DIE NATURLICHEN ZAHLEN 53

Beweis: Wir lassen einige technische Details der Beweise aus. Der Leser isteingeladen, sich diese Details zu uberlegen.

(1) Es genugt zu zeigen, dass M abzahlbar ist, wenn

φ : N→M

surjektiv ist, M aber nicht endlich. Dazu konstruieren wir eine bijektive Abbil-dung

ψ : N→M

per Induktion. Wir wahlen ψ(1) = φ(1). Wenn ψ(1), . . . , ψ(n) definiert sind, sosetzen wir ψ(n+ 1) = φ(k), wobei k ∈ N das kleinste Element ist mit

φ(k) /∈ {ψ(1), . . . , ψ(n)}

Dadurch ist offenbar gewahrleistet, dass ψ injektiv ist. ψ ist aber in der Tatauch surjektiv, also bijektiv.

(2) Dies folgt unmittelbar aus (1), weil man leicht eine surjektive Abbildungvon einer Menge auf eine Teilmenge angeben kann.

(3) Es gilt

N× N = {(1, 1), (2, 1), (1, 2), (3, 1), (2, 2), (1, 3), . . .}.

Daraus folgt die Behauptung.

(4) Sei S ein abzahlbares Mengensystem von abzahlbaren Mengen, etwa

S = {S1, S2, . . .}.

Dann gibt es bijektive Abbildungen

φi = N→ Si.

Die Abbildungφ : N× N→

⋃S

definiert durchφ(i, j) = φi(j)

ist nun aber surjektiv. Daher ist⋃S abzahlbar oder endlich. Da es aber zum

Beispiel S1 umfasst, kann es nicht endlich sein. 2

1.153 Aufgabe: Begrunden Sie exakt, warum es im Beweis von (1) genugt, die Menge

N zu betrachten.

Der folgende Satz zeigt, dass es uberabzahlbare Mengen geben muss.

1.154 Satz: (1) Die Menge aller Abbildungen von einer abzahlbaren Mengenach {1, 2} ist nicht abzahlbar und nicht endlich.

(2) Die Menge aller Folgen in einer abzahlbaren Menge ist nicht abzahlbar undnicht endlich.

(3) Die Potenzmenge einer abzahlbaren Menge ist nicht abzahlbar.

Page 54: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

54 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Beweis: (1) Es genugt, die Aussage fur N zu beweisen. Sei

φ : N→ A(N, {1, 2})

eine Abbildung. Dann definieren wir

ψ : N→ {1, 2}

durch

ψ(n) =

{1, φ(n)(n) = 2,2, φ(n)(n) = 1.

Es folgt

ψ(n) 6= φ(n)(n)

fur alle n ∈ N. Also ψ 6= φ(n) fur alle n ∈ N. Also ist φ nicht surjektiv. Mannennt dieses Argument Cantorsches Diagonalargument.

(2) Nach (1) lasst sich nicht einmal die Menge der Folgen abzahlen, die nur1 und 2 enthalten, und dies ware eine Teilmenge der Menge aller Folgen. 2

1.155 Aufgabe: Beweisen Sie (3), indem Sie eine bijektive Abbildung

φ : P(M)→ A(M, {1, 2})

angeben.

1.156. Definition: Zwei Mengen heißen gleichmachtig, wenn eine bijektiveAbbildung zwischen ihnen existiert.

Also ist eine n-elementige Menge gleichmachtig mit {1, . . . , n} und eineabzahlbare Menge gleichmachtig mit N.

1.157 Satz: Keine Menge ist gleichmachtig mit ihrer Potenzmenge.

Beweis: Angenommen, es gabe fur eine Menge M eine bijektive Abbildung

φ : M → P(M).

Dann definieren wir

N = {m ∈M : m /∈ φ(m)}.

Es muss nun ein n ∈M geben mit φ(n) = N . Es folgt

n ∈ φ(n) ⇔ n /∈ φ(n).

Dies ist ein Widerspruch. 2

Page 55: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

1.4. DIE NATURLICHEN ZAHLEN 55

1.4.5 Das Auswahlaxiom

Ein umstrittenes Axiom der Mengenlehre ist das Auswahlaxiom. Es besagt,dass man aus jedem Element eines Mengensystems S mit paarweise disjunkten,nicht leeren Mengen genau ein Element auswahlen kann und daraus eine neueMenge S bilden.

Daraus folgt die Existenz einer Abbildung

φ : S →⋃S,

so dassφ(S) ∈ S

fur alle S ∈ S gilt.

Offenbar sichert dieses Axiom die Existenz von vielen Abbildungen, die nichtkonstruktiv anzugeben sind. Daher gilt es als problematisch.

1.158. Bemerkung: Das Auswahlaxiom braucht naturlich nicht angewendetzu werden, wenn jedes S ∈ S genau ein Element enthalt. Es braucht auch dannnicht angewendet zu werden, wenn man fur jedes S ∈ S ein s ∈ S eindeutigkonstruktiv angeben kann.

1.159. Bemerkung: Das Auswahlaxiom wird gewohnlich akzeptiert und in derAnalysis auch verwendet, wenn S abzahlbar ist, wie es im obigen Beispiel derFall ist. Wir werden seine Verwendung hier vollstandig vermeiden.

1.160. Beispiel: Um zu zeigen, dass es eine Folge von rationalen Zahlen gibt,die gegen

√2 konvergiert, kann man konstruktiv oder nicht konstruktiv vorge-

hen. Eine konstruktive Folge ist etwa die rekursiv durch

x0 = 1, xn+1 =12

(xn +

2xn

).

definierte Folge. Eine nicht-konstruktive Losung erhalt man, indem man zeigt,dass ein xn ∈ Q, xn > 0 existiert mit

2− 1n≤ x2

n ≤ 2 +1n.

Mit Hilfe des Auswahlaxioms erhalt man die gewunschte Folge.

1.161. Beispiel: Ein anderes Beispiel aus der Analysis ist die Konstruktioneiner Folge, die gegen das Supremum einer nach oben beschrankten, nicht-leerenMenge M ⊆ R konvergiert. Man ”‘wahlt”’

xn ∈ [supM − 1n, supM ] ∩M.

1.162. Bemerkung: Fur endliche Mengensysteme S braucht man das Aus-wahlaxiom nicht. Da man es hier durch Induktion nach |S| beweisen kann.

Page 56: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

56 KAPITEL 1. GRUNDLAGEN DER MATHEMATIK

Page 57: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Kapitel 2

Vektorraume

In diesem Kapitel lernen wir eine allgemeine Theorie uber Vektoren kennen. Inder Schule tauchen Vektoren nur als Pfeile in der Zahlenebene oder im Raumauf. Schon dort werden Vektoren addiert und mit reellen Zahlen multipliziert.Vektoren lassen sich aber wesentlich allgemeiner definieren und nutzen.

2.1 Korper

2.1.1 Definition, Eigenschaften und Beispiele

In der Schule betrachtet man Vektoren in der Ebene R2, und stellt sie als Pfeiledar. Vektoren kann man addieren, indem man die Pfeile hintereinander hangt.

v, w 7→ v + w.

Sie bilden eine Gruppe mit dieser Addition. Zu jedem Vektor v ist außerdemdas Vielfache λv definiert, wobei λ ∈ R ist.

λ, v 7→ λv.

Der Pfeil wird um das λ-fache in seiner Lange gestreckt. Naturlich kann man Rauch durch Q, die Menge der Bruche, ersetzten. Die moglichen Zahlraume, diehier sinnvoll sind, werden in diesem Abschnitt vorgestellt.

2.1. Definition: Eine Menge K, auf der eine Addition

+ : K ×K → K

x, y 7→ x+ y

und eine Multiplikation

∗ : K ×K → K

x, y 7→ xy

57

Page 58: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

58 KAPITEL 2. VEKTORRAUME

gegeben sind, heißt Korper (engl.: field), wenn diese Operationen die folgendenBedingungen erfullen.

(1) Es gibt Elemente 0 ∈ K und 1 ∈ K mit 0 6= 1.

(2) Fur die Addition gilt

x+ y = y + x fur alle x, y ∈ K,x+ (y + z) = (x+ y) + z fur alle x, y, z ∈ K,

x+ 0 = x fur alle x ∈ K,

und zu jedem x ∈ K existiert ein Inverses Element −x ∈ K mit

x+ (−x) = 0.

(3) Fur die Multiplikation gilt

xy = yx fur alle x, y ∈ K,x(yz) = (xy)z fur alle x, y, z ∈ K,

1x = x fur alle x ∈ K,

und zu jedem x ∈ K mit x 6= 0 existiert ein Inverses Element x−1 ∈ K mit

xx−1 = 1.

(4) Es giltx(y + z) = xy + xz fur alle x, y, z ∈ K.

Die Rechenregel (4) heißt Distributivgesetz. Die anderen Rechenregelnhaben wir schon bei der Betrachtung von Gruppen kennen gelernt.

2.2. Bemerkung: Jeder Korper K ist eine Gruppe bezuglich der Addition.Die Menge K \ {0} ist eine Gruppe bezuglich der Multiplikation. Denn dieRechenregeln gelten wortlich genauso, wenn man ”‘+”’ durch ”‘·”’ ersetzt. Wiewir gleich sehen werden, kann 0 kein multiplikatives Inverses haben, so dasses explizit ausgenommen werden muss. Wir konnen also alle Resultate uberGruppen auch in Korpern anwenden.

Wir schreiben fur die Multiplikation xy = x ∗ y = x · y. Außerdem schreibenwir, wie ublich,

x− y := x+ (−y)x

y:= xy−1.

Man beachte, dass die Division laut Definition nur fur y 6= 0 definiert ist.

2.3 Satz: Das neutrale Element und das Inverse der Addition sind eindeutigfestgelegt. In K\{0} ist das neutrale Element und das Inverse der Multiplikationeindeutig festgelegt. Es gilt

x+ y = x+ y ⇒ y = y fur alle x, y, y ∈ K

Page 59: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.1. KORPER 59

undxy = xy ⇒ y = y fur alle x, y, y ∈ K, x 6= 0.

Es gilt

−(x+ y) = (−x) + (−y) fur alle x, y ∈ K(xy)−1 = x−1y−1 fur alle x, y ∈ K \ {0}

Weiter gilt0x = 0 fur alle x ∈ K.

Beweis: Die meisten Behauptungen und die Eindeutigkeiten haben wir schonim Rahmen von Gruppen bewiesen. Aufgrund des Distributivgesetzes gilt

0x+ 0 = 0x = (0 + 0)x = 0x+ 0x.

Es folgt 0x = 0. 2

Man beachte, dass aus xy = x nur dann y = 1 folgt, wenn x 6= 0 ist. ImFall x = 0, gilt die Gleichheit fur jedes y ∈ K. Aufgrund des Satzes hat 0 keinInverses Element bezuglich der Multiplikation.

2.4. Bemerkung: Es ist auch sinnvoll, nicht-kommutative Korper zu betrach-ten. In diesem Fall fallt das Kommutiativgesezt fur die Multiplikation weg. Mankann dann trotzdem beweisen, dass das kommutative Inverse und die 1 dennocheindeutig bestimmt sind.

2.5 Aufgabe: Beweisen Sie die folgenden bekannten Rechenregeln fur Bruche.

a

b· cd

=ac

bcfur alle a, c und b 6= 0, d 6= 0,(a

b

)−1

=b

afur alle a 6= 0, b 6= 0,

a

b=ac

bcfur alle a und b 6= 0, c 6= 0,

a

b+c

d=ad+ cb

bdfur alle a, c und b 6= 0, d 6= 0,

2.6 Aufgabe: Zeigen Sie

(−x)y = −xy fur alle x, y,

(−x)(−y) = xy fur alle x, y,

(−x)−1 = −x−1 fur alle x 6= 0

2.7. Beispiel: Die wichtigsten Beispiele sind naturlich die rationalen Zahlenund die reellen Zahlen. Wir verweisen fur diese Korper auf die Vorlesung inAnalysis. Die komplexen Zahlen werden im nachsten Abschnitt behandelt.

2.8. Beispiel: Der kleinste Korper ist der Korper, der nur aus den Elementen0 und 1 besteht, K = {0, 1}. Die Addition und die Multiplikation lasst sich hierper Aufzahlung definieren.

0 + 0 = 1 + 1 = 0, 0 + 1 = 1 + 0 = 0,0 · 1 = 1 · 0 = 0 · 0 = 0, 1 · 1 = 1.

Page 60: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

60 KAPITEL 2. VEKTORRAUME

Man rechnet nach, dass diese Operationen die Korperaxiome erfullen. DieserKorper ist interessant, weil man 0 als ”‘falsch”’ und 1 als ”‘wahr”’ interpretierenkann. Die Operation ”‘+”’ ist dann als ”‘entweder, oder”’ zu lesen, und dieOperation ”‘·”’ entspricht ”‘und”’.

2.9 Aufgabe: Rechnen Sie nach, dass K = {0, 1} mit diesen Operationen tatsachlich

ein Korper ist.

2.10. Beispiel: Eine Erweiterung des vorherigen Beispiels sind die Restklas-senkorper. Fur eine Primzahl p definieren wir

K := {0, . . . , p− 1}

und definieren die Addition ”‘+K”’ und die Multiplikation ”‘·K”’ durch

x+K y = x+ y mod p,

x ·K y = xy mod p.

Das bedeutet, wir berechnen die gewohnliche Summe, und das gewohnliche Pro-dukt in Z und nehmen fur das Ergebnis den Rest modulo p. Man zeigt, dassauch diese Rechenoperationen einen Korper definieren. Man bezeichnet diesenKorper mit Zp.

2.11 Aufgabe: Weisen Sie nach, dass Zp fur eine Primzahl p tatsachlich ein Korperist. Hinweis: Fur die Existenz des multiplikativen Inversen beweisen Sie, dass die Zahlen

a, 2a, . . . , (p− 1)a

alle verschiedene Reste modulo p haben mussen, und dass deswegen der Rest 1 unter

diesen Resten vorkommen muss.

2.12. Beispiel: In der Algebra sind Korper der Form

K = {a+ b√

2 : a, b,∈ Q}

interessant. Es gilt

Q ⊂ K ⊂ R.

K erfullt naturlich die Rechengesetze, die auch R erfullt. Man muss aber 0 ∈ K,1 ∈ K sowie

x+ y ∈ K, xy ∈ K fur alle x, y ∈ K

und

x ∈ K ⇒ −x ∈ K,x ∈ K \ {0} ⇒ x−1 ∈ K

zeigen.

2.13 Aufgabe: Zeigen Sie, dass K tatsachlich ein Unterkorper von R ist.

Page 61: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.1. KORPER 61

2.1.2 Die komplexen Zahlen

Lost man die quadratische Gleichung

x2 + ax+ b = 0

mit a, b ∈ R nach x auf, so entstehen die beiden Losungen

x = −a2±√a2

4− b.

Damit reelle Losungen existieren, muss a2/4 ≥ b sein. Die komplexen Zahlensind nun ein Zahlkorper R ⊂ C, in dem diese Gleichung immer Losungen hat.Es genugt dazu, die Losung

i =√−1

der Gleichung x2 = −1 zu den reellen Zahlen ”‘dazu zu nehmen”’. Wie diesgenau geschehen kann, wird in der folgenden Definition ausgefuhrt.

2.14. Definition: Wir fuhren auf dem R2 eine Addition und eine Multiplika-tion ein. Dazu setzen wir.

(a, b) + (c, d) = (a+ c, b+ d),(a, b) · (c, d) = (ac− bd, ad+ bc).

Es wird sich herausstellen, dass R2 mit diesen Operationen ein Korper ist, denwir den Korper der komplexen Zahlen C nennen.

2.15. Bemerkung: Mit Hilfe der bijektiven Abbildung

x ∈ R 7→ (x, 0) ∈ C

identifizieren wir R mit der Teilmenge

{(x, 0) ∈ R2 : x ∈ R},

die wir ebenfalls mit R ⊂ C bezeichnen. Man beachte, dass tatsachlich

x+ y 7→ (x+ y, 0) = (x, 0) + (y, 0),xy 7→ (xy, 0) = (x, 0) · (y, 0).

Daher kann man ebensogut in R ⊂ C rechnen wie in R. Außerdem definierenwir

i = (0, 1).

Es gilt danni2 = (0, 1) · (0, 1) = (−1, 0) = −1.

Es folgt fur a, b ∈ R ⊂ C.

a+ ib = (a, 0) + (0, 1) · (b, 0) = (a, b).

Wir schreiben im folgenden die komplexen Zahlen nur noch in dieser Form, also

C = {a+ ib : a, b ∈ R}.

Page 62: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

62 KAPITEL 2. VEKTORRAUME

a heißt Realteil und b Imaginarteil von a+ ib.

2.16. Bemerkung: Nun erklart sich auch die seltsame Definition der Multi-plikation. Wenn C ein Korper ist, so muss nach den Rechengesetzen fur Korpergelten

(a+ ib)(c+ id) = ac+ i2bd+ i(ad+ bc) = ac− bd+ i(ad+ bc).

Dies entspricht genau unserer Definition.

2.17 Aufgabe: Rechnen Sie nach, dass C tatsachlich ein Korper ist. Verwenden Sie

(a+ ib)−1 =a

a2 + b2− b

a2 + b2i.

2.18. Definition: Fur komplexe Zahlen definiert man

|a+ ib| =√a2 + b2,

a+ ib = a− ib.

2.19. Bemerkung: Tragt man die komplexen Zahlen in der Zahlenebene R2

auf, so dass der Realteil auf der x-Achse und der Imaginarteil auf der y-Achseabgetragen wird, so ist

• |z| der Abstand von z zu 0,

• z die Spiegelung von z an der x-Achse,

• Die Addition z + w die normale Vektoraddition in R2.

Mit Hilfe von Mitteln der Analysis wird sich herausstellen, dass die Mul-tiplikation zw die Winkel von z und w zur positiven x-Achse addiert und dieBetrage multipliziert.

2.20 Aufgabe: Zeigen Sie

|zw| = |z| |w|

zz = |z|2

zw = z · w

fur alle z, w ∈ C.

2.21 Aufgabe: Zeigen Sie fur z 6= 0

1

z=

z

|z|2 .

Page 63: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.2. VEKTORRAUME 63

2.2 Vektorraume

2.2.1 Definition

2.22. Definition: Eine nicht leere Menge V heißt Vektorraum (engl.: vectorspace) uber einem Korper K, wenn es eine Addition

+ : V × V → V,

v, w ∈ V 7→ v + w ∈ V

auf V gibt, die die Axiome einer Gruppe erfullt, und eine Multiplikation

∗ : K × V → V,

λ ∈ K, v ∈ V 7→ λv ∈ V,

fur die gelten

(1)(λµ)v = λ(µv) fur alle λ, µ ∈ K, v ∈ V ,

(2)(λ+ µ)v = λv + µv fur alle λ, µ ∈ K, v ∈ V ,

(3)λ(v + w) = λv + λw fur alle λ ∈ K, v, w ∈ V ,

(4)1v = v fur alle v ∈ V .

Wir schreiben naturlich wieder λ · v = λ ∗ v = λv. Niemals schreiben wir vλ.Manchmal schreibt man

v

λ:=

1λv.

Wir werden diese Schreibweise hier vermeiden.

2.23 Satz: Die Addition erfullt alle fur Gruppen bisher gezeigten Rechenge-setze. Insbesondere ist 0 und −v fur alle v ∈ V eindeutig bestimmt, und es gilt−(−v) = v. Außerdem gilt in Vektorraumen V

λ · v = 0 ⇔ λ = 0 oder v = 0

fur alle λ ∈ K, v ∈ V und(−λ) · v = −λv

fur alle λ ∈ K, v ∈ V .

Man beachte, dass zum Beispiel in der Gleichung 0 · v = 0 auf der linkenSeite die Null des Korpers gemeint ist, und auf der rechten Seite die Null desVektorraums. Derartige Schreibweisen sind ublich. Man vermeidet sie durch eineIndizierung

0K · v = 0V ,

Page 64: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

64 KAPITEL 2. VEKTORRAUME

die wir aber nur noch im folgenden Beweis verwenden wollen.

Beweis: Um 0Kv = 0V zu zeigen, konnen wir ganz analog zum Beweis von0x = 0 in Korpern vorgehen. Also

0Kv + 0V = 0Kv = (0K + 0K)v = 0Kv + 0Kv.

Weil V eine Gruppe bezuglich der Addition ist, folgt daraus 0V = 0Kv. Außer-dem gilt

λ · 0V = λ · (0V + 0V ) = λ · 0V + λ · 0V .Es folgt λ · 0V = 0V . Sei umgekehrt λv = 0V , aber λ 6= 0K . Dann gilt

0V = λ−10V = λ−1λv = 1v = v.

Die zweite Gleichung gilt wegen

0V = 0Kv = (1 + (−1))v = 1v + (−1)v = v + (−1)v.

Addiert man −v auf beiden Seiten, so erhalt man −v = (−1)v. 2

2.2.2 Beispiele

2.24. Beispiel: Das ”‘kanonische”’ Beispiel fur einen Vektorraum uber K istder Kn. Dieser Raum besteht aus allen Spaltenvektoren der Lange n, n ∈ N,mit Eintragen aus K.

Kn := {

x1

...xn

: x1, . . . , xn ∈ K}.

Mengentheoretisch ist jeder Vektor ein n-Tupel aus K. Ob man das Tupel alsSpalte oder Zeile darstellt, scheint im Moment egal zu sein. Spater werden wirjedoch einen Unterschied machen. Manchmal wird der Raum der Zeilenvektorenals

Kn := {(x1 · · · xn

): x1, . . . , xn ∈ K}.

definiert. Wir werden diese Notation hier vermeiden. Die Addition definiert manals x1

...xn

+

y1...yn

:=

x1 + y1...

xn + yn

,

die Multiplikation als

λ ·

x1

...xn

:=

λx1

...λxn

.

2.25 Aufgabe: Zeigen Sie, dass der Kn mit dieser Addition und Multiplikation ein

Vektorraum uber K ist.

2.26. Beispiel: Der fur uns wichtigste Vektorraum ist naturlich der Rn als Vek-torraum uber R. Wir werden sogar meist im Qn bleiben. Normiert man Vektoren

Page 65: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.2. VEKTORRAUME 65

in Qn, so tritt aufgrund der Wurzeln der Rn auf. Im Zusammenhang mit Ei-genwerten tritt auch der Cn auf, da wir beliebige Nullstellen von Polynomenbetrachten.

Wie man in der Schule lernt, kann man die Vektoren im R2 oder R3 alsgerichtete Pfeile interpretieren. Die Addition ist dann geometrisch das Hinter-einanderhangen von Pfeilen, die Multiplikation das Strecken von Pfeilen um denFaktor λ. In Abbildung 2.1 ist dies dargestellt. Man beachte dass fur λ < 0 dieRichtung des Pfeiles umgedreht wird.

Abbildung 2.1: Vektoraddition und -Multiplikation im R2

2.27. Bemerkung: Den K1 identifizieren wir mit K, also

K1 = K.

Der K0 ist der Vektorraum, der nur aus der 0 besteht, also

K0 := {0}.

Auch dieser Nullraum ist ein Vektorraum uber K, wie man sich leicht uberlegt.

2.28. Beispiel: Sei K = {0, 1} der Korper mit zwei Elementen. Sei

v =

v1...vn

∈ Kn

Page 66: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

66 KAPITEL 2. VEKTORRAUME

ein Vektor, der die Zustande von n Lampen enthalt. Dabei steht 0 fur ”‘aus”’und 1 fur ”‘ein”’. Der Vektor

w =

w1

...wn

∈ Kn

werde als ein Vektor mit Schaltern interpretiert, wobei 1 fur ”‘schalten”’ und0 fur ”‘nicht schalten”’ stehe. Dann ist w + v = v + w der Vektor der Lam-penzustande, wenn die Schaltvorgange von w auf die Lampenzustande von vangewendet werden.

2.29. Beispiel: Ein wichtiger Raum ist der Raum aller Abbildungen einer Men-ge M in einen Korper K also die Menge A(M,K). Auf diesem Abbildungs-raum ist die Addition zweier Abbildungen f, g : M → K ist punktweisedefiniert. Also

(f + g)(x) = f(x) + g(x) fur alle x ∈M.

Genauso ist die Multiplikation definiert, also

(λf)(x) = λf(x)

fur alle x ∈M .

2.30. Beispiel: Als wichtigen Spezialfall denke man an die Menge aller reell-wertigen Funktionen auf einem reellen Intervall. Die Summe zweier Funktionenwird einfach punktweise berechnet. Wenn etwa

f(x) = x2, g(x) = 1

zwei Funktionen auf R sind, so folgt fur die Funktion 2f + g

(2f + g)(x) = 2x2 + 1.

2.31 Aufgabe: Zeigen Sie, dass A(M,K) mit diesen Operationen ein Vektorraum

uber K ist.

2.32. Beispiel: Noch allgemeiner sei V ein Vektorraum uber K. Dann ist dieMenge aller Abbildungen von A(M,V ) von M nach V ein Vektorraum uber K,wenn die Addition und die Multiplikation wieder punktweise definiert sind.

2.33. Bemerkung: Da jeder Vektor in Kn ein Tupel ist, also eine Abbildungvon {1, . . . , n} nach K, konnen wir den Kn mit dem Abbildungsraum

Kn = A({1, . . . , n},K).

identifizieren. Der Kn ist also nur ein Spezialfall eines Abbildungsraums.

2.34 Aufgabe: Machen Sie die Menge der Folgen in R zu einem Vektorraum. Schrei-

ben Sie diesen Raum als Abbildungsraum und definieren Sie die Addition und die

Multiplikation explizit.

2.35. Bemerkung: Man kann Funktionen f, g : M → K naturlich auch punkt-weise multiplizieren, also

(fg)(x) = f(x)g(x) fur alle x ∈M.

Page 67: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.2. VEKTORRAUME 67

Diese Multiplikation ist kommutativ und erfullt das Distributivgesetz

f(g + h) = fg + gh

Man stricht in diesem Fall von einer Funktionenalgebra.

2.2.3 Unterraume

2.36. Definition: Sei V ein Vektorraum uber K und U ⊆ V . Dann heißtU ein Unterraum (engl.: subspace) von V , wenn U mit der in V definiertenAddition und Multiplikation selbst ein Vektorraum uber K ist.

Es ist klar, dass dann v+w ∈ U fur alle v, w ∈ U sein muss. Man sagt, U mussabgeschlossen bezuglich der Addition sein. Dasselbe gilt fur die Multiplikation.In der Tat sind diese Bedingungen hinreichend dafur, dass U ein Unterraum vonV ist.

2.37 Satz: Sei V ein Vektorraum uber einem Korper K. Dann ist U ⊆ Vgenau dann ein Unterraum von V , wenn U 6= ∅ ist und die Bedingungen

v, w ∈ U ⇒ v + w ∈ U,λ ∈ K, v ∈ U ⇒ λv ∈ U

fur alle v, w ∈ U , λ ∈ K gelten.

Beweis: Es ist klar, dass diese Bedingungen notwendig sind. Sonst sind ”‘+”’und ”‘·”’ nicht richtig auf U definiert. Wenn umgekehrt diese Bedingungen gel-ten, dann sind die Abbildungen wohldefiniert. Es ist

0 = 0 · v ∈ U fur alle v ∈ V ,

und−v = (−1) · v ∈ U fur alle v ∈ U.

Also erfullt die Addition die Gruppenaxiome auf U . Auch die Axiome fur dieMultiplikation sind dann in U erfullt. 2

2.38. Beispiel: Jeder Vektorraum V enthalt die trivialen Unterraume {0} (denNullraum) und V .

2.39. Beispiel: Sei V ein Vektorraum uber dem Korper K, v ∈ V . Dann ist

U := {λv : λ ∈ K}

ein Unterraum von V . Im Fall V = Rn ist U die Gerade die durch 0 geht inRichtung v.

2.40. Beispiel: Es gibt zahlreiche interessante Unterraume von A(R,R). Eintypisches Beispiel ist die Menge aller stetigen Abbildung f : R→ R.

C(R) := {f ∈ A(R,R) : f ist stetig auf R}

Page 68: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

68 KAPITEL 2. VEKTORRAUME

Nach einem Satz der Analysis sind Summen und Vielfache von stetigen Funk-tionen wieder stetig. Analog ist C[a, b] ein Unterraum von A([a, b],R).

2.41. Beispiel: Ebenso gibt es zahlreiche interessante Unterraume des Folgen-raums auf R. Beispiele sind

l∞ = {(xn)n∈N : (xn) ist beschrankt},l1 = {(xn)n∈N :

∑∞n=1 |xn| <∞},

lc = {(xn)n∈N : Nur endlich viele xn 6= 0}.

2.42. Beispiel: Ein anderes Beispiel ist der Raum aller Polynome vom Gradn, n ∈ N0, den wir mit Pn bezeichnen. Dies ist der Unterraum aller Funktionenmit einer Darstellung

f(x) = a0 + a1x+ . . .+ anxn,

wobei a0, . . . , an ∈ R Koeffizienten sind und n ∈ N. Wir konnen die Polynomeals Funktionen in C(R) betrachten und erhalten einen Unterraum

Pn ⊂ C(R).

Wir werden spater aber Polynome auch als abstrakte Ausdrucke betrachten, mitdenen man dennoch rechnen kann.

2.43 Aufgabe: Welche der folgenden Mengen sind Unterraume des Rn? BegrundenSie die Entscheidung! Zeichnen Sie diese Mengen fur n = 2 in ein Koordinatensystem.Skizzieren Sie die Mengen fur n = 3.

{x ∈ Rn : x1 + . . .+ xn = 1},{x ∈ Rn : x1 = 1},{x ∈ Rn : x1 = x2}.

(Hier wird immer implizit x = (x1, . . . , xn) gesetzt).

2.2.4 Aufgespannter Unterraum

2.44. Definition: Sei V ein Vektorraum uber K und M ⊆ V . Dann heißt derkleinste Unterraum U , der M enthalt, der von M aufgespannte Unterraum(spanned subspace)

span (M).

Das heißt, span (M) ist ein Unterraum mit der Eigenschaft, dass jeder Unter-raum, der M enthalt auch span (M) enthalten muss.

U Unterraum mit M ⊆ U ⇒ span (M) ⊆ U.

Die Frage ist, ob dieser Raum existiert. Dies ergibt sich aber aus dem folgen-den Satz, in dem wir span (M) konstruktiv angeben. Wir benotigen zunachsteine Definition.

2.45. Definition: Seien v1, . . . , vn Elemente eines Vektorraums V uber K undλ1, . . . , λn ∈ K. Man nennt einen Ausdruck der Form

λ1v1 + . . .+ λnvn

Page 69: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.2. VEKTORRAUME 69

eine Linearkombination von v1, . . . , vn.

2.46 Satz: Sei V ein Vektorraum uber dem Korper K und M ⊆ V , M 6= ∅.Dann ist der aufgespannte Unterraum gleich der Menge aller Linearkombina-tionen aus M , also

span (M) =

{n∑i=1

λivi : v1, . . . , vn ∈M , λ1, . . . , λn ∈ K, n ∈ N

}

Beweis: Sei U der Raum aller Linearkombinationen. Dann ist U ein Un-terraum, weil Summe und Vielfache von Linearkombinationen offenbar wiederLinearkombinationen sind (Man beweise das, wobei man genau begrundet, wel-che Axiome des Vektorraums dabei verwendet werden).

Andererseits muss jeder Unterraum, der M enthalt auch alle Linearkombi-nationen aus M enthalten. Also ist der Raum aller Linearkombinationen dergesuchte aufgespannte Unterraum. 2

Dieser Beweis der Existenz von span (M) war konstruktiv. Es gibt aber aucheine direkte Moglichkeit, die in vielen ahnlichen Situationen funktioniert, etwabei der aufgespannten Untergruppe, oder beim aufgespannten Unterkorper. Da-zu halten wir zunachst ein Hilfsresultat fest

2.47 Satz: Der Durchschnitt eines Systems von Unterraumen eines Vektor-raums V ist ein Unterraum.

2.48 Aufgabe: Beweisen Sie diesen Satz.

2.49 Aufgabe: Gilt dies auch fur die Vereinigung von Unterraumen?

2.50 Satz: Sei V ein Vektorraum uber K und M ⊆ V , M 6= ∅. Dann sei Udie Menge der Unterraume, die M enthalten, also

U := {U ⊆ V : U Unterraum von V mit M ⊆ U}.

Es gilt dannspan (M) =

⋂U .

Beweis: Wir setzenD :=

⋂U .

Wir wissen, dass D wieder ein Unterraum ist. Dann gilt fur jeden UnterraumU mit M ⊆ U , dass U ∈ U ist, und daher D ⊆ U . 2

2.51. Bemerkung: Der Nullraum wird offenbar von der leeren Menge erzeugt.Denn er ist offenbar der kleinste Unterraum, der die leere Menge enthalt. Dieleere Menge selbst ist kein Unterraum, weil jeder Vektorraum eine {0} enthaltenmuss. Der obige Satz ist auch in diesem Fall richtig.

2.52. Beispiel: WennM = {v1, . . . , vn}

Page 70: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

70 KAPITEL 2. VEKTORRAUME

eine endliche Teilmenge von V ist, so ist

span (M) = {n∑i=1

λivi : λ1, . . . , λn ∈ K}.

Dies folgt unmittelbar aus Satz 2.46, da man Linearkombinationen von Teil-mengen von M durch Summanden 0vi auffullen kann.

Wir sprechen in diesem Fall einfach von dem durch v1, . . . , vn erzeugten (oderaufgespannten) Unterraum.

2.53. Beispiel: Fur v ∈ Rn, v 6= 0, n = 2, 3, ist

span {v} = {λv : λ ∈ R}

die von v aufgespannte Gerade durch 0. Fur v, w ∈ R3, v, w 6= 0, ist

span {v, w} = {λv + µw : λ, µ ∈ R}

die Ebene durch 0, die die Geraden span {v} und span {w} enthalt, wenn diebeiden Vektoren nicht in dieselbe Richtung zeigen.

2.54 Aufgabe: Skizzieren Sie im R2 die folgenden Mengen und die davon aufge-spannten Unterraume.

{(

11

)}, {

(11

),

(12

)}, {

(11

),

(22

)},

2.55 Aufgabe: Sei V ein Vektorraum uber K, und M1,M2 ⊆ V mit

M1 ⊆M2.

Zeigen Sie

span (M1) ⊆ span (M2).

2.56. Beispiel: Betrachtet man die Funktionen

fi(x) = xi, i = 0, . . . , n,

wobei x0 fur die Funktion 1 steht, so sind diese Funktionen Elemente von C(R).Offenbar gilt

span {f0, . . . , fn} = Pn.

Es gilt namlich (n∑i=0

λifi

)(x) =

n∑i=0

λifi(x) =n∑i=0

λixi.

Page 71: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.2. VEKTORRAUME 71

2.2.5 Basen

In diesem Abschnitt studieren wir die Mengen, die einen Vektorraum aufspan-nen. Man nennt solche Mengen Erzeugendensysteme des Vektorraums. Wir sinddaran interessiert, Erzeugendensysteme minimaler Große zu finden, so genann-te Basen. Es wird sich herausstellen, dass die Lange einer Basis (die Dimen-sion) charakteristisch fur den Vektorraum ist. Außerdem ist fur jeden Vektordie Darstellung als Linearkombination von Basisvektoren eindeutig. Basen sinddeswegen ein theoretisch und praktisch zentrales Mittel zum Studium von Vek-torraumen.

2.57. Definition: Wenn ein Vektorraum V von einer Menge M ⊆ V aufge-spannt wird, so nennt man M ein Erzeugendensystem von V . Ein Erzeugen-densystem heißt Basis, wenn es minimal ist. Das heißt, jede echte Teilmenge

M ⊆M, M 6= M

ist kein Erzeugendensystem von V mehr.

Eine Basis eines Vektorraums ist ein minimales Erzeugen-densystem des Vektorraums.

Wir interessieren uns hier hauptsachlich, aber nicht ausschließlich, fur Vek-torraume und Untervektorraume, die ein endliches Erzeugendensystem haben.Man nennt solche Vektorraume endlich erzeugt.

2.58. Definition: Eine Teilmenge M eines Vektorraums V heißt linear un-abhangig, wenn kein Element von M Linearkombination von anderen Vektorenin M ist. Das heißt

v /∈ span (M \ {v})

fur alle v ∈M .

2.59 Aufgabe: SeiM = {v1, v2} ⊂ V.

Zeigen Sie, dass dann M genau dann linear unabhangig ist, wenn v1 6= 0 ist und v2kein Vielfaches von v1 ist.

2.60. Bemerkung: Offenbar ist jede Teilmenge eines linear unabhangigen Sys-tems wieder linear unabhangig.

2.61. Bemerkung: Ein linear unabhangige Menge von Vektoren kann die 0nicht enthalten, weil

0 ∈ {0} = span ∅

ist. Insbesondere ist die Menge {0} nicht linear unabhangig. Aber die leereMenge ∅ ist linear unabhangig und daher Basis des Nullraums.

Wir charakterisieren nun linear unabhangige Systeme auf eine aquivalenteArt und Weise, die manchmal als Definition fur lineare Unabhangigkeit verwen-det wird.

2.62 Satz: Eine Teilmenge M eines Vektorraums V . Dann sind aquivalent:

Page 72: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

72 KAPITEL 2. VEKTORRAUME

(1) M ist linear unabhangig.

(2) Fur je endlich viele paarweise verschiedene v1, . . . , vn ∈ M und beliebigeλ1, . . . , λn ∈ K gilt

λ1v1 + . . .+ λnvn = 0 ⇒ λ1 = . . . = λn = 0.

(3) Jedes v ∈ span (M) \ {0} lasst sich eindeutig (bis auf die Reihenfolge) alsLinearkombination

v = λ1v1 + . . .+ λnvn

mit λ1, . . . , λn ∈ K \ {0} und paarweise verschiedenen v1, . . . , vn ∈ M darstel-len.

Beweis: (1) ⇒ (2): Sei M linear unabhangig. Seien dann v1, . . . , vn ∈ Mpaarweise verschieden und λ1, . . . , λn ∈ K mit

λ1v1 + . . .+ λnvn = 0.

Wir fuhren den Beweis durch Widerspruch. Angenommen zum Beispiel λ1 6= 0.Dann kann man schreiben

v1 =−λ2

λ1v2 + . . .+

−λnλ1

vn.

Alsov1 ∈ span {v2, . . . , vn}.

Dies ist ein Widerspruch dazu, dass M linear unabhangig ist. Also muss λ1 = 0sein. Analog zeigt man λ2 = . . . = λn = 0.

(2) ⇒ (3): Wir fuhren den Beweis durch Widerspruch. Angenommen v sei aufzweierlei Arten als Linearkombination darstellbar. Dann konnen wir annehmen,dass

v = λ1v1 + . . .+ λnvn

= µ1v1 + . . .+ µnvn

mit paarweise verschiedenen v1, . . . , vn ∈ M ist und die beiden Darstellungenvoneinander verschieden sind. (Dazu sei {v1, . . . , vn} die Vereinigung der Vek-toren, die in beiden, verschiedenen Darstellungen vorkommen.) Es folgt

0 = (λ1 − µ1)v1 + . . .+ (λn − µn)vn.

Nach Voraussetzung erhalt man λ1 = µ1, . . . , λn = µn. Dies ist ein Widerspruchdazu, dass v auf zwei verschiedene Arten darstellbar sein soll.

(3) ⇒ (1): Wieder fuhren wir den Beweis durch Widerspruch. Angenommen,M ist nicht linear unabhangig. Dann gibt es ein v ∈ M , das von den ubrigenlinear abhangig ist. Also

v = λ1v1 + . . .+ λnvn

mit v1, . . . , vn ∈M\{v} und λ1, . . . , λn ∈ K. Aber wir haben in dieser Gleichungoffenbar zwei verschiedene Darstellungen des Vektors v vorliegen. Dies ist einWiderspruch zu (3). 2

Page 73: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.2. VEKTORRAUME 73

Im Fall M = ∅ gelten alle drei Bedingungen. Der Satz ist also auch fur diesenSonderfall richtig.

2.63. Bemerkung: Fur endliche Systeme M = {v1, . . . , vn} spricht man ein-fach von linearer Unabhangigkeit der Vektoren v1, . . . , vn, oder auch von linearerUnabhangigkeit des Tupels

A = (v1, . . . , vn).

Man nennt solche Tupel von Vektoren nur dann linear unabhangig, wenn dieVektoren paarweise verschieden sind. Wenn zwei Vektoren gleich sind, kanndie Menge {v1, . . . , vn} linear unabhangig sein, ohne dass es das Tupel dieserVektoren ist. Nach Bedingung (2) des eben bewiesenen Satz muss außerdem furalle λ1, . . . , λn ∈ K gelten

n∑i=0

λivi = 0 ⇒ λ1 = . . . = λn = 0.

Aquivalent mussen nach Bedingung (3) die Darstellungen als Linearkombinationeindeutig sein. Also

n∑i=1

λivi =n∑i=1

µivi ⇒ λi = µi fur i = 1, . . . , n.

Man beachte, aus der Eindeutigkeit der Darstellung unmittelbar die Bedin-gung (2) folgt.

Der folgende Satz dient uns zum Generieren von Basen. Wir streichen auseinem System solange linear abhangige Vektoren, bis dies nicht mehr geht.

2.64 Satz: Sei M ein Erzeugendensystem von V , und v ∈M von den ubrigenVektoren in M linear abhangig, also

v ∈ span (M \ {v}).

Dann ist M \ {v} ebenfalls ein Erzeugendensystem von V .

Beweis: Wenn v = 0 ist, so ist M \ {v} in jedem Fall ebenfalls ein Erzeugen-densystem von V (auch wenn V der Nullraum ist). Wenn v 6= 0 ist, so gibt esnach Voraussetzung v1, . . . , vn ∈M \ {v} und λ1, . . . , λn ∈ K mit

v = λ1v1 + . . .+ λnvn.

Wir mussen zeigen, dass M \ {v} dann auch ein Erzeugendensystem von V ist.Sei also w ∈ V und

w = µ1w1 + . . .+ µkwk

mit paarweise verschiedenen w1, . . . , wk ∈M und Koeffizienten µ1, . . . , µk ∈ K.Dann mussen wir w als Linearkombination aus M \{v} darstellen. Wenn v unterden Vektoren w1, . . . , wk nicht vorkommt, so sind wir fertig. Wenn etwa v = w1

ist, so gilt

w = µ1λ1v1 + . . .+ µ1λnvn + µ2w2 + . . .+ µkwk ∈ span (M \ {v})

Page 74: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

74 KAPITEL 2. VEKTORRAUME

Analog fur v = w2 etc. 2

Den nachsten Satz beweisen wir hier nur fur endliche Systeme. In der nach-folgenden Bemerkung gehen wir kurz auf den unendlich dimensionalen Fall ein.

2.65 Satz: Sei v1, . . . , vn ein Erzeugendensystem von V . Dann gibt es einTeilsystem, das eine Basis von V ist. Also ist jeder endlich erzeugte Vektorraumendlich-dimensional.

Beweis: Gemaß dem vorigen Satz streichen wir solange Vektoren aus diesemErzeugendensystem, bis wir ein linear unabhangiges System erhalten, das aberimmer noch Erzeugendensystem ist. Dieses Erzeugendensystem ist minimal, weilkein Vektor mit Hilfe der ubrigen darstellbar ist. 2

2.66 Aufgabe: Sei M linear unabhangig in V und M ∪ {v} linear abhangig. ZeigenSie, dass dann

v ∈ span (M)

sein muss. Folgern Sie, dass fur linear unabhangiges M ⊆ V und v /∈ span (M) das

System M ∩ {v} linear unabhangig ist.

2.67. Bemerkung: Man kann auch fur nicht endlich erzeugte Vektorraumebeweisen, dass sie eine Basis besitzen, wenn man das Auswahlaxiom zugrundelegt. Diese Basen sind aber nicht konstruktiv beschreibbar und fur praktischeZwecke unbrauchbar. Außerdem ist der Beweis der Existenz mengentheoretischgepragt und wurde uns zu weit abseits fuhren.

Es folgt ein wichtiger Satz, mit dem wir Basen, also minimale Erzeugenden-systeme, mit Hilfe von linearer Unabhangigkeit charakterisieren konnen.

2.68 Satz: Sei M eine Teilmenge eines Vektorraums V . Dann sind aquivalent:

(1) M ist ein minimales Erzeugendensystem von V (also eine Basis).

(2) M ist ein linear unabhangiges Erzeugendensystem.

(3) M ist ein maximales linear unabhangiges System in V . (Das heißt, jedeechte Obermenge von M ist nicht mehr linear unabhangig.)

Beweis: (1) ⇒ (2): Sei M eine Basis. Es muss nur gezeigt werden, dass Mlinear unabhangig ist. Dies folgt aber unmittelbar aus Satz 2.64.

(2) ⇒ (3): Diesen Beweis fuhren wir durch Widerspruch. Sei also M ein linearunabhangiges Erzeugendensystem. Angenommen M ist eine echte Obermengevon M , die linear unabhangig ist. Sei v ∈ M \M . Dann ist M ∪ {v} also alsTeilmenge einer linear unabhangigen Menge selbst linear unabhangig. Es folgt

v /∈ span (M).

Also ware M kein Erzeugendensystem. Dies ist ein Widerspruch.

(3) ⇒ (1): Sei M ein maximales linear unabhangiges System in V . Dann lasstsich jedes v ∈ V als Linearkombination ausM darstellen, weil sonstM∪{v} nachAufgabe 2.66 linear unabhangig ware. Also ist M ein Erzeugendensystem. Keinw ∈M lasst sich als Linearkombination von anderen Elementen in M darstellen,weil M linear unabhangig ist. Also ist M ein minimales Erzeugendensystem. 2

Page 75: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.2. VEKTORRAUME 75

Jedes linear unabhangige Erzeugendensystem ist ein mini-males Erzeugendensystem und ein maximales System vonlinear unabhangigen Vektoren

Wir halten noch den folgenden Sachverhalt fest, der sich unmittelbar ausden obigen Satzen ergibt.

2.69 Satz: Ein TupelA = (v1, . . . , vn)

von Vektoren aus V ist genau dann eine Basis von V , wenn sich jedes v ∈ Veindeutig als Linearkombination

v = λ1v1 + . . . λnvn

schreiben lasst.

2.2.6 Endlich-Dimensionale Vektorraume

2.70. Definition: Wenn M = {v1, . . . , vn} mit paarweise verschiedenen Vek-toren vi eine Basis von V ist, so heißt n die Dimension von V . Man schreibt

dimV = n.

In diesem Fall nennt man V endlich-dimensional.

2.71. Bemerkung: Der Nullraum {0} hat vereinbarungsgemaß die Dimension0. Man muss aber bei Beweisen uber Dimensionen diesen Sonderfall stets imAuge behalten.

Die Definition von Erzeugendensystem, Basis und Dimension gilt naturlichauch fur Unterraume, die ja selber Vektorraume sind. Wir mussen noch zeigen,dass die Dimension eine eindeutig bestimmte Zahl ist. Zuvor jedoch ein paarBeispiele.

2.72. Beispiel: Die Vektoren

e1 :=

10...0

, . . . , en :=

0...01

sind eine Basis des Kn. Denn jedes Element wird eindeutig alsx1

...xn

= x1e1 + . . .+ xnen

dargestellt. Man nennt die Basis die kanonische Basis des Kn und die Vekto-ren die Einheitsvektoren. Es gilt also

dimKn = n.

Page 76: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

76 KAPITEL 2. VEKTORRAUME

2.73. Beispiel: Zwei Vektoren v1, v2 ∈ R3 spannen genau dann eine Ebeneauf, wenn sie linear unabhangig sind. Die Dimension dieser Ebenen ist dann 2.Sonst gilt entweder v1 = v2 = 0, und die Vektoren spannen den Nullraum mitDimension 0 auf, oder ein Vektor ist Vielfaches des anderen, und die Vektorenspannen eine Gerade mit Dimension 1 auf.

2.74. Beispiel: Der Nachweis der linearen Unabhangigkeit nach der Bedin-gung (2) aus Satz 2.62 oder die Berechnung einer Linearkombination im Kn

erfordern das Aufstellen und Losen eines linearen Gleichungssystems, wie manin der folgenden Aufgabe sieht.

2.75 Aufgabe: Gegeben seien die Vektoren

v1 =

111

, v2 =

101

, v3 =

110

im R3. Stellen Sie den Vektor

v =

123

als Linearkombination von v1, v2, v3 dar, und weisen Sie nach, dass die Vektoren

v1, v2, v3 linear unabhangig sind. Verwenden Sie dazu jeweils ein lineares Gleichungs-

system mit 3 Unbekannten und drei Gleichungen.

2.76. Beispiel: Wir betrachten wieder den Raum aller Polynome n-ten Grades

Pn ⊂ C(R).

Wir zeigen, dass die Funktionen

fi(x) = xi, i = 0, . . . , n

eine Basis von Pn bilden. Diese Funktionen sind ein Erzeugendensystem, wiewir schon gesehen haben. Wir zeigen, dass die Funktionen linear unabhangigsind. Sei

p :=n∑i=0

λifi = 0,

wobei mit 0 die Nullfunktion gemeint ist, die auf ganz R identisch 0 ist. Wirmussen zeigen, dass alle λi = 0 sind. Es folgt also

p(x) = λ0 + λ1x+ . . .+ λnxn = 0 fur alle x ∈ R.

Insbesonderep(0) = λ0 = 0.

Da p identisch 0 ist, folgt durch k-faches Ableiten auch

p(k)(0) = k!λk = 0,

fur k = 1, . . . , n. In der Tat folgt also

λ0 = λ1 = . . . = λn = 0.

Page 77: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.2. VEKTORRAUME 77

Wir zeigen nun, dass die Langen aller Basen eines endlich-dimensionalenVektorraums gleich sind. Die Dimension ist also wohlbestimmt.

2.77 Satz: (Steinitzscher Austauschsatz) Sei V ein Vektorraum, v1, . . . , vnein Erzeugendensystem von V und w1, . . . , wk linear unabhangig. Dann gilt

k ≤ n

und man kann k Vektoren der v1, . . . , vn durch w1, . . . , wk ersetzen, so dass manwieder ein Erzeugendensystem erhalt.

Beweis: Wir setzen induktiv einen Vektor wi nach dem anderen in das Er-zeugendensystem ein. Sei zunachst

w1 =n∑i=1

λivi.

Wegen der linearen Unabhangigkeit ist w1 6= 0. Also zum Beispiel λ1 6= 0. Dannersetzen wir v1 durch w1. Wir mussen nun zeigen, dass

w1, v2, . . . , vn

noch immer ein Erzeugendensystem von V ist. Klar ist, dass

w1, v1, v2, . . . , vn

ein Erzeugendensystem ist. Es gilt aber

v1 =1λ1w1 −

λ2

λ1v2 − . . .−

λnλ1vn.

Nach Satz 2.64 kann man daher v1 streichen und erhalt immer noch ein Erzeu-gendensystem.

Wenn wir w1, . . . , wm, m < k ersetzt haben, so konnen wir nach Umnum-merierung der vi annehmen, dass ein Erzeugendensystem

w1, . . . , wm, vm+1, . . . , vn

entstanden ist. Sei nun

wm+1 = λ1w1 + . . .+ λmwm + λm+1vm+1 + . . .+ λnvn.

Wegen der linearen Unabhangigkeit der wi muss einer der Koeffizienten

λm+1, . . . , λn

ungleich 0 sein. Insbesondere muss m < n sein. Wenn zum Beispiel λm+1 6= 0 ist,so konnen wir mit demselben Argument wie oben wm+1 gegen vm+1 tauschen.

Wir setzen den Austausch fort, bis alle wi eingetauscht sind. 2

Der folgende Satz besagt, dass die Dimension eines endlich erzeugten Vek-torraums eine wohldefinierte Große ist.

2.78 Satz: Alle Basen eines endlich-dimensionalen Vektorraums haben diegleiche Lange.

Page 78: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

78 KAPITEL 2. VEKTORRAUME

Beweis: Fur den Nullraum ist diese Aussage klar. Ansonsten seien v1, . . . , vnund w1, . . . , wm zwei Basen. Nach dem Austauschsatz ist m ≤ n und n ≤ m.2

Wir geben nun noch zwei Satze uber endlich-dimensionale Vektorraume an,die sehr nutzlich sein werden.

2.79 Satz: Sei V ein Vektorraum, n ∈ N0.

(1) Genau dann ist dimV ≥ n, wenn jedes Erzeugendensytem mindestens nVektoren umfasst.

(2) Wenn dimV ≥ n ist, so ist jedes Erzeugendensystem der Lange n eine Basisund folglich dimV = n.

(3) Genau dann ist dimV ≤ n, wenn jedes linear unabhangige System hochstensn Vektoren umfasst.

(4) Wenn dimV ≤ n ist, so ist jedes System mit n linear unabhangigen Vektoreneine Basis und folglich dimV = n.

Beweis: (1) Sei dimV = k ≥ n. Im Fall k = ∞ kann es gar kein endlichesErzeugendensystem geben. Falls k = n = 0, so ist die Behauptung klar. Sonstgabe es ein Basis v1, . . . , vk von V . Wenn w1, . . . , wm ein Erzeugendensystemist, so gilt nach dem Austauschsatz k ≤ m. Also n ≤ m.

Wenn umgekehrt jedes Erzeugendensystem n Vektoren umfasst, so kanndimV < n nicht gelten, weil sonst V eine Basis mit kleinerer Lange als n habenmusste.

(2) Nach (1) ist jedes Erzeugendensystem der Lange n ≤ dimV minimal, alsoBasis.

(3) Sei dimV = k ≤ n und v1, . . . , vm linear unabhangig. Dann ist nach demAustauschsatz m ≤ k. Also m ≤ n.

Umfasse jedes linear unabhangige System hochstens n Vektoren. Da jedeBasis aus linear unabhangigen Vektoren besteht, folgt dimV ≤ n.

(4) Es gebe also eine Basis der Lange k ≤ n und ein linear unabhangiges Systemv1, . . . , vn. Nach dem Austauschsatz ist n ≤ k, also n = k, und v1, . . . , vn istdann auch Erzeugendensystem, also Basis. 2

2.80 Satz: Jedes linear unabhangige System eines endlich-dimensionalen Vek-torraums lasst sich zu einer Basis erganzen.

Beweis: Fur die leere Menge stimmt der Satz. Sei w1, . . . , wm linear un-abhangig und v1, . . . , vn eine Basis von V . Nach dem Steinitzschen Austausch-satz ist m ≤ n, und man kann die wi in die Basis eintauschen, so dass man einErzeugendensystem der Lange n erhalt, das die Vektoren w1, . . . , wm umfasst.Dies ist nach dem letzten Satz eine Basis von V . 2

Page 79: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.2. VEKTORRAUME 79

Den folgenden, nicht trivialen Satz erhalten wir nunmehr leicht aus dembisherigen Satzen. Der Satz erlaubt es, Unterraume mit ihrer Dimension zucharakterisieren.

2.81 Satz: Sei V ein endlich-dimensionaler Vektorraum und U ein Unter-raum. Dann ist auch U endlich-dimensional und

dimU ≤ dimV

Außerdem giltU = V ⇔ dimU = dimV

Beweis: Die Maximalgroße eines Systems von linear unabhangiger Vektorenin U ist kleiner als in V . Also dimU ≤ dimV .

Sei nun dimU = dimV . Dann ist jede Basis von U ein linear unabhangigesSystem in V der Lange dimV . Nach dem vorigen Satz ist jede Basis von U alsoauch Basis von V . Es folgt U = V . 2

2.82. Beispiel: Im R2 gibt es einen Unterraum der Dimension 0, namlich {0},Unterraume der Dimension 1, namlich Geraden durch 0, und einen Unterraumder Dimension 2, namlich den R2. Im R3 gibt es echte Unterraume der Dimension2, namlich die Ebenen durch 0.

2.83. Bemerkung: Der obige Satz gilt naturlich auch fur Unterraume. Wennalso U1 ⊆ U2 ⊆ V Unterraume sind, so folgt

dimU1 ≤ dimU2.

Falls dimU1 = dimU2 ist, so folgt U1 = U2.

2.84 Aufgabe: Sei U ⊂ Pn der Raum der Polynome mit p(0) = 0. Zeigen Sie, dass

dies ein Unterraum von Pn ist und geben Sie eine Basis fur diesen Raum an.

2.2.7 Summen von Unterraumen

2.85. Beispiel: Seien v1, v2 ∈ R3 linear unabhangig. Es gibt dann eine Ebenedurch 0, die die Geraden

G1 = span {v1}, G2 = span {v2}

enthalt, namlichE = span {v1, v2}.

Da v1, v2 linear unabhangig sind, lasst sich jedes v ∈ E eindeutig als

v = λ1v1 + λ2v2 = w1 + w2

mit w1 ∈ G1 und w2 ∈ G2 schreiben. Man kann also E als die Summe derGeraden auffassen

E = G1 +G2 := {w1 + w2 : w1 ∈ G1, w2 ∈ G2}.

Page 80: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

80 KAPITEL 2. VEKTORRAUME

2.86. Definition: Seien U1, U2 Unterraume eines Vektorraums V . Dann defi-nieren wir die Summe der Unterraume U1, U2 als

U1 + U2 := {u1 + u2 : u1 ∈ U1, u2 ∈ U2}.

Wenn jedes u ∈ U1+U2 eine eindeutige Summendarstellung hat, so heißt U1+U2

direkte Summe der Vektorraume und man schreibt fur die Summe in diesemFall

U1 ⊕ U2.

Fur den folgenden Satz erinnern wir uns, dass der Durchschnitt zweier Un-terraume wieder ein Unterraum ist.

2.87 Satz: (Dimensionsformel) Es gilt fur zwei endlich-dimensionale Un-terraume U1, U2 eines Vektorraums

dim(U1 + U2) = dimU1 + dimU2 − dim(U1 ∩ U2).

Beweis: U1 ∩ U2 ist ein Unterraum von U1. Falls einer der beteiligten Un-terraume die Dimension 0 hat, so wird dieser Sonderfall in der folgenden Aufgabebehandelt. Ansonsten wahlen wir eine Basis v1, . . . , vk von U1∩U2 und erganzendiese Basis zu einer Basis

v1, . . . , vk, wk+1, . . . , wn

von U1. Analog erganzen wir diese Basis zu einer Basis

v1, . . . , vk, sk+1, . . . , sm

von U2. Unmittelbar aus der Definition der Summe U1 + U2 folgt dann, dass

v1, . . . , vk, wk+1, . . . , wn, sk+1, . . . , sm

ein Erzeugendensystem von U1 + U2 ist. Wir zeigen nun, dass dieses Systemlinear unabhangig ist. Sei dazu

0 =k∑i=1

λivi +n∑

i=k+1

µiwi +m∑

i=k+1

ηisi.

Da v1, . . . , vk, wk+1, . . . , wn linear unabhangig sind, genugt es zu zeigen dassalle Koeffizienten ηk+1, . . . , ηm gleich 0 sind. Es gilt aber aufgrund der obigenDarstellung

h :=m∑

i=k+1

ηisi ∈ U1 ∩ U2.

Also ist h als Linearkombination von v1, . . . , vk darstellbar. Aufgrund der linea-ren Unabhangigkeit von v1, . . . , vk, sk+1, . . . , sm ist aber h eindeutig mit diesemKoeffizienten darstellbar. Es folgt h = 0 und

ηk+1 = . . . = ηm = 0.

Page 81: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.3. ANALYTISCHE GEOMETRIE 81

2

2.88 Aufgabe: Uberlegen Sie sich, dass die Dimensionsformel auch fur die Sonderfalle

dimU1 = 0, dimU2 = 0, dim(U1 ∩ U2) = 0

korrekt ist.

2.89 Satz: Genau dann ist U1 + U2 direkte Summe von U1, U2 wenn

U1 ∩ U2 = {0}

ist. Falls U1 und U2 endlich-dimensional sind, so gilt in diesem Fall

dim(U1 ⊕ U2) = dimU1 + dimU2.

Beweis: Sei U1 ∩ U2 = {0}. Es gebe zwei Darstellungen

v = u1 + u2 = u1 + u2

mit u1, u1 ∈ U1 und u2, u2 ∈ U2. Dann folgt

u1 − u1 = u2 − u2 ∈ U1 ∩ U2.

Also nach Voraussetzung u1 = u1 und u2 = u2.

Sei umgekehrt die Darstellung immer eindeutig, und v ∈ U1∩U2. Dann sind

v + 0 = 0 + v

zwei Darstellungen von v als Summe aus U1 und U2. Da diese Darstellungengleich sein sollen, muss v = 0 sein. 2

2.90 Aufgabe: Sei V endlich-dimensional und U1 ⊆ V ein Unterraum. Zeigen Sie,dass es einen Unterraum U2 ⊆ V gibt, so dass

V = U1 ⊕ U2

ist.

2.3 Analytische Geometrie

Als ”‘analytische Geometrie”’ bezeichnet man Geometrie, die Koordinaten ver-wendet. Studiert werden geometrische Objekte und Beziehungen im R2 und R3.In diesem Abschnitt studieren wir lediglich Geraden, Ebenen und Strecken imRaum.

Im Gegensatz zur analytischen Geometrie steht die ”‘synthetische Geome-trie”’, die geometrische Objekte axiomatisch festlegt. Wir betrieben diese Geo-metrie, die auf die Griechen zuruck geht und Jahrtausende lang eine wichtigeSaule der Mathematik war, hier nicht.

Page 82: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

82 KAPITEL 2. VEKTORRAUME

2.3.1 Affine Unterraume

2.91. Definition: Sei V ein Vektorraum uber K und U ein Unterraum vonV . Zu a ∈ V bezeichnet man dann die Menge

a+ U := {a+ u : u ∈ U}

als affinen Unterraum (affine subspace) von V . Die Dimension des affinenUnterraums ist die Dimension von U .

Die Summe oder Differenz von Mengen oder eines Vektors mit einer Mengeist eine nutzliche Notation. Sie muss aber mit Vorsicht benutzt werden. So giltetwa fur jeden Unterraum U

U − U := {u1 − u2 : u1, u2 ∈ U} = U.

2.92. Beispiel: Man kann in beliebigen Vektorraumen Geraden als 1-dimen-sionale affine Unterraume definieren. Eine Gerade ist damit von der Form

G = {a+ λv : λ ∈ R}

mit a, v ∈ V und v 6= 0 (siehe Abbildung 2.2). In diesem Fall ist

U = span {v}.

Falls v = 0 ist, so besteht G = a+U nur aus einem Punkt und ist keine Gerademehr. Im R3 werden wir außerdem Ebenen als 2-dimensionale affine Unterraumecharakterisieren (siehe Abbildung 2.3).

Die Dimension eines affinen Unterraums scheint von der konkreten Darstel-lung abzuhangen. Die folgende Aufgabe zeigt, das das nicht so ist.

2.93 Aufgabe: SeiE = a+ U

ein affiner Unterraum und b ∈ E. Zeigen Sie

E = b+ U.

2.94. Bemerkung: Aufgrund dieser Aufgabe ist der Unterraum U , der zueinem affinen Unterraum E gehort, eindeutig durch

U = E − a

gegeben, wobei a ∈ E beliebig gewahlt werden kann.

2.95 Satz: Der Schnitt eines nicht-leeren Systems A von affinen Unterraumenist entweder leer, oder der affine Unterraum⋂

A = b+⋂E∈A

(E − b).

mit einem beliebigen b ∈⋂A.

Page 83: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.3. ANALYTISCHE GEOMETRIE 83

Beweis: Wenn der Schnitt nicht leer ist, so wahlen wir ein beliebiges b ∈⋂A.

Aufgrund von Aufgabe 2.93 ist

E = b+ (E − b),

fur alle E ∈ A, wobei E−b jeweils der zu E gehorige Unterraum ist. Der Schnittdieser Unterraume

U =⋂E∈A

E − b

ist ein Unterraum.

”‘⊆”’: Sei c ∈⋂A, und E ∈ A. Dann ist c ∈ E und nach der vorigen Aufgabe

ist E = b+ (E − b). Es folgt c = b+ u mit einem u ∈ E − b. Es bleibt u ∈ U zuzeigen. Sei dazu E ∈ A beliebig. Genau wie eben zeigt man c = b+ u mit einemu ∈ E − b. Es folgt u = u und daher c ∈ b+ (E − b).

”‘⊇”’: Sei umgekehrt c = b + u mit u ∈ U und E ∈ A. Wegen u ∈ E − b istdann c ∈ E = b+ (E − b). 2

Dass der Schnitt von beliebig vielen affinen Unterraumen ein affiner Unter-raum ist, lasst sich auch mit dem folgenden Satz beweisen, der affine Unterraumecharakterisiert.

2.96 Satz: Eine nicht-leere Teilmenge E eines reellen Vektorraums V istgenau dann affiner Unterraum von V , wenn sie fur alle x, y ∈ E die Gerade

G(x, y) = {x+ λ(y − x) : λ ∈ R}

durch x und y enthalt.

Beweis: Sei E = b + U ein affiner Unterraum. Sei dann x = b + u1 undy = b+ u2. Dann gilt

G(x, y) = {b+ u1 + λ(u1 − u2) : λ ∈ R} ⊆ E.

Umgekehrt enthalte E mit zwei Punkten jeweils die Gerade durch diese Punkte.Wir wahlen b ∈ E fest. Zu zeigen ist, dass U = E − b ein Unterraum ist. Es giltoffenbar 0 ∈ U . Außerdem fur alle x, y ∈ E

G(x, y) = {x+ λ(y − x) : λ ∈ R}= {(x+ b) + λ((y + b)− (x+ b))− b : λ ∈ R}= G(x+ b, y + b)− b.

Wenn also x, y ∈ U sind, so ist x+ b, y + b ∈ E und daher

G(x+ b, y + b) ⊆ E,

alsoG(x, y) ⊆ E − b = U.

Also enthalt auch U zu je zwei Punkten die Gerade durch diese Punkte. Sei nunx ∈ E und λ ∈ R. Dann ist

λx ∈ G(0, x) ⊆ U.

Page 84: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

84 KAPITEL 2. VEKTORRAUME

Seien x, y ∈ U . Dann ist

x+ y = 2x+12

(2y − 2x) ∈ G(2x, 2y) ⊆ U.

Also ist U ein Unterraum. 2

2.97 Aufgabe: Seien

A1 = a1 + U1, A2 = a2 + U2

zwei affine Unterraume.

(1) Zeigen Sie, dass genau dann A1 ⊆ A2 gilt, wenn A1 ∩A2 6= ∅ ist und U1 ⊆ U2.

(2) Folgern Sie, dass genau dann A1 = A2 gilt, wenn A1 ∩A2 6= ∅ ist und U1 = U2.

2.98 Satz: Sei V ein n-dimensionaler Vektorraum, wobei wir n =∞ zulassen,k ≤ n und

a1, . . . , ak+1 ∈ V

Punkte, die in keinem k−1-dimensionalen affinen Unterraum liegen. Dann gibtes genau einen affinen Raum E der Dimension k, der alle diese Punkte enthalt.

Beweis: Existenz: Die Existenz ist sehr einfach zu zeigen. Dazu setzen wir

a = a1, v1 = a2 − a1, . . . , vk = ak+1 − a1.

und setzenE = a+ span {v1, . . . , vk}.

Wegena1 = a+ 0, a2 = a+ v1, . . . , ak+1 = a+ vk

enthalt E alle Punkte a1, . . . , ak+1. Offenbar gilt

dimE = dim span {v1, . . . , vk} ≤ k

Aufgrund der Annahme folgt dimE = k.

Eindeutigkeit: Nehmen wir an, dass H ein zweiter affiner Unterraum der Di-mension k ist, der die Punkte enthalt. Dann gilt also a = a1 ∈ E ∩ H. Esgilt

v1, . . . , vk ∈ H − a

AlsoE − a = span {v1, . . . , vk} ⊆ H − a.

Andererseits haben diese Unterraume dieselbe Dimension k. Also sind sie nachSatz 2.81 gleich. Es folgt E = H. 2

2.99. Definition: Fur eine beliebige nicht-leere Teilmenge M eines reellenVektorraums V kann man den erzeugten affinen Unterraum E definieren.Dies ist der kleinste affine Unterraum, der M umfasst, also

E =⋂{A : A ist affiner Unterraum von V mit M ⊆ A}.

Page 85: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.3. ANALYTISCHE GEOMETRIE 85

2.100 Aufgabe: Zeigen Sie

E = v + span (M − v)

fur beliebiges v ∈M . Falls M = {v0, v1, . . . , vn} ist, so haben wir also

E = {v0 +

n∑i=1

λ1(vi − v0) : λ1, . . . , λn ∈ R}

2.101 Aufgabe: Zeigen Sie fur den von M ⊆ V aufgespannten affinen Unterraum

E = {n∑i=1

λivi : λ1, . . . , λn ∈ R,∑ni=1 λi = 1, v1, . . . , vn ∈M , n ∈ N}.

Man nennt eine Summe

v =

n∑i=1

λivi,

n∑i=1

λi = 1.

eine Affinkombination von v1, . . . , vn. Folgern Sie, dass eine Teilmenge E ⊆ V genau

dann ein affiner Unterraum von V ist, wenn er mit v1, . . . , vn alle Affinkombinationen

dieser Vektoren enthalt.

2.102 Aufgabe: Seien a1, . . . , ak+1 Punkte im Rn, die nicht in einem affinen Unter-raum der Dimension k − 1 liegen und k ≤ n. Zeigen Sie, dass sich dann jeder Punktedes Rn eindeutig in der Form

x = λ1a1 + . . .+ λk+1ank+1

λ1 + . . .+ λk+1 = 1

schreiben lasst.

Man nennt die Koordinaten in obiger Aufgabe baryzentrische Koordina-ten.

2.103. Definition: Ein affiner Unterraum E1 = a1 + U1 verlauft parallel zueinem anderen affinen Unterraum E2 = a2 + U2, wenn sich E1 und E2 nichtschneiden und U1 ⊆ U2 ist. Die affinen Unterraume heißen parallel, wenn siesich nicht schneiden und U1 = U2 ist.

Eine Gerade kann also parallel zu einer Ebene verlaufen, aber nur affineUnterraume gleicher Dimension konnen zueinander parallel sein.

2.3.2 Geraden und Ebenen

Ein 0-dimensionaler affiner Unterraum ist nur ein Punkt. Der erste interessanteaffine Unterraum hat die Dimension 1.

2.104. Definition: Eine Gerade im Rn ist definiert als eine 1-dimensionaleraffiner Unterraum, also

G = {a+ λv : λ ∈ R},

wobei a ∈ Rn ein Punkt ist, und v ∈ Rn, v 6= 0, der Richtungsvektor.

Wir haben alsoG = a+ span {v}.

Page 86: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

86 KAPITEL 2. VEKTORRAUME

span {v} ist ein eindimensionaler Unterraum von Rn, namlich eine Gerade durch0.

2.105. Beispiel: Im Bild 2.2 ist die Gerade

G = a+ span {v}

eingezeichnet. Setzt man die Wert fur a und v ein, so ergibt sich

G = {(

0.2 + 0.4λ0.7 + 0.2λ

): λ ∈ R}.

Abbildung 2.2: Eine Gerade G im R2

Nach Satz 2.98 gibt es im Rn genau eine Gerade durch zwei verschiedenePunkte. Denn zwei verschiedene Punkte konnen nicht gemeinsam in einem 0-dimensionalen affinen Unterraum von R liegen. Wie im Beweis von Satz 2.98festgestellt wurde, ist die Gerade durch a und b die Menge

G := {a+ λ(b− a) : λ ∈ R}.

2.106. Definition: Eine Ebene im R3 ist ein 2-dimensionaler affiner Unter-raum, also

E = a+ span {v1, v2}

mit linear unabhangigen Vektoren v1, v2 ∈ R3, und a ∈ R3.

Page 87: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.3. ANALYTISCHE GEOMETRIE 87

Abbildung 2.3: Ebene im R3

Als Beispiel fur die Art von Sachverhalten, die man mit Hilfe der Dimensionbeweisen kann, geben wir folgenden Satz an.

2.107 Satz: Der Schnitt zweier Ebenen im R3 ist leer, eine Gerade oder beideEbenen sind gleich.

Beweis: Wenn der Schnitt der Ebenen nicht leer ist, so haben beide Ebeneneine Darstellung

E1 = b+ U1, E2 = b+ U2

(siehe dazu den Beweis von Satz 2.95) mit

dimU1 = dimU2 = 2.

Es gilt dannE1 ∩ E2 = b+ (U1 ∩ U2).

Die Frage ist, welche Dimensionen U1 ∩ U2 haben kann. Nach Satz 2.87 gilt

dim(U1 + U2) = dimU1 + dimU2 − dim(U1 ∩ U2) = 4− dim(U1 ∩ U2).

Andererseits gilt nach Satz 2.81

dim(U1 + U2) ≤ dim(R3) = 3.

Alsodim(U1 ∩ U2) ≥ 1.

Falls diese Dimension gleich 1 ist, so ist der Schnitt also eine Gerade. Falls siegleich 2 ist, so folgt wegen dimU1 = dimU2 = 2, wieder aus Satz 2.81, dassU1 ∩ U2 = U1 = U2 ist. Also sind die Ebenen in diesem Fall gleich. 2

Page 88: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

88 KAPITEL 2. VEKTORRAUME

2.108 Aufgabe: Sei G eine Gerade im R2 und b ∈ R2, b /∈ G. Zeigen Sie, dass es

genau eine zu G parallele Gerade durch b gibt.

2.109 Aufgabe: Sei E eine Ebene im R3 und b ∈ R3, b /∈ E.

(1) Zeigen Sie, dass es unendliche viele Geraden durch b gibt, die parallel zu E verlau-fen.

(2) Zeigen Sie, dass jede Gerade durch b entweder parallel zu E verlauft oder E schnei-

det.

2.3.3 Strecken und konvexe Mengen

Bei der Definition von Strecken nutzen wir zum ersten Mal die Anordnung derreellen Zahlen. Aus diesem Grund werden Strecken und konvexe Mengen auchals Teilgebiet der Analysis betrachtet. Sie sind aber ein wichtiger Bestandteil inder analytischen Geometrie. Daher behandeln wir die Grundlagen hier.

Wir reden in diesem Abschnitt zunachst uber beliebige Vektorraume uberdem Korper R, die wir ”‘reelle Vektorraume”’ nennen.

2.110. Definition: Eine Strecke (engl.: line segment) in einem reellen Vek-torraum ist eine Menge der Form

S = {a+ λ(b− a) : 0 ≤ λ ≤ 1}.

a und b heißen die Endpunkte der Strecke. Wir schreiben fur die Strecke mitEndpunkten a und b in diesem Abschnitt einfach S(a, b).

2.111 Aufgabe: Zeigen SieS(a, b) = S(b, a).

Der folgende, erstaunlich umstandlich zu beweisende Satz zeigt, dass zweiStrecken nur dann gleich sein konnen, wenn sie dieselben Endpunkte haben.

2.112 Satz: SeienS(a, b) = S(a, b)

zwei gleiche Strecken. Dann ist (a, b) = (a, b) oder (a, b) = (b, a).

Beweis: Wenn a = b ist, so degeneriert die Strecke zu einem Punkt. Es mussdann offenbar a = b = a = b gelten. Sei also a 6= b, und v = b− a. Dann ist

S(a, b) = S(a, b) ⊂ a+ span {v}.

Also gibt es λa und λb mit

a = a+ λav, b = a+ λbv.

Aufgrund der obigen Aufgabe konnen wir λa < λb annehmen. Wir zeigen λa = 0und λb = 1, woraus die Behauptung folgt. Zunachst sei festgehalten, dass S(a, b)genau die Punkte

a+ λv, 0 ≤ λ ≤ 1

Page 89: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.3. ANALYTISCHE GEOMETRIE 89

enthalt. Wegen a, b ∈ S(a, b) folgt λa ≥ 0 und λb ≤ 1. Wenn aber λa > 0 ware,so konnte S(a, b) den Punkt a nicht enthalten. Analog widerlegt man λb < 1.2

2.113. Definition: Eine Teilmenge M eines reellen Vektorraums heißt kon-vex, wenn gilt

S(a, b) ⊆M fur alle a, b ∈M.

Abbildung 2.4: Konvexe Menge und nicht konvexe Menge

2.114 Aufgabe: Zeigen Sie, dass jede Strecke S(a, b) konvex ist.

2.115 Aufgabe: Zeigen Sie dass der Durchschnitt von konvexen Mengen konvex ist.

2.116 Aufgabe: Zeigen sie, dass jeder affine Unterraum eines reellen Vektorraums

konvex ist.

2.117. Definition: Zu einer Menge M eines reellen Vektorraums V definierenwir die konvexe Hulle von M als die kleinste konvexe Menge, die M enthalt.Fur diese Menge schreiben wir

conv (M).

Diese Definition macht naturlich nur Sinn, wenn die konvexe Hulle existiert.Wie bei der Definition des aufgespannten Unterraums gibt es einen konstruk-tiven und einen weniger konstruktiven Weg, die Existenz nachzuweisen. Derweniger konstruktive benutzt

conv (M) =⋂{K ⊂ V : M ⊆ K und K konvex}.

Page 90: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

90 KAPITEL 2. VEKTORRAUME

Auf der rechten Seite steht nach der obigen Aufgabe eine konvexe Menge. Diesekonvexe Menge ist dann in allen konvexen Mengen enthalten, die M umfassen.Man beachte, dass V selbst konvex ist, so dass der Schnitt nicht leer ist.

Es ist nutzlich, zunachst mit endlichen Mengen M zu beginnen. Man nennteinen Ausdruck der Form

k∑i=0

λixi

mit λ1, . . . , λk ≥ 0 und∑λi = 1 eine Konvexkombination der Punkte

x1, . . . , xk.

2.118 Aufgabe: Zeigen Sie, dass die Strecke S(a, b) die Menge alle Konvexkombina-

tionen von a und b ist.

2.119 Aufgabe: Zeigen Sie, dass die Menge aller Konvexkombinationen der Punkte

x1, . . . , xk konvex ist.

2.120 Satz: Sei x1, . . . , xk Elemente eines reellen Vektorraums V . Dann istconv {x1, . . . , xk} die Menge aller Konvexkombinationen der Punkte x1, . . . , xk.

Beweis: Aufgrund der obigen Aufgabe mussen wir nur noch zeigen, dassalle Konvexkombinationen in der konvexen Hulle liegen mussen. Dies zeigen wirdurch Induktion nach k. Fur k = 1 ist die Aussage klar, da dort x1 = 1 · x1

die einzige Konvexkombination ist, und die konvexe Hulle eines Punktes dieserPunkt ist. Sei

x =k∑i=0

λixi

eine Konvexkombination. Wenn λk = 1 ist, so ist λ1 = . . . = λk−1 = 0 und x =xk. Der Punkt xk muss naturlich in der konvexen Hulle der Punkte {x1, . . . , xk}sein. Wenn λk 6= 1 ist, so schreiben wir

x = (1− λk)x+ λkxk

mit

x =k−1∑i=0

λi1− λk

xi.

Wegenk−1∑i=0

λi1− λk

=∑k−1i=0 λi

1− λk= 1

ist x eine Konvexkombination von {x1, . . . , xk−1}. Nach Induktionsvorausset-zung folgt

x ∈ conv {x1, . . . , xk−1} ⊆ conv {x1, . . . , xk}.

Aufgrund unserer Darstellung ist

x ∈ Sx,xk .

Fur die konvexe Hulle der Punkte muss aber gelten

Sx,xk ⊆ conv {x1, . . . , xk}.

Page 91: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

2.3. ANALYTISCHE GEOMETRIE 91

2

2.121 Satz: Sei M Teilmenge eines reellen Vektorraums. Dann ist conv (M)die Vereinigung aller konvexen Hullen von je endlich vielen Punkten aus M .Also

conv (M) =

{k∑i=0

λixi : λ1, . . . , λk ≥ 0,∑λi = 1, x1, . . . , xk ∈M , k ∈ N

}

Beweis: Es genugt nun zu zeigen, dass die Vereinigung aller Konvexkombi-nationen konvex ist. Es ist aber nicht schwer nachzuprufen, dass die Konvex-kombination zweier Konvexkombinationen von zwei endlichen Teilmengen ausM selbst wieder Konvexkombination ist. 2

Die bisherigen Resultate uber konvexe Mengen gelten in beliebigen reellenVektorraumen. Wenn wir uns aber auf den Rn zuruck ziehen, kann man mehraussagen.

2.122 Satz: (Caratheodory) Die konvexe Hulle einer Teilmenge M einesn-dimensionalen reellen Vektorraums V ist die Vereinigung der konvexen Hullenaller hochstens n+ 1-elementigen Teilmengen von M . Also

conv (M) =

{n+1∑i=0

λixi : λ1, . . . , λn+1 ≥ 0,∑λi = 1, x1, . . . , xn+1 ∈M

}

Beweis: Wir mussen nur noch zeigen, dass wir eine Konvexkombination

x =k∑i=1

λixi

als Konvexkombination einer echten Teilmenge der Punkte

{x1, . . . , xk}

schreiben konnen, solange k > n+ 1 ist. Wir konnen also λi > 0 fur i = 1, . . . , kannehmen. Weil in V hochstens Systeme mit n Vektoren linear unabhangig seinkonnen, sind fur k > n+ 1 die k − 1 Vektoren

x2 − x1, . . . , xk − x1

linear abhangig. Angenommen

k∑i=2

µi(xi − x1) = 0,

wobei nicht alle Koeffizienten µi gleich 0 sind. Addiert man dann das c-fachedieser Gleichung zu x, so folgt

x = (λ1 − ck∑i=2

µi)x1 +k∑i=2

(λi + cµi)xi

Page 92: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

92 KAPITEL 2. VEKTORRAUME

Wir stellen zunachst fest, dass die Summe der Koeffizienten dieser Darstellung

(λ1 − ck∑i=2

µi) +k∑i=2

(λi + cµi) =k∑i=1

λi = 1

ist. Fur c = 0 sind die Koeffizienten positiv. Wir wahlen nun gemaß Aufga-be 2.123 ein c, so dass einer dieser Koeffizienten 0 wird, die anderen aber immernoch nicht-negativ sind. Damit haben wir x als Konvexkombination einer echtenTeilmenge der Punkte dargestellt. 2

2.123 Aufgabe: Seienλ1, . . . , λm > 0

reelle Zahlen undµ1, . . . , µm ∈ R

nicht alle gleich 0. Dann existiert ein c ∈ R, so dass

λ1 + cµ1, . . . , λm + cµm ≥ 0

ist, und mindestens eine dieser Zahlen gleich 0 wird.

2.124. Beispiel: Im R2 ist ein Dreieck die Konvexkombination der drei Eck-punkte. Nach dem Satz von Caratheodory ist die konvexe Hulle einer TeilmengeM ⊆ R2 die Vereinigung aller Dreiecke mit Ecken in M .

Im R3 hat man Tetraeder statt Dreiecke zu betrachten.

2.125 Aufgabe: (a) Schreiben Sie Ecken eines Dreiecks als Konvexkombination derEckpunkte.

(b) Schreiben Sie die Seitenmitten eines Dreiecks als Konvexkombination der Eck-punkte.

(c) Die Strecken zwischen den Seitenmitten und den gegenuber liegenden Ecken nenntman Seitenhalbierende. Zeigen Sie, dass der Schwerpunkt

s =1

3(a+ b+ c)

auf allen Seitenhalbierenden liegt, indem Sie den Punkt als Konvexkombination der

Ecken und der Seitenmitten schreiben.

Page 93: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Kapitel 3

Lineare Abbildungen

3.1 Lineare Abbildungen

3.1.1 Eigenschaften

3.1. Definition: Seien V,W Vektorraume uber einem Korper K. Dann heißteine Abbildung φ : V →W linear, wenn die folgenden Bedingungen gelten.

(1)φ(v1 + v2) = φ(v1) + φ(v2) fur alle v1, v2 ∈ V ,

(2)φ(λv) = λφ(v) fur alle v ∈ V , λ ∈ K.

3.2. Beispiel: Die identische Abbildung id : V → V ist linear, ebenso wie dieNullabbildung 0, die konstant gleich 0 ist.

3.3 Aufgabe: Zeigen Sie, dass im Rn die Streckung tc : Rn → Rn, definiert durch

tc(x) = a+ cx fur alle x ∈ Rn,

genau dann linear ist, wenn a = 0 ist. Welches sind die Fixpunkte der Streckung, also

die Punkte mit tc(x) = x, in Abhangigkeit von a und c?

3.4. Bemerkung: Fur eine lineare Abbildung φ : V →W gilt

φ(λ1v1 + . . .+ λnvn) = λ1φ(v1) + . . .+ λnφ(vn),

wobei λ1, . . . , λn ∈ K und v1, . . . , vn ∈ V seien. Dies folgt aus den Bedinungun-gen (1) und (2) der Linearitat per Induktion.

3.5 Aufgabe: Zeigen Sie φ(0) = 0 fur alle lineare Abbildungen φ : V →W .

3.6. Beispiel: In Abbildung 3.1 ist eine lineare Abbildung φ : R2 → R2 darge-stellt. Eingezeichnet sind die Einheitsvektoren e1, e2 (in blau) und deren Bilder

φ(e1) = w1 =(

0.9−0.2

), φ(e2) = w2 =

(0.40.5

)93

Page 94: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

94 KAPITEL 3. LINEARE ABBILDUNGEN

Abbildung 3.1: Lineare Abbildung φ : R2 → R2

(in braun). Man kann dann fur jeden Punkt

v =(λ1

λ2

)= λ1e1 + λ2e2

das Bildφ(v) = λ1φ(e1) + λ2φ(e2)

berechnen. Beispielsweise ist

v =(

0.21

)und damit

φ(v) = 0.2w1 + 1w2 =(

0.2 · 0.9 + 0.40.2 · (−0.2) + 0.5

)=(

0.580.46

).

Macht man dasselbe fur die vier anderen Ecken des Viereck (in blau), so entstehtdas eingezeichnete Bildviereck (in braun).

3.7. Bemerkung: Lineare Abbildungen machen nur dann Sinn, wenn Defini-tionsbereich und Bildraum Vektorraume uber demselben Korper sind.

3.8. Bemerkung: Eine lineare Abbildung φ : V → K bezeichnet man alsFunktional auf V . Dabei identifizieren wir K = K1, damit K ein Vektorraumuber K wird.

3.9. Beispiel: Lineare Gleichungen, die zwischen Punkten eines Vektorraumserfullt sind, sind auch zwischen den Bildern unter einer linearen Abbildung

Page 95: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.1. LINEARE ABBILDUNGEN 95

erfullt. Seien beispielsweise a, b ∈ V zwei Punkte und

m =12

(a+ b)

die Mitte zwischen diesen beiden Punkten. Sei φ : V →W linear. Dann ist φ(m)die Mitte zwischen φ(a) und φ(b). Denn

φ(m) =12

(φ(a) + φ(b))

aufgrund der Bedingungen (1) und (2). Allgemeiner erhalt eine lineare Abbil-dung im Rn Verhaltnisse, etwa Konvexkombinationen

φ(λa+ µb) = λφ(a) + µφ(b)

fur jede Konvexkombination λ + µ = 1. Daraus folgt, dass das Bild einer kon-vexen Menge eine konvexe Menge ist. Lineare Abbildungen erhalten also Stre-ckenverhaltnisse und bilden konvexe Mengen auf konvexe Mengen ab.

3.10 Satz: Sei φ : V →W linear.

(1) Wenn U ⊆ V ein Unterraum von V ist, dann ist das Bild φ(U) diesesUnterraums ein Unterraum von W .

(2) Wenn U ⊆ W ein Unterraum von W ist, dann ist das Urbild φ−1(U) einUnterraum von V .

Beweis: (1) Sei w1, w2 in φ(U). Dann gibt es v1, v2 ∈ U mit

φ(v1) = w1, φ(v2) = w2.

Es folgtφ(v1 + v2) = φ(v1) + φ(v2) = w1 + w2.

Also w1+w2 ∈ φ(U). Ganz analog zeigt man die Bedingung (2) fur Unterraume.

(2) Bleibt dem Leser als Aufgabe uberlassen. 2

3.11 Aufgabe: Zeigen Sie (2) in dem obigen Satz.

3.12. Definition: Sei φ : V →W linear. Dann bezeichnet man den Unterraum

φ−1{0} = {x ∈ V : φ(x) = 0}

als Kern (engl.: kernel) von φ. Wir schreiben dafur Kern (φ). Außerdem be-zeichnet man den Unterraum

φ(V ) = {φ(x) : x ∈ V }

als Bild (engl.: image) von φ. Wir schreiben dafur Bild (φ).

3.13. Beispiel: Wenn φ : V →W die Nullabbildung ist, dann ist Kern (φ) = V .Wenn φ : V → V injektiv ist, dann ist Kern (φ) = {0}. Dies ist etwa imBeispiel 3.6 der Fall.

Page 96: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

96 KAPITEL 3. LINEARE ABBILDUNGEN

Wenn φ : V → W eine lineare Abbildung ist, so kann es naturlich durchaussein, dass φ nicht surjektiv ist und ein y ∈ W kein Urbild hat. Das gilt in derTat fur alle

y ∈W \ Bild (φ).

Im folgenden Satz zeigen wir, dass die Menge aller Urbilder von y ein affinerUnterraum von V ist, wenn sie nicht leer ist.

3.14 Satz: Sei φ : V →W linear und φ(x) = y. Dann gilt

φ−1{y} = x+ Kern (φ).

Die Abbildung φ ist also genau injektiv, wenn es einen Punkt gibt, der genauein Urbild hat, insbesondere, wenn Kern (φ) = {0} ist.

Beweis: ”‘⊆”’: Wenn x ∈ φ−1{y} ist, dann ist

φ(x) = y = φ(x).

Es folgtφ(x− x) = φ(x)− φ(x) = 0.

Also x− x ∈ Kern (φ). Also

x ∈ x+ Kern (φ).

”‘⊇”’: Die Argumentation ist dieselbe, nur umgekehrt. 2

3.15. Bemerkung: Will man also alle Urbilder von y ∈ W berechnen, sogenugt es den Kern (φ) zu bestimmen und ein spezielles Urbild von y. Die Ur-bildmengen aller y sehen also im Prinzip gleich aus, wenn sie nicht leer sind.Die Urbildmengen von Punkten sind zum Kern parallele affine Unterraume.

3.16 Aufgabe: Sei φ : K2 → K die Abbildung

φ

(x1

x2

)= x1 + x2.

Zeichnen Sie Kern (φ) in ein Koordinatensystem, sowie φ−1(a) fur a = −2,−1, 0, 1, 2.

3.17 Aufgabe: Sie φ : V →W linear. Zeigen Sie, dass zwei Mengen φ−1(y1), φ−1(y2)fur y1, y2 ∈W entweder gleich oder disjunkt sind. Zeigen Sie daruber hinaus

V =⋃{φ−1(y) : y ∈W}.

3.18 Satz: Sei V ein endlich-dimensionaler Vektorraum uber K und B eineBasis von V . Sei W ein Vektorraum uber K und φ : B → W eine Abbildung.Dann gibt es eine eindeutig bestimmte lineare Fortsetzung φ : V →W .

Beweis: Da sich jedes v ∈ V eindeutig als Linearkombination

v =n∑i=0

λivi

Page 97: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.1. LINEARE ABBILDUNGEN 97

mit Vektoren aus der Basis darstellen lasst, muss gelten

φ(v) =n∑i=0

λiφ(vi) =n∑i=0

λiwi.

Definiert man φ auf diese Art und Weise, so ist φ(v) festgelegt. Man rechnetnach, dass φ linear ist. 2

Lineare Abbildungen sind also durch die Bilder eine Basis eindeutig be-stimmt.

3.19 Aufgabe: Sei v1, . . . , vn ein Erzeugendensystem von V und φ : V → W linear.

Zeigen Sie, dass dann Bild (φ) von φ(v1), . . . , φ(vn) erzeugt wird.

3.1.2 Dimensionsformel

Wir beweisen nun eine weitere wichtige Dimensionsformel.

3.20 Satz: Sei φ : V → W linear und V endlich-dimensional. Dann istBild (φ) ebenfalls endlich-dimensional und es gilt

dim Kern (φ) + dim Bild (φ) = dimV.

Beweis: Als Unterraum von V ist Kern (φ) endlich-dimensional. Sei

v1, . . . , vk

eine Basis von Kern (φ). Nach Satz 2.80 kann man dieses linear unabhangigeSystem zu einer Basis

v1, . . . , vk, vk+1, . . . , vn

von V erganzen. Wir behaupten, dass

φ(vk+1), . . . , φ(vn) (3.1)

eine Basis von Bild (φ) ist. Dann gilt namlich in der Tat

dim Kern (φ) + dim Bild (φ) = k + (n− k) = n = dimV.

Sei y ∈ Bild (φ). Dann existiert ein x ∈ V mit φ(x) = y. Sei

x =n∑i=1

λivi.

Dann folgt

y = φ(x) = φ(n∑i=1

λivi) =n∑i=1

λiφ(vi) =n∑

i=k+1

λiφ(vi).

Damit haben wir bewiesen, dass Bild (φ) von den Vektoren in (3.1) aufgespanntwird. Wir mussen noch die lineare Unabhangigkeit zeigen. Sei

0 =n∑

i=k+1

λiφ(vi) = φ(n∑

i=k+1

λivi)

Page 98: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

98 KAPITEL 3. LINEARE ABBILDUNGEN

Alson∑

i=k+1

λivi ∈ Kern (φ).

Es muss also auchn∑

i=k+1

λivi =k∑i=1

λivi

mit gewissen λi, i = 1, . . . , k, sein. Da aber v1, . . . , vn eine Basis von V ist, folgtaus der Eindeutigkeit der Darstellung

λ1 = . . . = λk = λk+1 = . . . = λn = 0.

2

3.21 Aufgabe: Uberlegen Sie sich, dass der Beweis auch in den Extremalfallen

dim Kern (φ) = 0, dim Bild (φ) = 0

richtig ist.

3.22 Satz: Seien φ : V → W linear und dimV = dimW , V,W endlichdimensional. Dann sind aquivalent

(1) φ ist bijektiv.

(2) φ ist surjektiv.

(3) φ ist injektiv.

Beweis: Es genugt offenbar zu zeigen, dass (2) und (3) aquivalent sind.

(2) ⇒ (3): Wenn φ surjektiv ist, dann ist

dimW = dim Bild (φ) = dimV − dim Kern (φ)

nach der Dimensionsformel. Also dim Kern (φ) = 0. Es folgt, dass Kern (φ) ={0} ist und daher φ injektiv nach Satz 3.14.

(3) ⇒ (2): Wenn φ injektiv ist, ist Kern (φ) = {0} nach Satz 3.14. Aus derDimensionsformel folgt die Behauptung. 2

3.23 Satz: Sei φ : V →W linear.

(1) Wenn V endlich-dimensional ist, dann kann φ nur dann surjektiv sein, wennW endlich-dimensional ist und

dimV ≥ dimW.

(2) Wenn W endlich dimensional ist, dann kann φ nur dann injektiv sein, wennV endlich dimensional sein, wenn

dimV ≤ dimW.

Page 99: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.1. LINEARE ABBILDUNGEN 99

Wenn einer der Raume endlich dimensional ist, kann folglich φ nur bijektivsein, wenn es der andere auch ist und die Dimensionen gleich sind.

3.24 Aufgabe: Beweisen Sie Satz 3.23.

3.25 Aufgabe: Sei v1, . . . , vn eine Basis von V , und φ : V → W linear. Zeigen Sie,dass dann das System

φ(v1), . . . , φ(vn)

genau dann linear unabhangig ist, wenn φ injektiv ist.

3.26 Aufgabe: Sei V endlich dimensional. Welche Dimension kann der Kern eines

Funktionals φ : V → K haben?

3.27 Aufgabe: Betrachten Sie das Funktional φ : Kn → K definiert durch

φ

x1

...xn

= x1 + . . .+ xn.

Geben Sie eine Basis des Kerns von φ an.

3.28 Satz: Fur zwei lineare Abbildungen

φ : V →W, ψ : W → H

ist die Verkettung ψ◦φ wieder linear. Zu jeder invertierbaren linearen Abbildungφ : V →W ist die Umkehrabbildung φ−1 linear ist.

3.29 Aufgabe: Zeigen Sie Satz 3.28.

3.30. Definition: Eine bijektive lineare Abbildung φ : V →W heißt Isomor-phismus (isomorphism) (oder Isomorphie, genauer Vektorraum-Isomorphie).Zwei Vektorraume V,W uber einem Korper K hießen isomorph, wenn es eineIsomorphie zwischen diesen Vektorraumen gibt.

3.31. Bemerkung: Wir konnen von Isomorphismus zwischen den Vektorraum-en reden, weil ja auch die Umkehrabbildung eines Isomorphismus wieder eineIsomorphismus ist. Isomorphien kann man auf ganz analoge Weise auch fur an-dere algebraische Strukturen, wie Gruppen oder Korper, definieren. Wichtig ist,dass sie bijektiv sind und sich die Rechengesetze ubertragen.

3.32 Aufgabe: Definieren Sie, wann eine lineare Abbildung f : K → Q fur zwei

Korper K und Q eine Isomorphie ist.

3.33 Satz: Wenn V eine endlich dimensionaler Vektorraum uber K ist, undφ : V → W ein Isomorphismus, dann ist auch W endlich dimensional unddimV = dimW . Wenn umgekehrt V,W endlich dimensionale Vektorraume uberK mit gleicher Dimension sind, dann ist V isomorph zu W .

Isomorphe Vektorraume haben also die gleiche Dimension. Jeder n-dimen-sionale Vektorraum uber K ist isomorph zu Kn.

Beweis: Dass isomorphe Vektorraume die gleiche Dimension haben, folgt ausder Dimensionsformel, insbesondere aus Aufgabe 3.23. Wenn umgekehrt V undW dieselbe Dimension haben, so wahlen wir eine Basis

v1, . . . , vn

Page 100: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

100 KAPITEL 3. LINEARE ABBILDUNGEN

von V und eine Basisw1, . . . , wn

von W . Nach Satz 3.18 gibt es eine lineare Abbildung φ : V →W mit

φ(v1) = w1, . . . , φ(vn) = wn.

Nach Aufgabe 3.25 ist φ injektiv und damit bijektiv nach Satz 3.22. 2

Wir geben zum Ende dieses Abschnittes einige abstrakte Definitionen an,die algebraische Strukturen auf dem Raum der linearen Abbildungen zwischenzwei Vektorraumen einfuhren.

3.34. Definition: Eine lineare Abbildung φ : V → V nennt man auch einenEndomorphismus auf V . Bisweilen findet man auch die Bezeichnung linearerOperator auf V . Einen injektiven Endomorphismus nennt man auch Mono-morphismus. Ein surjektiver Monomorphismus ist ein Isomorphimus.

3.35. Definition: Wenn V und W Vektorraume uber K sind, so definierenwir L(V,W ) als die Menge aller linearen Abbildungen von V nach W .

L(V,W ) := {φ : V →W : φ linear}.

Da man auf W eine Vektorraumstruktur hat, kann man lineare Abbildungenpunktweise addieren und multiplizieren. Also

(φ1 + φ2)(x) = φ1(x) + φ2(x)(λφ)(x) = λφ(x)

fur alle φ, φ1, φ2 ∈ L(V,W ) und λ ∈ K.

3.36 Aufgabe: Zeigen Sie, dass L(V,W ) mit diesen Operationen ein Vektorraum

uber K wird.

3.37. Bemerkung: Zwei Elemente in L(V, V ) kann man daruber hinaus mul-tiplizieren, indem man die Abbildungen hintereinander ausfuhrt. Aufgrund derRechengesetze aus der folgenden Aufgabe wird L(V, V ) mit diesen Operationeneine assoziative Algebra uber K.

3.38 Aufgabe: Zeigen Sie

(λφ1) ◦ φ2 = φ1 ◦ (λφ2) = λ(φ1 ◦ φ2)

fur alle λ ∈ K, φ1, φ2 ∈ L(V, V ).

3.39 Aufgabe: Zeigen Sie

φ1 ◦ (φ2 + φ3) = φ1 ◦ φ2 + φ1 ◦ φ3

(φ1 + φ2) ◦ φ3 = φ1 ◦ φ3 + φ2 ◦ φ3

fur alle φ1, φ2, φ3 ∈ L(V, V ).

3.40 Aufgabe: Man gebe Endomorphismen φ ∈ L(K2,K2) an, so dass gilt

φ1 ◦ φ2 6= φ2 ◦ φ1.

Page 101: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.1. LINEARE ABBILDUNGEN 101

K sei dabei ein beliebiger Korper. Man gebe zwei andere, von einander verschiedeneEndomorphismen an, so dass gilt

φ1 ◦ φ2 = φ2 ◦ φ1.

3.41. Bemerkung: Die Multiplikation ”‘◦”’ auf dem Raum der Isomorphismenvon V auf sich selbst ist also nicht kommutativ. Sie erfullt aber dennoch dieubrigen Gruppenaxiome. Es gilt also

φ1 ◦ (φ2 ◦ φ3) = (φ1 ◦ φ2) ◦ φ3

φ ◦ id = φ

φ ◦ φ−1 = id

fur alle Isomorphismen φ, φ1, φ2, φ3 von V auf sich selbst. Man spricht von derGruppe der Ismorphismen von V auf sich selbst.

3.1.3 Matrizen

3.42. Definition: Sei K ein Korper. Ein Rechteckschema der Form

A :=

a1,1 . . . a1,n

......

am,1 . . . am,n

mit ai,j ∈ K fur i = 1, . . . ,m, j = 1, . . . , n bezeichnet man als m × n-Matrixuber dem Korper K. Die Matrix besteht also aus n Spalten a1, . . . , an, die alsVektoren im Km gedeutet werden konnen. Wir schreiben deswegen auch

A = (a1, . . . , an).

Wir schreiben auch

A =

a1

...am

,

wobei a1, . . . , am ∈ Kn die Zeilen von A bezeichnen. Die Eintrage ai,j nenntman Koeffizienten der Matrix. Die Menge aller m × n-Matrizen bezeichnenwir mit Km×n. Bisweilen schreibt man

A = (ai,j) 1≤i≤m1≤j≤n

,

insbsondere fur quadratische Matrizen

A = (ai,j)1≤i,j≤m.

3.43. Bemerkung: Mengentheoretisch ist eine Matrix A eine Abbildung

a : {1, . . . ,m} × {1, . . . , n} → K,

(i, j) 7→ ai,j .

Page 102: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

102 KAPITEL 3. LINEARE ABBILDUNGEN

Die Unterscheidung von Zeilen und Spalten dient aber der Veranschaulichung.

3.44. Bemerkung: Gelegentlich werden wir hier auch Matrizen uber ande-ren Mengen betrachten, also mit Koeffizienten in einer Menge M . Da wir abermit Matrizen rechnen wollen, sollte auf M wenigstens eine Addition und eineMultiplikation definiert sein.

3.45. Definition: Das Produkt einer Matrix A ∈ Km×n und eines Vektorsx ∈ Kn ist definiert als

A · x =

a1,1 . . . a1,n

......

am,1 . . . am,n

·x1

...xn

:=

a1,1x1 + . . .+ a1,nxn...

an,1x1 + . . .+ am,nxn

.

Wir schreiben Ax = A · x. Wenn y = Ax ist, so ergibt sich der i-te Koeffizientvon y als

yi =n∑j=0

ai,jxj fur alle i = 1, . . . ,m

3.46. Bemerkung: Man beachte, dass das Produkt nur definiert ist, wenn dieSpaltenzahl von A und die Zeilenzahl von x ubereinstimmen.

3.47. Bemerkung: Seien a1, . . . , an die Spalten von A und x ∈ Kn, sowiey = Ax. Dann gilt

y = Ax =

a1,1x1 + . . .+ a1,nxn...

am,1x1 + . . .+ am,nxn

=n∑i=0

xiai.

Ax ist also eine Linearkombination der Spalten von A.

Produkte von Matrizen mit Vektoren, sowie die spater definierten Produktevon Matrizen sind nutzlich, weil sich lineare Abbildungen mit Matrixproduktenkomfortabel schreiben lassen.

3.48 Satz: Jede lineare Abbildung φ : Kn → Km lasst sich in der Form

φ(x) = Ax

schreiben. Dabei ist A ∈ Km×n durch φ eindeutig bestimmt, und die Spalten vonA enthalten die Bilder der Einheitsvektoren e1, . . . , en ∈ Kn, also

A = (φ(e1), . . . , φ(en)).

Beweis: Wenn die Spalten von A die Bilder der Einheitsvektoren enthalten,so gilt

φ

x1

...xn

= φ

n∑j=1

xjej

=n∑j=1

xjφ(ej) = Ax.

Page 103: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.1. LINEARE ABBILDUNGEN 103

Wenn umgekehrt φ(x) = Ax ist und a1, . . . , an die Spalten von A sind, so rechnetman nach, dass

φ(ej) = Aej = aj

fur j = 1, . . . , n sein muss. 2

3.49. Definition: Wir definieren fur eine Matrix A ∈ Km×n die Abbildung

φA : Kn → Km

φA(x) = Ax.

Wie haben gerade bewiesen, dass sich jede Abbildung φ : Kn → Km alsφ = φA schreiben lasst, und dass A dabei eindeutig bestimmt ist. Das heißt

φA = φB ⇔ A = B.

Das Studium von linearen Abbildung zwischen endlich dimensionalen Vektor-raumen ist damit gleichbedeutend mit dem Studium von Matrizen. Man nenntA die darstellende Matrix von φA.

Zu jeder linearen Abbildung von Kn nach Km gehort ei-ne eindeutig bestimmte darstellende Matrix in Km×n undumgekehrt.

3.50. Beispiel: Die im Beispiel 3.6 angegebene Abbildung

φ(e1) = w1 =(

0.9−0.2

), φ(e2) = w2 =

(0.40.5

)schreibt sich in Matrixdarstellung als

φ

(x1

x2

)=(

0.9 0.4−0.2 0.5

)·(x1

x2

)3.51. Beispiel: Das in Aufgabe 3.27 angegebene Funktional

φ

x1

...xn

= x1 + . . . xn

lasst sich in Matrixschreibweise als

φ

x1

...xn

=(1 · · · 1

x1

...xn

schreiben. Die Matrix hat hier nur eine Zeile.

3.52. Beispiel: Die Nullabbildung schreibt sich mit einer Matrix, die nur 0enthalt.

3.53. Beispiel: Zwei Produkte P1 und P2 bestehen aus je drei KomponentenK1, K2 und K3 in den Zusammensetzungen

K1 K2 K3

P1 besteht aus 3 1 0P2 besteht aus 1 1 1

Page 104: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

104 KAPITEL 3. LINEARE ABBILDUNGEN

Wenn die entsprechenden Mengen mit Kleinbuchstaben bezeichnet werden, sogilt die Beziehung k1

k2

k3

=

3 11 10 1

· (p1

p2

).

3.54. Beispiel: Die identische Abbildung id : Kn → Kn schreibt sich in derForm

x = id(x) =

1 0. . .

0 1

· x.Die Matrix hat 1 als Diagonalelemente und ist 0 uberall sonst.

3.55. Definition: Die Matrix In mit Spalten e1, . . . , en heißt Einheitsmatrix(engl.: identity matrix). φIn ist also die Identitat id : Kn → Kn.

3.56. Definition: Da sich Matrizen und lineare Abbildungen entsprechen,schreiben wir

Bild A = Bild φA, Kern A = Kern φA

3.57 Satz: Sei A ∈ Km×n mit den Spalten

A = (a1, . . . , an).

Dann giltBild A = span {a1, . . . , an}

3.58 Aufgabe: Beweisen Sie diesen Satz.

Wir werden nun das Produkt von Matrizen A,B so definieren, dass

φAB = φA ◦ φB

gilt.

Dem Produkt von Matrizen entspricht die Hintereinander-ausfuhrung von linearen Abbildungen.

3.59. Definition: Sei A ∈ Km×n, B ∈ Kn×k. Bezeichnen dann b1, . . . , bkdie Spalten von B, so definieren wir das Produkt als Matrix mit den SpaltenAb1, . . . , Abk

A ·B := (Ab1, . . . , Abk)

Wir schreiben wieder AB = A ·B.

3.60. Bemerkung: Es gilt also AB ∈ Km×k und fur die Koeffizienten derMatrix C = AB gilt

ci,j =n∑ν=1

ai,νbν,j ,

Page 105: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.1. LINEARE ABBILDUNGEN 105

fur i = 1, . . . ,m, j = 1, . . . , k. Denn ci,j ist die i-te Komponente des VektorsAbj und

c1,j...

cm,j

= Abj =

a1,1 . . . a1,n

......

am,1 . . . am,n

·b1,j...bn,j

=

a1,1b1,j + . . .+ a1,nbn,j

...am,1b1,j + . . .+ am,nbn,j

fur j = 1, . . . , k. Es gilt also

ci,j =(ai,1 · · · ai,n

b1,j...bn,j

.

Sei C = AB. Dann entsteht ci,j durch Multiplikation deri-ten Zeile von A mit der j-ten Spalte von B.

Man kann die Matrizen-Multiplikation mit folgendem Schema organisieren

· · · b1,j · · ·...

· · · bn,j · · ·...

... ↓ai,1 · · · ai,n → ci,j

......

Zur dieser Rechnung benotigt man mnk Multiplikationen und m(n− 1)k Addi-tionen.

3.61. Beispiel: (1 23 4

)·(

1 23 4

)=(

7 1015 22

).

3.62 Satz: A ∈ Km×n, B ∈ Kn×k. Dann gilt

φAB = φA ◦ φB .

Die Matrix der Verkettung der linearen Abbildung ist also die Produktmatrix.

Dem Produkt von Matrizen entspricht die Hintereinander-ausfuhrung der zugehorigen linearen Abbildungen.

Beweis: Nach Satz 3.28 ist

φA ◦ φB : Kk → Km

Page 106: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

106 KAPITEL 3. LINEARE ABBILDUNGEN

linear. Nach Satz 3.48 enthalt die darstellende Matrix C dieser Abbildung dieBilder der Einheitsvektoren in den Spalten, also

C = (φA(φB(e1), . . . , φA(φB(ek)))= (φA(b1), . . . , φA(bk))= (Ab1, . . . , Abk)= AB

nach der Definition der Matrizen-Multiplikation. Dabei seien b1, . . . , bk die Spal-ten von B. 2

3.63 Satz: Sei

A ∈ Kn×m, B ∈ Km×k, C ∈ Kk×l.

Dann gilt(A ·B) · C = A · (B · C).

Beweis: Fur die zugehorige lineare Abbildung

φA ◦ φB ◦ φC

gilt das Assoziativgesetz nach Aufgabe 1.96. Also

φ(AB)C = φAB ◦ φC= (φA ◦ φB) ◦ φC= φA ◦ (φB ◦ φC)= φA ◦ (φBC)= φA(BC).

Aus der Eindeutigkeit der Matrixdarstellung von linearen Abbildungen folgt dieBehauptung. 2

3.64. Bemerkung: Das Assoziativgesetz fur die Matrizen-Multplikation kannman auch direkt nachrechnen. Man erhalt fur die Koeffizienten von D = (AB)C

di,j =k∑ν=1

(m∑µ=1

ai,µbµ,ν

)cν,j

und fur die Koeffizienten von D = A(BC)

di,j =m∑µ=1

(ai,µ

k∑ν=1

bµ,νcν,j

).

Beide Doppelsummen sind jedoch gleich und konnen als

di,j =∑

ν=1,...,kµ=1,...,m

ai,µbµ,νcν,j

Page 107: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.1. LINEARE ABBILDUNGEN 107

gedeutet werden. Das heißt, die Summe ist uber alle moglichen µ, ν zu nehmen,die in diesen Zahlbereichen liegen.

3.65. Bemerkung: Wir konnen auch die Multiplikation einer Matrix mit einemVektor als Matrizen-Multiplikation auffassen, indem wir den Vektor x ∈ Kk alsMatrix x ∈ Kk×1 interpretieren. Es gilt dann nach dem obigen Satz

φAB(x) = (AB)x = A(Bx) = φA(φB(x)) fur alle x ∈ Kk.

Also erhalten wir nochmals

φAB = φA ◦ φB .

3.66. Beispiel: Wir setzen Beispiel 3.53 fort. Verpackt man P1 und P2 in zweiVersionen V1 und V2 mit

P1 P2

V1 enthalt 2 2V2 enthalt 1 3

so gilt fur die Mengen (p1

p2

)=(

2 12 3

)·(v1v2

).

Also insgesamt k1

k2

k3

=

3 11 10 1

· (2 12 3

)·(v1v2

)

=

8 64 42 3

· (v1v2

)Damit kann man also berechnen, welche Mengen der Komponenten K1, K2 undK3 man benotigt, wenn man eine gewunschte Anzahl von Packungen V1 und V2

herstellen will.

3.67. Definition: Eine Matrix A ∈ Kn×n nennt man quadratische Matrix.Dann ist also φA : Kn → Kn ein Endomorphismus. Eine quadratische Matrixheißt invertierbare Matrix, wenn es eine Matrix A−1 gibt, fur die gilt

A ·A−1 = In.

Man nennt eine solche Matrix auch regulare Matrix.

Wie wir im folgenden Satz sehen werden, folgt aus AA−1 = In automatischA−1A = In. Fur Abbildungen ist dies gemaß Aufgabe 1.85 nicht analog der Fall.

3.68 Satz: Eine quadratische Matrix A ist genau dann invertierbar, wenn dieAbbildung φA invertierbar ist. In diesem Fall gilt

φA−1 = φ−1A .

Außerdem giltA ·A−1 = A−1 ·A = In.

Page 108: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

108 KAPITEL 3. LINEARE ABBILDUNGEN

Beweis: Sei A invertierbar, also AA−1 = In. Dann folgt aus Satz 3.62

φA ◦ φA−1 = φIn = id.

Deswegen muss φA surjektiv sein. Nach Satz 3.22 ist φA damit bijektiv. Dahermuss

φ−1A = φA−1

sein. Außerdem giltid = φ−1

A ◦ φA = φA−1 ◦ φA.Wieder nach Satz 3.62 folgt

In = A−1A.

Wenn umgekehrt φA invertierbar ist, und B die darstellende Matrix von φ−1A ,

dann giltφAB = id = φBA,

also AB = In = BA. A ist also tatsachlich invertierbar. 2

3.69. Bemerkung: Wir haben in diesem Satz gezeigt, dass aus AB = In folgt,dass A und B invertierbar sind, und dass BA = In gilt.

3.1.4 Matrizenrechnung

Neben dem Produkt von Matrizen fuhren wir hier noch weitere nutzliche Re-chenoperationen ein.

3.70. Definition: Die Summe von gleichgroßen Matrizen A ∈ Km×n, B ∈Km×n ist elementweise definiert. Alsoa1,1 . . . a1,n

......

am,1 . . . am,n

+

b1,1 . . . b1,n...

...bm,1 . . . bm,n

=

a1,1 + b1,1 . . . a1,n + b1,n...

...am,1 + bm,1 . . . am,n + bm,n

.

Das Produkt eines λ ∈ K mit einer Matrix A ∈ Km×n ist ebenfalls elementweisedefiniert. Also

λ

a1,1 . . . a1,n

......

am,1 . . . am,n

=

λa1,1 . . . λa1,m

......

λam,1 . . . λam,n

.

3.71 Aufgabe: Zeigen Sie, dass der Raum der Matrizen Km×n mit diesen Operatio-

nen zu einem Vektorraum uber K wird. Zeigen Sie, dass dieser Vektorraum isomorph

zum Vektorraum Kmn ist.

3.72 Satz:

A(B + C) = AB +AC fur alle A ∈ Km×n, B,C ∈ Kn×k

(A+B)C = AC +BC fur alle A,B ∈ Km×n, C ∈ Kn×k

Page 109: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.1. LINEARE ABBILDUNGEN 109

3.73 Aufgabe: Beweisen Sie diese Distributivgesetze.

3.74. Bemerkung: Es gilt im Allgemeinen fur Matrizen A,B ∈ Kn×n

AB 6= BA.

Wir haben aber auch schon festgestellt, dass manche Matrizen miteinander kom-mutieren, wie zum Beispiel

AA−1 = A−1A = In.

3.75. Definition: Sei A ∈ Kn×n. Dann definieren wir

An = A · . . . ·A︸ ︷︷ ︸n mal

.

Also, induktivA1 = A, An+1 = An ·A.

AußerdemA0 = In.

Fur invertierbare Matrizen definieren wir außerdem

A−n = (A−1)n.

3.76 Satz: Sei A ∈ Kn×n. Dann gilt

AnAm = An+m = AmAn fur alle n,m ∈ N0.

Falls A invertierbar ist, so gilt auch

AnAm = An+m = AmAn fur alle n,m ∈ Z.

Beweis: Dieser Satz ist aufgrund der Definitionen einleuchtend und kanndurch elementare Uberlegungen bewiesen werden. Es gilt zum Beispiel

AnAm = A · . . . ·A︸ ︷︷ ︸n mal

A · . . . ·A︸ ︷︷ ︸m mal

= A · . . . ·A︸ ︷︷ ︸n+m mal

= An+m.

Etwas schwieriger ist n,m ∈ Z. Man muss hier verschiedene Falle unterscheiden.Wir beschranken uns auf den Fall n > 0, m < 0.

AnAm = A · . . . ·A︸ ︷︷ ︸n mal

A−1 · . . . ·A−1︸ ︷︷ ︸|m| mal

.

Nun heben sich |m| der A−1 gegen genauso viele A auf und es bleiben n−|m| =n+m Faktoren A uber. Es folgt die Behauptung.

Page 110: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

110 KAPITEL 3. LINEARE ABBILDUNGEN

Fur einen exakteren Beweis sollte man jedoch vollstandige Induktion ver-wenden. Fur n,m ∈ N ist das auch nicht schwer. Wir verwenden Induktion nachm. Fur m = 1 gilt

AnA1 = AnA = An+1

gemaß der induktiven Definition von An. Die Behauptung gelte fur m. Danngilt

AnAm+1 = An(AmA) = (AnAm)A = An+mA = An+m+1

nach Definition von Am, Satz 3.63 und der Induktionsannahme. 2

3.77 Aufgabe: Sie A ∈ R2×2 mit

A =

(1 23 4

).

Berechnen Sie mit lediglich 3 Matrizen-Multiplikationen die Matrix A8. Wie viele

Matrizen-Multiplikationen benotigt man fur die Matrix A7? Konnen Sie einen Algo-

rithmus angeben, der An fur alle n ∈ N mit moglichst wenigen Matrizen-Multipli-

kationen berechnet?

3.78 Satz: Wenn A invertierbar ist, so ist auch A−1 invertierbar und es gilt(A−1

)−1= A.

Beweis: Der Satz folgt unmittelbar aus Satz 3.68. 2

3.79. Definition: Sei A ∈ Km×n. Dann ist die transponierte Matrix AT ∈Kn×m die Matrixa1,1 . . . a1,n

......

am,1 . . . am,n

T

=

a1,1 . . . am,1...

...a1,n . . . am,n

Das heißt, fur die Matrix B = AT gilt

bi,j = aj,i fur alle i = 1, . . . , n, j = 1, . . . ,m.

Transponierte Matrizen werden spater im Zusammenhang mit Skalarpro-dukten sehr wichtig.

3.80 Satz: Es gelten folgende Rechenregeln.

(1) (AT)T

= A

(A+B)T = AT +BT

(λA)T = λAT

fur alle A,B ∈ Km×n, λ ∈ K.

Page 111: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.1. LINEARE ABBILDUNGEN 111

(2) Außerdem

(AB)T = BTAT

fur alle A ∈ Km×n, B ∈ Kn×k.

(3) Fur invertierbare Matrizen A ∈ Kn×n ist AT invertierbar, und es gilt(AT)−1

=(A−1

)T.

Beweis: (1) ist eine Ubungsaufgabe.

(2) Sei C = AB. Dann gilt

ci,j =k∑ν=1

ai,νbν,j fur alle i = 1, . . . ,m, j = 1, . . . , n

Wenn ci,j die Koeffizienten von BTAT sind, ai,j die Koeffizienten von AT undbi,j die Koeffizienten von BT , dann gilt also

cj,i =k∑ν=1

bi,ν aν,j = ci,j

fur i = 1, . . . , k, j = 1, . . . ,m. Es folgt (AB)T = BTAT .

(3) Wegen (2)AT (A−1)T = (A−1A)T = ITn = In.

Es folgt(AT )−1 = (A−1)T .

2

Wir definieren naturlich xT fur x ∈ Kn als Zeilenvektor mit denselben Ko-effizienten wie x, also x1

...xn

T

=(x1 · · · xn

).

Dies entspricht der Philosophie, Kn = Kn×1 zu setzen. Man beachte xT = xfur alle x ∈ K = K1.

3.81 Aufgabe: Sei A ∈ Kn×n und x ∈ K1. Zeigen Sie

xTAx ∈ K = K1.

Berechnen Sie xTAx. Zeigen Sie

xTAx = xTATx.

Page 112: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

112 KAPITEL 3. LINEARE ABBILDUNGEN

3.2 Gleichungssysteme

3.2.1 Gaußscher Algorithmus

3.82. Definition: Ein lineares Gleichungssystem ist ein System von nlinearen Gleichungen mit Unbekannten x1, . . . , xn der Form

a1,1x1 + . . .+ a1,nxn = b1,

...am,1x1 + . . .+ am,nxn = bm.

In Matrixschreibweise alsoAx = b

mit A ∈ Km×n und b ∈ Km. Gesucht ist x ∈ Kn. Die Losungsmenge deslinearen Gleichungssystems ist

L := {x ∈ Kn : Ax = b}.

3.83. Bemerkung: Offenbar ist fur die Losungsmenge nach Satz 3.14 ein affinerUnterraum

L = φ−1A {b} = v0 + Kern φA

oder leer. Es genugt also, eine spezielle Losung x0 mit

Av0 = b

zu bestimmen und alle Losungen von

Av = 0

zu addieren. Ein Gleichungssystem heißt homogenens Gleichungssystem,wenn die rechte Seite b = 0 ist. Ax = 0 nennt man das zugehorige homogeneGleichungssystem.

Die Losungsmenge eines linearen Gleichungssystems ist leeroder die Summe einer speziellen Losung und aller Losungendes zugehorigen homogenen Gleichungssystems.

Der Gauß-Algorithmus ist nun ein Verfahren, die Losungsmenge L desGleichungssystems in parametrisierter Form anzugeben. Eine Parametrisie-rung von L ist etwa

L = {v0 +k∑i=1

λivi : λ1, . . . , λk ∈ K},

mit festen v0, v1, . . . , vk ∈ Kn. Die Zahlen λ1, . . . , λk sind dann die Parameterder Losungen.

Page 113: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.2. GLEICHUNGSSYSTEME 113

Da der Losungsraum L eines linearen Gleichungssystems ein affiner Un-terraum von Kn ist, lasst sich L immer auf diese Art schreiben. Der Gauß-Algorithmus erreicht außerdem, dass

v1, . . . , vk

eine Basis des Unterraums L − v0 ist. Dies ist aquivalent dazu, dass die Para-meterzahl k minimal ist. Denn jede Basis ist ein minimales Erzeugendensystemnach Satz 2.68.

Wir beginnen den Gauß-Algorithmus damit, dass wir das lineare Gleichungs-system Ax = b in ein Schema

a1,1 . . . a1,n b1...

......

am,1 . . . am,n bm

(3.2)

schreiben.

3.84. Definition: Eine zulassige Zeilenoperation ist eine der folgendenOperationen in den m Zeilen des Schemas (3.2).

(1) Multiplikation einer Zeile mit einem λ ∈ K, λ 6= 0.

(2) Vertauschung von zwei Zeilen.

(3) Addition des λ-fachen einer Zeilen zu einer anderen Zeile mit beliebigemλ ∈ K.

3.85 Satz: Zulassige Zeilenoperationen andern die Losungsmenge des linearenGleichungssystem nicht.

3.86 Aufgabe: Beweisen Sie diesen Satz, indem Sie zeigen, dass jede Losung x vor

vor einer zulassigen Zeilenoperation auch Losung danach ist, und indem Sie zusatzlich

zeigen, dass zulassige Zeilenoperationen mit zulassigen Zeilenoperationen ruckgangig

gemacht werden konnen.

Ziel des Algorithmus ist, eine Zeilenstufenform zu erreichen. Wir werdensehen, dass man dann die Losungsmenge in parametrisierter Form ablesen kann.

3.87. Definition: Das Schema (3.2) hat Zeilenstufenform, wenn es folgendeForm hat

0 · · · 0 1 ∗ 0 ∗ 0 0 ∗ b10 · · · 0 0 0 1 ∗ 0 0 ∗ b20 · · · 0 0 0 0 0 1 0 ∗ b3...

. . .... ∗

...1 ∗ bk

0 · · · 0 bk+1

......

...0 · · · 0 bm

Die Sterne ”‘∗”’ stehen hier fur eine beliebige Anzahl von Spalten.

Page 114: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

114 KAPITEL 3. LINEARE ABBILDUNGEN

Die wesentliche Eigenschaft der Zeilenstufenform ist, dasses k Spalten gibt, in denen die Einheitsvektoren e1, . . . , ekstehen, und dass unterhalb der k-ten Zeile nur 0 steht.

Die Zeilenstufenform macht daruber hinaus weitere Einschrankungen uberdie Spalten, in denen keine Einheitsvektoren stehen. Diese Einschrankungensind aber fur die Losung nicht notwendig.

3.88 Satz: Man kann jedes Schema durch zulassige Zeilenoperationen aufZeilenstufenform bringen.

Beweis: Der Beweis wird mit Induktion nach n, der Anzahl der Spalten desSchemas (auf der linken Seite von ”‘|”’) gefuhrt.

Fur n = 1 gibt es zwei Falle. Wenn die Spalte nur 0 enthalt so sind wir fertig.In diesem Fall ist dann k = 0. Ansonsten kann man zwei Zeilen vertauschen,so dass der erste Koeffizient verschieden von 0 ist. Durch eine Operation vomTyp (1) kann dieser Koeffizient zu 1 gemacht werden. Durch Operationen vomTyp (3) verschwinden die anderen Koeffizienten. In diesem Fall ist k = 1.

Ansonsten konnen wir per Induktion die ersten n−1 Spalten auf Zeilenstufen-form bringen. Der letzte auftretende Einheitsvektor sei el. Wenn nun unterhalbder l-ten Zeile nur 0 steht, so sind wir fertig. In diesem Fall ist k = l. Ansonstenkann mit Hilfe von zulassigen Zeilenoperationen erreicht werden, dass in derletzten Spalte el+1 steht, ohne die vorigen Spalten zu andern. In diesem Fall istk = l + 1. 2

Bevor wir jetzt allgemein angeben, wie man aus der Zeilenstufenform dieLosung abliest, hier einige Beispiele.

3.89. Beispiel: Wir losen das Gleichungssystem

x+ y = 3,x− y = 1.

Also (1 11 −1

)·(xy

)=(

31

).

Das Schema lautetx y

1 1 31 −1 1

Zur Erinnerung haben wir hier die Variablennamen uber die Spalten geschrie-ben. Subtraktion der ersten von der zweiten Spalte ergibt

1 1 30 −2 −2

Division der zweiten Zeile durch −2 und Subtraktion von der ersten ergibtschließlich

x y

1 0 20 1 1

Page 115: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.2. GLEICHUNGSSYSTEME 115

Dies ist eine Zeilenstufenform mit zwei Einheitsvektoren (k = 2) ohne ”‘∗”’.Dieses aquivalente System liest sich als

x = 2y = 1

Das ist die eindeutig bestimmte Losung. Man pruft die Losung durch Einsetzennach.

3.90. Beispiel: Wir wollen das reelle System

x + 2y + 3z = 64x + 5y + 6z = 157x + 8y + 9z = 24

losen. Das Gauß-Schema ist

1 2 3 64 5 6 157 8 9 24

Abziehen des 4-fachen der ersten von der zweiten und des 7-fachen der erstenzur dritten ergibt.

1 2 3 60 −3 −6 −90 −6 −12 −18

Nun dividieren wir die zweite Zeile durch −3, ziehen das 2-fache von der zweitenvon der ersten ab, und addieren das 6-fache der zweiten zur dritten. Wir erhalten

1 0 −1 00 1 2 30 0 0 0

Dies ist schon eine Zeilenstufenform mit k = 2. Die Einheitsvektoren e1, e2stehen in den ersten beiden Spalten. Wir schreiben nun dieses System in derfolgenden Art und Weise.

x = z,

y = 3− 2z,

indem wir die Variable z auf die rechte Seite bringen. Offenbar sind nun x, ydurch z festgelegt und es gilt

L = {

z3− 2zz

: z ∈ R}

= {

030

+ λ

1−21

: λ ∈ R}.

Dabei haben wir λ = z umbenannt. Dies ist die gesuchte parametrisierte Dar-stellung von L. L ist eine Gerade im R3

3.91. Beispiel: Gegeben sei das Gleichungssystem mit der einen Gleichung

x+ y + z = 1

Page 116: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

116 KAPITEL 3. LINEARE ABBILDUNGEN

mit drei Unbekannten. Das Gauß-Schema

1 1 1 1

ist schon in Zeilenstufenform. Es ist k = 1 und e1 taucht in der ersten Spalteauf. Wir bringen y, z auf die andere Seite und erhalten

L = {

1− y − zyz

: y, z ∈ R}

= {

100

+ λ1

−110

+ λ2

−101

: λ1, λ2 ∈ R}.

Dabei haben wir λ1 = y, λ2 = z umbenannt. Dies ist ein affiner Unterraum derDimension 2, also eine Ebene im R3.

Wir konnen alternativ die spezielle Losung sofort ablesen, indem wir y =z = 0 setzen. Es ergibt sich x = 1 und damit die spezielle Losung

v0 =

100

.

Danach berechnen wir eine Basis des homogenen Losungsraums, indem wir dierechte Seite gleich 0 setzen. Der erste Basisvektor ergibt sich mit y = 1 undz = 0. Daraus folgt x = −1, also

v1 =

−110

.

Der zweite Basisvektor ergibt sich mit y = 0 und z = 1. Also

v2 =

−101

.

Da x mit durch die Wahl von y, z festgelegt ist, konnen wir damit alle Losungendes homogenen Systems erreichen.

3.92. Bemerkung: Sei ein Schema in Zeilenstufenform gegeben. Die Einheits-vektoren e1, . . . , ek sollen in Spalten mit Indizes

J = {j1, . . . , jk}

auftauchen, wobei1 ≤ j1 < . . . < jk ≤ n

sei. Die anderen Spalten sollen Indizes aus einer Menge I haben. Nach Konstruk-tion haben diese Spalten keine Koeffizienten ungleich 0 unterhalb der k-ten Zeile,sind also in

span {e1, . . . , ek}.

Page 117: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.2. GLEICHUNGSSYSTEME 117

Die rechte Seite sei b.

(1) Wenn dann nichtbk+1 = . . . = bm = 0

ist, so hat das Gleichungssystem offenbar keine Losung.

(2) Andernfalls finden wir eine spezielle Losung, indem wir die Variablen in denSpalten I gleich 0 setzen. Die anderen Variablen lassen sich mit

xj1 = b1, . . . , xjk = bk

ablesen.

(3) Außerdem finden wir eine Basis des Losungsraums des homogenen Systems,indem wir die rechte Seite 0 setzen, und dann jede Variable in I gleich 1, dieanderen gleich 0. Es ergeben sich n − k linear unabhangige Vektoren, die dashomogene Gleichungssystem losen.

Wir fassen noch einmal unsere Erkenntnisse in einem Satz zusammen.

3.93 Satz: Das lineare Gleichungssystem

Ax = b, A ∈ Km×n, b ∈ Kn,

werde durch zulassige Zeilenoperationen in das aquivalente System

Ax = b

uberfuhrt, wobei die Matrix A in k Spalten die Einheitsvektoren

e1, . . . , ek ∈ Km

enthalte und in den anderen Spalten Vektoren aus

span {e1, . . . , ek}.

Wenn dannb ∈ span {e1, . . . , ek}

ist, so hat das Gleichungssystem einen (n−k)-dimensionalen affinen Unterraumvon Kn als Losungsmenge L.

Wennb /∈ span {e1, . . . , ek}

ist, dann hat Ax = b keine Losung.

Beweis: Das homogene Gleichungssystem Ax = 0 wird durch dieselben Zei-lenoperationen in das System Ax = 0 uberfuhrt.

Es ist offensichtlich, dass jede Losung durch die Werte in den Spalten, diekeine Einheitsvektoren sind, festgelegt ist. Setzt man die Variablen in diesenSpalten einzeln gleich 1, die anderen gleich 0, so erhalt man n − k linear un-abhangige Vektoren, die eine Basis von Kern (A) bilden.

Eine spezielle Losung erhalt man, indem man alle diese Variablen gleich 0setzt.

Page 118: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

118 KAPITEL 3. LINEARE ABBILDUNGEN

Nach Satz 3.14 ist der Losungsraum L von Ax = b also ein affiner Unterraumvon Km der Dimension n− k. 2

3.94 Aufgabe: Uberlegen Sie sich, dass die n − k gewonnen Losungen von Ax = 0

tatsachlich linear unabhangig sind.

3.95. Bemerkung: Man macht die Probe, indem man die spezielle Losung unddie Basis des Kerns in Ax einsetzt.

3.96. Bemerkung: Wenn A nur aus den Einheitsvektoren e1, . . . , en besteht,so ist die Losung von Ax = b eindeutig und gleichb1...

bn

.

3.97. Bemerkung: Es lassen sich offenbar auf dieselbe Art auch n+1 spezielleLosungen von Ax = b finden, die den affinen Losungsraum nach Satz 2.98aufspannen. Im Beispiel

x+ y + z = 1

erhalten wir die drei Punkte durch

y = z = 0 ⇒ x = 1,y = 1, z = 0 ⇒ x = 0,y = 0, z = 1 ⇒ x = 0.

Die Losungsmenge ist also die Ebene durch die drei Einheitsvektoren e1, e2, e3 ∈R3.

3.98 Aufgabe: Berechnen Sie eine Basis des Kerns von

A =

1 2 14 5 17 8 1

.

3.99 Aufgabe: Fur welche c ∈ R ist das Gleichungssystem2 1 11 2 11 −1 0

·xyz

=

1−1c

losbar und wie lautet dann die Losung?

3.100 Aufgabe: Fur welche a ∈ R ist das Gleichungssystema 1 11 a 11 1 a

·xyz

=

111

losbar und wie lautet dann die Losung?

Page 119: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.2. GLEICHUNGSSYSTEME 119

3.2.2 Berechnung von Basen

Nach Satz 2.65 kann man aus den Spalten einer Matrix A linear unabhangigeSpalten auswahlen. Wie findet man diese Spalten?

3.101 Satz: Sei die Zeilenstufenform A aus A ∈ Km×n durch zulassige Zei-lenoperationen entstanden. A enthalte die Einheitsvektoren e1, . . . , ek in denSpalten j1, . . . , jk. Dann bilden die Spalten

aj1 , . . . , ajk

von A eine Basis des von den Spalten erzeugten Unterraums von A, also nachSatz 3.57 von Bild A.

Beweis: Offenbar gilt

span {aj1 , . . . , ajk} ⊆ Bild A.

Sei umgekehrt b ∈ Bild A, also Ax = b losbar. Das Schema A|b gehe durch dieZeilenoperationen in A|b uber. Wir konnen also das Gleichungssystem Ax = bdurch einen Vektor x losen, der nur in den Zeilen j1, . . . , jk Elemente ungleich0 hat, d.h.

x ∈ span {ej1 , . . . , ejn}.

Diese Losung x erfullt auch Ax = b. Es folgt

b ∈ span {aj1 , . . . , ajn}.

Wir haben noch die lineare Unabhangigkeit dieser Spalten zu zeigen. Ange-nommen eine Linearkombination dieser Spalten ist 0. Sei also Aλ = 0 fur einλ ∈ Kn, das nur Elemente ungleich 0 in den Zeilen j1, . . . , jk enthalt. Dann istauch Aλ = 0, also

0 = Aλ =k∑i=1

λjiei.

Es folgt λ = 0. 2

3.102 Aufgabe: Wahlen Sie aus den Spalten von

A =

1 2 3 14 5 6 17 8 9 1

eine Basis von Bild A aus.

3.103 Satz: Sei die Zeilenstufenform A aus A durch zulassige Zeilenoperatio-nen entstanden (mit k Einheitsvektoren). Dann enthalten die ersten k Zeilenvon A eine Basis des von den Zeilen von A erzeugten Unterraums von Kn.

Beweis: Es ist leicht zu sehen, dass die ersten k Zeilen von A linear un-abhangig sind, wenn man diese Zeilen in den Spalten betrachtet, in denen dieEinheitsvektoren stehen.

Page 120: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

120 KAPITEL 3. LINEARE ABBILDUNGEN

Wir mussen nun noch zeigen, dass zulassige Zeilenoperationen den von denZeilen erzeugten Unterraum nicht andern. Dies ist aber fur jede einzelne Ope-ration leicht nachzuprufen (Ubungsaufgabe). 2

3.104 Aufgabe: Sei V ein Vektorraum uber K: Zeigen Sie fur v1, . . . , vn ∈ V , λ ∈ K

span {v1, v2, . . . , vn} = span {v1, v2 + λv1, . . . , vn}.

3.105. Bemerkung: Wir konnen also eine Basis von

span {v1, . . . , vn} ⊆ Km

auf zwei Arten ermitteln.

(1) Wir fuhren zulassige Zeilenoperationen an der Matrix

A = (v1, . . . , vn) ∈ Km×n

durch. Wenn j1, . . . , jk die Spalten mit den Einheitsvektoren sind, so ist

vj1 , . . . , vjk

die gesuchte Basis.

(2) Wir fuhren zulassige Zeilenoperationen an der Matrix AT durch und erhal-ten in den ersten k Zeilen eine gesuchte Basis. Alternativ kann man dieselbenOperationen an den Spalten von A durchfuhren, und eine Spaltenstufenformerreichen.

3.106 Aufgabe: Fuhren Sie Methode (2) durch, um eine Basis des von den Vektoren147

,

258

,

369

,

111

aufgespannten Unterraums zu finden.

3.2.3 Rang

3.107. Definition: Als Spaltenrang einer Matrix A ∈ Km×n bezeichnen wirdie Dimension des von den Spalten von A aufgespannten Unterraums von Kn.Nach Satz 57 also

SpaltenrangA = dim Bild φA.

Als Zeilenrang bezeichnen wir den Spaltenrang von AT , also die Dimensiondes von den Zeilen aufgespannten Unterraums des Km.

Der folgende Satz zeigt, dass der Zeilenrang immer gleich dem Spaltenrangist. Wir sprechen daher einfach vom Rang einer Matrix.

3.108 Satz: Der Zeilenrang einer Matrix A ∈ Km×n ist gleich dem Spalten-rang dieser Matrix.

Page 121: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.2. GLEICHUNGSSYSTEME 121

Beweis: Sei A durch zulassige Zeilenumformungen in die Matrix A uberfuhrt,die k Einheitsvektoren besitze. Nach Satz 3.101 ist k der Spaltenrang von A.Nach Satz 3.103 ist k auch der Zeilenrang von A. 2

3.109 Satz: Ein Gleichungssystem Ax = b ist genau dann losbar, wenn

Rang (A|b) = Rang (A)

ist. Dabei sei A|b die Matrix, die aus den Spalten von A und b besteht.

Beweis: Offenbar ist die Bedingung aquivalent dazu, dass b linear abhangigvon den Spalten von A ist. 2

3.2.4 Berechnung der inversen Matrix

Der Gauß-Algorithmus kann auch simultan fur mehrere rechte Seiten angewen-det werden. Zur Losung von

Av1 = b1, . . . , Avk = bk

wenden wir zulassige Zeilenoperationen auf

A|b1, . . . , bk

an, bis A in eine Zeilenstufenform A umgewandelt wird. Dann lassen sich spe-zielle Losungen der Gleichungssysteme leicht ablesen.

3.110 Satz: Sei A ∈ Kn×n. Dann ist A genau dann invertierbar, wenn sichA durch zulassige Zeilenoperationen in In umformen lasst. Sei nun

(A|In)→ (In|B)

mit Hilfe von zulassigen Zeilenoperationen umgewandelt. Dann gilt B = A−1.

Beweis: Wenn sich A in In umwandeln lasst, dann ist Rang (A) gleich n. Alsoist A invertierbar nach Satz 3.22. Wenn umgekehrt A invertierbar ist, dann istRang (A) = n und daher k = n in der Zeilenstufenform.

Die Inverse ist die Matrix B mit AB = In. Sie lost also simultan die Glei-chungssystem

Ab1 = e1, . . . , Abn = en.

Die speziellen Losungen b1, . . . , bn dieser Gleichungssysteme lassen sich in derTat aus dem Schema (In|B) ablesen. 2

3.111 Aufgabe: Ermitteln Sie die inverse Matrix von1 2 34 5 67 8 8

Page 122: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

122 KAPITEL 3. LINEARE ABBILDUNGEN

Fuhren Sie die Rechnung moglichst lange ohne Bruche durch!

3.112 Aufgabe: Fur welche a ∈ R ist die Matrix1 1 1 10 1 1 10 0 1 10 0 0 a

invertierbar? Wie lautet in diesem Fall die inverse Matrix?

3.113 Aufgabe: Berechnen Sie die Inverse der Matrix1x 1

. . .. . .

x 1

,

wobei alle nicht aufgefuhrten Elemente der Matrix gleich 0 seien.

3.114 Aufgabe: Sei A ∈ Rn×m ⊆ Cn×m. Dann ist der Rang von A als reelle Matrix

gleich dem Rang von A als komplexe Matrix.

3.2.5 Elementarmatrizen

Die zulassigen Zeilenoperationen des Gaußschen Algorithmus konnen als Ma-trizenmultiplikationen geschrieben werden. Dazu definieren wir eine Sammlungvon Elementarmatrizen.

3.115. Definition: (1) Wir definieren die Matrix Ri,j,n(λ) ∈ Kn×n als dieMatrix, die in der Diagonalen 1 enthalt und an der (i, j)-ten Komponenten λ,sonst aber nur 0, also etwa

R2,1,3(2) =

1 0 02 1 00 0 1

.

(2) Wir definieren als Pi,j,n ∈ Kn×n die Einheitsmatrix, bei der die Spalten iund j vertauscht sind, also etwa

P1,2,3 =

0 1 01 0 00 0 1

.

(3) Wir definieren als Di,n(λ) ∈ Kn×n als die Einheitsmatrix, bei der die 1 inder i-ten Zeile und Spalte durch λ ersetzt ist, also etwa

D2,3(4) =

1 0 00 4 00 0 1

.

3.116 Satz: Sei A ∈ Km×n eine Matrix.

Page 123: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.2. GLEICHUNGSSYSTEME 123

(1) Die Addition des λ-fachen der j-ten Zeile zur i-ten entspricht einer Mul-tiplikation mit Ri,j,m(λ) von links. Die Addition des λ-fachen der j-ten Spaltezur i-ten Spalte entspricht einer Multiplikation mit Rj,i,n(λ) von rechts.

(2) Die Vertauschung der i-ten und j-ten Zeile entspricht einer Multiplikationmit Pi,j,m von links. Die Vertauschung der i-ten und j-ten Spalte entspricht eineMultiplikation mir Pi,j,n von rechts.

(3) Die Multiplikation der i-ten Zeile mit λ entspricht eine Multiplikation mitDi,m(λ) von links. Die Multiplikation der i-ten Spalte mit λ entspricht eineMultiplikation mit Di,nx(λ) von rechts.

3.117 Aufgabe: Rechnen Sie diesen Satz nach. Fur die Spaltenoperationen verwen-den Sie

Ri,j,n(λ)T = Rj,i,n(λ), PTi,j,n = Pj,i,n, Di,n(λ)T = Di,n(λ).

3.118 Aufgabe: Zeigen Sie

Ri,j,n(λ)−1 = Ri,j,n(−λ),

sowieP−1i,j,n = Pi,j,n

und, fur λ 6= 0

Di,n(λ)−1 = Di,n(1

λ).

3.119. Bemerkung: Die Elementarmatrizen entsprechen also den zulassigenZeilenoperationen, wenn man Di,n(0) ausnimmt. Wir sprechen von zulassigenElementarmatrizen.

3.120. Bemerkung: Der Gauß-Algorithmus zur Invertierung von A kann alsofolgendermaßen gedeutet werden. Man multipliziert sowohl A, also auch In vonlinks mit Elementarmatrizen, bis links die Einheitsmatrix entsteht. Wenn alsoA|In in In|A uberfuhrt wird, so hat man

In = Ek · . . . · E1A, A = Ek · . . . · E1In

mit gewissen zulassigen Elementarmatrizen E1, . . . , Ek. Es folgt

In = AA,

also A = A−1.

3.121 Aufgabe: Zeigen Sie, das man die Inverse auch mit Spaltenoperationen be-

rechnen kann, aber nicht mit einem Gemisch aus Spalten- und Zeilenoperationen.

3.122 Satz: Jede quadratische Matrix ist Produkt von Elementarmatrizen.

Beweis: Mit zulassigen Zeilen- oder Spalten-Operationen kann man jede qua-dratische Matrix auf Diagonalform bringen, also

Ek · . . . · E1AF1 · . . . · Fl = D,

Page 124: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

124 KAPITEL 3. LINEARE ABBILDUNGEN

wobei E1, . . . , Ek und F1, . . . , Fl zulassige Elementarmatrizen sind und D eineDiagonalmatrix, also eine Matrix, die außerhalb der Diagonalen nur 0 enthalt.Eine solche Matrix ist aber Produkt von Elementarmatrizen, denn

D =

λ1 0. . .

0 λn

= D1,n(λ1) · . . . ·Dn,n(λn).

Bringt man die zulassigen Elementarmatrizen Ei und Fi auf die andere Seite,so ist die Behauptung bewiesen. 2

3.123 Aufgabe: Schreiben Sie (2 11 2

)∈ R2×2

als Produkt von Elementarmatrizen.

3.2.6 Basiswechsel

Ein Ziel der linearen Algebra ist es, moglichst einfache Dar-stellungen fur lineare Abbildung zu finden.

Dazu mussen wir wissen, wie man lineare Abbildungen mit anderen Basendarstellen kann, und wie man diese Darstellungen von einer in die andere Basisumrechnet.

3.124. Beispiel: Wir betrachten die Spiegelung φ : R2 → R2 an der Geradenx = y. Nimmt man die Basis

v1 =(

11

), v2 =

(1−1

)so sieht man

φ(v1) = v1, φ(v2) = −v2.

Sei allgemeinφ(λ1v1 + λ2v2) = µ1v1 + µ2v2.

Dann ist alsoµ1 = λ1, µ2 = −λ2.

Es stellt sich heraus, dass die Abbildung λ 7→ µ linear ist, und die einfachedarstellende Matrix

B =(

1 00 −1

)hat. Wir bezeichnen diese Matrix als darstellende Matrix von φ bezuglich derBasis v1, v2. Um die gewohnliche Darstellungsmatrix bezuglich der kanonischenBasis zu bekommen, mussen wir die Bilder von e1, e2 berechnen. Wenn λ dieDarstellung eines Vektors x ∈ R2 bezuglich unserer Basis ist, so gilt offenbar

Mλ = x

Page 125: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.2. GLEICHUNGSSYSTEME 125

wobei M die Matrix ist, die v1, v2 in den Spalten hat, also

M =(

1 11 −1

).

Wenn µ die Darstellung von φ(x) sein soll, so gilt also φ(x) = Mµ und µ = Bλ.Also

φ(x) = Mµ = MBλ = MBM−1x.

Die darstellende Matrix von φ ist also hier

MBM−1 =(

0 11 0

).

Im folgenden werden wir diese Definition und die zugehorigen Uberlegungenallgemein herleiten.

3.125. Definition: Sei V ein m-dimensionaler Vektorraum uber K mit einerBasis

A = (v1, . . . , vn)

Dann definieren wir die lineare Abbildung

φA : Kn → V

durch die Bilder der Einheitsvektoren gemaß

φA(ei) = vi fur alle i = 1, . . . , n.

Es gilt also

φA

λ1

...λn

=n∑i=1

λivi.

Nach Aufgabe 3.25 ist φA ein Isomorphismus. Wir haben diesen Isomorphis-mus schon benutzt um zu zeigen, dass jeder n-dimensionale Vektorraum uberK isomorph zum Kn ist.

3.126. Bemerkung: Die Abbildung φ−1A berechnet die Basisdarstellung zu

einem Vektor v. Das heißt, sie ermittelt die Abbildung∑i=0

λivi 7→ λ.

Die Abbildung, die einen Vektor auf die Koeffizienten einerBasisdarstellung abbildet, ist ein Isomorphismus des Vek-torraums und des Kn.

.

3.127. Beispiel: Sei E die kanonische Einheitsmatrix von Km. Dann ist φE dieidentische Abbildung. Denn

φE(λ) =n∑i=1

λiei = λ.

Page 126: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

126 KAPITEL 3. LINEARE ABBILDUNGEN

3.128. Definition: Seien V ein n-dimensionaler und W ein m-dimensionalerVektorraum uber K, φ : V → W linear. Die Basisdarstellung von φ bezuglicheiner Basis A von V und einer Basis B von W ist die darstellende Matrix derAbbildung

φ−1B ◦ φ ◦ φA : Kn → Km.

Wir bezeichnen diese Matrix als

MA,B(φ).

Diese etwas unubersichtliche Situation lasst sich zunachst in folgendem Dia-gramm darstellen.

Knφ−1B ◦φ◦φA−→ Km

↓ φA ↓ φBV

φ−→ W

Ein solches Diagramm heißt kommutierendes Diagramm. Es ist gleichgultig,auf welchen Wegen zwischen zwei Punkten man den Pfeilen folgt.

Da jede lineare Abbildung zwischen Kn und Km eindeutig durch eine Matrixdarstellbar ist, ist

MA,B(φ) ∈ Km×n

wohlbestimmt.

Rechnerisch ergibt sich folgendes Bild. Sei

A = (v1, . . . , vn),B = (w1, . . . , wm).

Wenn dannv = λ1v1 + . . .+ λnvn ∈ V

ist, undφ(v) = µ1w1 + . . .+ µmwm ∈W,

Dann gilt µ1

...µm

=MA,B(φ)

λ1

...λn

.

Die Multiplikation mit der darstellenden Matrix berechnetdie Basisdarstellung des Bildes aus der Basisdarstellung desUrbilds.

3.129. Bemerkung: Hat man zwei Basen A und B eines Vektorraums V , sokann man mit Hilfe der Matrix

MA,B(id)

einen Basiswechsel durchfuhren. Denn sei

λ = φ−1A (x)

Page 127: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.2. GLEICHUNGSSYSTEME 127

die Basisdarstellung bezuglich A und

µ = φ−1B (x)

die Basisdarstellung bezuglich B, dann gilt

µ =MA,B(id) · λ.

3.130. Beispiel: Sei E die kanonische Einheitsmatrix von Kn undA eine andereBasis von Kn. Tragt man die Basis

A = (v1, . . . , vn),

als Spalten einer Matrix

A = (v1, . . . , vn) ∈ Kn×n

ein, so giltMA,E(id) = A.

Denn

x = φA(λ) =n∑i=1

λivi ⇒ x = Aλ = φE(Aλ).

Wenn also λ die Basisdarstellung bezuglich A ist, dann ist Aλ die Basisdarstel-lung bezuglich E . Umgekehrt berechnet man die Basisdarstellung λ bezuglich Aaus der kanonischem Basisdarstellung µ durch

λ = A−1µ.

3.131. Bemerkung: Mit Hilfe der darstellenden Matrizen kann man auch li-neare Abbildungen φM : Kn → Km mit M ∈ Km×n bezuglich anderer Basenals der kanonischen Einheitsbasis darstellen. Bezeichnet man die kanonischenBasen mit En bzw. Em, so gilt naturlich

MEn,Em(φM ) = M

Sei A eine Basis von Kn, deren Vektoren wir in eine Matrix A eintragen, sowieB eine Basis von Km, deren Vektoren wir in eine Matrix B eintragen. Dann gilt

MA,B(φ) = B−1MA

Denn, angenommen wir haben eine Darstellung λ von x ∈ Km bezuglich A, also

x = Aλ

Dann istµ := B−1MAλ = B−1Mx = B−1φ(x)

eine Darstellung von φ(x) bezuglich B. Mit M = In kann man insbesonderezwei Basisdarstellungen des Kn ineinander umrechnen.

3.132. Beispiel: Wir stellen die Abbildung φM : R2 → R2 mit

M =(

1 10 1

)

Page 128: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

128 KAPITEL 3. LINEARE ABBILDUNGEN

bezuglich der Basis A (11

),

(1−1

)dar. Dazu haben wir zu berechnen

MA,A(φM ) =(

1 11 −1

)−1(1 10 1

)(1 11 −1

)=(

3/2 −1/21/2 1/2

).

Als Beispiel berechnen wir das Bild des Punktes

x =(

23

)in beiden Darstellungen. Zunachst gilt

φM (x) = Mx =(

53

).

Stellen wir x bezuglich A dar, so erhalten wir

λ = A−1x =(

5/2−1/2

)Zur Probe rechnet man nach, dass in der Tat

x =(

23

)= 5/2

(11

)− 1/2

(1−1

)ist. Nun berechnen wir die Basisdarstellung µ von Mx in der Basis A durchMultiplikation mit der darstellenden Matrix

µ =(

3/2 −1/21/2 1/2

)λ =

(41

).

Zuruckrechnen in die kanonische Basis ergibt in der Tat dasselbe Ergebnis furMx.

Aµ = 4(

11

)+ 1

(1−1

)=(

53

)= Mx.

In Abbildung 3.2 ist die Basis v1, v2 und deren Bilder

w1 = Mv1, w2 = Mv2

eingezeichnet. Man erkennt

w1 = 3/2v1 + 1/2v2w2 = −1/2v1 + 1/2v2

In der Tat ist also die Basisdarstellung von w1 = Mv1 der Vektor(3/21/2

)=MA,A(φM )

(10

).

Page 129: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.2. GLEICHUNGSSYSTEME 129

Abbildung 3.2: Basis und Bilder der Basis

3.133 Aufgabe: Berechnen Sie die Basisdarstellung bezuglich der obigen Basis furdie Abbildung

φ

(xy

)=

(x0

).

Zeichnen Sie wieder die Basis und die Bilder der Basis in ein Koordinatensystem und

stellen Sie die Bilder bezuglich der alternativen Basis dar.

3.134. Beispiel: Wir wissen bereits, dass die Funktionen

1, x, . . . , xn

eine Basis des Polynomraums Pn ⊂ C(R) sind, die wir mit A bezeichnen. Fureine Polynom

p(x) = a0 + a1x+ . . .+ anxn

definieren wir die Ableitung als Bild der Abbildung

φ(p) = p′.

φ ist aufgrund der Rechengesetze fur Ableitungen linear. Es gilt

MA,A(φ) =

0 1

0 2. . . . . .

0 n0

.

Page 130: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

130 KAPITEL 3. LINEARE ABBILDUNGEN

Denn offenbar gilt dann

MA,A(φ)

a0

a1

...an

=

a1

2a2

...nan

0

.

In der Tatφ(p)(x) = p′(x) = a1 + 2a2x+ . . .+ nanx

n−1.

3.135 Satz: (1) Sei φ : V →W linear, und ψ : W → H linear, A eine Basisvon V , B eine Basis von W und C eine Basis von H. Dann gilt

MA,C(ψ ◦ φ) =MB,C(ψ) · MA,B(φ).

(2) Sei φ : V → V bijektiv und A, B Basen von V . Dann gilt

MB,A(φ−1) =MA,B(φ)−1.

Der Beweis dieses Satzes ist eine Ubungsaufgabe.

3.136. Bemerkung: Mit Hilfe dieses Satzes kann der Wechsel von einer Basis-darstellung einer linearen Abbildung φ : V →W in eine andere Basisdarstellungleicht dargestellt werden. Seien dazu A1,A2 zwei Basen von V und B1,B2 zweiBasen von W . Dann gilt also aufgrund der ersten Aussage des Satzes

MB1,B2(φ) =MA2,B2(id) · MA1,A2(φ) · MB1,A1(id).

Dabei sind MA2,B2(id) und MA1,B1(id) die Matrizen des Basiswechsels.

3.137. Beispiel: Sei speziell V = W = Kn, φ : Kn → Kn linear, sowie M diedarstellende Matrix von φ bezuglich der kanonischen Einheitsbasen En und Em.Fur eine Basis A = (v1, . . . , vn) von Kn erhalt man also

MA,A(φ) =ME,A(id) · ME,E(φ) · MA,E(id) = B−1MB,

wobei B = (v1, . . . , vn) ist.

3.138 Aufgabe: Stellen Sie auf die gleiche Weise den Basiswechsel aus Bemer-

kung 3.131 dar.

3.139 Aufgabe: Die Vektoren (i

1 + i

),

(1 + ii

)bilden eine Basis A des C2. Berechnen Sie die Matrix des Basiswechsels

ME,A(id).

Page 131: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.3. ANWENDUNGEN 131

3.140. Definition: Zwei Matrizen A,B ∈ Kn×n heißen ahnlich, wenn es eineregulare Matrix H ∈ Kn×n gibt mit

A = HBH−1.

3.141 Aufgabe: Zeigen Sie dass zwei Matrizen genau dann ahnlich sind, wenn sie

dieselbe lineare Abbildung φ : Kn → Kn bezuglich zweier Basen des Kn darstellen.

3.142 Aufgabe: Wenn A ∼ B die Ahnlichkeit bezeichnet, so zeigen Sie die folgendenBehauptungen.

(1) Fur alle A ∈ Kn×n giltA ∼ A

(2) Fur alle A,B ∈ Kn×n gilt

A ∼ B ⇒ B ∼ A

(3) Fur alle A,B,C ∈ Kn×n gilt

A ∼ B,B ∼ C ⇒ A ∼ C.

3.3 Anwendungen

3.3.1 Analytische Geometrie

Eine unmittelbare Folgerung aus unseren Uberlegungen ist, dass die Losungs-menge eines linearen Gleichungssystems ein affiner Unterraum ist, wenn sie nichtleer ist. Das halten wir im folgenden Satz nochmals fest. Wir wollen in diesemAbschnitt umgekehrt zu jedem affinen Unterraum ein lineares Gleichungssys-tem finden, dessen Losung dieser Raum ist. Dabei soll eine Minimalzahl vonGleichungen verwendet werden.

3.143 Satz: Sei A ∈ Km×n, b ∈ Km. Die Losungsmenge des Gleichungssys-tems Ax = b ist leer oder ein affiner Unterraum der Dimension n−Rang (A).

3.144. Definition: Ein affiner Unterraum des Kn mit Dimension n− 1 heißtHyperebene.

3.145 Aufgabe: Zeigen Sie: Wenn wir ein lineares Gleichungssystem mit einer Glei-chung

a1x1 + . . .+ anxn = b

auf dem Kn haben und nicht alle ai gleich 0 sind, so ist der Losungsraum eine Hyper-

ebene. Geben Sie eine parametrisierte Darstellung dieser Hyperebene an.

3.146 Satz: E ⊂ Kn ist genau dann ein affiner Unterraum der Dimensionk, wenn E die Losungsmenge eines linearen Gleichungssystems

Ax = b, A ∈ K(n−k)×n,

Page 132: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

132 KAPITEL 3. LINEARE ABBILDUNGEN

aber nicht Losungsmenge eines Gleichungssystems mit weniger als n − k Glei-chungen ist.

Insbesondere ist jede Hyperebene Losungsmenge eines Gleichungssystems mitnur einer Gleichung, deren Koeffizienten nicht alle 0 sind.

Beweis: Sei E ein affiner Unterraum der Dimension k, also

E = a+ U

mit dimU = k. Sei u1, . . . , uk eine Basis von U . Wir losen das Gleichungssystem

uT1 x = 0, . . . , uTk x = 0,

Also Ux = 0, wobei U die Zeilen uT1 , . . . , uTk habe. Der Zeilenrang von U ist

k, also auch der Spaltenrang. Nach der Dimensionsformel in Satz 3.20 hat derLosungsraum Kern U die Dimension n − k. Es gibt also linear unabhangigeVektoren

v1, . . . , vn−k

mituTi vj = 0, fur alle i = 1, . . . , k, j = 1, . . . , n− k.

Es folgtvTj ui = 0 fur alle i = 1, . . . , k, j = 1, . . . , n− k,

alsovTj u = 0 fur alle u ∈ U , j = 1, . . . , n− k.

Setzt man vT1 , . . . , vTn−k in die Zeilen einer Matrix V ∈ K(n−k)×n ein, so entsteht

ein GleichungssystemV u = 0.

Dieses System von n− k Gleichungen hat also einen Losungsraum L mit

U ⊆ L.

Nach der Dimensionsformel kann der Losungsraum dieser n − k Gleichungenhochstens die Dimension

n− (n− k) = k

haben. Wegen dimU = k folgt also U = L. Weniger als n − k Gleichungenhatten aber einen Losungsraum mit einer Dimension großer als k. E ist dannLosungsmenge des Gleichungssystems

V u = V a.

Umgekehrt wissen wir schon, dass der Losungsraum jedes Gleichungssystems

V u = 0, V ∈ K(n−k)×n

ein affiner Unterraum der Dimension n− Rang V ist. Wenn weniger Gleichun-gen nicht denselben Losungsraum haben, so muss V vollen Rang haben, alsoRang V = n−k sein. Der Losungsraum hat dann die Dimension n−(n−k) = k.2

Page 133: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.3. ANWENDUNGEN 133

Die im Beweis verwendete Methode ist konstruktiv. Sie kann daher zur Er-mittlung der gesuchten Gleichungen herangezogen werden.

3.147 Aufgabe: (1) Berechnen Sie mit der Methode im Beweis des obigen Satzeseine Gleichung fur die Ebene durch die Punkte1

10

,

011

,

101

in R3.

(2) Berechnen Sie eine Parameterdarstellung der Schnittgerade dieser Ebene mit derEbene mit der Gleichung

x+ y + z = 1.

3.3.2 Affine Abbildungen

Lineare Abbildungen haben den Nachteil, dass immer die 0 auf 0 abgebildetwird. Eine Drehung dreht also immer um 0, und eine Streckung streckt vomNullpunkt aus. Diese Einschrankung wollen wir nun beheben. Die Verallgemei-nerung des Begriffs der linearen Abbildung auf den Begriff der affinen Abbildungist zunachst sehr einfach.

3.148. Definition: Seien V,W Vektorraume uber K. Dann heißt die Abbil-dung

ψ : V →W

affine Abbildung, wenn sie die Form

ψ(x) = φ(x) + b

hat, wobei φ : V →W linear ist und b ∈W .

3.149. Bemerkung: φ und b sind eindeutig bestimmt durch

b = ψ(0)φ(x) = ψ(x)− b = ψ(x)− ψ(0).

Allgemeiner giltψ(x)− ψ(y) = φ(x− y)

oder ψ(x+h)−ψ(x) = φ(h). Das heißt, affine Abbildungen verhalten sich lokalwie die lineare Abbildung φ.

3.150 Aufgabe: Zeigen Sie, dass die Hintereinanderausfuhrung zweier affiner Abbil-

dungen affin ist.

3.151. Beispiel: (1) Das einfachste Beispiel ist eine Translation

db(x) = x+ b.

Page 134: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

134 KAPITEL 3. LINEARE ABBILDUNGEN

Jede affine Abbildung ist Hintereinanderausfuhrung einer Translation und einerlinearen Abbildung. Denn es gilt

ψ(x) = φ(x) + b = db(φ(x)).

Also ψ = db ◦ φ. Es gilt ubrigens φ ◦ db = dφ(b) ◦ φ.

(2) Die Streckung mit Streckungszentrum z ∈ V und mit Streckungsfaktorλ ∈ R ist die affine Abbildung

sλ(x) = z + λ(x− z) = λx+ (z − λz).

Diese Abbildung sieht in x lokal wie eine Streckung um den Faktor λ aus. Denn

sλ(x+ h)− sλ(x) = λh.

(3) Die Drehung um z mit dem Winkel α ist die Abbildung

Dz,α(x) = z +Dα(x− z).

Dabei ist Dα die Drehmatrix zum Winkel α.

3.152 Satz: Seien V,W Vektorraume uber R. Dann ist die Abbildung ψ :V → W genau dann affin, wenn sie Affinkombinationen erhalt. D.h. fur allev1, . . . , vn ∈ V und λ1, . . . , λn ∈ R mit

n∑i=1

λi = 1

giltψ(λ1v1 + . . .+ λnvn) = λ1ψ(v1) + . . .+ λnψ(vn).

Beweis: Zu ψ : V →W setzen wir

φ(x) = ψ(x)− ψ(0).

Wenn ψ affin ist, dann ist φ linear. Man hat

ψ(λ1v1 + . . .+ λnvn) = φ(λ1v1 + . . .+ λnvn) + ψ(0)= λ1φ(v1) + . . .+ λnφ(vn) + ψ(0)= λ1(φ(v1) + ψ(0)) + . . .+ λn(φ(vn) + ψ(0))= λ1ψ(v1) + . . .+ λnψ(vn).

Also erhalten affine Abbildungen Affinkombinationen. Wenn umgekehrt die Ab-bildung ψ Affinkombinationen erhalt, so erhalt, wie man analog zur obigen Rech-nung nachpruft, auch φ Affinkombinationen und es gilt φ(0) = 0. Also, fur λ ∈ Rund x ∈ V

φ(λx) = φ(λx+ (1− λ)0) = λφ(x) + (1− λ)φ(0) = λφ(x).

Damit hat man auch

φ(x+ y) = φ(12

2x+12

2y) =12

(φ(2x) + φ(2y)) = φ(x) + φ(y).

Page 135: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.3. ANWENDUNGEN 135

φ ist also linear und ψ ist affin. 2

3.153. Bemerkung: Wenn die Abbildung ψ im obigen Satz Affinkombinatio-nen zweier Vektoren erhalt, so erhalt sie per Induktion Affinkombinationen vonendlich vielen Vektoren.

3.154 Aufgabe: Folgern Sie aus diesem Satz, dass fur eine Teilmenge M eines reellenVektorraums V und eine affine Abbildung ψ : V →W gilt

conv (ψ(M)) = ψ(conv (M)).

Folgern Sie daraus, dass das Bild von konvexen Mengen unter affinen Abbildungen

konvex ist. Beweisen Sie dasselbe fur den erzeugten affinen Unterraum anstelle der

konvexen Hulle.

3.155 Aufgabe: Sei ψ : V → W affin. Zeigen Sie, dass das Urbild jeder konvexen

Menge konvex ist.

3.156 Satz: Seien V,W Vektorraume uber K und ψ : V → W affin. Dannist das Bild eines affinen Unterraums von V ein affiner Unterraum von W . DasUrbild eines affinen Unterraums von W ist ein affiner Unterraum von V oderleer.

Beweis: Fur den Beweis kann man den obigen Satz verwenden. Stattdes-sen argumentieren wir direkt mit unserer Definition von affinen Abbildungen.φ(x) = ψ(x)− ψ(0) ist linear. Man zeigt fur den affinen Unterraum x+ U ⊆ V

ψ(x+ U) = ψ(x) + φ(U).

Also ist ψ(x+U) ein affiner Unterraum von W . Sei y+H ein affiner Unterraumvon W und ψ(x) ∈ y +H, als ψ−1(y +H) nicht leer. Man zeigt dann

ψ−1(y +H) = x+ φ−1(H).

Es folgt die Behauptung. 2

3.157 Aufgabe: Zeigen Sie die beiden Identitaten im obigen Beweis.

3.158. Bemerkung: Fur eine affine Abbildung ψ : V → V bezeichnet man dieMenge

Fψ := {x ∈ V : ψ(x) = x}

als Fixpunktmenge von ψ. Die Menge ist offenbar das Urbild von {0} unterder affinen Abbildung ψ − id, also nach dem obigen Satz ein affiner Unterraumoder leer. Fur eine Translation db mit b 6= 0 ist die Fixpunktmenge zum Beispielleer.

3.159. Beispiel: (1) Eine affine Abbildung s : V → V heißt Spiegelung, wenns2 = id ist. Die Fixpunktmenge ist dann die Menge, an der gespiegelt wird. InV = R2 kann man fur eine beliebige Basis v1, v2

φ(v1) = v1, φ(v2) = −v2

setzen, und erhalt eine Spiegelung durch

s(x) = z + φ(x− z).

Page 136: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

136 KAPITEL 3. LINEARE ABBILDUNGEN

dabei ist die Spiegelungsgerade

Fψ = z + span {v1}.

(2) Eine affine Abbildung p : V → V heißt Projektion, wenn p2 = p ist. Indiesem Fall ist die Fixpunktmenge die Menge, auf die projiziert wird. Zu jederSpiegelung s gehort die Projektion

p(x) =12

(x+ s(x)),

und zu jeder Projektion p gehort die Spiegelung

s(x) = p(x)− (x− p(x)) = 2p(x)− x.

3.160 Aufgabe: Beweisen Sie, dass die zugehorige Projektion tatsachlich eine Pro-

jektion, und die zugehorige Spiegelung tatsachlich eine Spiegelung ist.

3.161 Aufgabe: (1) Sei ψ = φ + a eine Spiegelung mit der linearen Abbildung φ.Zeigen Sie ψ(a) = 0. Zeigen Sie, dass φ ebenfalls eine Spiegelung ist.

(2) Sei ψ = φ+ a eine Projektion mit der linearen Abbildung φ. Zeigen Sie, dass a einFixpunkt von ψ ist. Zeigen Sie, dass φ ebenfalls eine Projektion ist.

(3) Muss ψ eine Projektion (bzw. Spiegelung) sein, wenn φ eine Projektion (bzw.

Spiegelung) ist?

3.162 Aufgabe: Sei ψ(x) = φ(x) + b eine affine Abbildung von einem endlich di-

mensionalen reellen Unterraum in sich. Zeigen Sie, dass ψ genau dann einen eindeutig

bestimmten Fixpunkt hat, wenn 0 der einzige Fixpunkt des linearen Teils φ ist.3

3.163. Bemerkung: Die Dimensionsformel lasst sich folgendermaßen auf affineAbbildungen anwenden. Sei ψ : V → W affin und E = x + U ein endlichdimensionaler affiner Unterraum von V . Dann ist nach der ersten Formel imobigen Beweis und der Dimensionsformel

dimψ(E) = dimφ(U) = dimU − dim Kern φ|U = dimE − dim Kern φ|U .

Es folgt insbesonderedimψ(E) ≤ dimE,

und fur injektive Abbildungen ψ gilt Gleichheit.

3.3.3 Interpolation

Wir untersuchen ein in der numerischen Mathematik wichtiges Beispiel, in demFunktionenraume eine wichtige Rolle spielen. Sei dazu

V ⊆ C(R)

ein n-dimensionaler Unterraum. Seien

x1 < . . . < xn

Page 137: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.4. QUOTIENTENRAUME 137

n paarweise verschiedene Punkte in R. Die Aufgabe der Interpolation bestehtnun darin, zu gegebenen Werten

y1 < . . . < yn

eine Funktion v ∈ V zu finden mit

v(xi) = yi fur alle i = 1, . . . , n

3.164. Beispiel: Sei V = P1 der Raum der Geraden ax + b in R2. Dann istbekannt, dass man in zwei verschiedenen Punkten immer interpolieren kann. Esgilt namlich fur x1 6= x2 und fur die Gerade

p(x) = y1 +y2 − y1x2 − x1

(x− x1)

in der Tatp(x1) = y1, p(x2) = y2.

Die Abbildung

φ : V → Rn

φ(v) =

v(x1)...

v(xn)

ist linear, wie man nachrechnet. Die Interpolationsaufgabe ist nun fur alle Wertey1, . . . , yn losbar, wenn diese Abbildung surjektiv ist. Aufgrund der Dimensions-formel ist sie dann auch immer eindeutig losbar. Wir konnen also den folgendenSatz formulieren.

3.165 Satz: Sei V ⊂ C(R) ein n-dimensionaler Unterraum. Dann ist dieInterpolationsaufgabe in n verschiedenen Punkten x1, . . . , xn ∈ R genau dannfur alle Werte losbar, wenn jede Funktion v ∈ V , die auf diesen Punkten 0 ist,identisch 0 ist.

3.166. Beispiel: Pn ⊆ C(R) ist ein (n + 1)-dimensionaler Unterraum. In derAnalysis wird bewiesen, dass ein Polynom, das nicht identisch 0 ist, hochstensn verschiedene Nullstellen haben kann. Also kann man mit Polynomen n-tenGrades in n+ 1 Punkten immer eindeutig interpolieren.

3.4 Quotientenraume

Mit Hilfe von Quotientenraumen lassen sich lineare Raume und Abbildung ”‘ver-einfachen”’. Man identifiziert dazu Punkte, die in einem gemeinsamen affinenUnterraum liegen. Im Fall von linearen Abbildungen werden etwa Punkte mitgleichem Bild identifiziert. Die Abbildung wird dadurch injektiv.

Eine weitere, wichtige Anwendung ist die Identifikation von Funktionen, die”‘fast uberall”’ gleich sind. Beispielsweise verhalten sich Funktionen, die sich

Page 138: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

138 KAPITEL 3. LINEARE ABBILDUNGEN

nur in endlich vielen Punkten unterscheiden, bezuglich des Riemann-Integralsgleich.

3.167. Definition: Die Relation ∼ auf einer Menge V heißt Aquivalenzrela-tion, wenn die folgenden Eigenschaften gelten.

(1) Fur alle x, y, z ∈ V gilt

x ∼ y, y ∼ z ⇒ x ∼ z.

(2) Fur alle x, y ∈ V giltx ∼ y ⇒ y ∼ x.

(3) Fur alle x ∈ V giltx ∼ x.

3.168 Satz: Sei ∼ eine Aquivalenzrelation auf V und fur x ∈ V

[x] = {y ∈ V : x ∼ y}.

Dann ist das System der Mengen [x] eine Klassenaufteilung von V . Das heißt,es gilt

[x] ∩ [y] 6= ∅ ⇒ [x] = [y]

undV =

⋂x∈V

[x].

3.169 Aufgabe: Beweisen Sie diesen Satz.

3.170. Bemerkung: Man kann umgekehrt zu jeder Klassenaufteilung S vonV eine Aquivalenzrelation finden, die diese Klassenaufteilung erzeugt. Dazu de-finiert man einfach, dass x ∼ y gelten soll, wenn x und y in derselben MengeS ∈ S liegen.

3.171. Definition: Sei V ein linearer Vektorraum uber K und U ⊆ V einUnterraum. Wir definieren dann eine Aquivalenzrelation ”‘∼U”’ durch

x ∼U y ⇔ x− y ∈ U.

3.172 Aufgabe: Weisen Sie nach, dass ∼U in der Tat eine Aquivalenzrelation ist.

3.173. Definition: Die Menge der Klassen bezeichnet man als Quotienten-raum

V/U = {[x]U : x ∈ V }.

Wir fuhren in V/U eine Addition ein, indem wir fur alle x, y ∈ V definieren

[x]U + [y]U = [x+ y]U .

Außerdem eine Multiplikation fur λ ∈ K und x ∈ V

λ[x]U = [λx]U .

Page 139: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.4. QUOTIENTENRAUME 139

3.174 Satz: Die Addition und Multiplikation sind auf diese Weise wohldefi-niert, und V/U wird zu einem Vektorraum uber K.

Beweis: Damit die Addition wohldefiniert ist, muss man zeigen, dass

[x]U = [x]U , [y]U = [y]U ⇒ [x+ y]U = [x+ y]U

gilt. Das ist aber leicht, wenn man beachtet, dass nach Definition

[x]U = [x]U ⇔ x− x ∈ U

gilt. Analog zeigt man, dass die Multiplikation wohldefiniert ist.

Es bleibt nachzuprufen, dass V/U mit diesen Operationen ein Vektorraumist. Dies uberlassen wir als Ubung. 2

3.175 Aufgabe: Zeigen Sie, dass V/U mit den oben definierten Operationen einVektorraum ist. Der Nullvektor dieses Raumes ist

0 = [0] = U.

3.176. Beispiel: Sei V = R2 und U = span {e1}. Dann ist(x1

x2

)∼U

(y1y2

)⇔ x2 = y2.

Die Klasse [x] ist die Gerade durch x ∈ R2, die parallel zur y-Achse liegt.

3.177. Beispiel: Fur lineare Abbildungen φ : V →W kann man

V/Kern φ

betrachten. Die Elemente dieses Raumes sind die Klassen

[x] = x+ Kern φ = φ−1(φ(x)).

Es giltx ∼Kern φ y ⇔ φ(x) = φ(y).

3.178 Satz: Sei V ein endlich dimensionaler Raum und U ⊆ V ein Unter-raum. Dann gilt

dimV/U = dimV − dimU.

Beweis: Seiv1, . . . , vk

eine Basis von U , die wir mit

vk+1, . . . , vn

zu einer Basis von V erganzen. Es genugt zu zeigen, dass

[vk+1], . . . , [vn]

Page 140: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

140 KAPITEL 3. LINEARE ABBILDUNGEN

eine Basis von V/U ist. Wir zeigen zunachst, dass dieses System Erzeugenden-system ist. Dazu sei

v =n∑i=1

λivi ∈ V.

Dann folgt

[v] =n∑i=1

λi[vi] =n∑

i=k+1

λi[vi],

denn es gilt wegen v1, . . . , vk in U

[v1] = . . . = [vk] = 0.

Wir zeigen nun die lineare Unabhangigkeit. Sei dazu

n∑i=k+1

λi[vi] = 0.

Es folgt [n∑

i=k+1

λivi

]= 0

und dahern∑

i=k+1

λivi ∈ U.

Also muss diese Linearkombination auch Linearkombination von v1, . . . , vk sein.Da v1, . . . , vn eine Basis ist, folgt

λk+1 = . . . = λn = 0.

2

3.179 Satz: Sei V endlich dimensional und φ : V →W linear. Dann ist dieAbbildung

φ : V/Kern (φ)→ φ(V ),

φ([x]) = φ(x)

ein Isomorphismus.

Beweis: Wieder muss man zunachst zeigen, dass die Abbildung wohldefiniertist. Wenn aber [x] = [x] ist, dann gilt

φ([x]) = φ(x) = φ(x) = φ([x]).

Es gilt außerdem nach den Dimensionsformeln aus Satz 3.178 und Satz 3.20

dim(V/Kern φ) = dimV − dim Kern φ = dimφ(V ).

Daher genugt es zu zeigen, dass φ surjektiv ist. Fur y = φ(x) ∈ φ(V ) gilt aberφ([x]) = y. 2

Page 141: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.5. DUALRAUM 141

3.5 Dualraum

Ziel dieses Abschnittes ist es, den Raum der linearen Funktionale auf einemVektorraum zu beschreiben. Dieser Raum ist ja selbst ein Vektorraum, und wirmochten daher eine Basis fur den Raum angeben.

3.180. Definition: Zu zwei linearen Raumen V,W uber K definieren wir denRaum der linearen Abbildungen zwischen V und W als

L(V,W ) = {φ : φ : V →W linear}.

Dieser Raum ist ein Unterraum von A(V,W ) und wir konnen die Addition unddie Multiplikation punktweise definieren.

(φ1 + φ2)(x) = φ1(x) + φ2(x),(λφ)(x) = λφ(x).

3.181 Aufgabe: Zeigen Sie, dass L(V,W ) mit Hilfe dieser Operationen zu einem

Vektorraum uber K wird.

3.182 Aufgabe: Seien V und W endlich dimensional, dimV = n, dimW = m.Zeigen Sie, dass die Abbildung

ψ : L(V,W )→ Km×n

die jedem ψ seine Matrixdarstellung bezuglich fester Basen von V und W zuordnetein Isomorphismus ist, und dass insbesondere

dimL(V,W ) = nm

gilt. Fur V = Kn und W = Km ist insbesondere

ψ(φA) = A.

Wir erinnern uns daran, dass der Matrizenraum Km×n mit den Matrizenoperationen

zu einem Vektorraum uber K wird, der in nahe liegender Weise isomorph zum Knm

ist.

3.183. Definition: Sei V ein Vektorraum uber K. Den Raum der Funktionaleauf V , also den L(V,K), bezeichnen wir als linearen Dualraum V ∗ von V .

3.184. Bemerkung: Nach obiger Aufgabe hat dieser Raum fur endlich di-mensionale V die gleiche Dimension wie V , und ist daher isomorph zu V . Derfolgende Satz gibt eine Basis fur V ∗ an. Im Fall V = Kn ist der lineare Dualraumoffenbar isomorph zum Raum der Zeilenvektoren der Lange n.

3.185. Definition: Sei V ein linearer Raum und B eine Basis von V . Wirdefinieren nun das duale System in V ∗ durch

B∗ = {δb : b ∈ B}

Dabei ist die Abbildung δb : V → K fur alle b ∈ B durch die Bilder derBasisvektoren aus B folgendermaßen festgelegt.

δb(v) =

{1, v = b,

0, v ∈ B, v 6= b.

Page 142: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

142 KAPITEL 3. LINEARE ABBILDUNGEN

3.186 Satz: Fur endlich dimensionale Vektorraume V mit Basis

b1, . . . , bn

ist das duale Systemδb1 , . . . , δbn

eine Basis von V ∗, die man duale Basis nennt.

Beweis: Sei φ ∈ V ∗ und

φ(b1) = µ1, . . . , φ(bn) = µn.

Man rechnet nun nach, dass in der Tat

φ = µ1δb1 + . . .+ µnδbn .

gilt, und dass diese Darstellung eindeutig ist. 2

3.187. Bemerkung: Im Kn liegen die Dinge viel einfacher. Es gilt hier

eTν eµ = δν,µ =

{1, ν = µ

0, ν 6= µ.

Mann nennt δν,µ das Kronecker-Symbol. Es folgt, dass die zu

e1, . . . , en

duale Basis gleicheT1 , . . . , e

Tn

ist.

3.188 Aufgabe: Sei B eine Basis von V und fB : V → V ∗ definiert durch

fB(b) = δb.

Zeigen Sie, dass fB linear und injektiv ist. Daraus folgt im Fall dimV < ∞, dass fBein Isomorphismus zwischen V und V ∗ ist.

3.189 Aufgabe: Sei g : V → (V ∗)∗ definiert durch

g(v)(φ) = φ(v) fur alle φ ∈ V ∗

Zeigen Sie, dass g linear und injektiv ist.

3.190. Bemerkung: In unendlich dimensionalen Vektorraumen ist der Satzfalsch. Ein Gegenbeispiel ist der Vektorraum lc der Folgen in R, die nur endlichviele von 0 verschiedene Glieder haben. Definiert man die Folgen eν ∈ lc durch

eν = (δν,n)n∈N,

so bilden diese Folgen eine Basis des lc. Die Abbildung

φ((xn)n∈N) =∞∑n=1

xn

Page 143: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

3.5. DUALRAUM 143

ist eine lineare Abbildung in l∗c . Sie ist aber nicht in dem Unterraum von l∗c , dervon den Funktionalen δeν , ν ∈ N, aufgespannt wird.

3.191. Beispiel: Fur Funktionenraume ist der lineare Dualraum gewohnlichzu groß. Man betrachtet hier zum Beispiel nur stetige Funktionale, also einenTeilraum des linearen Dualraums. Wir konnen hier darauf nicht eingehen.

3.192. Definition: Sei F : V → W linear. Dann definieren wir die dualeAbbildung F ∗ : W ∗ → V ∗ durch

F ∗(ψ) = ψ ◦ F

fur alle ψ ∈W ∗.

Das folgende Diagramm kommutiert also.

VF−→ W

↓ F ∗(ψ) ↓ ψK

id←→ K

3.193 Satz: Wenn F : V → W ein Isomorphismus ist, dann ist auch F ∗ :V → W ein Isomorphismus. Isomorphe Vektorraume haben also isomorpheDualraume. Es gilt

(F ∗)−1 = (F−1)∗.

Beweis: Wir berechnen

F ∗((F−1)∗(φ)) = F ∗(φ ◦ F−1) = φ ◦ F−1 ◦ F = φ

fur alle φ ∈ V ∗ sowie umgekehrt

(F−1)∗(F ∗(ψ)) = (F−1)∗(ψ ◦ F ) = ψ ◦ F ◦ F−1 = ψ

fur alle ψ ∈W ∗. Also ist (F−1)∗ die Umkehrabbildung von F ∗. 2

3.194 Aufgabe: Zeigen Sie, dass F ∗ genau dann injektiv ist, wenn F surjektiv ist.

3.195 Satz: Seien V und W endlich dimensional, A eine Basis von V undB eine Basis von W . Zeigen Sie

MB∗,A∗(F ∗) =MA,B(F )T .

Dabei bezeichnen B∗ und A∗ die dualen Basen.

Beweis: Sei ψ ∈ V ∗,ψ = l1b

∗1 + . . .+ λmb

∗m,

wobei b1, . . . , bm die Basis B ist, und

µ =MA,B(F )Tλ.

Zu zeigen istF ∗(ψ) = µ1a

∗1 + . . . µna

∗n,

Page 144: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

144 KAPITEL 3. LINEARE ABBILDUNGEN

wobei a1, . . . , an die Basis cA ist. Wir uberprufen diese Gleichheit durch An-wenden auf a1, . . . , an. Zur Abkurzung setzen wir C =MA,B(F ). Es gilt in derTat

F ∗(ψ)(ai) = ψ(F (ai))= ψ(c1,ib1 + . . .+ cm,ibm)= λ1c1,i + . . .+ λmcm,i

= µi

= (µ1a∗1 + . . .+ µna

∗n)(ai).

Es folgt die Behauptung. 2

Page 145: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Kapitel 4

Das Skalarprodukt

In diesem Kapitel behandeln wir das reelle und komplexe Skalarprodukt. Ausder Schule bekannt ist das reelle Skalarprodukt bei der Berechnung von Win-keln zwischen Vektoren und als Hilfsmittel zur Entscheidung, ob zwei Vektorensenkrecht aufeinander stehen. Wir werden dieses Konzept verallgemeinern. In-teressante Anwendungen ergeben sich insbesondere in Funktionenraumen.

4.1 Skalarprodukte und Normen

4.1.1 Skalarprodukte

Wir werden uns in diesem Abschnitt nur mit Vektorraumen uber R und Cbeschaftigen. Zur Abkurzung schreiben wir K fur einen dieser beiden Korper,also

K ∈ {R,C}.

Die komplexe Konjugationa+ ib = a− ib,

die wir hier oft verwenden werden, ist fur im Falle K = R einfach die identischeAbbildung (x = x). Fur Matrizen M definieren wir M elementweise.

4.1. Definition: Sei V ein Vektorraum uber K. Eine Abbildung von V × Vnach K

(v, w) 7→ 〈v, w〉 ∈ K

heißt Skalarprodukt (engl.: scalar product), wenn die folgenden Bedingungerfullt sind.

(1) Die Abbildung ist linear in der ersten Variablen, also

〈λv,w〉 = λ〈v, w〉,〈v1 + v2, w〉 = 〈v1, w〉+ 〈v2, w〉

fur alle λ ∈ K, v, w, v1, v2 ∈ V ,

145

Page 146: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

146 KAPITEL 4. DAS SKALARPRODUKT

(2) Die Abbildung ist konjugiert symmetrisch, also

〈w, v〉 = 〈v, w〉

fur alle v, w ∈ V ,

(3) Die Abbildung ist positiv definit, das heißt

〈v, v〉 > 0

fur alle v 6= 0.

Man nennt einen Vektorraum zusammen mit einem Skalarprodukt einenSkalarproduktraum oder Euklidschen Vektorraum. Im komplexen Fallspricht man von einem unitaren Raum. Wir werden hier in beiden Fallen voneinem Skalarproduktraum sprechen.

4.2. Bemerkung: Im reellen Fall ist das Skalarprodukt dann auch linear imzweiten Argument. Man spricht hier von einer symmetrischen Bilinearform.Im komplexen Fall ist es allerdings nur konjugiert linear. Es gilt

〈v, λw〉 = 〈λw, v〉

= λ · 〈w, v〉

= λ · 〈w, v〉= λ · 〈v, w〉.

Eine konjugiert lineare Form dieser Art nennt man auch Hermitesche Form.

4.3. Bemerkung: Wegen〈v, v〉 = 〈v, v〉

ist in jedem Fall 〈v, v〉 ∈ R. Weil 〈v, w〉 in v linear ist, gilt wie bei jeder linearenAbbildung

〈0, v〉 = 0

fur alle v ∈ V , insbesondere 〈0, 0〉 = 0. Die Bedingung (3) sagt also insbesondereaus, dass

〈v, v〉 = 0 ⇔ v = 0

ist. Daruber hinaus muss fur alle v ∈ V

〈v, v〉 ≥ 0

gelten. Gilt nur diese Eigenschaft, so spricht man von einer positiv semi-defini-ten Bilinearform, bzw. Hermiteschen Form.

4.4. Definition: Auf dem Rn konnen wir ein Skalarprodukt durch

〈x, y〉 =n∑k=1

xkyk = xT y

definieren. Man nennt dieses Skalarprodukt Euklidsches Skalarprodukt. Aufdem Cn definieren wir

〈x, y〉 =n∑k=0

xkyk. = xT y

Page 147: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.1. SKALARPRODUKTE UND NORMEN 147

Diese Skalarprodukte nennt man auch kanonisches Skalarprodukt auf demRn, bzw. Cn. Im Rn nennt man das Skalarprodukt auch Euklidsches Skalar-produkt.

4.5 Aufgabe: Weisen Sie nach, dass die beiden Abbildungen Skalarprodukte sind.

4.6 Aufgabe: Zeigen Sie fur eine Skalarprodukt 〈x, y〉

〈x± y, x± y〉 = 〈x, x〉+ 〈y, y〉 ± 2Re 〈x, y〉

wobei Re z den Realteil von z ∈ C bezeichne.

4.7 Satz: Sei V ein endlich dimensionaler Vektorraum uber K mit dem Ska-larprodukt 〈v, w〉, und

A = (v1, . . . , vn)

eine Basis von V . Wir definieren dann die Matrix

H =

〈v1, v1〉 . . . 〈v1, vn〉...

...〈vn, v1〉 . . . 〈vn, vn〉

,

die man darstellende Matrix des Skalarproduktes bezuglich dieser Basisnennt. Dann gilt fur

v = λ1v1 + . . .+ λnvn

w = µ1v1 + . . .+ µnvn

die Beziehung〈v, w〉 = λTHµ.

Es gilt außerdemH = HT = H

T.

Die Matrix H ist invertierbar und es gilt

λTHλ > 0

fur alle λ ∈ Kn, λ 6= 0.

Setzt man wie ublich

φA(λ) =n∑i=1

λivi,

so gilt also〈v, w〉 = φ−1

A (v)THφ−1A (w)).

Beweis: Wir rechnen die Darstellung des Skalarproduktes nach. Die Kompo-nenten der Matrix H nennen wir hi,j .

〈v, w〉 = 〈n∑i=1

λivi,

n∑j=1

µjvj〉

=n∑i=1

λi〈vi,n∑j=1

µjvj〉

Page 148: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

148 KAPITEL 4. DAS SKALARPRODUKT

=n∑i=1

λi

n∑j=1

〈vj , µjvj〉

=

n∑i=1

λi

n∑j=1

µjhi,j

=(λ1 . . . λn

)∑nj=1 µih1,j

...∑nj=1 µihn,j

= λTHµ.

Aufgrund der Eigenschaften eines Skalarproduktes hat man

hi,j = 〈vi, vj〉 = 〈vj , vi〉 = hj,i,

also H = HT = HT

. Gleichfalls hat man λTHλ > 0 fur λ 6= 0. H muss deswegenauch invertierbar sein, da es sonst ein λ ∈ Kn gabe mit Hλ = 0 und λ 6= 0. 2

4.8. Definition: Zur Matrix H ∈ Kn×m definiert man die adjungierte Ma-trix

H∗ = HT .

Eine Matrix H ∈ Kn×n mitH = H∗

nennt man (konjugiert) symmetrisch oder auch selbstadjungierte Matrixoder Hermitesche Matrix.

4.9 Aufgabe: Zeigen Sie fur das Euklidsche Skalarprodukt auf dem Kn und jedeMatrix A ∈ Kn×n

〈Ax, y〉 = 〈x,A∗y〉 fur alle x, y ∈ Kn.

Zeigen Sie außerdem (A∗)∗ = A und

〈A∗x, y〉 = 〈x,Ay〉 fur alle x, y ∈ Kn.

4.10. Definition: Eine Hermitesche Matrix mit

λTHλ > 0 fur alle λ ∈ Kn, λ 6= 0

nennt man positiv definite Matrix. Gilt hier nur ”‘≥”’, so nennt man dieMatrix positiv semi-definit. Analog definiert man negativ definite und negativsemi-definite Matrizen.

4.11. Bemerkung: Eine positiv definite Matrix ist in diesem Skript automa-tisch auch Hermitesch. Viele Autoren setzen das nicht voraus.

4.12 Aufgabe: Sei H ∈ Kn×n positiv definit. Zeigen Sie, dass dann auch HT und H

positiv definit sind. Zeigen Sie, dass H regular ist und dass H−1 positiv definit ist.

4.13 Aufgabe: Angenommen, wir setzen bei der Definition von positiven MatrizenH ∈ Rn×n nicht voraus, dass H = HT ist. Zeigen Sie, dass dann H genau dann positivdefinit ist, wenn die symmetrische Matrix

1

2(H +HT )

Page 149: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.1. SKALARPRODUKTE UND NORMEN 149

positiv definit ist.

Wir haben also festgestellt, dass die darstellende Matrix eines Skalarpro-duktes positiv definit ist. Umgekehrt definiert jede positiv definite Matrix einSkalarprodukt, wie der folgende Satz zeigt.

4.14 Satz: Sei V ein Vektorraum uber K und

A = (v1, . . . , vn)

eine Basis von V , sowie H ∈ Kn×n positiv definit. Dann ist

〈v, w〉 = φ−1A (v)THφ−1

A (w))

ein Skalarprodukt auf V mit darstellender Matrix H bezuglich A.

4.15 Aufgabe: Beweisen Sie diesen Satz.

4.16. Bemerkung: Wahlt man im Kn speziell die kanonische Basis aus Ein-heitsvektoren, so ist also

〈v, w〉 = vTHw

genau dann ein Skalarprodukt auf Kn, wenn H positiv definit ist.

4.17. Beispiel: Ein typisches Skalarprodukt auf dem Raum C[a, b] ist

〈f, g〉 =∫ b

a

f(t)g(t) dt.

In der Analysis wird dieses Skalarprodukt auch auf dem Raum aller Funktionf : I → R erweitert, fur die f2 im Riemannschen oder Lebesgueschen Sinnintegrierbar sind. Wir konnen auf die Details dieser Verallgemeinerung hier nichteingehen. Man nennt diesen Skalarproduktraum L2[a, b].

4.18 Aufgabe: Zeigen Sie, dass die Hilbertmatrix

Hn =

1 1/2 1/3 . . . 1/n

1/2 1/31/3

......

1/n . . . 1/(2n)

=

(1

i+ j − 1

)1≤i,j≤n

positiv definit ist, indem Sie die Matrix als darstellende Matrix des Skalarprodukts

auf L2[0, 1] erkennen.

4.19 Aufgabe: (a) Berechnen Sie das Minimum von fa(t) = 1+2at+t2 in Abhangig-keit von a und zeigen Sie, dass fa > 0 genau dann gilt, wenn |a| < 1 gilt. (fa > 0bedeutet naturlich, dass fa(t) > 0 fur alle t ∈ R ist.)

(b) Folgern Sie, dassx2 + 2axy + y2 > 0

genau dann fur alle x, y ∈ R mit x 6= 0 oder y 6= 0 gilt, wenn |a| < 1 ist.

(c) Folgern Sie, dassbx2 + 2axy + cy2 > 0

genau dann fur alle x, y ∈ R mit x 6= 0 oder y 6= 0 gilt, wenn b > 0 und bc > a2 ist.

(d) Folgern Sie, dass (b aa c

)genau dann positiv definit ist, wenn b > 0 und bc > a2 ist.

Page 150: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

150 KAPITEL 4. DAS SKALARPRODUKT

4.1.2 Normen

Normen erlauben es, Abstande in Vektorraumen zu messen. Zu jedem Skalar-produkt werden wir eine zugehorige Norm definieren.

4.20. Definition: Sei V ein Vektorraum uber K. Eine Abbildung

‖ · ‖ : V → Rv 7→ ‖v‖

heißt Norm auf dem Vektorraum V , wenn die folgenden Bedingungen gelten.

(1)‖v‖ > 0 fur alle v ∈ V , v 6= 0.

(2)‖λv‖ = |λ|‖v‖ fur alle λ ∈ K, v ∈ V .

(3)‖v + w‖ ≤ ‖v‖+ ‖w‖ fur alle v, w ∈ V .

Ein Vektorraum V mit einer Norm ‖ · ‖ heißt normierter Vektorraum.

Bedingung (3) nennt man die Dreiecksungleichung. Im Rn soll die Norm‖v‖ der ”‘Lange”’ des Vektors v entsprechen. Die Dreiecksungleichung sagt aus,dass die Lange von v + w nicht großer ist, als die Lange der beiden anderenDreiecksseiten v und w im Dreieck aus Abbildung 2.1 links.

4.21 Aufgabe: Zeigen Sie ‖0‖ = 0.

4.22. Definition: Sei M eine Menge. Eine Abbildung

d : M ×M → R(x, y) 7→ d(x, y)

heißt Metrik auf M , wenn die folgenden Bedingungen gelten.

(1)d(x, y) = 0 ⇔ x = y fur alle x, y ∈M.

(2)d(x, y) = d(y, x) fur alle x, y ∈M.

(3)d(x, z) ≤ d(x, y) + d(y, z) fur alle x, y, z ∈M.

4.23 Aufgabe: Zeigen Sie d(x, y) ≥ 0 fur alle x, y ∈M .

Wieder ist Bedingung (3) die Dreiecksungleichung. Da die Metrik als Ab-standsmaß dienen soll, besagt diese Bedingung, dass der Umweg uber y langerist als die direkte Verbindung von x nach z.

4.24 Aufgabe: Sei V ein normierter Vektorraum mit Norm ‖ · ‖. Zeigen Sie, dassdann die Funktion

d(x, y) = ‖x− y‖ fur alle x, y ∈ V

Page 151: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.1. SKALARPRODUKTE UND NORMEN 151

eine Metrik auf V ist.

4.25. Bemerkung: Damit wird ein normierter Raum zu einem metrischenRaum. Dort kann man daher die Konvergenz einer Folge (xn)n∈N in V zu einemWert x ∈ V durch

limn→∞

xn = x ⇔ limn→∞

‖xn − x‖ = 0

definieren. Da man außerdem addieren kann, kann man konvergente Reihendefinieren. Diese Verallgemeinerung der Konvergenz wird in der Analysis be-sprochen.

Wir definieren nun die fur uns hier wichtigste Norm. Sie heißt die zum Ska-larprodukt zugehorige Norm.

4.26 Satz: Sei V ein Skalarproduktraum uber K. Dann ist

‖v‖ =√〈v, v〉 fur alle v ∈ V

eine Norm auf V .

Beweis: Aufgrund der positiven Definitheit von Skalarprodukten ist

〈v, v〉 > 0

fur alle v 6= 0. Außerdem 〈0, 0〉 = 0. Da die Wurzel fur alle nicht-negativen Zah-len definiert ist, ist das Skalarprodukt fur alle v ∈ V wohldefiniert. Außerdemfolgen die Bedingungen (1) und (2) fur Normen.

Man hat aufgrund der Eigenschaften des Skalarprodukts, und wegen λλ =|λ|2

‖λv‖ =√〈λv, λv〉 =

√λλ〈v, v〉 = |λ|

√〈v, v〉 = |λ|‖v‖.

Zum Beweis der Dreiecksungleichung berechnen wir zunachst mit Hilfe vonAufgabe 4.6

‖x+ λy‖2 = 〈x+ λy, x+ λy〉= 〈x, x〉+ 〈λy, λy〉+ 2Re 〈x, λy〉= 〈x, x〉+ |λ|2〈y, y〉+ 2 Reλ〈x, y〉.

Nun setzen wir im Fall y 6= 0

λ = −〈x, y〉〈y, y〉

.

Es folgt damit

0 ≤ ‖x+ λy‖2 = 〈x, x〉+|〈x, y〉|2

〈y, y〉− 2|〈x, y〉|2

〈y, y〉= 〈x, x〉 − |〈x, y〉|

2

〈y, y〉.

Man erhalt|〈x, y〉|2 ≤ 〈x, x〉〈y, y〉 = ‖x‖2 ‖y‖2.

Page 152: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

152 KAPITEL 4. DAS SKALARPRODUKT

Aufgrund der Monotonie der Wurzel folgt

|〈x, y〉| ≤ ‖x‖ ‖y‖.

Die ist die sogenannte Schwarzsche Ungleichung, die fur alle x, y ∈ V gilt(auch im Fall y = 0).

Mit Hilfe der Schwarzschen Ungleichung beweisen wir die Dreiecksunglei-chung. Dazu berechnen wir zunachst wieder mit Aufgabe 4.6

‖x+ y‖2 = ‖x‖2 + ‖y‖2 + 2Re 〈x, y〉.

Es gilt aber fur alle komplexen Zahlen z = a+ ib

Re z = a ≤√a2 + b2 = |z|.

Also, mit der Schwarzschen Ungleichung,

‖x+ y‖2 ≤ ‖x‖2 + ‖y‖2 + 2|〈x, y〉|≤ ‖x‖2 + ‖y‖2 + 2‖x‖ ‖y‖= (‖x‖+ ‖y‖)2.

Durch Wurzelziehen folgt die Dreiecksungleichung. 2

Wir halten hier noch die wichtige Schwarzsche Ungleichung fest, die wirschon im obigen Beweis hergeleitet haben. Wir werden fur diese Ungleichung imFall V = Rn weiter unten eine geometrische Begrundung herleiten, die naturlichkein im Sinne dieser Theorie exakter Beweis sein kann.

4.27 Satz: Sei V ein Skalarproduktraum. Dann gilt

|〈v, w〉| ≤ ‖v‖ ‖w‖

fur alle v, w ∈ V . Gleichheit gilt genau dann, wenn v und w linear abhangigsind.

Beweis: Den Beweis fur die Gultigkeit der Ungleichung haben wir schonerbracht. Betrachtet man diesen Beweis, so sieht man, dass Gleichheit nur geltenkann, wenn y = 0 ist, oder x + λy = 0. Dies ist aquivalent dazu, dass x und ylinear abhangig sind. 2

4.28. Beispiel: Die zum Euklidschen Skalarprodukt gehorige Norm auf demRn und auf dem Cn ist die Norm

‖x‖ =

√√√√ n∑i=1

|xi|2 fur alle x ∈ Kn

Entsprechend ist der Abstand zweier Punkte im Kn durch

d(x, y) = ‖x− y‖ =

√√√√ n∑i=1

|xi − yi|2

Page 153: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.1. SKALARPRODUKTE UND NORMEN 153

gegeben. Dies entspricht im Rn dem geometrischen Abstand der EuklidschenGeometrie, wie man geometrisch mit Hilfe des Satzes von Pythagoras nachweist.

4.29. Beispiel: Es gibt viele weitere Normen auf dem Kn. Typische Vertretersind die 1-Norm

‖x‖1 =n∑i=1

|xi|

und die Maximumsnorm

‖x‖∞ = max1≤i≤n

|xi|.

4.30 Aufgabe: Weisen Sie nach, dass die 1-Norm und die Maximumsnorm tatsachlich

Normen auf dem Kn sind.

4.31 Aufgabe: Zeichnen Sie die Einheitskugeln

K1 = {x : ‖x‖ ≤ 1}

fur die Euklidsche Norm, die 1-Norm im Fall n = 1, 2, 3 und K = R.

4.32 Aufgabe: (a) Zeigen Sie die Parallelogrammgleichung

‖x− y‖2 + ‖x+ y‖2 = 2(‖x‖2 + ‖y‖2)

fur alle Normen, die zu einem Skalarprodukt gehoren.

(b) Geben Sie eine Formal fur die Lange der Seitenhalbierenden im Dreieck an, ab-

hangig von den Langen der Seiten.

4.33 Aufgabe: Sei K = R. Zeigen Sie

〈x, y〉 =1

4

(‖x+ y‖2 − ‖x− y‖2

)fur die Norm ‖ · ‖, die zum Skalarprodukt 〈·, ·〉 gehort. Weisen Sie mit Hilfe dieser

Gleichung nach, dass die 1-Norm und die Maximumsnorm zu keinem Skalarprodukt

gehoren. Stellen Sie eine entsprechende Gleichung fur komplexe Skalarprodukte auf.

4.34 Aufgabe: Zeigen Sien∑i=1

|xi| ≤√n‖x‖

fur alle x ∈ Kn mit Hilfe der Schwarzschen Ungleichung, wobei ‖x‖ = ‖x‖2 die Eu-klidsche Norm sei. Finden Sie ein x ∈ Kn, so dass Gleichheit gilt. Zeigen Sie

‖x‖1 ≤√n‖x‖2 ≤ n‖x‖∞

und‖x‖∞ ≤ ‖x‖2 ≤ ‖x‖1

fur alle x ∈ Kn. Kann in diesen Ungleichungen Gleichheit auftreten?

4.35. Beispiel: Das Skalarprodukt in Beispiel 4.17 fuhrt zur Norm

‖f‖ = ‖f‖2 =

√∫ b

a

f(t)2 dt.

Page 154: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

154 KAPITEL 4. DAS SKALARPRODUKT

Man nennt diese Norm L2-Norm. Sie gibt den gemittelten quadrierten Abstandzweier Funktionen wieder. Durch das Quadrieren werden große Abstande starkergewichtet. Eine alternative Norm ist

‖f‖1 =∫ b

a

|f(t)| dt.

Dies Norm nennt man L1-Norm. Sie gewichtet große Abstande nicht so stark.Ein Nachteil ist, dass diese Norm nicht zu einem Skalarprodukt gehort. Dasandere Extrem ist die L∞-Norm, die durch

‖f‖∞ = sup{|f(t)| : t ∈ [a, b]}.

Sie nutzt ausschließlich die großen Abstande.

4.36 Aufgabe: Weisen Sie nach, dass ‖f‖1 und ‖f‖∞ tatsachlich Normen auf dem

Raum C[a, b] sind.

4.37 Aufgabe: Nutzen sie die Schwarzsche Ungleichung, um

‖f‖1 ≤√b− a‖f‖2 ≤

√b− a‖f‖∞

zu zeigen. Kann hier Gleichheit auftreten? Zeigen Sie aber, dass keine Ungleichungender Form

‖f‖∞ ≤ c1‖f‖2, ‖f‖2 ≤ c2‖f‖1

fur alle f ∈ C[a, b] gelten.

4.38 Aufgabe: Die reelle Reihe∞∑i=1

a2i

sei konvergent. Zeigen Sie, dass dann auch die Reihe

∞∑i=1

|ai|i

konvergiert.

4.2 Orthogonalitat

4.2.1 Senkrechte Vektoren

Senkrechte stehende Vektoren spielen naturlich eine besondere Rolle in der Geo-metrie. Wir sind in diesem Abschnitt zunacht an Orthonormalbasen interessiert.Das sind Basen, die aus paarweise senkrecht stehenden, normierten Vektorenbestehen. Mit solchen Basen kann man besonders leicht rechnen. Das ist insbe-sondere in Funktionenraumen nutzlich.

4.39 Aufgabe: Uberlegen Sie sich im R2 oder R3 anhand einer Skizze, dass der Vektor

x genau dann senkrecht auf dem Vektor y steht, wenn die Differenzenvektoren x − y

Page 155: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 155

und x − (−y) gleich lang sind. Rechnen Sie nach, dass dies aquivalent zu 〈x, y〉 = 0

ist.

4.40. Definition: Sei V ein Vektorraum uber K mit einem Skalarprodukt〈v, w〉. Zwei Vektoren v, w heißen senkrecht zueinander, wenn

〈v, w〉 = 0

ist. Man schreibt dafurv ⊥ w.

Wenn U ein Unterraum von V ist, so heißt v senkrecht auf U , wenn

v ⊥ u fur alle u ∈ U

gilt. Man schreibtv ⊥ U.

4.41. Bemerkung: Es gilt naturlich

v ⊥ w ⇔ w ⊥ v.

Es gilt aber nicht, dass aus v ⊥ w und w ⊥ z folgt, dass v ⊥ z sein muss.

4.42. Bemerkung: In Fall K = C genugt

Re 〈v, u〉 = 0 fur alle u ∈ U,

damit v ⊥ U ist. Denn mit u ∈ U ist auch iu ∈ U und es folgt

Im 〈v, u〉 = Re (−i)〈v, u〉 = Re 〈v, iu〉 = 0,

weil fur jede komplexe Zahl Im z = Re (−iz) gilt.

4.43 Aufgabe: Sei U ein endlich dimensionaler Unterraum des SkalarproduktraumesV mit Erzeugendensystem u1, . . . , un. Zeigen Sie, dass v ⊥ U genau dann gilt, wenn

v ⊥ ui fur alle i = 1, . . . , n

gilt.

Wir beweisen nun eine allgemeine Version des Satzes von Pythagoras. Dies istnaturlich kein Beweis des eigentlichen geometrischen Sachverhaltes, weil wir denSatz quasi in die Definition des Skalarproduktes und der Norm hineingesteckthaben.

4.44 Satz: Es gilt

v ⊥ w ⇒ ‖v + w‖2 = ‖v‖2 + ‖w‖2.

Im reellen Fall gilt auch die umgekehrte Implikation.

Beweis:‖v + w‖2 = ‖v‖2 + ‖w‖2 + 2Re 〈v, w〉.

Page 156: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

156 KAPITEL 4. DAS SKALARPRODUKT

Wenn also 〈v, w〉 = 0 ist, folgt der Satz des Pythagoras. Wenn umgekehrt dieserSatz gilt, muss im reellen Fall Re 〈v, w〉 = 〈v, w〉 = 0 sein

4.45. Definition: Eine Teilmenge M eines Raums V mit Skalarprodukt 〈v, w〉heißt Orthogonalsystem, wenn es die 0 nicht enthalt und

v ⊥ w fur alle v, w ∈M , v 6= w

gilt. Ein Orthogonalsystem mit normierten Vektoren nennen wir in diesemSkript Orthonormalsystem. Ein Orthogonalsystem heißt Orthonormalba-sis, wenn es Basis von V ist, und wenn

‖v‖ = 1 fur alle v ∈M

gilt. 2

Wie ublich, nennen wir n paarweise verschiedene Vektoren v1, . . . , vn ein Or-thonormalsystem, bzw. eine Orthonormalbasis, wenn die Menge {v1, . . . , vn} einOrthogonalsystem, bzw. eine Orthonormalbasis, im Sinne der obigen Definitionist.

4.46 Satz: Jedes Orthogonalsystem M ⊆ V ist linear unabhangig.

Beweis: Seien v1, . . . , vn ∈M paarweise verschieden und

n∑i=1

λivi = 0.

Dann folgt durch Multiplikation mit vj , j ∈ {1, . . . , n}

λj < vj , vj >= 0.

Wegen vj 6= 0 folgt λj = 0. 2

Der folgende Satz besagt, dass jeder endlich dimensionale Raum eine Ortho-gonalbasis hat. Der Beweis erfolgt mit einem Konstruktionsverfahren, das manOrthonormalisierungs-Verfahren von Gram-Schmidt (oder einfach Schmidt-sches Verfahren) nennt.

4.47 Satz: Jeder endlich dimensionale Skalarproduktraum V uber K besitzteine Orthonormalbasis. Man kann jedes Orthonormalsystem zu einer Orthonor-malbasis von V erganzen.

Beweis: Fur V = {0} ist die leere Menge eine Orthogonalbasis.

Sonst wahlen wie ein v1 ∈ V mit v1 6= 0 und normieren

v1 =1‖v1‖

v1.

Dann bildet {v1} eine Orthonormalsystem in V .

Angenommen, wir haben ein Orthonormalsystem v1, . . . , vn in V , und

v /∈ U = span {v1, . . . , vn}.

Page 157: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 157

Wir setzen

vn+1 = v −n∑i=1

〈v, vi〉vi.

Man berechnet〈vn+1, vi〉 = 0 fur alle i = 1, . . . , n,

also vn+1 ⊥ U . Da v /∈ U ist, folgt vn+1 6= 0. Wir konnen also

vn+1 =1

‖vn+1‖vn+1

setzen. Es folgt vn+1 ⊥ U . Daher ist v1, . . . , vn+1 eine Orthonormalbasis vonspan {v1, . . . , vn+1}.

Da V endlich dimensional ist und Orthognormalsysteme linear unabhangig,muss dieses Verfahren irgendwann enden, und wir erhalten eine Orthonormalba-sis von V . Aufgrund des Konstruktionsverfahrens ist klar, dass man damit jedesOrthogonalsystem in V mit normierten Vektoren zu einer Orthonormalbasiserganzen kann. 2

4.48. Bemerkung: Zur Vermeidung von Wurzeln ist es gunstiger, zunachstnicht zu normieren. Dazu nehmen wir ein Orthogonalsystem v1, . . . , vn an undeinen Vektor v. Man muss dann, im Unterschied zum Verfahren im Beweis desSatzes,

vn+1 = v −n∑i=1

〈v, vi〉〈vi, vi〉

vi.

setzen und erst am Ende alle vi normieren. Außerdem kann man zur Vermeidungvon Bruchen zunachst ein geeignetes Vielfaches von vn+1 verwenden. Wenn manversehentlich ein v ∈ span {v1, . . . , vn} nimmt, so wird vn+1 = 0.

4.49. Bemerkung: Ausgehend von einem beliebigen linear unabhangigen Sys-tem w1, . . . , wn in V kann man mit dem Verfahren ein Orthonormalsystemv1, . . . , vn erhalten, so dass

span {v1, . . . , vk} = span {w1, . . . , wk} fur alle k = 1, . . . , n

gilt. Dazu wahlt man in jedem Schritt v = wk+1, also gleich dem nachsten, nochnicht verwendeten Basisvektor.

4.50. Beispiel: Ausgehend von

v1 =

111

bestimmen wir eine Orthonormalbasis von R3. Man kann nun einen beliebigenVektor v /∈ span {v1} nehmen. Wir nehmen v = e1. Also

v2 = e1 −〈e1, v1〉〈v1, v1〉

v1.

Page 158: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

158 KAPITEL 4. DAS SKALARPRODUKT

In konkreten Zahlen

v2 =

−2/31/31/3

Zur Vermeidung von Bruchen nehmen wir

v2 =

−211

.

Weiter mit v = e2

v3 = e2 −〈e2, v1〉〈v1, v1〉

v1 −〈e2, v2〉〈v2, v2〉

v2.

In Zahlen

v3 =

01/2−1/2

.

Also, zur Vermeidung von Bruchen

v3 =

01−1

In der Tat stehen alle drei Vektoren senkrecht aufeinander. Wir erhalten durchNormieren die folgende Orthonormalbasis

1√3

111

,1√6

−211

,1√2

01−1

.

4.51. Beispiel: Im Raum C[0, 1] mit dem Skalarprodukt

〈f, g〉 =∫ 1

0

f(t)g(t) dt

stellen wir eine Orthonormalbasis von P2 auf, und zwar ausgehend von der Basis

w0(x) = 1, w1(x) = x, w2(x) = x2.

Dazu setzen wir f0(x) = w0(x) = 1. Als Funktion v wahlen wir nun die Funktionv(x) = w1(x) = x. Also

f1 = v − 〈v, f0〉〈f0, f0〉

f0.

Man berechnet

〈f0, f0〉 =∫ 1

0

1 dt = 1.

und

〈v, f0〉 =∫ 1

0

x dt =12.

Page 159: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 159

Alsof1(x) = x− 1

2.

Im nachsten Schritt wahlen wir v(x) = w2(x) = x2. Wir haben wieder

f2 = v − 〈v, f0〉〈f0, f0〉

f0 −〈v, f1〉〈f1, f1〉

f1

zu berechnen. Man erhalt

f2(x) = x2 − x+16.

Die Funktionen f0, f1, f2 mussen nun noch normiert werden.

4.52 Satz: Sei v1, . . . , vn ein Orthonormalsystem in V . Dann gilt fur jedesv ∈ V die Besselsche Ungleichung

‖v‖ ≥

√√√√ n∑i=1

|λi|2.

mitλi =< v, vi > fur alle i = 1, . . . , n.

Gleichheit gilt genau dann, wenn

v ∈ span {v1, . . . , vn}

ist (Parsevalsche Gleichung). In diesem Fall gilt

v =n∑i=0

λivi.

Dies ist insbesondere dann fur alle v ∈ V der Fall, wenn v1, . . . , vn eine Ortho-normalbasis bilden.

Beweis: Zu v ∈ V definieren wir

v =n∑i=1

λivi.

mit λi = 〈v, vi〉 fur i = 1, . . . , n. Dann gilt

〈v − v, vj〉 = 〈v, vj〉 − 〈v, vj〉

= 〈v, vj〉 −n∑i=1

λi〈vi, vj〉

= 〈v, vj〉 − λj= 0.

fur alle j = 1, . . . , n. Man erhalt

v − v ⊥ v.

Page 160: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

160 KAPITEL 4. DAS SKALARPRODUKT

Es folgt aus Satz 4.44

‖v‖2 = ‖v − v‖2 + ‖v‖2 ≥ ‖v‖2

Nun berechnet man

‖v‖2 = 〈v, v〉

= 〈n∑i=1

λivν ,

n∑i=1

λivν〉

=n∑i=1

n∑j=1

λiλj〈vi, vj〉

=n∑i=1

|λi|2.

Damit ist die Besselsche Ungleichung bewiesen. Die Gleichheit gilt außerdemnur dann, wenn v = v ist. 2

4.53. Bemerkung: Wenn wir in einem Skalarproduktraum V ein abzahlbaresOrthornormalsystem

M = {v1, v2, . . .}

von paarweise verschiedenen Vektoren vi, i ∈ N, haben, so folgt die allgemeineBesselsche Ungleichung

‖v‖2 ≥∞∑i=1

|〈v, vi〉|2

fur alle v ∈ V . Wenn hier Gleichheit fur alle v ∈ V gilt, so nennt man M eineSchauder-Basis von V . In diesem Fall konvergiert die Folge

n∑i=1

< v, vi > vi

mit n→∞ gegen v. Dieser Sachverhalt ist Gegenstand der Funktionalanalysis.

4.54 Aufgabe: Sei v1, . . . , vn ein Orthonormalsystem in V , sowie

v = λ1v1 + . . .+ λnvn

Zeigen Sie

‖v‖ = |λ1|2 + . . .+ |λn|2.

Sei

w = µ1v1 + . . .+ µnvn.

Zeigen Sie

〈v, w〉 =

n∑ν=1

λνµν

Page 161: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 161

Abbildung 4.1: Orthogonale Projektion von v auf den Unterraum g

4.2.2 Orthogonale Projektion

Senkrechte Vektoren sind hauptsachlich nutzlich, um kurzeste Abstande zu fin-den. Dabei wird der Abstand mit Hilfe der zum Skalarprodukt zugehorigenNorm gemessen.

In Abbildung 4.1 ist geometrisch klar, dass die Verbindung v−w unter allenw ∈ g am kurzesten wird, wenn v − w senkrecht auf dem Unterraum g steht.Wir werden dies prazisieren und beweisen.

4.55. Definition: Fur eine nicht-leere Teilmenge A ⊆ V eines metrischenRaums V und ein v ∈ V definieren wir den Abstand von v zu A als

d(v,A) = inf{d(v, x) : x ∈ A}.

4.56. Bemerkung: Dieses Infimum existiert, weil die Menge der Abstanded(v, x), x ∈ A nicht leer und nach unten durch 0 beschrankt ist. Das Infimumbraucht aber kein Minimum zu sein. So ist etwa

d(0, ]1, 2[) = 1

in R aber kein Punkt im Intervall ]1, 2[ hat den minimalen Abstand.

4.57 Satz: Sei V ein Skalarproduktraum uber K. Sei v ∈ V , und A = a + Uein affiner Unterraum des Vektorraums V , also U ein Unterraum von V . Danngilt fur w ∈ A genau dann

‖v − w‖ = d(v,A),

Page 162: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

162 KAPITEL 4. DAS SKALARPRODUKT

wennv − w ⊥ U

ist. w ist in diesem Fall eindeutig bestimmt, und es gilt

‖v − w‖2 + ‖w − w‖2 = ‖v − w‖2

fur alle w ∈ A.

Beweis: Sei zunachst die Orthogonalitatsbedingung

v − w ⊥ U

erfullt. Sei w ∈ A. Dann gilt w − w ∈ U und daher

‖v − w‖2 = ‖v − w‖2 + ‖w − w‖2

nach Sath 4.44. Es folgt, dass ‖v − w‖ minimal ist, und dass w das eindeutigbestimmte Minimum ist.

Sei nun umgekehrt w minimal, also

‖v − w‖ = d(v,A).

Sei u ∈ U und λ > 0. Dann gilt

‖v − (w − λu)‖2 = ‖(v − w) + λu‖2

= ‖v − w‖2 + ‖λu‖2 + 2Re 〈v − w, λu〉.

Nun ist w − λu ∈ A und daher

2Re 〈v − w, λu〉 = ‖v − (w − λu)‖2 − ‖v − w‖2 − ‖λu‖2

≥ −‖λu‖2.

Division durch λ ergibt

2Re 〈v − w, u〉 ≥ −λ‖u‖2.

fur alle λ > 0. Es folgtRe 〈v − w, u〉 ≥ 0.

Da u ∈ U beliebig war, gilt diese Bedingung fur alle u ∈ U . Also auch

Re 〈v − w,−u〉 = −Re 〈v − w, u〉 ≥ 0.

Es folgtRe 〈v − w, u〉 = 0 fur alle u ∈ U.

Nach Bemerkung 4.42 bedeutet dies v − w ⊥ U . 2

Der obige Satz behauptet nicht, dass immer ein Element bester Approxima-tion existieren muss. In der Tat ist das auch nicht richtig. Wenn aber U endlichdimensional ist, so muss immer eine beste Approximation existieren, wie derfolgende Satz konstruktiv zeigt.

4.58 Satz: Sei V ein Skalarproduktraum A = a + U ein affiner Unterraum,wobei U ein endlich dimensionaler Unterraum von V sei. Dann existiert zujedem v ∈ V ein w ∈ U , so dass ‖v − w‖ minimal unter allen w ∈ A wird.

Page 163: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 163

Beweis: Sei v1, . . . , vn eine beliebige Basis des Unterraums U . Wir suchen zuv ∈ V ein w ∈ a+ U mit v − w ⊥ U . Gesucht sind also λ1, . . . , λn mit

v − (a+n∑i=1

λivi) ⊥ vj fur alle j = 1, . . . , n

Dies ist aquivalent zu

〈v − a, vj〉 −n∑i=1

λi〈vi, vj〉 = 0 fur alle j = 1, . . . , n

Alson∑i=1

λi〈vi, vj〉 = 〈v − a, vj〉 fur alle j = 1, . . . , n.

Dies ist offenbar ein lineares Gleichungssystem fur λ1, . . . , λn. Das Gleichungs-system ist immer losbar. Denn die zugehorige Matrix ist die darstellende Matrixdes Skalarproduktes auf U und daher regular nach Satz 4.7. 2

4.59. Bemerkung: Wenn v1, . . . , vn eine Orthonormalbasis von U ist, so ver-einfacht sich die darstellende Matrix zur Einheitsmatrix In und wir erhalten

λi = 〈v − a, vi〉 fur alle i = 1, . . . , n.

Wenn v1, . . . , vn lediglich ein Orthogonalsystem ist, so berechnet man das mi-nimale Element aus a+ U als

w = a+n∑i=1

〈v − a, vi〉〈vi, vi〉

vi ∈ U,

Das ist bedeutend einfacher als das Losen eines linearen Gleichungssystems wieim Beweis des Satzes. Dies ist einer der Grunde fur die Wichtigkeit von Ortho-normalbasen.

4.60. Bemerkung: Das Orthonormalisierungs-Verfahren von Gram-Schmidtlasst sich also folgendermaßen deuten. Wenn v1, . . . , vn ein Orthogonalsystemist und

v /∈ span {v1, . . . , vn} = U.

Dann ist also

w =n∑i=1

〈v, vi〉〈vi, vi〉

vi

das Element minimalen Abstands zu v aus U . Es gilt

v − w ⊥ U.

Daher setzen wir

vn+1 = v − w = v −n∑i=1

〈v, vi〉〈vi, vi〉

vi.

Page 164: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

164 KAPITEL 4. DAS SKALARPRODUKT

Wir halten noch den folgenden wichtigen Satz fest. Man nennt die dortdefinierte Abbildung die orthogonale Projektion.

4.61 Satz: Sei U ein endlich dimensionaler Unterraum eines Skalarproduk-traumes V . Die Abbildung

π : V → U,

die v ∈ V das Element minimalen Abstands aus U zuordnet, ist eine lineareAbbildung. Es gilt π2 = π und

v − π(v) ⊥ U fur alle v ∈ V .

Beweis: Wir wahlen eine Orthonormalbasis v1, . . . , vn von U . Dann ist auf-grund der vorigen Bemerkung

π(v) =n∑i=0

〈v, vi〉vi,

also eine lineare Abbildung. Wegen π(v) ∈ U ist π(π(v)) = π(v). Die letzteBehauptung ist Gegenstand von Satz 4.57. 2

4.62 Satz: Sei u1, . . . , uk ∈ Kn ein Orthormalsystem bezutlich des kanoni-schen Skalarprodukts in Kn und

U = span {u1, . . . , uk},

sowie πU : V → U die orthogonale Projektion auf U . Dann ist die darstellendeMatrix dieser Projektion bezuglich der kanonischen Einheitsmatrix

ME,E(πU ) =k∑ν=1

vνv∗ν

Beweis: Offenbar gilt(k∑ν=1

vνv∗ν

)vl =

k∑ν=1

vν(v∗νvl) = vl

fur l = 1, . . . , k. Andererseits(k∑ν=1

vνv∗ν

)v =

k∑ν=1

vν(v∗νv) = 0

fur jedes v ∈ U⊥. Erweitert man v1, . . . , vk zu einer Orthonormalbasis von v, sostimmt die Abbildung

v 7→

(k∑ν=1

vνv∗ν

)v

also auf dieser Basis mit πU uberein. 2

Page 165: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 165

4.63. Beispiel: Die Spiegelung φ an der durch die orthonormalen Vektoren

v1, . . . , vk ∈ Rn

erzeugten Ebene U hat also die darstellende Matrix

2

(k∑ν=1

vνvTν

)− In.

Dennφ(v) = v − 2(v − πU (v)) = 2πU (v)− v.

Wir spiegeln etwa in R2 an der Winkelhalbierenden und erhalten

2 · 1√2

(11

)· 1√

2

(1 1

)− I2 =

(0 11 0.

)

Abbildung 4.2: Geometrische Interpretation des Skalarprodukts.

4.64. Beispiel: Sei w ∈ R2 \ {0} und

G = span {w}.

Fur v ∈ R2 \G ist dannv − s ⊥ G.

mit

s =〈v, w〉〈w,w〉

w

Im linken Bild der Abbildung 4.2 ist v, w und das Element minimalen Abstandss eingezeichnet. Es gilt

‖s‖2 + ‖v − s‖2 = ‖v‖2.

Page 166: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

166 KAPITEL 4. DAS SKALARPRODUKT

Außerdem uberlegt man sich geometrisch in dieser Abbildung

cosα =‖s‖‖v‖

=|〈v, w〉||〈w,w〉|

‖w‖ 1‖v‖

=|〈v, w〉|‖w‖ ‖v‖

.

In der linken Abbildung gilt daher 〈v, w〉 > 0, also

〈v, w〉 = ‖v‖ ‖w‖ cosα.

Im rechten Bild ist 〈v, w〉 < 0 und es gilt dasselbe, wie man sich ebenfallsuberlegt. Die Menge

H = {v ∈ R2 : 〈v, w〉 > 0}

ist also die Halbebene aller Vektoren, die einen spitzen Winkel mit w bilden.Aufgrund von | cosα| ≤ 1 erklart diese Formel auch die Schwarzsche Ungleichung

|〈v, w〉| ≤ ‖v‖ ‖w‖.

4.65 Aufgabe: (a) Zeigen Sie, dass der kurzeste Abstand von einem Punkt x ∈ R2

zur Geraden

G = {a+ λv : λ ∈ R}

im R2 durch die Formel

d(x,G) =|〈x− a, v〉|‖v‖

gegeben ist fur jeden Vektor v ⊥ v, v 6= 0. Was hat das mit der aus der Schulebekannten Hesseschen Normalform zu tun?

(b) Wie muss man (a) im Fall von Ebenen im R3 modifizieren?

(c) Zeigen Sie

d(x,G)2 = ‖x− a‖2 − |〈x− a, v〉|2

‖v‖2 .

4.66 Aufgabe: Sei V = P1, der Raum der linearen Funktionen mit der Basis

v0(t) = 1, v1(t) = t,

sowie f(t) = t2. Wir versehen C[0, 1] mit dem Skalarprodukt aus 4.51. Verwenden Sie

die Methode aus dem Beweis von Satz 4.58, um die beste Approximation bzgl. P1 an

f zu berechnen.

4.67 Aufgabe: (a) Seien E = a+ U und F = b+ V zwei affine Unterraume des Rn,die sich nicht schneiden (U und V seien Unterraume des Rn). Zeigen Sie dass v ∈ Eund w ∈ F genau dann Elemente mit minimalen Abstand

‖v − w‖ = inf{‖v − w‖ : v ∈ E, w ∈ F}

sind, wenn

v − w ⊥ U, v − w ⊥ V

gilt.

(b) Stellen Sie mit Hilfe von Basen u1, . . . , uk von U und v1, . . . , vl von V ein lineares

Gleichungssystem zur Berechnung von v und w auf.

Page 167: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 167

4.2.3 Orthogonale Abbildungen

In der Geometrie der Ebene oder des Raumes sind wir besonders an Abbildungeninteressiert, die die Abstande von Punkten erhalten. Solche Abbildungen nenntman Bewegungen. Dieses Konzept ist auch in beliebigen Skalarproduktraumennutzlich.

4.68. Definition: Seien V , W Skalarproduktraume und φ : V → W linear.Dann heißt φ orthogonale Abbildung, wenn sie orthonormale Systeme auforthonormale Systeme abbildet.

4.69. Beispiel: Die einzigen orthogonale Abbildungen von R2 in sich sind dieDrehungen und die Spiegelungen an einer Geraden. Anschaulich ist klar, dassdiese Abbildungen die Norm erhalten und senkrechte Vektoren auf senkrechteVektoren abbilden. Wir werden spater darauf zuruck kommen. Die einzigenorthogonale Abbildungen von R3 in sich sind Drehungen um eine feste Achseund Spiegelungen an Ebenen. Auch darauf werden wir spater zuruck kommen.

4.70. Bemerkung: Die in der Definition gegebene Bedingung fur Orthogona-litat einer Abbildung impliziert insbesondere, dass normierte Vektoren normiertbleiben. Wir werden im folgenden Satz sehen, dass dies schon genugt. Wir wer-den auch sehen, dass es genugt, dass eine einzige, gegebene Orthonormalbasis aufein Orthonormalsystem abgebildet wird. Oft wird ubrigens die Bedingung (2)des folgenden Satzes als Definition genommen.

4.71 Satz: Seien V , W Skalarproduktraume und φ : V → W linear. Dannsind aquivalent

(1) φ ist orthogonal.

(2) φ erhalt das Skalarprodukt. Das heißt

〈φ(v1), φ(v2)〉 = 〈v1, v2〉 fur alle v1, v2 ∈ V .

(3) φ erhalt die Norm. Das heißt

‖v‖ = ‖φ(v)‖ fur alle v ∈ V .

(4) φ bildet Vektoren mit Norm 1 auf Vektoren mit Norm 1 ab, also

‖v‖ = 1 ⇒ ‖φ(v)‖ = 1 fur alle v ∈ V .

(5) Eine einzige, feste Orthonormalbasis von V wird auf ein Orhtonormalsystemin W abgebildet.

Beweis: ”‘(1)⇒(4)”’: Dies folgt unmittelbar aus der Definition. Denn jederVektor mit Norm 1 bildet ein Orthonormalsystem.

”‘(4)⇒(3)”’: Aus (4) folgt fur alle v ∈ V , v 6= 0,

1‖v‖‖φ(v)‖ = ‖φ(

1‖v‖

v)‖ = 1,

also ‖φ(v)‖ = ‖v‖. Fur v = 0 ist das ohnehin klar.

Page 168: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

168 KAPITEL 4. DAS SKALARPRODUKT

”‘(3)⇒(2)”’: Wir erinnern uns an

Re 〈v1, v2〉 =14(‖v1 + v2‖2 − ‖v1 − v2‖2

).

Wenn also φ die Norm erhalt, so gilt

Re 〈φ(v1), φ(v2)〉 =14(‖φ(v1) + φ(v2)‖2 − ‖φ(v1)− φ(v2)‖2

)=

14(‖v1 + v2‖2 − ‖v1 − v2‖2

)= Re 〈v1, v2〉.

Wegen

Im 〈φ(v1), φ(v2)〉 = −Re 〈φ(iv1), φ(v2)〉 = −Re 〈iv1, v2〉 = Im 〈v1, v2〉

erhalt φ auch den Imaginarteil des Skalarprodukts.

”‘(2)⇒(1)”’: Wenn φ das Skalarprodukt erhalt, erhalt es die Normen von Vek-toren, und es bildet senkrechte Vektoren auf senkrechte Vektoren ab. Also ist φorthogonal.

”‘(1)⇒(5)”’ ist klar aufgrund der Definition von orthogonalen Abbildungen.

”‘(5)⇒(4)”’: Sei B eine Orthonormalbasis von V und v ∈ V mit ‖v‖ = 1. Wirstellen v bezuglich B durch

v = l1v1 + . . .+ λnvn

dar. Man berechnet nach Aufgabe 4.54

1 = ‖v‖ = |λ1|2 + . . .+ |λn|2.

Da nach Voraussetzung φ(v1), . . . , φ(vn) ein Orthonormalsystem in W bilden,erhalt man ebenso ‖φ(v)‖ = 1. 2

4.72 Satz: Seien V ein Skalarproduktraum mit Orthonormalbasis

A = {v1, . . . , vn}

und W ein Skalarproduktraum mit Orthonormalbasis

B = {w1, . . . , wm},

sowie φ : V → W linear. Dann ist φ genau dann orthogonal, wenn die Spaltenvon

M =MA,B(φ)

ein Orthonormalsystem im Rm bilden.

Beweis: Aufgrund der Eigenschaften der darstellenden Matrix gilt

φ(vk) = m1,kw1 + . . .+mm,kwm fur alle k = 1, . . . , n,

Page 169: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 169

wobei mi,j die Eintrage von M seien. Mit Aufgabe 4.54 erhalt man

〈φ(vk), φ(vl)〉 =m∑µ=1

mµ,kmµ,l.

Daraus folgt die Behauptung mit Hilfe des vorigen Satzes. 2

4.73 Aufgabe: Zeigen Sie, dass die Spalten einer Matrix A ∈ Km×n genau dann einOrthonormalsystem bilden wenn

A∗A = In

ist. Im Fall n = m ist also dann A regular und A−1 = A∗.

4.74. Definition: Eine regulare Matrix A ∈ Kn×n heißt unitare Matrix,wenn A−1 = A∗ ist. Eine reelle unitare Matrix nennt man auch orthogonaleMatrix.

4.75 Aufgabe: Zeigen Sie, dass mit A ∈ Kn×n auch AT , A∗ und A unitar sind. Also

bilden auch die Zeilen von A ein Orthonormalsystem.

4.76. Bemerkung: Seien der Kn und Km versehen mit dem Euklidschen Ska-larprodukt, und A ∈ Km×n. Dann ist die Abbildung

φA : Kn → Km

φA(x) = Ax

also genau dann orthogonal, wenn die Spalten von A ein Orthonormalsystemim Km bilden. Im Fall n = m muss dann also A unitar sein.

4.77. Beispiel: Die Drehung um den Winkel α

Dα =(

cos(α) − sin(α)sin(α) cos(α)

)ist eine orthogonale Abbildung. Im R3 ist die Drehung um eine beliebige Ach-se eine orthogonale Abbildung. Die Matrix der Drehung um die x1-Achse istbeispielsweise

Dα,x1 =

1 0 00 cos(α) − sin(α)0 sin(α) cos(α)

.

4.78 Aufgabe: Berechnen Sie Matrix der Hintereinanderausfuhrung zweier Drehun-

gen um Winkel α und β im R2 und vergleichen Sie mit der Drehung um α+ β.

4.79 Aufgabe: Berechnen Sie die Matrix einer Spiegelung an der von x ∈ R2 aufge-

spannten Geraden, x 6= 0.

4.80 Aufgabe: Geben Sie alle moglichen orthonormalen Matrizen A ∈ R2×2 an.

Zeigen Sie so, dass jede orthogonale Abbildung des R2 in sich eine Drehung ist oder

eine Drehung mit anschließender Spiegelung.

4.81 Aufgabe: Die Drehachse eine Drehung im R3 sei um den Winkel β zur z-

Achse geneigt und liege in der x-z-Ebene. Berechnen Sie die Matrix der Drehung um

Page 170: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

170 KAPITEL 4. DAS SKALARPRODUKT

diese Achse um den Winkel α, indem Sie die Drehung als Produkt von Drehungen um

Hauptachsen schreiben.

4.82 Aufgabe: Drehen Sie im R3 die x-y-Ebene einmal um die x-Achse nach linksund einmal um die y-Achse nach rechts um 23 Grad. Der Schnitt weist dann in denpositiven Oktanden.

(a) Geben Sie Gleichungen und senkrechte Vektoren fur die beiden gedrehten Ebenenan. Berechnen Sie den Winkel zwischen diesen Vektoren. Berechnen Sie den Winkelzwischen den beiden Ebenen, der nach unten (in Richtung −z) weist.

(b) Berechnen Sie den Richtungsvektor der Schnittgeraden und den Winkel, den dieser

Vektor zur x-y-Ebene hat.

4.83. Definition: Eine affine Abbildung ψ : V → V , V ein Skalarproduk-traum, heißt Bewegung, wenn die zugehorige lineare Abbildung orthogonalist.

Bei dieser Definition ist vorausgesetzt, dass ψ affin ist. Wir konnen aberin endlich dimensionalen Raumen Bewegungen unabhangig von der Linearitatcharakterisieren.

4.84 Satz: Sei V ein Skalarproduktraum. Eine Abbildung ψ : V → V istgenau dann eine Bewegung, wenn sie Abstande erhalt. Das heißt es gilt

‖ψ(v)− ψ(w)‖ = ‖v − w‖

fur alle v, w ∈ V .

Beweis: Gemaß Satz (3.152) und der darauf folgenden Bemerkungen genugtes zu zeigen, dass ψ Affinkombinationen von zwei Vektoren erhalt. Sei v, w ∈ V ,sowie λ+ µ = 1. Dann gelten mit

u = φ(λv + µw)

die Gleichungen

‖u− φ(v)‖ = |µ| ‖v − w‖,‖u− φ(w)‖ = |λ| ‖v − w‖,‖φ(v)− φ(w)‖ = ‖v − w‖.

Dieselben Gleichungen gelten auch fur

u = λφ(v) + µφ(w).

Wenn wir also zeigen, dass es nur eine Losung der Gleichungen gibt, so folgtu = u und damit die Behauptung. Man kann die Eindeutigkeit mit Hilfe derfolgenden Aufgabe nachweisen. 2

4.85 Aufgabe: Bezeichne fur einen Skalarproduktraum

Dr(x) := {y ∈ V : ‖x− y‖ ≤ r}

die ”‘Kugel”’ mit Radius r um x.

(1) Wenn dannDr(x) ⊂ Dρ(y)

Page 171: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 171

gilt, so gilt r ≤ ρ, und fur r < ρ haben Dr(x) und Dρ(y) hochstens einen Punktgemeinsam.

(2) WennDr(x) ⊂ V \Dρ(y)

ist, so haben Dr(x) und Dρ(y) hochstens einen Punkt gemeinsam.

4.2.4 Orthogonale Unterraume

Wir haben schon definiert, wann ein Vektor senkrecht auf einem Unterraumist. Was ist nun die Menge aller Vektoren, die auf einem Unterraum senkrechtstehen?

4.86. Definition: Sei U ein Unterraum eines Skalarproduktraums V . Danndefinieren wir

U⊥ := {v ∈ V : v ⊥ U}.

4.87 Aufgabe: Zeigen Sie, dass U⊥ ein Unterraum von V ist.

4.88 Satz: Sei V ein Skalarproduktraum und U ein Unterraum von V . Danngilt

U ⊆ (U⊥)⊥

Wenn V endlich dimensional ist, so gilt

U = (U⊥)⊥

undV = U ⊕ U⊥,

und daherdimV = dimU + dimU⊥.

Beweis: Sei u ∈ U . Fur alle v ∈ U⊥ gilt dann v ⊥ u, also auch u ⊥ v. Esfolgt u ∈ (U⊥)⊥.

Wenn V endlich dimensional ist, so gibt es eine Orthonormalbasis u1, . . . , ukvon U . Wir erganzen diese Basis zu einer Orthonormalbasis

u1, . . . , uk, uk+1, . . . , un

von V . Falls

u =n∑ν=1

λνuν

in U⊥ ist, so muss auch 〈u, uν〉 = 0 fur ν = 1, . . . , k sein. Also λ1 = . . . = λk = 0.Es folgt

U⊥ ⊆ span {uk+1, . . . , un}.

Aber ”‘⊇”’ ist auch leicht zu sehen. Daraus folgt die Behauptung. Da die beidenBasen von U und U⊥ sich zu einer Basis von V erganzen, folgt V = U ⊕ U⊥.2

Page 172: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

172 KAPITEL 4. DAS SKALARPRODUKT

4.89 Satz: Sei V ein endlich-dimensionaler Skalerproduktraum und E =a+ U ein affiner Unterraum von E. Dann gilt fur alle v ∈ V

d(v,E) = ‖πU⊥(v − a)‖,

wobei πU⊥ die orthogonale Projektion auf U⊥ bezeichne.

4.90 Aufgabe: Beweisen Sie diesen Satz.

4.91 Aufgabe: Was passiert im obigen Satz im Fall dimU = 0 oder dimU = dimV .

4.92. Bemerkung: In unendlich dimensionalen Vektorraumen muss (U⊥)⊥

nicht gleich U sein gelten. In C[a, b] gilt beispielsweise

P⊥ = {0},

wobei P der Unterraum aller Polynome (beliebigen Grades) ist mit dem Skalar-produkt aus Beispiel 4.17. Dies folgt aus dem Satz von Weierstraß, auf den wirhier nicht weiter eingehen konnen. Es gilt also

(P⊥)⊥ = C[a, b] 6= P.

4.93 Aufgabe: Sei π : V → U die orthogonale Projektion auf den Unterraum U desendlich dimensionalen Skalarproduktraums V . Zeigen Sie

Kern π = (Bild π)⊥.

4.2.5 Die adjungierte Abbildung

Die adjungierte Abbildung ist ein in Funktionenraumen wichtiges Hilfsmittel.Wir leiten sie hier nur fur endlich dimensionale Raume her.

Der folgenden Satz heißt in unendlich dimensionalen Vektorraumen Riesz-scher Darstellungssatz. Man benotigt dort aber die zusatzliche Vorausset-zungen, dass das Funktional stetig und der Raum ein sogenannter Hilbertraumist. Wir konnen hier darauf nicht weiter eingehen.

4.94 Satz: Sei V ein endlich dimensionaler Skalarproduktraum und φ : V →K linear. Dann gibt es genau ein u ∈ V mit

φ(v) = 〈v, u〉 fur alle v ∈ V .

Beweis: Falls φ = 0 ist, so erfullt u = 0 die Darstellung, und man muss auchu = 0 wahlen. Ansonsten ist Kern φ eine n − 1-dimensionaler Unterraum vonV , wobei n = dimV sei. Wir wahlen

u ∈ (Kern φ)⊥, ‖u‖ = 1.

Wir setzenu = φ(u) u,

Page 173: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.2. ORTHOGONALITAT 173

also φ(u) = |φ(u)|2. Jedes v ∈ V lasst sich nun eindeutig darstellen als

v = v1 + v2, v1 ∈ Kern φ, v2 ∈ (Kern φ)⊥ = span {u}.

Also existiert ein λ ∈ K mit v2 = λu. Es folgt

φ(v) = φ(v2) = λφ(u) = λ|φ(u)|2.

Andererseits〈v, u〉 = 〈v1 + λu, u〉 = λ〈u, u〉 = λ|φ(u)|2.

Es folgt φ(v) = 〈v, u〉 fur alle v ∈ V . Wenn u ein weiteres Element mit dieserEigenschaft ist, so folgt

〈v, u− u〉 = 〈v, u〉 − 〈v, u〉 = 0

fur alle v ∈ V . Also u− u = 0. 2

4.95. Bemerkung: Sei V = Kn und 〈·, ·〉 ein Skalarprodukt auf V mit dar-stellender Matrix H. Dann besitzt φ : V → K eine darstellende Matrix. Alsoexistiert ein a ∈ Kn mit

φ(v) = aT v fur alle v ∈ Kn

Wir setzen u = H−1a, also Hu = a, und erhalten

φ(v) = φ(v)T = vTa = vTHu = 〈v, u〉.

Der obige Satz kann also im Kn auf diese einfache Weise bewiesen werden.

Auch fur den folgenden Satz gibt es einen einfachen Beweis im Kn. Wirgeben aber zunachst einen anderen Beweis.

4.96 Satz: Seien V und W endlich dimensionale Skalarproduktraume undφ : V →W linear. Dann gibt es eine eindeutig bestimmte Abbildung φ∗ : W → Vmit

〈φ(v), w〉 = 〈v, φ∗(w)〉 fur alle v ∈ V , w ∈W .

Man nennt diese Abbildung die adjungierte Abbildung.

Beweis: Fur festes w ∈W ist die Abbildung

v 7→ 〈φ(v), w〉

linear. Es folgt die Existenz eines eindeutig bestimmten u ∈ V mit

〈φ(v), w〉 = 〈v, u〉 fur alle v ∈ V .

Wir setzen φ∗(w) = u, und diese Wahl ist auch eindeutig. Es gilt dann also diegewunschte Beziehung fur alle v ∈ V , w ∈W . Um zu zeigen, dass φ∗ linear ist,beachten wir

〈v, φ∗(w1 + w2)〉 = 〈φ(v), w1 + w2〉= 〈φ(v), w1〉+ 〈φ(v), w2〉= 〈v, φ∗(w1)〉+ 〈v, φ∗(w2)〉= 〈v, φ∗(w1) + φ∗(w2)〉.

Page 174: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

174 KAPITEL 4. DAS SKALARPRODUKT

fur alle v ∈ V . Es folgt

φ∗(w1 + w2) = φ∗(w1) + φ∗(w2).

Analog zeigt man φ∗(λw) = λφ∗(w). 2

4.97. Definition: Sei φ ein Skalarproduktraum. Dann heißt φ : V → Vselbstadjungiert, wenn φ = φ∗ ist.

Der folgende Satz erklart, warum wir Hermitesche Matrizen auch selbstad-jungiert nennen.

4.98 Satz: Seien V und W endlich-dimensionale Skalarproduktraume, A eineOrthonormalbasis von V und B eine Orthonormalbasis von W . Dann gilt

MB,A(φ∗) =MA,B(φ)∗

Eine Abbildung φ : V → V ist also genau dann selbstadjungiert, wenn diedarstellende Matrix MA,A(φ) Hermitesch ist.

Beweis: Sei λ die Darstellung von v ∈ V bezuglich A und µ die Darstellungvon w ∈ W bezublich B. Da MA,B(φ)λ die Darstellung von φ(v) bezuglich Bist, gilt

〈φ(v), w〉 = (MA,B(φ)λ)Tµ = λT (MA,B(φ)∗µ).

Ebenso gilt〈φ(v), w〉 = 〈v, φ∗(w)〉 = λT (MB,A(φ∗)µ).

Da dies fur alle λ und alle µ gilt, mussen die beiden Matrizen gleich sein. 2

4.99. Bemerkung: Die Abbildung φ(x) = Ax mit A ∈ Kn×n ist also genaudann selbstadjungiert, wenn A Hermitesch ist.

4.3 Anwendungen

4.3.1 Ausgleichsrechung und Lineare Regression

Ein Spezialfall der orthogonale Projektion tritt auf, wenn der Unterraum dieForm

U = {Ax : x ∈ Km} = Bild A

hat, wobei A ∈ Kn×m eine Matrix ist. Wir suchen das Element minimimalenAbstands zu b ∈ Kn. Dies ist aquivalent damit, den Ausdruck

‖Ax− b‖

fur x ∈ Kn zu minimieren. Man nennt dieses Problem das Problem der Aus-gleichsrechnung. Obwohl das System Ax = b nicht losbar ist, wird ein x ∈ Kn

gesucht, das den Fehler ‖Ax− b‖ minimiert.

4.100 Satz: Sei A ∈ Kn×m und b ∈ Km. Dann minimiert x ∈ Kn genaudann den Fehler

‖Ax− b‖

Page 175: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.3. ANWENDUNGEN 175

wenn es die Normalgleichung

A∗Ax = A∗b

lost. Wenn x0 eine bestimmte Losung des Ausgleichsproblem ist, so gilt fur alleanderen Losungen

x ∈ x0 + Kern A.

Falls Rang A = m ist (insbesondere m ≥ n), so ist das Ausgleichsproblemeindeutig losbar.

Beweis: Setzt man U = Bild A, so gibt es ein eindeutig bestimmtes Element

u0 = Ax0 ∈ U

mit minimalem Abstand zu b. Nach unserer Theorie muss fur das x0 gelten

b−Ax0 ⊥ u fur alle u ∈ U.

Es folgt nach Aufgabe 4.9

〈b−Ax0, Ax〉 = 〈A∗b−A∗Ax0, x〉 = 0 fur alle x ∈ Kn

Dies ist nur dann der Fall, wenn

A∗Ax0 = A∗b

gilt. Da u0 eindeutig bestimmt ist, gilt fur alle Losungen x des Ausgleichspro-blems Ax = u0 = Ax0. Also

x ∈ x0 + Kern A.

Falls umgekehrt x0 die Gleichung A∗Ax = A∗b erfullt, so folgt nach der obigenRechnung b−Ax ⊥ U . Also ist x eine Losung des Ausgleichsproblems.

Sei nun Rang A = m. Dann folgt aus der Dimensionsformel dim Kern A = 0.Also ist das Ausgleichsproblem eindeutig losbar. 2

4.101. Bemerkung: Man beachte, dass m ≥ n der interessante Fall ist. Essind dann zuviele Gleichungen gegeben. Das lineare Gleichungssystem Ax = bist dann im Allgemeinen nicht losbar. Falls m < n ist und A vollen Rang mhat, so besitzt das Gleichungssystem immer mehrere Losungen, die alle dasAusgleichsproblem losen.

4.102. Bemerkung: Es gibt eine direktere Methode, die Normalgleichung zubegrunden. Sei

A∗Ax0 = A∗b

Durch konjugieren erhalt man ATAx0 = AT b. Dann berechnet man

‖Ax− b‖2 = (x− x0)TATA(x− x0)− xT0 ATAx0 + bT b.

Dieser Ausdruck wird fur x = x0 minimal, weil ATA positiv definit ist. Umge-kehrt erfullt jedes Minimum dieses Ausdrucks A(x− x0) = 0.

4.103 Aufgabe: Rechnen Sie die Gleichung in der obigen Bemerkung nach.

4.104 Aufgabe: Zeigen Sie

Rang A∗A = Rang A.

Page 176: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

176 KAPITEL 4. DAS SKALARPRODUKT

4.105. Beispiel: Das Ausgleichsproblem taucht auch in der linearen Regres-sion auf. Gegeben sind dort Messpunkte

t1, . . . , tn ∈ Rm

und Messwertes1, . . . , sn ∈ R.

Gesucht ist ein lineares affines Funktional

φa,b(t) = aT t+ b, a ∈ Rm, b ∈ R,

so dass|φa,b(t1)− s1|, . . . , |φ(tn)− sn|.

moglichst klein wird. Die lineare Regression minimiert nun die quadratischeFehlersumme

S(a, b) =n∑i=1

|φa,b(ti)− si|2.

unter allen a ∈ Rm, b ∈ R. Setzt man

M =

t1,1 . . . t1,m 1...

......

tn,1 . . . tn,m 1

, x =

a1

...amb

, s =

s1...sn

,

so istSa,b = ‖Mx− s‖2

fur x ∈ Rm+1 zu minimieren.

4.106 Aufgabe: Seien t1 < . . . < tn reelle Punkte und s1, . . . , sn ∈ R. MinimierenSie

n∑i=1

(ati + b− si)2.

Stellen Sie die Normalgleichung mit folgenden Abkurzungen auf

Σt =

n∑i=1

ti, Σs =

n∑i=1

si, Σtt =

n∑i=1

t2i , Σst =

n∑i=1

siti.

und bestimmen Sie auf diese Art und Weise die optimalen Wert a, b.

Page 177: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

4.3. ANWENDUNGEN 177

Abbildung 4.3: Lineare Regression einer Geraden.

Page 178: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

178 KAPITEL 4. DAS SKALARPRODUKT

Page 179: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Kapitel 5

Determinanten

5.1 Definition und Eigenschaften

5.1.1 Determinante als Flache

Abbildung 5.1: Determinante als Flache

Die Determinante taucht historisch zuerst als Formel zur Flachenberechnungund Volumenberechnung auf.

5.1. Beispiel: Wir versuchen mit elementargeometrischen Uberlegungen eineFormel fur die die von a und b abhangige Flache F (a, b) des Parallelogramms

179

Page 180: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

180 KAPITEL 5. DETERMINANTEN

in Abbildung 5.1 zu gewinnen, also die Flache von

P (a, b) = {λa+ µb : 0 ≤ λ, µ ≤ 1}.

Dazu bestimmen wir die Hohe des Parallelogramms. Der Vektor

b =(b2−b1

)steht offenbar senkrecht auf b. Daher kann man die Hohe h durch Projektionvon a auf die von b aufgespannte Gerade berechnen, also

|h| = |〈a, 1‖b‖

b〉|.

Fur die Flache ergibt sich F (a, b) = |h| ‖b‖. Wegen ‖b‖ = ‖b‖ erhalt man

F (a, b) = |〈a, b〉| = |a1b2 − a2b1|.

Als Determinante eine 2× 2-Matrix muss man also

det(a1 b1a2 b2

)= a1b2 − a2b1

setzen.

5.2. Beispiel: Im R3 wird die Flache durch das Volumen von

P (a, b, c) = {λ1a+ λ2b+ λ3b : 0 ≤ λ1, λ2, λ3 ≤ 1}

ersetzt. Fur dieses Volumen gilt ebenfalls eine relativ einfache Formel, namlich

V (a, b, c) = |det(a, b, c)|

mit

det

a1 b1 c1a2 b2 c2a3 b3 c3

= a1b2c3 + b1c2a3 + c1a2b3 − a1c2b3 − b1a2c3 − c1b2a3

Diese Formel nennt man Regel von Sarrus. Die Begrundung fur diese Formelliefern wir nach.

5.1.2 Permutationen

Zur Entwicklung der Determinante benotigen wir das Vorzeichen (Signum) ei-ner Permutation. Wir haben bereits die Menge aller Permutationen von 1, . . . , nals Sn definiert. Man kann nun jeder Permutation π ∈ Sn ein Vorzeichensign (π) ∈ {−1, 1} zuordnen, indem man die Anzahl der notwendigen Vertau-schungen zahlt. Dies geschieht am einfachsten mit der folgenden Definition.

5.3. Definition: Fur eine Permutation π ∈ Sn definieren wir

sign (π) = sign∏

1≤i<j≤n

(π(j)− π(i)).

Page 181: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.1. DEFINITION UND EIGENSCHAFTEN 181

Dabei ist mit sign auf der rechten Seite das Vorzeichen einer ganzen Zahl ge-meint. Man beachte, dass dieses Produkt nicht gleich Null sein kann.

5.4. Bemerkung: Es gilt

sign (π) =

∏1≤i<j≤n(π(j)− π(i))∏

1≤i<j≤n(j − i)

Denn der Zahler und der Nenner enthalten bis auf das Vorzeichen dieselbenFaktoren, und das Vorzeichen aller Faktoren des Nenners ist positiv.

5.5. Bemerkung: Zahlt man die Anzahl der vertauschten Stellen

k = |{(i, j) : 1 ≤ i < j ≤ n und π(j) < π(i)}|

so gilt offenbarsign (π) = (−1)k.

5.6. Definition: Eine einfache Vertauschung der Elemente i und j, die alleanderen Elemente von {1, . . . , n} festhalt, bezeichnen wir als (i j). Allgemeinbezeichnen wir fur paarweise verschiedene i1, . . . , ik in {1, . . . , n} mit

π = (i1 i2 . . . ik)

die zyklische Permutation

π(i1) = i2, . . . , π(ik−1) = ik, π(ik) = i1.

Dabei werden alle anderen Elemente festgehalten.

5.7 Aufgabe: Zeigen Sie fur i 6= j

sign (i j) = −1.

Vertauschungen haben also das Vorzeichen −1.

5.8 Satz: Fur zwei Permutationen π1, π2 ∈ Sn gilt

sign (π1 ◦ π2) = sign (π1) sign (π2).

Beweis: Es gilt

sign (π1 ◦ π2) =

∏1≤i<j≤n(π1(π2(j))− π1(π2(i)))∏

1≤i<j≤n(j − i)

=

∏1≤i<j≤n(π1(π2(j))− π1(π2(i)))∏

1≤i<j≤n(π2(j)− π2(i)

∏1≤i<j≤n(π2(j)− π2(i))∏

1≤i<j≤n(j − i).

Wir mussen also nur noch zeigen, dass

sign (π1) =

∏1≤i<j≤n(π1(j)− π1(i))∏

1≤i<j≤n(j − i)

=

∏1≤i<j≤n(π1(π2(j))− π1(π2(i)))∏

1≤i<j≤n(π2(j)− π2(i))

Page 182: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

182 KAPITEL 5. DETERMINANTEN

ist. Nun sind aber die Faktoren im Zahler

j − i, 1 ≤ i < j ≤ n

bis auf das Vorzeichen identisch mit den Faktoren

π2(j)− π2(i), 1 ≤ i < j ≤ n.

Die Anzahl der Vorzeichenanderungen ist gleich der Anzahl der i, j mit π2(j) <π2(i). Dasselbe gilt auch fur die Faktoren im Nenner, so dass insgesamt derBruch gleich bleibt. 2

5.9 Aufgabe: Zeigen Sie mit Hilfe dieses Satzes

sign (i1 . . . ik) = (−1)k−1

fur paarweise verschiedene i1, . . . , ik in {1, . . . , n}, indem sie diese zyklische Permuta-

tion als Produkt von k − 1 Vertauschungen schreiben.

5.10 Aufgabe: Zeigen Sie durch Induktion nach n, dass sich jede Permutation als

Produkt von Vertauschungen schreiben lasst.

5.11 Aufgabe: Berechnen Sie in S5 die Permutationen

(1 2 3) ◦ (3 4 5), (3 4 5) ◦ (1 2 3),

sowie(1 2 3) ◦ (4 5), (4 5) ◦ (1 2 3),

und die Vorzeichen dieser Permutationen. Uberlegen Sie sich, dass zyklische Permuta-

tionen vertauschbar sind, wenn sie keine gemeinsamen Elemente haben.

5.12 Aufgabe: Zeigen Sie, dass sich jede Permutation bis auf die Reihenfolge eindeu-

tig als Produkt von zyklischen Vertauschungen schreiben lasst, die keine gemeinsamen

Elemente haben.

5.13 Aufgabe: Zeigen Sie fur π ∈ Sn

sign π = sign π−1.

5.14 Aufgabe: Um einen Tisch sitzen n Personen. Bei einem zulassiger Platztausch

tauscht eine Person den Platz mit einer anderen, die m Platze weiter links sitzt (m <

n). Zeigen Sie, dass man genau dann durch zulassiges Platztauschen jede Sitzordnung

herstellen kann, wenn m und n teilerfremd sind.

5.1.3 Die Determinante

Die erste Beobachtung ist, dass das Volumen und die Flache linear von deneinzelnen Vektoren abhangen, wenn jeweils anderen Parameter fest bleiben.

5.15. Definition: Sei V ein Vektorraum uber K. Eine Abbildung

φ : V n → K

(v1, . . . , vn) 7→ φ(v1, . . . , vn) ∈ K

Page 183: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.1. DEFINITION UND EIGENSCHAFTEN 183

heißt Multilinearform, wenn fur alle i = 1, . . . , n die Abbildung

vi 7→ φ(v1, . . . , vn)

linear ist, wobei v1, . . . , vi−1, vi+1, . . . , vn fest gehalten werden.

5.16. Beispiel: Mit Hilfe von elementargeometrischen Uberlegungen zeigt manfur die Flache des Parallelogramms

F (a+ a, b) = F (a, b) + F (a, b),

sowie fur λ > 0F (λa, b) = λF (a, b).

Allerdings muss man fur negative λ der Flache ein Vorzeichen zuordnen. Dennfur Multilinearformen F (a, b) musste gelten

F (−a, b) = −F (a, b).

Fur die zweidimensionale Determinante

det(a, b) = a1b2 − a2b1

zeigt man leicht, dass det(a, b) eine Multilinearform ist.

5.17. Definition: Eine Multilinearform φ : V n → K heißt alternierendeMultilinearform, wenn sie 0 ist, sobald zwei Parameter gleich sind.

5.18 Satz: Sei φ : V n → K eine Multilinearform, und K ein Korper mit

1 + 1 6= 0.

Dann sind die folgenden Aussagen aquivalent.

(1) φ ist alternierend, z.B.

φ(v1, v1, v3, . . . , vn) = 0.

(2) φ(v1, . . . , vn) andert sich nicht, wenn man das λ-fachen von vi zu einem vjaddiert (j 6= i), z.B.

φ(v1, . . . , vn) = φ(v1 + λv2, . . . , vn).

(3) Fur v1, . . . , vn ∈ V , die nicht linear unabhangig sind, gilt

φ(v1, . . . , vn) = 0

(4) φ andert das Vorzeichen, wenn man zwei Parameter vertauscht, z.B.

φ(v1, v2, v3, . . . , vn) = −φ(v2, v1, v3, . . . , vn).

Beweis: (1) ⇒ (2): Man hat

φ(v1 + λv2, v2, . . . , vn) = φ(v1, v2, . . . , vn) + λφ(v2, v2, . . . , vn)= φ(v1, v2, . . . , vn).

Page 184: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

184 KAPITEL 5. DETERMINANTEN

(2) ⇒ (3): Sei z.B.v1 = λ2v2 + . . .+ λnvn.

Dann folgt durch Subtraktion von λ2v2, λ3v3 etc. von v1

φ(v1, v2, . . . , vn) = φ(0, v2, . . . , vn) = 0.

(3) ⇒ (4): Wir berechnen z.B.

0 = φ(v1 + v2, v1 + v2, v3, . . . , vn)= φ(v1, v1, . . . , vn) + φ(v1, v2, . . . , vn)

+ φ(v2, v1, . . . , vn) + φ(v2, v2, . . . , vn)= φ(v1, v2, . . . , vn) + φ(v2, v1, . . . , vn).

Es folgt die Behauptung.

(4) ⇒ (1): Es gilt z.B.

φ(v1, v1, v3, . . . , vn) = −φ(v1, v1, v3, . . . , vn),

worausφ(v1, v1, v3, . . . , vn) = 0

folgt, wenn x + x 6= 0 ist fur alle x 6= 0. Dies ist genau dann der Fall, wenn1 + 1 6= 0 in K ist. 2

5.19. Bemerkung: Falls 1 + 1 = 0 ist, so zeigt der Beweis des Satzes, dassdie Aussagen (1) bis (3) immer noch aquivalent sind, und das aus ihnen dieAussage (4) folgt. Aber aus Aussage (4) muss nicht mehr folgen, dass φ alter-nierend ist. Als Gegenbeispiel beachte man, dass in K = {0, 1} fur alle Elementex = −x gilt. Jede Multilinearform auf diesem Korper erfullt daher (4). Es gibtaber nicht alternierende Multilinearformen.

5.20. Beispiel: Die zweidimensionale Determinante ist alternierend. In der Tatgilt fur a, b ∈ R2

det(a, b) = a1b2 − a2b1 = −(b1a2 − b2a1) = − det(b, a).

5.21. Bemerkung: Sei φ : V n → K eine alternierende Multilinearform undv1, . . . , vn ∈ V . Dann ist

φ(vν1 , . . . , vνn)

fur 1 ≤ ν1, . . . , νn ≤ n also genau dann ungleich 0, wenn

νi = π(i)

fur eine Permutation π ∈ Sn ist. In diesem Fall kann man die Parameter durchsign π Vertauschungen umordnen und erhalt folglich

φ(vπ(1), . . . , vπ(n)) = sign (π) · φ(v1, . . . , vn).

5.22 Satz: Es gibt genau eine alternierende Multilinearform mit n Parame-tern auf dem Kn, die durch

φ(e1, . . . , en) = 1

Page 185: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.1. DEFINITION UND EIGENSCHAFTEN 185

normiert ist.

Beweis: Sei φ(a1, . . . , an) eine normierte alternierende Multilinearform. Seia1, . . . , an ∈ Kn, und

ai =

a1,i

...an,i

=n∑ν=1

aν,ieν .

Dann berechnen wir

φ(a1, . . . , an) =n∑

ν1=1

aν1,1φ(eν1 , a2, . . . , an)

= . . .

=n∑

ν1=1

aν1,1 . . .

n∑νn=1

aνn,nφ(eν1 , . . . , eνn)

=∑

1≤ν1,...,νn≤n

aν1,1 · . . . · aνn,nφ(eν1 , . . . , eνn)

=∑π∈Sn

aπ(1),1 · . . . · aπ(n),n sign (π).

Die letzte Gleichheit gilt, weil wir alle Summanden weglassen konnen, bei denenzwei ki gleich sind. Damit haben wir die eindeutige Bestimmtheit von φ gezeigt.

Wir mussen noch zeigen, dass diese Formel eine alternierende, normierteMultilinearform φ definiert. Es ist leicht zu sehen, dass φ eine Multilinearformist. Sei zum Beispiel a1 = a2. Dann gilt mit der Vertauschung σ = (1 2)

aπ(1),1aπ(2),2 . . . aπ(n),n sign (π)= −aπ◦σ(1),2aπ◦σ(2),1 . . . aπ◦σ(n),n sign (π ◦ σ).

Die Abbildungπ 7→ π ◦ σ

ist aber bijektiv, so dass die Permutationen π und π ◦ σ in Paaren auftreten.Daraus folgt

φ(a1, a1, a3 . . . , an) = 0.

Falls a1 = e1, . . . , an = en ist, so gilt

aπ(i),i = 0

fur π(i) 6= i. Es folgtφ(e1, . . . , en) = sign (id) = 1.

Also ist φ eine alternierende, normierte Multilinearform auf dem Kn. 2

5.23. Definition: Die durch den obigen Satz eindeutig definierte alternie-rende Multilinearform φ nennt man Determinantenform. Man definiert furMatrizen A ∈ Kn×n die Determinante

detA = φ(a1, . . . , an),

Page 186: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

186 KAPITEL 5. DETERMINANTEN

wobei a1, . . . , an die Spalten von A sind.

Die FormeldetA =

∑π∈Sn

aπ(1),1 · . . . · aπ(n),n sign (π).

nennt man Leibnitz-Formel.

5.24. Beispiel: Die Leibnitzsche Formel ergibt sofort die Formel

det(a1,1 a1,2

a2,1 a2,2

)= a1,1a2,2 − a1,2a2,1.

fur die Determinante einer Matrix aus K2×2. Denn in S2 gibt es nur die zweiPermutationen id und (1 2). Auch die Regel von Sarrus folgt sofort aus dieserFormel.

det

a1,1 a1,2 a1,3

a2,1 a2,2 a2,3

a3,1 a3,2 a3,3

= a1,1a2,2a3,3 + a1,2a2,3a3,1 + a1,3a2,1a3,2

− a1,1a2,3a3,2 − a1,2a2,1a3,3 − a1,3a2,2a3,1.

Denn hier besteht S3 aus id, den beiden Verschiebungen und den drei Vertau-schungen.

5.25 Satz: Es gilt fur A ∈ Kn×n

detA = detAT .

Beweis: Wenn π die Permutationen in Sn durchlauft, so durchlauft π−1

ebenfalls alle Permutationen in Sn. Man zeigt also mit Hilfe der LeibnitzschenFormel

detA =∑π∈Sn

aπ(1),1 · . . . · aπ(n),n sign (π)

=∑π∈Sn

a1,π−1(1) · . . . · an,π−1(n) sign (π)

=∑π∈Sn

a1,π−1(1) · . . . · an,π−1(n) sign (π−1)

=∑π∈Sn

a1,π(1) · . . . · an,π(n) sign (π)

= detAT .

2

5.26. Bemerkung: (1) Aufgrund dieses Satzes und Satz 5.18 andert sich dieDeterminante nicht, wenn man das λ-fache einer Zeile oder Spalte zu eineranderen addiert.

Page 187: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.1. DEFINITION UND EIGENSCHAFTEN 187

(2) Vertauschungen von Zeilen oder Spalten andern allerdings das Vorzeichender Determinante.

(3) Multiplikation einer Zeile oder Spalte mit λ multipliziert die Determinantemit λ.

Mit Hilfe dieser Operationen und dem folgenden Satz kann man die Deter-minante von Matrizen mit dem Gauß-Algorithmus berechnen.

5.27 Satz: Fur obere Dreiecksmatrizen ist die Determinante das Produkt derDiagonalelemente, also

det

d1 ∗. . .

0 dn

= d1 · . . . · dn.

Dasselbe gilt fur untere Dreiecksmatrizen.

Beweis: Falls eines der Diagonalelemente 0 ist, so ist die Determinante 0, weildann eine der Spalten von den vorherigen linear abhangig ist. Seien also alleDiagonalelemente verschieden von 0. Dann kann man durch Zeilenoperationen,die die Determinante nicht andern, die Matrix auf Diagonalform bringen, alsomit Hilfe der Linearitat und der Normierung

det

d1 ∗. . .

0 dn

= det

d1 0. . .

0 dn

= d1 · . . . · dn · det(In)= d1 · . . . · dn.

2

5.28 Aufgabe: Berechnen Sie

det

2 1 . . . 1

1 2. . .

......

. . .. . . 1

1 . . . 1 2

Ziehen Sie dazu die (n− 1)-te Spalte von der n-ten ab etc., und addieren Sie dann die

n-te Zeile zur (n− 1)-ten Zeile etc.

Der folgende Satz ist von zentraler Bedeutung und eine der wesentlichstenAnwendungen der Determinante.

5.29 Satz: A ∈ Kn×n ist genau dann regular wenn

detA 6= 0

ist.

Eine quadratische Matrix ist genau dann regular, wenn ihreDeterminante ungleich 0 ist.

Page 188: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

188 KAPITEL 5. DETERMINANTEN

Beweis: Aufgrund von Satz 5.18 ist die Determinante von nicht regularenMatrizen gleich 0.

Sei andererseits A regular. Dann lasst A sich mit elementaren Zeilenumfor-mungen auf Diagonalgestalt mit Diagonaleintragen ungleich 0 bringen. Dabeiandert sich hochstens das Vorzeichen der Determinanten. Also folgt detA 6= 0.2

5.30 Satz: Fur A,B ∈ Kn×n gilt

det(AB) = (detA)(detB).

Beweis: Falls detA = 0 ist, so ist A nicht regular wegen Satz 5.18. Deswegenist AB ebenfalls nicht regular. Es folgt in diesem Fall wieder mit Hilfe vonSatz 5.18 detAB = 0.

Sei also detA 6= 0 und daher A regular. Wir zeigen dann, dass

φ(B) =det(AB)det(A)

eine Determinantenform in B ist. Daraus folgt φ(B) = detB wegen der Eindeu-tigkeit der Determinante.

Schreibt man allerdings φ in der Form

φ(b1, . . . , bn) =1

detAdet(Ab1, . . . , Abn),

so ist leicht zu sehen, dass φ eine alternierende Multilinearform ist. φ(In) = 1ist ebenfalls erfullt. 2

5.31. Bemerkung: Der Determinantenmultiplikationssatz kann auch mit Hilfevon Satz 3.122 bewiesen werden. Dazu genugt offensichtlich, dass

det(EA) = det(E) det(A)

fur Elementarmatrizen E und beliebige quadratische Matrizen A ist.

5.32 Aufgabe: Zeigen Sie fur regulare Matrizen A ∈ Kn×n

detA−1 =1

detA.

5.33 Aufgabe: Zeigen Sie, dass ahnliche Matrizen dieselbe Determinante haben.

5.34. Definition: Nach der obigen Aufgabe hangt die Determinante nichtvon der darstellenden Matrix ab. Man kann also die Determinante detφ einesEndomorphismus φ : V → V durch

detφ = detMA,A(φ)

definieren, wenn V ein endlich dimensionaler Vektorraum und A eine Basis vonV ist.

Page 189: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.1. DEFINITION UND EIGENSCHAFTEN 189

Der folgende Entwicklungssatz von Laplace gibt eine weitere Moglich-keit, die Determinante zu berechnen. Der Aufwand ist allerdings gegenuber demGauß-Algorithmus erheblich.

5.35 Satz: Zu einer Matrix A ∈ Kn×n bezeichnen wir mit

Ai,j ∈ K(n−1)×(n−1)

die Matrix, die aus A entsteht, indem man die i-te Zeile und die j-te Spaltestreicht. Dann gilt fur alle j = 1, . . . , n

detA =n∑i=1

(−1)i+jai,j detAi,j .

Ebenso gilt fur alle i = 1, . . . , n

detA =n∑j=1

(−1)i+jai,j detAi,j .

Beweis: Wir zeigen die zweite Gleichung, indem wir zeigen, dass

φ(a1, . . . , an) =n∑j=1

(−1)i+jai,j detAi,j

fur festes i ∈ {1, . . . , n} eine alternierende, normierte Multilinearform ist. Dar-aus folgt die Behauptung. Die erste Gleichung folgt durch Transponieren wegenSatz 5.25.

Es gilt zum Beispiel

φ(a1 + a1, a2, . . . , an) = (ai,1 + ai,1) detAi,1

+n∑j=2

(−1)i+jai,j(detAi,j + det Ai,j)

=n∑j=1

(−1)i+jai,j detAi,j +n∑j=1

(−1)i+j ai,j det Ai,j

= φ(a1, . . . , an) + φ(a1, . . . , an).

Dabei entstehe die Matrix A aus A, indem man die erste Spalte a1 durch a1

ersetzt. Analog zeigt man die multiplikative Linearitat. φ ist also eine Multili-nearform.

Wenn etwa die ersten beiden Spalten von A gleich sind, so heben sich die ers-ten beiden Summanden von φ gegeneinander auf und die anderen Summandensind gleich 0. Analog behandelt man alle anderen Falle von gleichen Spalten.

Man rechnet sofort nach, dass

φ(e1, . . . , en) = 1

gilt. φ ist also auch normiert. 2

Page 190: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

190 KAPITEL 5. DETERMINANTEN

5.36. Bemerkung: Man beachte das Vorzeichen (−1)i+j . Die Verteilung diesesVorzeichens in einer Matrix ist schachbrettartig, etwa fur 3× 3-Matrizen+ − +

− + −+ − +

.

5.37. Beispiel: Entwickelt man die Determinante von

An =

2 1 01 2 1

. . . . . . . . .1 2 1

0 1 2

∈ Rn×n

nach der ersten Spalte, so erhalt man

detAn = 2 detAn−1 − det

1 0 01 2 1

. . . . . . . . .1 2 1

0 1 2

Entwickelt man diese Matrix wieder nach der ersten Zeile, so erhalt man dieRekursionsformel

detAn = 2 detAn−1 − detAn−2.

mit den Anfangswerten

detA1 = 2, detA2 = 3.

Man zeigt per InduktiondetAn = n+ 1.

5.38 Aufgabe: Berechnen Sie diese Determinante mit dem Gauß-Algorithmus.

5.39 Aufgabe: Leiten Sie die Formeln fur die Determinante von 2× 2-Matrizen und

3× 3-Matrizen durch Entwicklung nach der ersten Spalte her.

Der folgende Satz ist oft sehr nutzlich, um Determinanten zu berechnen,wenn Matrizen vorliegen, die aus Blocken von Matrizen bestehen, so dass dieBlocke in der Diagonalen quadratisch sind und unterhalb dieser Blocke nur 0steht. Man nennt solche Matrizen Blockdiagonalmatrizen.

5.40 Satz: Sei A eine Matrix der Form

A =

D1 ∗. . .

0 Dk

∈ Kn×n.

Dabei seien die Matrizen D1, . . . , Dk selbst wieder quadratische Matrizen. Danngilt

det(A) = det(D1) · . . . · det(Dk).

Page 191: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.2. ANWENDUNGEN 191

5.41 Aufgabe: Beweisen Sie diesen Satz, indem Sie Gauß-Transformationen auf A

anwenden.

5.42. Beispiel:

det

1 2 ∗ ∗2 1 ∗ ∗0 0 2 ∗0 0 0 3

= (1− 4) · 2 · 3 = −18.

5.43 Aufgabe: Berechnen Sie fur x ∈ R und a0, . . . , an ∈ R

det

x an−1 x an−1

. . .. . .

...−1 x a1

−1 a0 + x

Alle nicht bezeichneten Matrixelemente sind dabei gleich 0.

5.2 Anwendungen

5.2.1 Cramersche Regel

Man kann die Determinante anwenden, um Gleichungssysteme oder das Inversevon Matrizen zu berechnen. Der Aufwand ist aber meist hoher, so dass es sichmehr um theoretische Ergebnisse handelt.

5.44 Satz: Sei A ∈ Kn×n regular, und Ax = b fur x, b ∈ Kn. Dann gilt dieCramersche Regel

xi =det(a1, . . . , ai−1, b, ai+1, . . . , an)

detAwobei a1, . . . , an die Spalten von A bezeichnen. Fur die Komponenten der In-versen Matrix A = A−1 gilt

ai,j =(−1)i+j detAj,i

detA.

Dabei bezeichne Aj,i wieder die Matrix, die aus A entsteht, indem man die j-teZeile und die i-te Spalte streicht.

Beweis: Wegen Ax = b gilt

x1a1 + . . .+ xnan = b.

Mit entsprechenden Spaltenoperationen folgt

xi detA = det(a1, . . . , ai−1, xiai, ai+1, . . . , an)

= det(a1, . . . , ai−1,

n∑ν=1

xνaν , ai+1, . . . , an)

= det(a1, . . . , ai−1, b, ai+1, . . . , an).

Page 192: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

192 KAPITEL 5. DETERMINANTEN

Wegen detA 6= 0 folgt die Behauptung. Die j-te Spalte der Inversen ist dieLosung der Gleichung

Aaj = ej .

Nach der Cramerschen Regel und dem Entwicklungssatz von Laplace mit Ent-wicklung nach der i-ten Spalte

ai,j =1

detAdet(a1, . . . , ai−1, ej , ai+1, . . . , an)

=(−1)i+j detAj,i

detA

2

5.45 Aufgabe: Leiten Sie mit Hilfe dieses Satzes Formeln fur die Inverse von A ∈K2×2 her und fur die Losungen von Gleichungssystem Ax = b.

5.46 Aufgabe: Zu x0 < x1 < x2 in R und y0, y1, y2 ∈ R sei ein quadratischesPolynom

p(x) = a+ bx+ cx2

gesucht mit

p(xi) = yi, i = 0, 1, 2.

Schreiben Sie dieses Problem als lineares Gleichungssystem und finden Sie Formeln

fur a, b, c mit Hilfe der Cramerschen Regel.

5.2.2 Das Kreuzprodukt

5.47. Beispiel: Wir suchen zu zwei Vektoren a, b ∈ R3 einen senkrechten Vektorc ⊥ a, c ⊥ b, c 6= 0. Skaliert man den Vektor willkurlich durch λ1c1 + λ2c2 +λ3c3 = 1 ist, so ergibt sich folgendes Gleichungssystemλ1 λ2 λ3

a1 a2 a3

b1 b2 b3

c1c2c3

=

100

Nach der Cramerschen Regel und Entwicklung nach der jeweiligen Spalte erhaltman zum Beispiel

c1 =1

detMdet

1 0 00 a2 a3

0 b2 b3

=1

detM(a2b3 − a3b2).

wobei M die obige Matrix bezeichne. Also

c =1

detMc,

wobei

c = a× b =

a2b3 − a3b2−(a1b3 − a3b1)a1b2 − a2b1

Page 193: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.2. ANWENDUNGEN 193

das sogenannte Kreuzprodukt von a und b bezeichnet. Entwickelt man dieDeterminante von M nach der letzten Spalte, so erhalt man

detM = λ1c1 + λ2c2 + λ3c3.

Wenn a und b nicht linear abhangig sind, so uberlegt man sich, dass nicht alleci gleich 0 sein konnen. Man kann dann

λi =ci

c21 + c22 + c23, i = 1, 2, 3,

wahlen. Damit folgt detM = 1 und c = c = a× b.5.48 Aufgabe: Zeigen fur a, b ∈ R3

a× b = 0 ⇔ a und b sind linear abhangig.

5.49 Aufgabe: Was andert sich in den obigen Uberlegungen, wenn K = C ist?

5.50 Aufgabe: Zeigen Sie, dass φ(a, b) = a× b eine alternierende Bilinearform

φ : R3 × R3 → R3

ist.

5.51 Aufgabe: Zeigen Sie, dass ‖a× b‖ die Flache F des von a und b aufgespanntenParallelogramms ist. Betrachten Sie dazu

c =1

‖a× b‖ (a× b)

und berechnen Sie das Volumen des von a, b, c aufgespannten Zylinders auf F mit

Hohe 1, indem Sie det(a, b, c) berechnen. Hinweis: Die Rechnung steht praktisch in der

obigen Herleitung von a× b, wenn man die Determinante von (a, b, c)T berechnet.

5.52. Definition: Man kann die Definition des Kreuzprodukts im R3 furv1, . . . , vn−1 ∈ Rn verallgemeinern, indem man die Matrix

M =

vT1...

vTn−1

betrachtet. Bezeichne Mi ∈ Rn−1×n−1 die Matrix M , bei der die i-te Spaltegestrichen wurde. Man definiert dann

w = v1 × . . .× vn−1

durchwi = (−1)n+i detMi, fur alle i = 1, . . . , n.

5.53 Aufgabe: Zeigen Sie

v1 × . . .× vn−1 ⊥ vi fur alle i = 1, . . . , n− 1

Zeigen Sie außerdem

‖v1 × . . .× vn−1‖2 = det(v1, . . . , vn−1, v1 × . . .× vn−1)

Folgern Sie, dass die Abbildung

(v1, . . . , vn−1) 7→ v1 × . . .× vn−1

das Vorzeichen andert, wenn man zwei Vektoren vertauscht, dass sie also alternierend

ist. Zeigen Sie, dass diese Abbildung multilinear ist.

Page 194: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

194 KAPITEL 5. DETERMINANTEN

5.2.3 Volumen und Flache

Wir haben schon zu Beginn dieses Kapitels darauf hingewiesen, dass die De-terminante Volumen und Flachen berechnen kann. Genauer gilt der folgendeSatz.

5.54 Satz: Seien a1, . . . , an ∈ Rn und µ das Riemann-Maß (oder das Le-besgue-Maß) auf dem Rn. Dann gilt

|det(a1, . . . , an)| = µ{n∑i=1

λiai : 0 ≤ λi ≤ 1 fur i = 1, . . . , n}.

Mangels exakter Definition eines der Maße konnen wir diesen Satz hier nichtbeweisen. Der folgende Satz wird durch die Volumenformel motiviert, und wirkonnen ihn im Rahmen unserer Theorie beweisen.

5.55 Satz: Seien a1, . . . , an ∈ Rn. Dann gilt

|det(a1, . . . , an)| ≤n∏i=1

‖ai‖.

Dabei ist die Norm die Euklidsche Norm. Gleichheit tritt genau dann auf, wenndie Vektoren a1, . . . , an ein Orthogonalsystem bilden.

Beweis: Wir fuhren das Orthogonalisierungsverfahren von Schmidt durch undwandeln a1, . . . , an in ein Orthogonalsystem a1, . . . , an um. Im k-ten Schritt sinda1, . . . , ak orthogonal und es gilt

ak+1 = ak+1 − vk, vk ∈ span {a1, . . . , ak}.

Außerdem haben wir ak+1 − vk ⊥ ai fur i = 1, . . . , k. Also

‖ak+1‖2 = ‖ak+1‖2 − ‖vk‖2 ≤ ‖ak+1‖2.

Fur die Matrix A = (a1, . . . , an) gilt nun

AA∗ =

‖a1‖2 0. . .

0 ‖an‖2

.

Alson∏i=1

‖ai‖2 = det(AA∗) = det(A)det(AT ) = |det(A)|2.

Da die Operationen des Schmidtschen Orthogonalisierungsverfahrens die Deter-minante nicht andern, folgt insgesamt

|det(A)| = |det(A)| =n∏i=1

‖ai‖ ≤n∏i=1

‖ai‖.

Gleichheit kann nur auftreten, wenn in jedem Schritt vk = 0 ist, also die Vek-toren a1, . . . , an schon paarweise senkrecht stehen. 2

Page 195: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.2. ANWENDUNGEN 195

5.56. Bemerkung: Wir notieren als wichtige Folgerung, dass eine Matrix mitnormierten Spalten genau dann eine Determinante vom Betrag 1 hat, wenn sieorthogonal ist.

5.57. Bemerkung: Fur Endomorphismen φ : Rn → Rn gibt die Determinanteden Verzerrungsfaktor fur Volumina an. Es gilt fur messbare Mengen

µ(φ(K)) = det(φ)K.

Falls K der Einheitswurfel ist, so folgt dies aus unseren Uberlegungen, dennφ(K) wird von den Bildern der Einheitsvektoren aufgespannt. Fur allgemeineK beweist man diese Formel in der Maß- und Integrationstheorie. Man hat sogarallgemeiner die Transformationsformel∫

φ(K)

f(x) dµ(x) =∫K

f(φ(x))|det(Jφ(x))| dµ(x).

fur integrierbare Funktionen f und bijektive, stetig differenzierbare Funktionenφ. Dia Matrix Jφ(x) ist die Ableitungsmatrix (Jordanmatrix) von φ.

5.2.4 Positiv definite Matrizen

Wir haben schon festgestellt, dass eine Matrix A ∈ Kn×n genau dann ein Ska-larprodukt

〈x, y〉 = xTAy

definiert, wenn A positiv definit ist. Das heißt, A = A∗ und

xTAx > 0 fur alle x 6= 0.

Der folgende Satz gibt ein handliches Kriterium fur positive Definitheit, dasman Hurwitz-Kriterium nennt.

5.58 Satz: Sei A ∈ Kn×n, A = A∗. Dann ist A genau dann positiv definit,wenn alle Hauptminoren positiv sind, das heißt es gilt

det

a1,1 . . . a1,k

......

ak,1 . . . ak,k

> 0

fur alle 1 ≤ k ≤ n.

Beweis: Sei A positiv definit. Wir fuhren den Beweis durch Induktion nachn. Fur n = 1 ist die Behauptung klar. Fur n > 1 gilt zunachst

eT1 Ae1 = a1,1 > 0.

Wir konnen also durch elementare Zeilenumformungen die Elemente

a2,1, . . . , an,1

zu 0 machen. Dies ist aquivalent zur Multiplikation mit einer regularen Ele-mentarmatrix R von links. Wir setzen

A = RAR∗.

Page 196: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

196 KAPITEL 5. DETERMINANTEN

Da die Multiplikation mit R∗ von rechts nur auf die zweite bis n-te Spalte wirkt,gilt

a2,1 = . . . = an,1 = 0.

AußerdemA∗ = RA∗R∗ = RAR∗ = A.

Also hat A die Gestalt

A =(a1,1 0

0 H

)mit einer Matrix H ∈ Kn−1×n−1 mit H = H∗. Es gilt nun

xT Ax = (RTx)A(RTx).

Also ist A genau dann positiv definit, wenn A positiv definit ist. Andererseitsberechnet man

xT Ax = a1,1x21 + xTHx.

mit

x =

x2

...xn

.

Also ist A genau dann positiv definit, wenn a1,1 > 0 ist und H positiv definitist. Bezeichnen wir mit Ai die i-te Untermatrix von A und mit Hi die i-teUntermatrix von H. Dann gilt

Ai =(a1,1 0

0 Hi−1

).

Außerdem haben wir nur Vielfache der ersten Spalte oder Zeile zu den anderenSpalten bzw. Zeilen addiert. Es gilt also

detAi = det Ai = a1,1 detHi−1.

Da H also positiv definit ist, folgt per Induktionsvoraussetzung detHi−1 > 0fur i = 2, . . . , n, und schließlich die Behauptung.

Seien umgekehrt alle Hauptminoren positiv. Wieder verwenden wir Induk-tion nach n. n = 1 ist klar. Sonst folgt a1,1 > 0 und wir konnen wie oben dieMatrix A definieren. Es folgt, dass alle Hauptminoren von H positiv sind, und Hnach Induktionsvoraussetzung positiv definit. Wie oben gezeigt, ist dann auchA und damit A positiv definit. 2

5.59. Bemerkung: Eine Matrix A heißt negativ definit, wenn −A positivdefinit ist, also

xTAx < 0 fur alle x 6= 0.

Als Bedingung ergibt sich also

detA1 < 0, detA2 > 0, . . . .

Page 197: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.2. ANWENDUNGEN 197

Analog kann man eine positiv semidefinite und negativ semidefinite Matrixdefinieren. Es genugt aber fur positive Semidefinitheit nicht, dass alle Hauptmi-noren großer oder gleich 0 sind. Ein Beispiel ist

A =

0 0 00 1 00 0 −1

Alle Hauptminoren sind 0, also nicht negativ. Dennoch ist A indefinit. Dasheißt es gibt x mit xTAx > 0 und es gibt x mit xTAx < 0. Mit Hilfe von Eigen-werten werden wir spater beweisen, dass regulare Matrizen, die weder positivnoch negativ definit sind, indefinit sein mussen.

5.60 Aufgabe: Zeigen Sie, dass es fur jede indefinite Hermitesche Matrix A ∈ Kn×n

ein x ∈ Kn gibt mitxTAx = 0.

5.61 Aufgabe: Zeigen Sie, dass fur jede regulare Matrix A ∈ Kn×n die Matrizen

A∗A und AA∗ positiv definit sind.

5.2.5 Dreieckstraversalen

Wir erinnern daran, dass das Dreieck ABC die konvexe Hulle der PunkteA,B,C ∈ R2 ist. Wenn A, B und C nicht auf einer Geraden liegen, so lasstsich jeder Punkte X ∈ R2 eindeutig in mit baryzentrischen Koordinaten

X = λ1A+ λ2B + λ3C

λ1 + λ2 + λ3 = 1

schreiben. Wir erinnern außerdem daran, dass die Gerade durch A,B ∈ R2 dererzeugte affine Unterraum ist, und genau die Punkte X ∈ R2 enthalt, die sichals

X = λ1A+ λ2B

λ1 + λ2 = 1

schreiben lassen.

5.62. Definition: Fur A,B,C ∈ R2 definieren wir die Abbildung

φ : R3 → R2

durchφ(λ) = λ1A+ λ2B + λ3C

5.63 Aufgabe: Zeigen Sie, dass φ die Ebene

E = {x ∈ R3 : x1 + x2 + x3 = 1}

linear und bijektiv auf den R2 abbildet.

5.64 Aufgabe: Zeigen Sie, dass dann das Dreieck ABC das Bild der konvexen Hulle

der Einheitsvektoren e1, e2, e3 ∈ R3 unter φ ist.

5.65 Satz: Seien A,B,C ∈ R2 nicht auf einer Geraden.

Page 198: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

198 KAPITEL 5. DETERMINANTEN

(1) Dann gibt es zu jeder Geraden G ∈ R2 Zahlen µ1, µ2, µ3 ∈ R, so dass G alsdie Menge aller Punkte X ∈ R2 ist, die sich als

X = λ1A+ λ2B + λ3C

µ1λ1 + µ2λ2 + µ3λ3 = 0λ1 + λ2 + λ3 = 1

schreiben lassen.

(2) Diese Menge ist genau dann eine Gerade, wenn µ1, µ2, µ3 nicht alle gleichsind.

Beweis: (1) F = φ−1(G) ist eine Ebene im R3, die die Ebene E mit λ1 +λ2 + λ3 = 1 schneidet. Man kann schreiben

F = {λ ∈ R3 : µ1λ1 + µ2λ2 + µ3λ3 = 1}

wobei µ nicht auf E senkrecht steht, weil F nicht parallel zu E ist. Es folgt,dass alle Punkte von G eine Darstellung der verlangten Form haben.

(2) Wenn alle µi gleich sind, so ist die Menge leer oder gleich dem R2.Ansonsten ist die Menge aller λ ∈ R2 mit

µ1λ1 + µ2λ2 + µ3λ3 = 0λ1 + λ2 + λ3 = 1

eine Gerade im R3 die ganz in E liegt. Das Bild unter φ ist also eine Gerade inR2. 2

Der folgende Satz ist bekannt als der Satz von Ceva.

5.66 Satz: Seien A1, A2, A3 ∈ R2 nicht auf einer Geraden und X1, X2, X3 ∈R2 mit baryzentrischen Koordinaten

Xi = λi,1A1 + λi,2A2 + λi,3A3

fur i = 1, 2, 3. Dann schneiden sich die Geraden

A1X1, A2X2, A3X3

genau dann in einem Punkt oder sie sind parallel zueinander, wenn

λ1,2λ2,3λ3,1 = λ1,3λ2,1λ3,2

ist.

Beweis: Wir stellen die Geraden AiXi in der Form des vorigen Satzes dar.Fur A1X1 bedeutet dies

X = λ1A1 + λ2B1 + λ3C1,

λ1,3λ2 − λ1,2λ3 = 0,λ1 + λ2 + λ3 = 1,

Page 199: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.2. ANWENDUNGEN 199

Abbildung 5.2: Satz von Ceva

weil man leicht nachpruft, dass dann A1 und X1 auf der Geraden liegen. Furden Schnittpunkt aller Geraden ergibt sich ein Gleichungssystem 0 λ1,3 −λ1,2

λ2,3 0 −λ2,1

λ3,2 −λ3,1 0

λ1

λ2

λ3

=

000

.

Die Determinante dieser Matrix ist

λ1,2λ2,3λ3,1 − λ1,3λ3,2λ2,1.

Wenn die Determinante ungleich 0 ist, so schneiden sich die Geraden also nicht,da dann λ = 0 die einzige Losung ist. Wenn die Determinante gleich 0 ist, sosind ist zum Beispiel die dritte Zeile der Matrix von den ersten beiden linearabhangig. Das bedeutet, dass jeder Schnittpunkt von A1X1 und A2X2 auch aufA3X3 liegt. Damit schneiden sich die Geraden in einem Punkt oder sie sindparallel zueinander. 2

5.67. Beispiel: In Abbildung 5.2 gilt zum Beispiel

X3 = A1 +α1

α1 + β1(A2 −A1) =

β1

α1 + β1A1 +

α1

α1 + β1A2.

Es folgtλ3,1

λ3,2=β1

α1.

Analogλ1,2

λ1,3=β1

α1,

λ2,3

λ2,1=β2

α2.

Page 200: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

200 KAPITEL 5. DETERMINANTEN

Man erhalt den Satz von Ceva in der Form

α1α2α3 = β1β2β3.

Aus dem Satz folgt zum Beispiel sofort, dass sich die Seitenhalbierenden ineinem Dreieck in einem Punkt schneiden.

Um den gemeinsamen Schnittpunkt der Mittelsenkrechten und der Winkel-halbierenden zu zeigen, wird allerdings eine andere Idee genutzt.

5.68. Beispiel: Die Mittelsenkrechte von AB ist die Menge der Punkte, dievon A und B den gleichen Abstand haben, also

‖X −A‖ = ‖X −B‖.

Nach Quadrieren und Vereinfachen sieht man, dass dies aquivalent mit

2〈X,A−B〉 = ‖A‖2 − ‖B‖2

ist. Insbesondere ist dies eine Gerade. Der Punkt (A+B)/2 auf der Mittelsenk-rechten und sie steht senkrecht auf AB. Es ist auch leicht zu zeigen, dass jederSchnittpunkt von zwei Mittelsenkrechten auf der dritten liegt, denn

‖X −A‖ = ‖X −B‖ und ‖X −B‖ = ‖X − C‖ ⇒ ‖X −A‖ = ‖X − C‖.

5.69 Aufgabe: Zeigen Sie, dass die Menge der Punkte, die von zwei sich kreuzenden

Geraden gleichen Abstand haben, zwei sich im rechten Winkel kreuzende Geraden sind

(den Winkelhalbierenden). Zeigen Sie, dass es einen Punkt im Dreieck gibt, der von

allen drei Seiten den gleichen Abstand hat.

Bei den Hohen kann man eine andere Technik verwenden.

5.70. Beispiel: Wir nehmen wieder an, dassA,B und C nicht auf einer Geradenliegen. Die Punkte auf der Hohe durch A auf BC haben offenbar die Eigenschaft

〈X −A,C −B〉 = 0.

Dies ist eine Geradengleichung, und man kann nach dem Hohenschnittpunktfragen. Es ist nun recht leicht zu sehen, dass der Schnittpunkt zweier Hohen aufder dritten liegt. Dazu addiert man zum Beispiel die Gleichungen

〈X,C −B〉 = 〈A,C −B〉〈X,B −A〉 = 〈C,B −A〉

fur die Hohe durch A und C und erhalt

〈X,C −A〉 = 〈B,C −A〉,

also die Gleichung der dritten Hohe. Man kann dies auch in folgendem Glei-chungssystem ausdrucken.C1 −B1 C2 −B2 〈A,C −B〉

B1 −A1 B2 −A2 〈C,B −A〉A1 − C1 A2 − C2 〈B,A− C〉

X1

X2

−1

=

000

.

Page 201: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

5.2. ANWENDUNGEN 201

Dieses System muss von einem Hohenschnittpunkt erfullt werden. Da die dritteZeile Summe der beiden anderen ist, so hat das System hochstens den Rang 2.Es gibt also eine Losung λ ∈ R3. Falls fur diese Losung λ3 = 0 ist, so mussendie ersten beiden Spalten linear abhangig sein, also auch die obere linke 2× 2-Untermatrix. Deren Zeilen sind aber C − B und B − A. Dies kann nicht sein,weil sonst A, B und C auf einer Geraden liegen. Es folgt, dass sich alle dreiHohen in genau einem Punkt schneiden.

5.71 Aufgabe: Benutzen Sie dieselbe Beweisidee, um zu zeigen, dass sich die Mit-

telsenkrechten in einem Punkt schneiden.

Page 202: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

202 KAPITEL 5. DETERMINANTEN

Page 203: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Kapitel 6

Eigenwerte

6.1 Definition und Eigenschaften

6.1.1 Polynome

Zur Vorbereitung auf die Berechnung von Eigenwerten halten wir hier einigeResultate uber Polynome fest.

6.1. Definition: Sei K ein Korper und a0, . . . , an ∈ K. Dann heißt ein Aus-druck der Form

P (X) = a0 + a1X + . . .+ anXn

ein Polynom uber K. Die Menge aller Polynome uber K bezeichnet man alsK[X]. Auf ihr ist in naheliegender Weise eine Addition und eine Multiplikationdefiniert. Falls an 6= 0 ist, so heißt n der Grad von P .

n = degP.

Mengentheoretisch ist ein Polynom also eine Folge

a0, a1, a2, . . .

von Koeffizienten, von denen nur endlich viele ungleich 0 sind.

6.2 Aufgabe: Definieren Sie die Multiplikation von Polynomen exakt, indem Sie die

Koeffizienten des Produktes angeben.

6.3. Bemerkung: Man benotigt fur die Definition des Polynomraums eigent-lich nur, dass K ein kommutativer Ring ist. Der einzige Unterschied zu einemKorper ist, dass bei einem kommutativen Ring auf das Inverse der Multiplika-tion verzichtet wird. Ein kommutativer Ring R heißt nullteilerfrei, wenn furalle a, b ∈ R gilt

ab = 0 ⇔ a = 0 oder b = 0.

Wie wir wissen, ist jeder Korper ein nullteilerfreier Ring.

6.4 Aufgabe: Zeigen Sie, dass R[X] ein nullteilerfreier Ring ist, wenn R ein nulltei-lerfreier Ring ist. Zeigen Sie, dass dann gilt

PQ1 = PQ2 ⇒ Q1 = Q2.

203

Page 204: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

204 KAPITEL 6. EIGENWERTE

fur alle P,Q1, Q2 ∈ R[X], P 6= 0 und

degPQ = degP + degQ

fur alle P,Q ∈ R[X].

6.5. Bemerkung: Der Polynomring K[X] uber dem Korper K ist auch einVektorraum uber K. Eine Basis dieses Vektorraums bilden die Polynome

1, X, X2, . . .

Denn jedes Polynom ist offenbar eindeutig als endliche Linearkombination dieserPolynome zu schreiben.

6.6. Bemerkung: Ein Polynom P ∈ K[X] kann auch als Abbildung P : K →K gedeutet werden, indem man x ∈ K fur X einsetzt. Die Abbildung

φ : K[X]→ A(K,K)φ(a0 + a1X + . . .+ anX

n)(x) = a0 + a1x+ . . .+ anxn,

ist in der Tat linear. Sie erhalt auch die Multiplikation, also

φ(PQ)(x) = φ(P )(x)φ(Q)(x).

Wir nennen diese Abbildung Auswertungsabbildung fur Polynome.

Leider ist die Auswertungsabbildung im Allgemeinen nicht injektiv. Im Kor-per K = {0, 1} erzeugen die Polynome X2 und X dieselbe Abbildung, weil furjedes x in diesem Korper x2 = x gilt. Ein x ∈ K, das in P ∈ K[X] eingesetzt 0ergibt, heißt Nullstelle von P .

Die wichtigste Technik fur Polynome ist das Ausdividieren.

6.7 Satz: Seien P,Q ∈ K[X] Polynome uber einem Korper K, degQ > 0.Dann gibt es Polynome F,R ∈ K[X] mit

P (X) = Q(X)F (X) +R(X)

unddegR < degQ.

Das Polynom Q wird also aus dem Polynom P ausdividiert, so dass der Rest Reinen kleineren Grad als Q hat.

Beweis: Der Beweis wird mit Induktion nach degP gefuhrt. Man beachte,dass er fur degQ > degP trivial ist, weil man F = 0 und R = P wahlen kann.Der Induktionsanfang ist also erfullt. Sei nun

P (X) = a0 + . . .+ anXn, Q(X) = b0 + . . .+ bmX

m,

an, bm 6= 0. Dann gilt

P (X) =anbm

Xn−mQ(X) + P (X)

mit deg P (X) < degP . Aufgrund der Induktionsannahme folgt wie gewunscht

P (X) =anbm

Xn−mQ(X) + F (X)Q(X) +R(X) = F (X)Q(X) +R(X).

Page 205: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 205

2

6.8. Beispiel: Der Beweis folgt exakt dem Divisionsalgorithmus, den man schonaus der Schule kennt. Als Beispiel dividieren wir X − 2 aus X2 − 2 aus.

X2 − 2 = X(X − 2) + (2X − 2)= X(X − 2) + 2(X − 2) + 2= (X + 2)(X − 2) + 2.

Der folgende Satz zeigt, dass fur die wichtigsten Korper die Auswertungs-abbildung injektiv ist. Dort ist es also egal, ob wir ein Polynom als Ausdruckoder als Abbildung auffassen. Insbesondere lasst sich jede Abbildung, die voneinem Polynom erzeugt wird, mit eindeutig bestimmten Koeffizienten als Poly-nom darstellen.

6.9 Satz: Ein Polynom n-ten Grades uber einem Korper K kann hochstensn verschiedene Nullstellen haben. Fur einen Korper K mit unendlich vielenElementen ist die Auswertungsabbildung folglich injektiv.

Beweis: Sei

Pn(X) = a0 + a1X + . . .+ anXn ∈ K[X], an 6= 0

und x1, . . . , xn Nullstellen von P . Man kann dann das Polynom X − x1 aus Pausdividieren und erhalt

Pn(X) = Pn−1(X)(X − x1) + cn.

Einsetzen von X = x1 ergibt cn = 0. Außerdem sind x2, . . . , xn die Nullstellenvon Pn−1. Induktiv erhalt man durch weiteres Ausdividieren

Pn(X) = an(X − x1) · . . . · (X − xn).

Nun ist offenbar, dass Pn keine weiteren Nullstellen haben kann.

Wenn nun P ein Polynom ist, das als Funktion immer 0 liefert, so ergibtsich sofort eine Widerspruch, wenn P 6= 0 ist und K unendlich viele Elementeenthalt. Also ist der Kern der Auswertungsfunktion {0} und die Auswertungfolglich injektiv. 2

Wir haben damit bewiesen, dass jedes Polynom P ∈ K[X] mit n paarweiseverschiedenen Nullstellen in bis auf die Reihenfolge eindeutige Linearfaktorenzerfallt.

P (X) = an(X − x1) · . . . · (X − xn).

In der Tat ist die eindeutige Darstellung auch richtig, wenn die Nullstellen mitVielfachheit vorkommen. Dies zeigt der folgende Satz von der eindeutigen Prim-faktorzerlegung.

6.10. Definition: Ein nicht konstantes Polynom P ∈ K[X] heißt Primpoly-nom oder irreduzibel, wenn es nicht Produkt von nicht konstanten Polynomenkleineren Grades ist.

6.11 Satz: Jedes nicht konstante Polynom P ∈ K[X] mit hochstem Koeffi-zient 1 uber einem Korper K zerfallt bis auf die Reihenfolge eindeutig in einProdukt aus Primpolynomen mit hochstem Koeffizient 1.

Page 206: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

206 KAPITEL 6. EIGENWERTE

Beweis: Die Existenz ist klar, weil man Polynome mit hochstem Koeffizient 1solange in Faktoren kleineren Grades mit hochstem Koeffizient 1 zerlegen kann,bis keine weitere Zerlegung mehr moglich ist. In diesem Fall hat man ein Produktaus Primpolynomen vor sich.

Die Eindeutigkeit folgt aus dem folgenden Satz. Denn seien

P1 · . . . · Pn = Q1 · . . . ·Qm

Produkte aus Primpolynomen, so muss nach diesem Satz P1 letztendlich einesder Qi teilen. Da Qi prim ist, muss P1 = αQi mit einer Konstanten α ∈ Ksein. Da aber beide Polynome den hochsten Koeffizienten 1 haben sollen, folgtPi = Qi. 2

6.12 Satz: Sei P ein Primpolynom, das ein Produkt Q1Q2 teilt. Dann teiltP mindestens eines der Polynome Q1 oder Q2.

Beweis: Angenommen, P teilt Q1 nicht. Der Beweis wird dann mit Hilfe desEuklidschen Algorithmus gefuhrt. Dazu dividieren wir P aus Q1 aus, undfahren mit dem Ausdividieren in folgender Weise fort.

Q1 = PF1 +R1,

P = R1F2 +R2,

R1 = R2F3 +R3

...Rk−2 = Rk−1Fk +Rk,

Rk−1 = RkFk+1 + c.

Die Grade der Reste Ri werden streng monoton kleiner, bis schließlich nur eineKonstante c ∈ K ubrig bleibt. Wenn c = 0 ware, so wurde Rk alle ResteRk−1, . . . , R1 teilen und deswegen auch P . Dies ist ein Widerspruch dazu, dassP irreduzibel ist.

Indem man von unten nach oben Rk, . . . , R1 aus den Werten der vorigenZeile einsetzt, erhalt man

c = H1Q1 +H2P.

mit irgendwelchen Polynomen H1, H2 ∈ K[X]. Dann gilt aber

cQ2 = H1Q1Q2 +H2PQ2.

P teilt die rechte Seite dieser Gleichung, also auch die linke. Es folgt, dass Pdas Polynom Q2 teilt. 2

6.13. Bemerkung: Derselbe Beweis kann in jedem Ring angewendet werden, indem der Euklidsche Algorithmus Sinn macht. Fur die ganzen Zahlen terminierter offenbar mit c = 0 oder c = 1. Man kann also mit diesem Algorithmus unddem obigen Beweis zeigen, dass die Primfaktorzerlegung in Z eindeutig ist, und,wie die folgenden Aufgaben zeigen, den großten gemeinsamen Teiler von zwei

Page 207: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 207

Zahlen berechnen, sowie multiplikative Inverse im Restklassenkorper moduloeiner Primzahl.

6.14 Aufgabe: Angenommen der Euklidsche Algorithmus, gestartet mit Q und P ,terminiert mit c = 0. Zeigen Sie dann, dass Rk die Polynome P und Q teilt und dasssich

Rk = H1Q+H2P

schreiben lasst. Folgern Sie, dass Rk ein Polynom hochsten Grades ist, dass P und

Q gemeinsam teilt (großter gemeinsamer Teiler). Zeigen Sie, dass der großte ge-

meinsame Teiler von P und Q bis auf ein konstantes Vielfaches eindeutig bestimmt

ist. Bestimmen Sie den großten gemeinsamen Teiler von X2 + 2X + 1 und X2 − 1 mit

dem Euklidschen Algorithmus.

6.15 Aufgabe: Berechnen Sie mit dem Euklidschen Algorithmus a, b ∈ Z mit

57a+ 103b = 1.

Berechnen Sie auf diese Weise das multiplikative Inverse von 57 im Restklassenkorper

Z103.

Der Beweis des folgenden Satzes gehort in die Analysis. Man nennt den Satzden Hauptsatz der Algebra.

6.16 Satz: Jedes Polynom P ∈ C[X] zerfallt bis auf die Reihenfolge eindeu-tig in Linearfaktoren aus C[X]. Jedes Polynom P ∈ R[X] zerfallt bis auf dieReihenfolge eindeutig in lineare oder quadratische Primpolynome aus R[X].

Beweis: Zum Beweis dieses Satzes benotigen wir lediglich ein Ergebnis, dasmit Methoden der Analysis bewiesen werden muss. Jedes Polynom P ∈ C[X]hat mindestens eine Nullstelle in C. Aufgrund von Induktion zerfallt also jedesPolynom in C[X] in Linearfaktoren, indem man eine Nullstelle nach der anderenausdividiert.

Fur reelle Polynome stellt sich heraus, dass mit a+ ib auch der konjugierteWert a − ib Nullstelle ist. Fasst man diese Nullstellen paarweise zusammen, sohat man

(X − (a+ ib))(X − (a− ib)) = (X − a)2 + b = X2 − 2aX + a2 + b.

Diese Polynome sind fur b 6= 0 prim in R[X]. 2

6.17 Aufgabe: Zeigen Sie fur ein reelles Polynom p, dass mit z auch z Nullstelle von

p ist.

6.18 Aufgabe: Seien a0, . . . , an−1 ∈ Z und

p(x) = a0 + . . .+ an−1xn−1 + xn.

Zeigen Sie, dass jede Nullstelle z ∈ Q von p automatisch ganzzahlig ist und Teiler von

a0.

6.19. Bemerkung: Man kann den Polynomring K[X] wie auch jeden anderennullteilerfreien, kommutativen Ring in einen Korper erweitern. In diesem Fallentsteht der Ring der rationalen Funktionen

R(K[X]) = {PQ

: P,Q ∈ R[X], P,Q teilerfremd, Q = Xn + . . .}.

Page 208: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

208 KAPITEL 6. EIGENWERTE

Wir verzichten auf die Details. Wichtig ist die Folgerung, dass man nun Deter-minanten von Matrizen mit Eintragen aus K[X] berechnen kann, indem manwie gewohnt im Korper R(K[X]) rechnet.

det(

2−X 11 2−X

)= (2−X)2 − 1 = X2 − 4X + 3.

Es gelten automatisch alle Regeln uber Determinanten.

6.20. Bemerkung: Wir definieren die Ableitungsabbildung D : K[X]→ K[X]als

D(a0 + a1X + . . .+ anXn) = a1 + 2a2X + . . .+ nanX

n−1,

wobei kx fur k ∈ N und x ∈ K in naturlicher Weise als Summe von n Summan-den x definiert sei. Entsprechend definieren wir die k-te Ableitung Dk(P ).

6.21 Aufgabe: (a) Zeigen Sie fur alle P,Q ∈ K[X]

D(P +Q) = D(P ) +D(Q)

D(P ·Q) = D(P ) ·Q+ P ·D(Q).

(b) Zeigen Sie, dass λ ∈ K genau dann k-fache Nullstelle von P ∈ K[X] ist (dass also(X − λ)k das Polynom P teilt), wenn

P (λ) = . . . = Dk−1(P )(λ) = 0

ist.

6.1.2 Eigenwerte und Eigenvektoren

Um das Verhalten von iterierten linearen Abbildungen Anx zu studieren, ist esnutzlich, wenn der Vektor x die Eigenschaft hat, dass Ax = λx ist. In diesemFall gilt namlich offenbar Anx = λnx. Diese Idee fuhrt zur folgenden Definition.

6.22. Definition: Sei φ : V → V linear, V ein Vektorraum uber dem KorperK. Dann heißt ein v ∈ V Eigenvektor zum Eigenwert λ ∈ K, wenn v 6= 0 istund

φ(v) = λv

gilt.

Ein Eigenvektor einer Abbildung ist ein Vektor v 6= 0, derdurch die Abbildung einfach nur um einen Faktor λ ge-streckt wird.

6.23. Bemerkung: Naturlich gilt φ(0) = λ0 fur jedes λ ∈ K. Deswegen wirdv = 0 ausgeschlossen.

6.24. Bemerkung: Falls φ(x) = Ax ist, so bezeichnet man die Eigenwertevon φ auch einfach als Eigenwerte der Matrix A. Wir werden sehen, dass dieEigenwerte jeder darstellenden Matrix von φ gleich sind.

6.25 Aufgabe: Zeigen Sie, dass φ genau dann injektiv ist, wenn es nicht den Eigenwert

0 hat.

6.26. Beispiel: Sei

A =(

2 11 2

)∈ R2×2.

Page 209: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 209

Dann gilt

A

(11

)=(

33

)= 3

(11

)und

A

(1−1

)=(

1−1

)= 1

(1−1

).

Wir haben also eine Basis aus Eigenvektoren(11

),

(1−1

)von A mit zugehorigen Eigenwerten

3, 1.

6.27. Bemerkung: Wenn v1, . . . , vn Eigenvektoren zu Eigenwerten λ1, . . . , λnsind und

v = µ1v1 + . . .+ µnvn

so ist offenbarφ(v) = µ1λ1v1 + . . .+ µnλnvn

und weiterφm(v) = µ1λ

m1 v1 + . . .+ µnλ

mn vn

Wenn alle Eigenwerte ungleich 0 sind, so gilt das sogar fur alle m ∈ Z, zumBeispiel

φ−1(v) =µ1

λ1v1 + . . .+

µnλnvn,

wie man sofort nachrechnet. Man kann also φm(v) fur alle

v ∈ span {v1, . . . , vn}

recht bequem berechnen. Es liegt also nahe, dass man daran interessiert ist, eineBasis aus Eigenvektoren zu bekommen.

6.28. Definition: Sei A ∈ Kn×n. Dann heißt

χA(λ) = det(A− λIn)

das charakteristische Polynom von A. Fur eine lineare Abbildung φ : V → Vauf einem endlich dimensionalen Vektorraum V uber K definieren wir

χφ(λ) = χA(λ),

wobei A die darstellende Matrix von φ bezuglich irgendeiner Basis A von V sei,also

A =MA,A(φ).

6.29. Bemerkung: Es gilt offenbar χA(λ) ∈ K[λ], und der Grad dieses Poly-noms ist genau n. Dies folgt unmittelbar aus dem Entwicklungssatz.

χA(λ) = det

a1,1 − λ . . . a1,n

.... . .

...an,1 . . . an,n − λ

.

Page 210: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

210 KAPITEL 6. EIGENWERTE

6.30 Satz: Das charakteristische Polynom einer Abbildung φ : V → V hangtnicht von der Wahl der Basis ab.

Beweis: Seien A,B Basen von V . Dann gilt

MA,A(φ) = HMB,B(φ)H−1

mit der regularen MatrixH =MB,A(id).

Es folgt

det(MA,A(φ)− λIn) = det(H(MB,B(φ)− λIn)H−1)

= det(H) det(MB,B(φ)− λIn) det(H−1)= det(MB,B(φ)− λIn).

Dabei rechnen wir im Korper R(K[X]) der rationalen Funktionen uber X. 2

6.31. Bemerkung: Im Fall von unendlichen Korpern K konnen wir im obigenBeweis auch einfach festhalten, dass die berechnete Gleichheit fur alle λ ∈ Kgilt. Daraus folgt die Gleichheit der charakteristischen Polynome.

6.32. Definition: Die Spur einer Matrix A ∈ Kn×n ist die Summe der Dia-gonalelemente

Spur (A) = a1,1 + . . .+ an,n.

Die Spur einer Abbildung ist erstaunlicherweise unabhangig von der Basis-darstellung, ebenso wie die Determinante. Fur die Determinante haben wir dasschon bewiesen.

6.33 Satz: Fur das charakteristische Polynom einer Matrix A ∈ Kn×n gilt

χA(λ) = (−1)nλn + (−1)n−1Spur (A)λn−1 + . . .+ det(A).

Ahnliche Matrizen haben dasselbe charakteristische Polynom und daher die glei-che Spur und Determinante.

6.34 Aufgabe: Beweisen Sie diesen Satz.

Mit Hilfe des folgenden Satzes konnen wir alle Eigenwerte eines Endomor-phismus auf einem endlich dimensionalen Vektorraums berechnen.

6.35 Satz: Sei φ : V → V linear und V ein endlich dimensionaler Vektor-raum uber K. Dann ist λ genau dann Eigenwert von φ, wenn es Nullstelle descharakteristischen Polynoms χφ ist.

Beweis: Sei λ ∈ K Eigenwert. Dann gibt es ein x 6= 0 mit

φ(x) = λx.

Wir wahlen eine Basis A von V und bezeichnen mit A die darstellende Matrixvon φ bezuglich A. Sei x die Darstellung von x bezuglich A, also

x = φA(x),

Page 211: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 211

Wir haben nun

Ax = (φ−1A ◦ φ ◦ φA)(x)

= φ−1A (λx)

= λφ−1A (x)

= λx.

Also ist λ auch Eigenwert der Matrix A. Es folgt

(A− λIn)x = 0.

Wegen x 6= 0 muss alsodet(A− λIn) = 0

sein. Dies bedeutet aber, dass λ Nullstelle des charakteristischen Polynoms vonA ist. Die Umkehrung geht ganz analog. 2

6.36. Bemerkung: Wir haben auch gleich gezeigt, wie man alle Eigenvektorenzu λ berechnet. Es sind dies die Losungen von

φ(x) = λx, x 6= 0.

Mit Hilfe einer darstellenden Matrix A haben wir also das lineare Gleichungs-system

(A− λIn)x = 0

zu losen. Man erhalt als Losungsraum den Eigenraum von λ

Eig λ(φ) = {x ∈ V : φ(x) = λx}.

Die Eigenvektoren sind dann die Vektoren

Eig λ(φ) \ {0}.

6.37. Beispiel: Sei wieder

A =(

2 11 2

)∈ R2×2.

Dann gilt

χA(λ) = det(A− λI2) =(

2− λ 11 2− λ

)= λ2 − 4λ+ 3.

Die Nullstellen dieses Polynoms sind

λ1 = 1, λ2 = 3.

Um zugehorige Eigenvektoren zu bekommen losen wir die Gleichungssysteme(2− λ 1

1 2− λ

)x = 0.

Page 212: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

212 KAPITEL 6. EIGENWERTE

Man erhalt

Eig 3(A) = span {(

11

)}, Eig 1(A) = span {

(1−1

)}.

Zur Probe berechnen wir

A

(11

)=(

33

)= 3

(11

)und

A

(1−1

)=(

1−1

)= 1

(1−1

).

Wir erhalten also eine Basis aus Eigenvektoren(11

),

(1−1

)von A.

6.38 Aufgabe: Sei A ∈ Cn×n und λ ∈ C ein Eigenwert von A. Zeigen Sie

|λ| ≤ max1≤i≤n

n∑j=1

|ai,j |.

6.39 Aufgabe: Zeigen Sie, dass A ∈ Kn×n und AT die gleichen Eigenwerte haben.

6.40 Aufgabe: Berechnen Sie das charakteristische Polynom und alle Eigenwertevon

A =

a 1 . . . 1

1. . .

. . ....

.... . . 1

1 . . . 1 a

, (a ∈ R).

Subtrahieren Sie dazu zunachst die letzte Zeile von allen anderen und addieren dann

das 1/(a− 1−X)-fache der ersten n− 1 Zeilen von der letzten.

6.41 Aufgabe: Sei A ∈ Kn×n und λ ∈ K ein Eigenwert von A (K = R oder K = C).Zeigen Sie

|λ| ≤ max1≤i≤n

n∑j=1

|ai,j |.

6.1.3 Diagonalisierbarkeit

6.42. Definition: Ein Endomorphismus φ : V → V heißt diagonalisierbar,wenn er eine Basis aus Eigenvektoren besitzt.

6.43. Bemerkung: Falls V endlich dimensional ist, so bedeutet dies, dass eseine Basis gibt, bezuglich derer φ eine Diagonalmatrix als darstellende Matrixhat. Jede darstellende Matrix von φ ist daher ahnlich zu einer Diagonalmatrix.

6.44 Satz: Sei A ∈ Kn×n und v1, . . . , vn eine Basis aus Eigenvektoren vonA zu Eigenwerten λ1, . . . , λn. Dann gilt

A = HDH−1

Page 213: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 213

mit der Diagonalmatrix

D =

λ1

. . .λn

und

H = (v1, . . . , vn).

A ist also ahnlich zur Diagonalmatrix D. Umgekehrt hat jede Matrix A, dieahnlich zu einer Diagonalmatrix ist, eine Basis aus Eigenvektoren.

Beweis: Offenbar

AH = (Av1, . . . , Avn) = (λ1v1, . . . , λnvn) = HD.

Wenn umgekehrt diese Gleichung gilt, so sind v1, . . . , vn Eigenvektoren von Azu λ1, . . . , λn. 2

6.45. Beispiel: Es gilt(2 11 2

)=(

1 11 −1

)(3 00 1

)(1/2 1/21/2 −1/2

).

6.46. Bemerkung: Aufgrund dieses Satzes kann man sehr leicht Potenzenvon Matrizen auswerten, oder auch Matrizen in Polynomausdrucke einsetzen.Zunachst gilt

Am = (HDH−1)m = (HDH−1) · . . . · (HDH−1) = HDmH−1,

weil sich Paare von H und H−1 wegheben. Dm ist aber sehr leicht zu berechnen,namlich

Dm =

λm1

. . .λmn

.

Wenn A regular ist, so gilt dies auch fur negative m ∈ Z. Man definiert dabeinaturlich

A0 = In, A−n = (A−1)n.

Dasselbe kann man fur Polynomausdrucke machen.

amAm + . . .+ a1A+ a0 = H(amDm + . . .+ a1D + a0In)H−1.

Also gilt fur alle Polynome p ∈ K[X]

p(A) = Hp(D)H−1 = H

p(λ1). . .

p(λn)

H−1

6.47 Aufgabe: Berechnen Sie (2 11 2

)m

Page 214: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

214 KAPITEL 6. EIGENWERTE

6.48. Bemerkung: Mit Hilfe eines geeigneten Grenzwertbegriffs kann man aufdiese Weise auch Potenzreihen in A auswerten. Man erhalt zum Beispiel

eA :=∞∑ν=0

1ν!Aν = H

eλ1

. . .eλn

H−1.

Dieses Thema gehort in die Analysis.

6.49 Aufgabe: Uberzeugen Sie sich davon, dass das Kommutativgesetz fur Poly-nomausdrucke von Matrizen gilt. Das heißt, dass fur Polynome P und Q, in die einequadratische Matrix A eingesetzt wird, gilt

P (A)Q(A) = Q(A)P (A).

Allgemeiner gilt fur quadratische Matrizen A,B

AB = BA ⇒ P (A)Q(B) = Q(B)P (A).

6.50. Beispiel: Wir haben zwei sehr große Gruppen von Personen. Durch-schnittlich wechselt die Halfte der Gruppe 1 in jedem Jahr nach Gruppe 2, einDrittel von Gruppe 2 wechselt nach Gruppe 1.

Wenn x1, x2 die Gruppengroßen sind, so erhalt man fur die neuen erwartetenGroßen x1, x2

x1 = 1/2x1 + 1/3x2, x2 = 1/2x1 + 2/3x2.

Also

x 7→ x =(

1/2 1/31/2 2/3

)· x = A · x.

Das charakteristische Polynom von A ist

det(A− λI2) =6λ2 − 7λ+ 1

6.

mit den Nullstellenλ1 = 1, λ2 = 1/6.

Zugehorige Eigenvektoren sind

v1 =(

2/53/5

), v2 =

(1/2−1/2

)Fur x = av1 + bv2 gilt dann

Amx = aAmv1 + bAmv2

= aλm1 v1 + bλm2 v2

= av1 +b

6mv2

→ av1.

Page 215: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 215

Die Gruppengroße tendiert also zu Vielfachen von v1. Also werden auf die Dauer2/5 in Gruppe 1 und 3/5 in Gruppe 2 sein.

Um dasselbe mit Matrizen zu rechnen, setzen wir

D =(

1 00 1/6

)und

M =(

2/5 1/23/5 −1/2

).

Man erhalt die Darstellung

A = M ·D ·M−1

=(

2/5 1/23/5 −1/2

)(1 00 1/6

)(1 1

6/5 −4/5

).

Also fur Am(2/5 1/23/5 −1/2

)(1 00 1/6m

)(1 1

6/5 −4/5

)=

15

(2 23 3

)+

15 · 6m

(3 −2−3 2

).

Mit m→∞ hat man 1/6m → 0, und man berechnet

Am → 15

(2 23 3

)Also

Amx→(

2/5(x1 + x2)3/5(x1 + x2)

).

Dies bestatigt das schon oben gewonnene Ergebnis.

6.51 Aufgabe: Die Matrix A habe wie im Beispiel die Eigenschaft

AT 1 = 1

mit

1 =

1...1

.

und nur nicht-negative Eintrage. Man nennt A dann eine stochastische Matrix. Zei-

gen Sie, dass A den Eigenwert 1 hat. Zeigen Sie, dass alle Eigenwerte von A den Betrag

kleiner oder gleich 1 haben.

Wir beschaftigen uns nun noch mit Matrizen, die keine Basis aus Eigenvek-toren haben. Dies kann der Fall sein, obwohl das charakteristische Polynom uberK vollstandig in Linearfaktoren zerfallt. Zunachst aber ein Hilfssatz.

6.52 Satz: Sei φ : V → V ein Endomorphismus eines endlich dimensionalenVektorraums uber K, und U ⊆ V ein Unterraum von V mit

φ(U) ⊆ U.

Page 216: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

216 KAPITEL 6. EIGENWERTE

Sei χφ das charakteristische Polynom von φ und χφ|U das charakteristischePolynom von φ, eingeschrankt auf U . Dann ist χφ|U ein Teiler von χφ, lasstsich also ohne Rest ausdividieren.

Beweis: Wir wahlen eine Basis b1, . . . , bk von U und erganzen zu einer Basisb1, . . . , bn von V . Die darstellende Matrix von φ bezuglich dieser Basis B hatdann die Gestalt

M =(M1 ∗0 M2

)mit Matrizen M1 ∈ Kk×k und M2 ∈ Kn−k×n−k. Außerdem ist M1 die darstel-lende Matrix von φ|U bezuglich b1, . . . , bk. Es folgt

χφ|U (λ) = det(M1 − λIk)

undχφ(λ) = det(M1 − λIk) · det(M2 − λIn−k).

Es folgt die Behauptung. 2

6.53. Definition: Sei φ : V → V ein Endomorphismus des endlich dimensio-nalen Vektorraums V und λ0 eine Nullstelle des charakteristischen Polynoms χφ.Dann ist die algebraische Vielfachheit von λ die maximale Potenz k, so dasssich (λ− λ0)k aus χφ(λ) ausdividieren lasst. Die geometrische Vielfachheitvon λ ist die Dimension des Eigenraums Eig λ.

6.54 Satz: Die geometrische Vielfachheit eines Eigenwertes ist kleiner odergleich der algebraischen Vielfachheit.

Beweis: Der Eigenraum ist offenbar ein Unterraum, der durch die Abbildungin sich selbst abgebildet wird. Naturlich besitzt der Eigenraum eine Basis aus Ei-genvektoren. Es gilt also fur das charakteristische Polynom auf dem EigenraumE = Eig λ0

mit Dimension n

χφ|E = (λ− λ0)n.

Es folgt aus dem vorigen Satz, dass dieses Polynom das gesamte charakteristi-sche Polynom teilt. Also ist die geometrische Vielfachheit von λ0 kleiner odergleich der algebraischen Vielfachheit von λ0. 2

6.55 Aufgabe: (a) Seien λ1, . . . , λk paarweise verschiedene Eigenwerte eines Endo-morphismus φ : V → V , sowie

0 6= vi ∈ Eigλifur alle i = 1, . . . , k. Zeigen Sie, dass dann v1, . . . , vk linear unabhangig sind.

(b) Folgern Sie, dass fur endlich dimensionales V , ein Endomorphismus φ : V → Vgenau dann diagonalisierbar ist, wenn

k∑i=1

dim Eigλi(φ) = dimV

gilt, wobei λ1, . . . , λk die paarweise verschiedenen Eigenwerte von φ sind.

6.56 Satz: Ein Endomorphismus φ : V → V auf einem n-dimensionalenVektorraum ist genau dann diagonalisierbar, wenn das charakteristische Poly-nom in Linearfaktoren zerfallt und alle geometrischen Vielfachheiten gleich denalgebraischen Vielfachheiten sind.

Page 217: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 217

Insbesondere ist er diagonalisierbar, wenn sein charakteristisches Polynom npaarweise verschiedene Nullstellen hat.

Beweis: Da ein diagonalisierbarer Endomorphismus eine Basis hat mit dar-stellender Matrix als Diagonalmatrix, zerfallt das charakteristische Polynom inLinearfaktoren. Denn dies ist fur Diagonalmatrizen der Fall. Außerdem ist dieSumme der geometrischen Vielfachheiten mindestens n, da φ ja eine Basis ausEigenvektoren besitzt. Da die Summe der algebraischen Vielfachheiten gleich nist, folgt die Gleichheit der geometrischen und algebraischen Vielfachheiten ausdem vorigen Satz.

Wenn umgekehrt das charakteristische Polynom zerfallt und die geometri-schen gleich den algebraischen Vielfachheiten sind, muss die Summe der geome-trischen Vielfachheiten n sein. Es gibt also eine Basis aus Eigenvektoren.

Die letzte Behauptung folgt daraus, dass die geometrische Vielfachheit jedesEigenvektors mindestens 1 ist. 2

6.57 Aufgabe: Berechnen Sie alle Eigenwerte und Eigenraume der Matrix

A =

1 1 1 10 1 1 10 0 2 10 0 0 2

6.58 Aufgabe: Berechnen Sie fur a ∈ K alle Eigenwerte und Basen der zugehorigenEigenraume der Matrix

Aa =

a 1 . . . 1

1. . .

. . .

.... . .

. . . 11 . . . 1 a

∈ Kn×n

Anstatt die Diagonalisierbarkeit zu fordern, kann man oft wenigstens eineahnliche obere Dreiecksmatrix erreichen. Wir werden diesen Sachverhalt spaternoch verscharfen, indem wir eine spezielle Gestalt fur die obere Dreiecksmatrixfordern.

6.59 Satz: Eine Matrix A ∈ Kn×n ist genau dann ahnlich zu einer oberenDreiecksmatrix, wenn χA in Linearfaktoren zerfallt.

Beweis: Da das charakteristische Polynom einer oberen Dreiecksmatrix inLinearfaktoren zerfallt, folgt die eine Richtung aus Satz 6.33.

Der Beweis der anderen Richtung geht mit Induktion nach n. n = 1 ist klar.Sei n > 1. Aufgrund der Annahme gibt es einen Eigenwert λ1 von A und dazueinen Eigenvektor v1. Wir erganzen v1 zu einer Basis v1, . . . , vn von Kn underhalten als darstellende Matrix von φA(x) = Ax die Matrix

A =(λ1 zT

0 An−1

)

Page 218: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

218 KAPITEL 6. EIGENWERTE

mit einem z ∈ Kn. Es gilt fur die Matrix An−1 ∈ Kn−1×n−1

χA(X) = (λ1 −X)χAn−1(X).

Also zerfallt auch das charakteristische Polynom von An−1 in Linearfaktoren,und An−1 ist aufgrund der Induktionsannahme ahnlich zu einer oberen Drei-ecksmatrix Rn−1, also

An−1 = Hn−1Rn−1H−1n−1.

Nun folgt(λ1 zT

0 An−1

)·(

1 00 Hn−1

)=(λ1 zTHn−1

0 An−1Hn−1

)=(λ1 zTHn−1

0 Hn−1Rn−1

)=(

1 00 Hn−1

)·(λ1 zTHn−1

0 Rn−1

).

Dies zeigt, dass die Matrix A ahnlich zu einer oberen Dreiecksmatrix ist, alsoauch die Matrix A, die ja ahnlich zu A ist. 2

6.60 Aufgabe: Finden Sie eine obere Dreiecksmatrix, zu der

A =

(2 −11 0

)ahnlich ist. Geben Sie die Matrix H an, die die Ahnlichkeit vermittelt.

6.61 Aufgabe: Sei A ∈ Kn×n eine Matrix, die nicht den Eigenwert 1 hat. ZeigenSie, dass dann In −A invertierbar ist, und dass

In +A+ . . .+Am = (In −Am+1)(In −A)−1

fur alle m ∈ N gilt.

6.62 Aufgabe: (a) Sei A ∈ Kn×n, v0, b ∈ Kn und

vm+1 = Avm + b, m ∈ N0.

Geben Sie eine Summenformel fur vm an.

(b) Vereinfachen Sie diese Formel fur den Fall, dass A nicht den Eigenwert 1 hat.

(c) Sei speziell

A =

(3 11 3

)∈ Rn×n

und v0 = 0, b = e1. Geben Sie mit Hilfe von (b) und einer Hauptachsentransformationvon A eine explizite Formel fur die Komponenten von vm an.

(d) Wieder gelte v0 = 0, b = e1. Die Matrix

A =

(2 11 2

)∈ Rn×n

hat den Eigenwert 1. Deswegen muss man in diesem Fall anders rechnen. Stellen Sie

dazu b als Linearkombination der Eigenvektoren dar, und finden Sie so erneut eine

Formel fur vm.

Page 219: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 219

6.1.4 Selbstadjungierte Endomorphismen

Wir erinnern daran, dass eine Abbildung φ : V → V auf einem Skalarproduk-traum V uber K selbstadjungiert heißt, wenn

〈φ(x), y〉 = 〈x, φ(y)〉

fur alle x, y ∈ Kn ist. Falls φ(x) = Ax ist und V = Kn, so bedeutet dies fur dieMatrix A, dass sie symmetrisch bzw. konjugiert symmetrisch (Hermitesch) ist,also

A = A∗

Allgemeiner muss in einem endlich-dimensionalen Skalarproduktraum die dar-stellende Matrix von φ bezuglich einer Orthonormalbasis Hermitesch sein, damitφ selbstadjungiert ist.

6.63 Aufgabe: Zeigen Sie, dass zwei Eigenvektoren zu verschiedenen Eigenwerten

eines selbstadjungierten Endomorphismus senkrecht aufeinander stehen mussen.

6.64 Satz: Ein selbstadjungierter Endomorphismus φ : V → V auf einemendlich dimensionalen Skalarproduktraum V uber K besitzt eine Orthonormal-basis aus Eigenvektoren. Alle Eigenwerte sind reell.

Beweis: Sei zunachst K = C. Wir beweisen den Satz durch Induktion nach derDimension von V . Aufgrund des Hauptsatzes der Algebra besitzt χφ mindestenseine Nullstellen λ ∈ C. λ ist also Eigenwert von φ und wir berechnen mit demzugehorigen Eigenvektor x

λ〈x, x〉 = 〈x, φ(x)〉 = 〈φ(x), x〉 = λ〈x, x〉.

Es folgt λ = λ und daher λ ∈ R. Dies beweist speziell die Behauptung im FalldimV = 1. Fur dimV > 1 sei nun

U = x⊥.

Fur u ∈ U erhalt man

〈φ(u), x〉 = 〈u, φ(x)〉 = λ〈u, x〉 = 0.

Also φ(u) ∈ U . Es folgt φ(U) ⊆ U . Auf dem Skalarproduktraum U ist φ wiederselbstadjungiert. Also besitzt dort φ eine Basis aus Eigenvektoren, die zusammenmit x eine Basis aus Eigenvektoren von φ auf V ergibt.

Sei nun K = R. Wir wahlen eine Orthonormalbasis A von V . Sei A diedarstellende Matrix von φ bezuglich dieser Basis. Dann ist A = AT und mit derobigen Argumentation erhalten wir einen reellen Eigenwert λ von A mit einemreellen Eigenvektor x ∈ Rn. Also ist

x = φA(x) ∈ V

ein Eigenvektor von φ zum reellen Eigenwert λ. Wir konnen nun wie oben perInduktion schließen und den Beweis vervollstandigen. 2

6.65. Bemerkung: Aus dem Satz folgt sofort, dass fur A = A∗ eine unitareMatrix H und eine reelle Diagonalmatrix D existiert mit

A = HDH−1 = HDH∗.

Page 220: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

220 KAPITEL 6. EIGENWERTE

6.66. Beispiel: Wir haben bereits fur die Matrix

A =(

2 11 2

)eine Basis aus Eigenwerten hergeleitet. Normiert man diese Eigenvektoren, soerhalt man (

2 11 2

)=

1√2

(1 11 −1

)(3 00 1

)1√2

(1 11 −1

).

In diesem Fall ist H selbst symmetrisch. Das muss jedoch im allgemeinen nichtder Fall sein. Vertauscht man in diesem Beispiel die Eigenwerte 1 und 3, so istes auch tatsachlich nicht mehr der Fall, jedoch ist H immer noch orthogonal.

6.1.5 Das Minimalpolynom

Wir beginnen mit dem beruhmten Satz von Cayley-Hamilton, den wir schon inSpezialfallen nachgerechnet haben. Er besagt, dass eine Matrix, eingesetzt inihr eigenes charakteristisches Polynom, die Nullmatrix ergibt. Die Informationdaruber, welche polynomialen Ausdrucke eine Matrix zu 0 machen, sagt, wiewir sehen werden, viel uber die Struktur der zugehorigen Abbildung aus.

6.67. Beispiel: Sei

A =(

2 11 2

)So berechnet man χA(λ) = λ2 − 4λ + 3. Setzt man A fur λ ein, so erhalt mandie Nullmatrix. In der Tat

χA(A) = A2 − 4A− 3I2 = 0.

Im Fall von diagonalisierbaren Matrizen lasst sich das auch leicht beweisen.Denn, wenn A = HDH−1 ist mit einer Diagonalmatrix D aus Eigenwertenλ1, . . . , λn, so gilt

χA(A) = HχA(D)H−1 = H

χA(λ1). . .

χA(λn)

H−1 = 0.

6.68 Satz: (Cayley-Hamilton) Sei A ∈ Kn×n. Dann gilt

χA(A) = 0.

Der folgende Beweis ist recht abstrakt. Wenn man zur Verfugung hat, dassdas charakteristische Polynom von A in K oder in einem ErweiterungslorperK ⊃ K n Linearfaktoren zerfallt, so gibt es einen einfacheren Beweis, der weiterunten wiedergegeben ist.

Page 221: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 221

Beweis: Wir betrachten die Matrix

B = A−XIn,

die als Eintrage Elemente aus K[X] hat. Es gilt

detB = χA ∈ K[X].

Mit Hilfe der Cramerschen Regel berechnen wir die Inverse von B, deren Ele-mente wir mit detB multiplizieren. Man erhalt eine Matrix B uber K[X] mit

B · B = (detB)In.

Wir haben also fur alle i, k

n∑j=1

bi,j bj,k = δi,k detB.

Dabei ist δi,k das Kroneckersymbol, und auf beiden Seiten stehen Polynome inK[X]. Wir setzen nun fur X die Matrix A ein, was wir als

(detB)(A), bi,j(A), bi,j(A) ∈ Kn×n

schreiben. Wir konnen dann diese Matrizen mit den Einheitsvektoren e1, . . . , enmultiplizieren und erhalten durch Umsummieren und Ausnutzen der Kommu-tativitat von Polynomausdrucken in A

(detB)(A)ek =n∑i=1

(δi,k detB)(A) · ei

=n∑i=1

n∑j=1

(bi,j bj,k)(A)ei

=n∑i=1

n∑j=1

bi,j(A)bj,k(A)ei

=n∑j=1

n∑i=1

bi,j(A)bj,k(A)ei

=n∑j=1

n∑i=1

bj,k(A)bi,j(A)ei

=k∑j=1

(bj,k(A)

n∑i=1

bi,j(A)ei

)

Andererseits berechnen wir fur i, j = 1, . . . , n wegen B = A−XIn

bi,j(A) = ai,j −Aδi,j

und daher fur j = 1, . . . , n

n∑i=1

bi,j(A)ei =

(n∑i=1

ai,jei

)− aj = 0.

Page 222: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

222 KAPITEL 6. EIGENWERTE

Es folgt(detB)(A)ek = 0

fur alle k = 1, . . . , n und daher die Behauptung. 2

6.69 Aufgabe: Die Matrix

Ja,n =

a 1

. . .. . .

a 1a

∈ Kn×n

nennt man Jordanblock. Berechnen Sie geometrische und algebraische Vielfachheitdes Eigenwerts a von Ja,n. Zeigen Sie den Satz von Cayley-Hamilton

(Ja,n − aIn)n = 0.

fur diesem Spezialfall. Sei A die Blockmatrix

A =

(Ja,n 0

0 Jb,m

)Rechnen Sie den Satz von Cayley-Hamilton auch in diesem Spezialfall nach.

6.70. Bemerkung: Wenn φ : V → V linear ist und V ein endlich dimensio-naler Vektorraum uber K, so kann man naturlich auch die Abbildung φ in ihrcharakteristisches Polynom einsetzen. Es gilt dann ebenfalls

χφ(φ) = 0.

Zum Beweis wahlt man eine Basis A von V . Sei A die darstellende Matrixvon φ bezuglich A. Dann ist fur jedes Polynom P ∈ K[X] die Matrix P (A)die darstellende Matrix der Abbildung P (φ). Also folgt die Behauptung ausχA(A) = 0.

6.71. Bemerkung: Man kann den Satz von Cayley-Hamilton auch anders be-weisen. Dazu betrachten wir zunachst den Fall, dass χA in Linearfaktoren zerfallt

χA(λ) = (λ− λ1) · . . . · (λ− λn).

Dann ist A ahnlich zu einer oberen Dreiecksmatrix D, also

A = HDH−1

mit einer regularen Matrix H. Es folgt

χA(A) = HχA(D)H−1 = HχD(D)H−1.

Es genugt also, den Satz fur obere Dreiecksmatrizen zu beweisen. Es gilt

χD(D) = (D − λ1In) · . . . · (D − λnIn)

fur alle i = 1, . . . , n, wobei die Reihenfolge der Faktoren D− λiIn vertauschbarist. Fur obere Dreiecksmatrizen gilt aber

(D − λiIn)ei ∈ span {e1, . . . , ei−1}.

Page 223: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 223

Aufgrund der Vertauschbarkeit folgt per Induktion

χD(D)ei = 0 fur alle i = 1, . . . , n,

und damit die Behauptung. Falls χA(λ) allerdings nicht in Linearfaktoren zer-fallt, so muss man mit algebraischen Hilfsmitteln einen Erweiterungskorper Kvon K konstruieren, in dem das der Fall ist. Damit kann man den Beweis auchin diesem Fall durchfuhren.

6.72. Definition: Sei φ : V → V linear, und V ein endlich dimensionaler Vek-torraum uber K. Dann heißt das Polynom P mit kleinstem Grad und hochstemKoeffizienten 1, fur das P (φ) = 0 gilt, das Minimalpolynom von φ. Analogdefinieren wir das Minimalpolynom einer Matrix A ∈ Kn×n.

6.73 Satz: Das Minimalpolynom einer Abbildung φ : V → V , V ein endlichdimensionaler Vektorraum, ist eindeutig bestimmt.

Das Minimalpolynom ist ein Teiler jedes Polynoms, das φ annulliert, insbeson-dere ein Teiler des charakteristischen Polynoms.

Umgekehrt ist jedes Primpolynom, das das charakteristische Polynom teilt, einTeiler des Minimalpolynoms. Insbesondere hat das Minimalpolynom alle Eigen-werte als Nullstellen.

Beweis: Sei M ∈ K[X] ein Minimalpolynom. Dann kann man M aus einemweiteren Polynom P ∈ K[X] ausdividieren und erhalt

P = QM +R, degR < degM.

Wenn P (φ) = 0 ist, so muss also R(φ) = 0 sein. Da M minimalen Grad mitdieser Eigenschaft hat, folgt R = 0 und M teilt P , was die zweite Aussage desSatzes ist.

Wir haben damit auch bewiesen, dass M eindeutig bestimmt ist. Denn furein zweites Minimalpolynom P mit gleichem Grad wurde P = QM gelten, wobeiP ein konstantes Polynom ist. Wir haben aber festgelegt, dass das Minimalpo-lynom den hochsten Koeffizienten 1 haben soll.

Sei P ein Primpolynom, das χφ teilt. Wir setzen

U = Kern P (φ).

U ist Unterraum von V und es gilt fur u ∈ U

(P (φ) ◦ φ)(u) = (φ ◦ P (φ))(u) = 0,

also φ(u) ∈ U . Es folgtφ(U) ⊆ U.

P ist nun per Definition von U ein Polynom, dass φ|U auf U annulliert. Da eskeine Teiler hat, ist es nach dem schon bewiesenen Behauptungen das Minimal-polynom von φ|U . Andererseits annulliert χφ die Abbildung φ, also auch dieAbbildung φ|U . Es folgt die Behauptung. 2

Page 224: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

224 KAPITEL 6. EIGENWERTE

6.74. Beispiel: Sei φ : R2 → R2 die Drehung um 60◦. Dann gilt φ3 = −id. DasMinimalpolynom ist also Teiler von

λ3 + 1 = (λ+ 1)(λ2 − λ+ 1).

Die Nullstellen des zweiten Faktors sind

λ1,2 =12±√

32i.

Also ist dieses Polynom in R ein Primpolynom. Da λ+ 1 nicht das Minimalpo-lynom ist, muss es der zweite Faktor sein. Da dieses Polynom den Grad 2 hat,ebenso wie das charakteristische Polynom, folgt, dass es gleich dem charakteris-tischen Polynom ist.

χφ(λ) = λ2 − λ+ 1.

In der Tat ist die Drehmatrix gleich

A60◦ =(

cos 60◦ − sin 60◦

sin 60◦ cos 60◦

)und

χA60◦ = λ2 − 2(cos 60◦)λ+ 1 = λ2 − λ+ 1.

6.75. Beispiel: Allgemeiner sei φ die Drehung um 360◦/n. Dann gilt φn = id.Das Minimalpolynom ist also

λn − 1 = (λ− 1)(1 + λ+ . . .+ λn−1).

Das Minimalpolynom dieser Drehung ist aber fur n > 2 gleich dem charakteris-tischen Polynom

χφ(λ) = λ2 − 2 cos(

360◦

n

)λ+ 1.

6.76. Beispiel: Eine Projektion φ2 = φ hat also Minimalpolynom eines derPolynome

λ, λ− 1, λ(λ− 1).

Die Jordanmatrix von φ besteht also in jedem Fall aus einer Diagonalmatrix mit0 und 1 in der Diagonalen. Sonderfalle sind die Nullmatrix und die Identitat.

6.77. Beispiel: Das charakteristische Polynom eines Jordanblocks Ja,n istχ(λ) = (λ−a)n. Das Minimalpolynom ist ein Teiler davon, also p(λ) = (λ−a)k

mit einem k = 0, . . . , n nur k = n. Man rechnet nach, dass in der Tat χ selberdas Minimalpolynom ist.

6.78. Definition: Eine Matrix

J =

Ja1,n1

. . .Jak,nk

,

Page 225: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 225

die aus Jordanblocken zusammen gesetzt ist, nennt man Jordanmatrix.

6.79 Satz: Das Minimalpolynom der Jordanmatrix J , die aus den Jordan-blocken Jai,ni mit i = 1, . . . , k besteht, ist gleich

P (λ) = (λ− b1)m1 · . . . · (λ− bs)ms ,

wobei b1, . . . , bs die paarweise verschiedenen Eigenwerte sind, also

{b1, . . . , bs} = {a1, . . . , ak},

sowie mi der maximale Index nj mit dem bi unter den den aj vorkommt, also

mi = max{nj : bi = aj fur ein j = 1, . . . , k}.

Beweis: Aufgrund des obigen Satzes muss das Minimalpolynom von J dieForm

p(λ) = (λ− b1)m1 · . . . · (λ− bs)ms

haben. Denn es muss ein Teiler des charakteristischen Polynoms sein und esmuss jeden Primteiler λ− bi dieses Polynoms als Faktor enthalten. Man rechnetaber leicht nach, dass alle mi wie im Satz verlangt gewahlt werden mussen. 2

6.80. Beispiel: Wenn V nicht endlich dimensional ist, so braucht fur Endo-morphismen φ : V → V kein Minimalpolynom zu existieren. Im FolgenraumL = A(N0,R) sei

D(a0, a1, a2, . . .) = (a1, a2, . . .)

der Shift-Operator D : L → L. Dann gibt offenbar kein Polynom, dass Dannulliert. Fur irgendein Polynom P ∈ R[X] ist allerdings, wie die folgendeAufgabe zeigt,

U = Kern P (D)

ein Unterraum von L, der durch D in sich abgebildet wird. In U wird D|U durchP annulliert und besitzt dort ein Minimalpolynom.

6.81 Aufgabe: Sei φ : V → V ein Endomorphismus und P ∈ K[X] ein Polynom.

Zeigen Sie, dass fur jedes Polynom Q ∈ K[X] die Abbildug Q(φ) den Unterraum

Kern P (φ) in sich abbildet.

Unser nachstes Ziel ist es, den folgenden Satz zu beweisen.

6.82 Satz: Jede lineare Abbildung φ : V → V , V ein endlich dimensio-naler Vektorraum uber K, deren charakteristisches Polynom in Linearfaktorenzerfallt, kann mit Hilfe einer geeigneten Basis als Jordanmatrix dargestellt wer-den. Diese Jordanmatrix ist bis auf die Reihenfolge der Blocke eindeutig be-stimmt.

6.83. Bemerkung: Als Folgerung erhalten wir, dass zwei Matrizen A,B ∈Kn×n genau dann ahnlich sind, wenn sie ahnlich zur selben Jordanmatrix sind.

6.84. Beispiel: Sei φ : R2 → R2 ein Endomorphismus mit φ2 = 2φ− id. Dannannuliert

P (X) = X2 − 2X + 1 = (X − 1)2

Page 226: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

226 KAPITEL 6. EIGENWERTE

den Endomorphismus φ. Das Minimalpolynom muss ein Teiler davon sein. Eskommen also in Frage

(X − 1), (X − 1)2

φ muss also nach den obigen beiden Satzen gleich einer der folgenden Abbildun-gen sein. (

1 00 1

),

(1 10 1

).

Diese beiden Matrizen sind nicht ahnlich zueinander.

6.85 Aufgabe: Sei φ : R3 → R ein Endomorphismus mit φ3 = φ. Geben Sie alle

Jordanmatrizen an, die diese Gleichung erfullen.

Zum Beweis des obigen Satzes sind folgende vorbereitende Aufgaben nutz-lich.

6.86 Aufgabe: Sei V endlich dimensional.

(a) Seien φ1, φ2 : V → V Endomorphismen mit

φ1 ◦ φ2 = 0,

sowie

Kern φ1 ∩Kern φ2 = {0}

Zeigen Sie

V = Kern φ1 ⊕Kern φ2.

Hinweis: Zeigen Sie mit Hilfe von Dimensionsformeln

dimV = dim Kern φ1 + dim Kern φ2,

wobei Sie von Bild φ2 ⊆ Kern φ1 ausgehen.

(b) Sei P ein Polynom, das in zwei teilerfremde Faktoren P = Q1Q2 zerlegt sei, undφ : V → V ein Endomorphismus. Zeigen Sie

Kern P (φ) = Kern Q1(φ)⊕Kern Q2(φ).

Hinweis: Aufgrund einer vorigen Aufgabe, sind Q1(φ) und Q2(φ) Endomorphismen aufKern P (φ). Uberlegen Sie sich, dass das Minimalpolynom des Schnittes Teiler von Q1

und Q2 die Identitat sein musste.

(c) Verallgemeinern Sie auf mehr als zwei Faktoren.

Beweis: Wir zeigen nun die Existenz der Jordandarstellung eines Endomor-phismus φ : V → V , V endlich dimensional, dessen charakteristisches Polynomin Linearfaktoren zerfallt. Das Minimalpolynom P ist ein Teiler des charakte-ristischen Polynoms und zerfallt dann in teilerfremde Faktoren der Form

P (X) = (X − λ1)k1 · . . . · (X − λs)ks .

Wir setzenUi = Kern (φ− λi id)ki , i = 1, . . . , s.

Aufgrund Aufgabe 6.81 giltφ(Ui) ⊆ Ui.

Page 227: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 227

Mit Hilfe Aufgabe 6.86 zeigt man

V = U1 ⊕ . . .⊕ Us.

Wir konnen uns also darauf beschranken zu zeigen, dass φ|Ui eine Jordandar-stellung mit Jordanblocken hat, die λi in der Diagonalen haben. Das Minimal-polynom von φ|Ui ist (X − λi)ki .

Wir durfen also annehmen, dass φ : V → V ein Endomorphismus mit Mini-malpolynom (X − λ)k ist. In der Tat konnen wir φ durch φ− λ id ersetzen unduns auf den Fall λ = 0 reduzieren.

Jede Jordandarstellung von φ besteht nun aus Ketten

v0 = v, v1 = φ(v), . . . , vt−1 = φt−1(v), φt(v) = 0.

Die Matrixdarstellung von φ bezuglich v0, . . . , vt−1 ist dann ein JordanblockJ0,t. Die Vektoren einer Kette sind automatisch linear unabhangig. Wir mussengenugend vieler solcher Ketten finden, so dass die Gesamtzahl der VektorendimV betragt, und die Vektoren linear unabhangig sind. Dies ist aquivalentmit der Existenz von linear unabhangigen Vektoren

v1,j , . . . , vmj ,j , j = 1, . . . , k

mitm1 > . . . > mk

mitφ(vi,j) = vi,j−1, i = 1, . . . ,mj , j = 2, . . . , k,

undφ(vi,1) = 0, i = 1, . . . ,m1.

Wir benotigen außerdem genugend viele Vektoren, also

m1 + . . .+mk = dimV.

Ein Beispiel fur ein solches System ist

v4,1 ∈ Kern φ4

↓v3,1 v3,2 ∈ Kern φ3

↓ ↓v2,1 v2,2 ∈ Kern φ2

↓ ↓v1,1 v1,2 v1,3 v1,4 ∈ Kern φ↓ ↓ ↓ ↓0 0 0 0

Die darstellende Matrix hatte die Jordanblocke

J0,4, J0,3, J0,1, J0,1.

Die letzten beiden Blocke formen naturlich die Nullmatrix, also eine Diagonal-matrix mit 0 in der Diagonalen. Hier ist k = 4 und dimV = 9. Das Minimalpo-lynom ist X4.

Page 228: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

228 KAPITEL 6. EIGENWERTE

Wir suchen also Vektoren

vi,j ∈ Kern φj \Kern φj−1.

Diese Vektoren werden induktiv fur j = k, . . . , 1 gefunden. Zunachst wahlen wireine Basis v1, . . . , vn von V = Kern φk und betrachten die Vektoren

φk−1(v1), . . . , φk−1(vn),

die nicht alle gleich 0 sein konnen. Aus diesen Vektoren wahlen wir ein linearunabhangiges Teilsystem aus, etwa die ersten mk Vektoren. Dann setzen wir

vk,i = vi, . . . , v1,i = φk−1(vi)

fur i = 1, . . . ,mk. Im obigen Beispiel haben wir damit eine Kette von Vektoren,namlich die erste Spalte v4,1, . . . , v1,1, festgelegt.

Im zweiten Schritt wahlen wir die Vektoren

vk−1,1, . . . , vk−1,mk−1 .

Die ersten mk dieser Vektoren sind bereits festgelegt. Diese Vektoren erganzenwir zu einer Basis von Kern φk−1 und wahlen ein lineares Teilsystem der Bilderunter φk−2 dieser Vektoren. Dieses System kann man so wahlen, dass es dieschon gewahlten Vektoren

v1,1, . . . , v1,mk ,

die ja linear unabhangig sind, umfasst. Das so gewahlte System bestimmt dieVektoren

vmk+1,k−1, . . . , vmk−1,k−1.

Im obigen Beispiel gilt mk = 1, mk−1 = 2, und wir haben auf diese Weisedie Kette v3,2, . . . , v1,2 gefunden. Man beachte aber, dass mk−1 = mk durchausmoglich ist. Dieser Fall tritt etwa im nachsten Schritt unseres Beispiels auf.

Analog verfahren wir bis wir im letzten Schritt die Vektoren

v1,1, . . . , v1,m2

zu einer Basis von Kern φ erganzen.

Die Gesamtheit der Vektoren, die wir auf diese Weise erhalten haben, istlinear unabhangig. Um das einzusehen, wendet man nacheinander φk, . . . , φ aufeine Linearkombination dieser Vektoren an, die gleich 0 ist, und verwendet, dassv1,1, . . . , v1,m1 linear unabhangig sind.

Aufgrund dieser Konstruktion gilt fur j = k, . . . , 1

mj = dimφj−1(Kern φj).

Andererseits giltKern φj−1 ⊆ Kern φj .

Wendet man die Dimensionsformel auf φj−1|Kern (φj) an, so erhalt man

mj = dim Kern φj − dim Kern φj−1.

Page 229: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.1. DEFINITION UND EIGENSCHAFTEN 229

Alsomk + . . .+m1 = dim Kern φk = dimV,

wie gewunscht.

Um die Eindeutigkeit der Darstellung zu beweisen, bemerken wir, dass dieLange der Ketten durch die Dimensionen von Kernφj nach der obigen Formelfur die mj vorgegeben sind. Damit ist aber auch die Jordanmatrix bis auf dieReihenfolge der Jordanblocke eindeutig gegeben. 2

6.87. Bemerkung: Die Existenz lasst sich auch leichter beweisen. GemaßSatz 6.59 ist eine Matrix A ahnlich zu einer oberen Dreiecksmatrix R. Es ist nunmoglich, mit Hilfe von Elementarmatrizen E1, . . . , Em die Matrix R zur einerJordanmatrix J umzuformen, so dass J und R mittels

J = E−1m . . . E−1

1 AE1 . . . Em

ahnlich zueinander sind.

6.88. Beispiel: Fur die Matrix

A =

1 2 20 1 00 0 1

multiplizieren wir die zweite Spalte mit 1/2 und entsprechend die zweite Zeilemit 2. Es entsteht die Matrix

A1 =

1 1 20 1 00 0 1

Nun addieren wir das (−2)-fache der zweiten zur dritten Spalte und entspre-chend das 2-fache der dritten zur zweiten Zeile. Wir erhalten die Jordanmatrix

A2 =

1 1 00 1 00 0 1

Der Basiswechsel wird in diesem Fall gegeben durch

E1 · E2 =

1 0 00 1/2 −10 0 1

.

Zur Berechnung muss man lediglich die verwendeten Spaltenoperationen an derEinheitsmatrix ausfuhren. Die Spalten v1, v2, v3 dieser Matrix haben tatsachlichdie Eigenschaft

Av1 = v1, Av2 = v2 + v1, Av3 = v3.

Man beachte, dass im Fall

A =

1 0 10 1 00 0 1

Page 230: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

230 KAPITEL 6. EIGENWERTE

eine Vertauschung der ersten und zweiten Spalte zum Ziel fuhrt.

6.89 Aufgabe: Finden Sie fur die folgenden Matrizen Basen des R3, so dass diedarstellenden Matrizen bezuglich dieser Basen Jordanmatrizen sind.0 0 1

0 0 10 0 0

,

0 1 10 0 00 0 0

,

0 1 10 0 10 0 0

.

Fuhren Sie die Rechnung mit Hilfe von Elementarmatrizen und mit Hilfe des Algo-

rithmus im obigen Beweis durch.

6.90 Aufgabe: Zeigen Sie, dass eine Matrix A genau dann diagonalisierbar ist, wenn

ihr charakteristisches Polynom in Linearfaktoren zerfallt, und das Minimalpolynom

jeden dieser Faktoren einfach enthalt.

6.2 Anwendungen

6.2.1 Positiv definite Matrizen

Man kann positiv definite Matrizen auch uber ihre Eigenwerte charakterisieren.

6.91 Satz: Sei A ∈ Kn×n Hermitesch. Dann ist

λ = maxx 6=0

xTAx

xTx= max‖x‖=1

xTAx

gleich dem großten Eigenwert von A und

µ = minx 6=0

xTAx

xTx= min‖x‖=1

xTAx.

gleich dem kleinsten Eigenwert von A. Folglich ist A genau dann positiv definit,wenn alle Eigenwerte positiv sind.

Beweis: Nach Satz 6.64 gibt es eine orthogonale Matrix P und eine Diago-nalmatrix D aus reellen Eigenwerten von A mit

A = PDP ∗.

PT ist ebenfalls orthogonal und es gilt daher

λ := sup‖x‖=1

xTAx = sup‖x‖=1

(PTx)TDPTx = sup‖x‖=1

xTDx.

Es folgt

λ = sup{n∑ν=1

λνx2ν :∑nν=1 x

2ν = 1},

wobei λ1 ≤ . . . ≤ λn die Eigenwerte von A seien. Mit x = en erhalt man λ ≥ λn.Andererseits

n∑ν=1

λνx2ν ≤ λn

n∑ν=1

x2ν .

Page 231: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 231

Es folgt λ ≤ λn. Also, wie behauptet λ = λn. Außerdem ist das Supremum einMaximum. Analog beweist man die Behauptung fur das Minimum. Die Eigen-wert von vv∗ sind 1 mit dem Eigenvektor v und gleich 0 mit dem Eigenraumv⊥. Die Matrix vv∗ ist die Matrix der orthogonalen Projektion auf den von verzeugten Unterraum. 2

6.92. Bemerkung: Aufgrund des Satzes von Hurwitz hat eine positiv defini-te Matrix eine positive Determinante. Dies steht im Einklang damit, dass dieDeterminante das Produkt der Eigenwerte ist.

6.93. Beispiel: Matrizen der Form vv∗ mit v ∈ Kn sind positiv semi-definit.Es gilt namlich

xT (vv∗)x = (xT v)(vTx) = |xT v|2 ≥ 0.

Dieser Sachverhalt folgt auch daraus, dass vv∗ die Darstellende Matrix der senk-rechten Projektion auf den von v erzeugten Unterraum ist. Ubrigens gilt

vv∗ =

|v1|2 . . . v1vn

......

vnv1 . . . |vn|2

.

Dies steht im Einklang damit, dass die Diagonalelemente einer positiv semi-definiten Matrix nicht-negativ sein mussen.

6.94. Definition: Sei A Hermitesch, sowie n+ die Anzahl der positiven Ei-genwerte von A einschließlich Vielfachheit gezahlt, n− die Anzahl der negativenEigenwerte mit Vielfachheit, und n0 die Vielfachheit des Eigenwertes 0. Dannheißt (n+, n−, n0) die Signatur von A.

6.95. Bemerkung: Eine positiv definite Matrix A ∈ Kn×n hat also die Signatur(n, 0, 0), eine negativ definite die Signatur (0, n, 0).

6.96. Bemerkung: Wir erinnern daran, dass jede darstellende Matrix einesSkalarproduktes positiv definit ist. Man kann aber auch konjugiert symmetrischeBilinearformen durch Matrizen darstellen. Also

〈v, w〉 = λTMµ

wobei λ und µ die Darstellungen von v und w bezuglich einer Basis B =(v1, . . . , vn) sind. Es gilt dann

M =

〈v1, v1〉 . . . 〈v1, vn〉...

...〈vn, v1〉 . . . 〈vn, vn〉

M ist dann Hermitesch. Es folgt, dass es fur zwei darstellende Matrizen M undM desselben Skalarprodukts eine invertierbare Matrix S gibt, so dass

M = SMS∗

ist. Denn man kann S = ET setzen, wobie E die Matrix des Basiswechselsist. Der folgende Tragheitssatz von Sylvester besagt, dass man nicht alleMatrizen auf diese Art ineinander tranformieren kann.

6.97 Satz: Die darstellenden Matrizen einer symmetrischen Bilinearformhaben alle dieselbe Signatur.

Page 232: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

232 KAPITEL 6. EIGENWERTE

Beweis: Jede darstellende Matrix M ist Hermitesch und damit orthogonalahnlich zu einer Diagonalmatrix

M = PDP ∗

mit einer orthogonalen Matrix P . M und D haben dieselben Eigenwerte unddamit dieselbe Signatur. Nimmt man PT als Basiswechsel, so folgt, dass wir dieBehauptung nur fur darstellende Matrizen zeigen mussen, die Diagonalmatrizensind.

Seien nun D und D zwei solche darstellende Diagonalmatrizen mit Signatu-ren (n+, n−, n0) und (n+, n−, n0). Aus der Basis, die zu D gehort, erhalt manUnterraume U+, U−, U0 mit

〈v, v〉 > 0 fur alle v ∈ U+,

〈v, v〉 < 0 fur alle v ∈ U−,〈v, v〉 = 0 fur alle v ∈ U0,

unddimU+ = n+, dimU− = n−,dimU0 = n0,

sowieV = U+ ⊕ U− ⊕ U0.

Analog seien U+, U−, U0 definiert. Aber auch U+, U− und U0 schneiden sichpaarweise nur in der 0. Also gilt

dimV ≥ dimU+ + dim U− + dim U0 = dimU+ + dimV − dim U+.

Es folgt dimU+ ≤ dim U+. Analog gilt ≥, so dass n+ = n+ folgt. Ebenso beweistman n− = n−, woraus dann n0 = n0 folgt. 2

Sie beweisen schießlich noch einen Darstellungssatz fur positiv semi-definiteMatrizen. Er besagt, dass diese Matrizen als Summe von Projektionen darstell-bar sind.

6.98 Satz: Eine Hermitesche Matrix A ∈ Kn×n ist genau dann positiv semi-definit, wenn sie als Summe

A =k∑i=1

viv∗i

mit v1, . . . , vk ∈ Kn darstellbar ist.

Beweis: Sei A positiv semi-definit. Dann existiert eine Orthogonalbasis

v1 . . . , vn

aus Eigenvektoren zu Eigenwerten

λ1 > 0, . . . , λk > 0, λk+1 = . . . = λn = 0.

Wir konnen annehmen, dass

‖vi‖2 = λi fur alle i = 1, . . . , k

Page 233: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 233

gilt. Wir behaupten nun

A =k∑i=1

viv∗i .

Dazu berechnen wir fur j = 1, . . . , k(k∑i=1

viv∗i

)vj =

k∑i=0

vi(v∗i vj) = ‖vj‖2vj = λjvj = Avj .

Analog fur j = k + 1, . . . , n(k∑i=1

viv∗i

)vj =

k∑i=1

vi(v∗i vj) = 0 = Avj .

Es folgt die Behauptung. Sei umgekehrt x ∈ Kn. Dann gilt

xT

(k∑i=1

viv∗i

)x =

k∑i=1

|xT vi|2 ≥ 0.

2

6.99 Aufgabe: Zeigen Sie, dass

A =

k∑i=1

viv∗i

positiv definit ist, wenn v1, . . . , vk ein Erzeugendensystem des Kn ist.

6.100 Satz: Seien A,B ∈ Kn×n positiv semi-definit. Dann ist auch die MatrixC ∈ Kn×n semi-positiv mit

ci,j = ai,jbi,j .

Diese Matrix nennt man das Hadamard-Produkt von A und B.

Beweis: Seien A,B positiv semi-definit. Wir konnen dann

A =k∑ν=1

vνv∗ν , B =

l∑µ=1

wµw∗µ.

schreiben. Es folgt

ai,j =k∑ν=1

vν,ivν,j , bi,j =l∑

µ=0

wν,iwν,j .

Alsoci,j =

∑1≤ν,µ≤n

(vν,iwµ,i)(vν,jwµ,j).

Also ist auch C Summe von kl positiv semi-definiten elementaren Matrizen, unddaher positiv semi-definit. 2

Page 234: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

234 KAPITEL 6. EIGENWERTE

6.2.2 Quadriken

6.101. Definition: Eine Quadrik ist die Nullstellenmenge eine quadratischenFunktion, also

Q := {x ∈ Rn :∑i,j

ai,jxixj +∑i

bixi = d}

mit Koeffizienten ai,j und bi in R.

6.102. Beispiel: Im R2 gibt es zwei Haupttypen von Quadriken, Ellipsen mitGleichung

x2

a2+y2

b2= 1

und Hyperbeln mit Gleichung

x2

a2− y2

b2= 1.

In Abbildung 6.1 ist die Ellipse und die Hyperbel fur a = 3 und b = 2 zusehen. Beide Kurven gehen durch die Punkte (±a, 0). Die Ellipse geht auchdurch (0,±b). Die Hyperbel hat die Asymptoten y = ±(b/a)x.

Die anderen Typen von Quadriken im R2 sind die Parabel und die Geradenmit Gleichungen

y = ax2, y = ax.

Außerdem gibt es parallele Geraden und gekreuzte Geraden mit den Gleichungen

y2 = c > 0, y2 = x2,

sowie einzelne Punkte (x2 + y2 = 0) und die leere Menge (x2 + y2 = −1). Allediese Quadriken konnen affin abgebildet, also verschoben, verzerrt und gedrehtwerden, und bleiben dabei Quadriken.

Ziel dieses Abschnittes ist es, die Quadriken systematisch in Typen zu ord-nen. Jeder Typ ist eine Klasse von Quadriken, die affin ineinander transformiertwerden konnen.

6.103. Bemerkung: Eine Quadrik lasst als

Q = {x ∈ Rn : xTAx+ bTx = c}

schreiben, mit einer symmetrischen Matrix A ∈ Rn×n und b ∈ Rn, c ∈ R. DieseDarstellung ist bis auf ein multiplikatives Vielfaches eindeutig.

6.104 Satz: Das Urbild eine Quadrik unter einer affinen Abbildung ist wiedereine Quadrik. Das bijektive affine Bild einer Quadrik ist wieder eine Quadrik.

Beweis: Sei φ(x) = Mx+ d eine affine Abbildung, M ∈ Kn×m Dann gilt

φ−1(Q) = {x ∈ Rm : (Mx+ d)TA(Mx+ d) + bT (Mx+ d) = c}= {x ∈ Rm : xT (MTAM)x+ (dTAM + bTM)x = c− dTAd− bT d}.

Page 235: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 235

Abbildung 6.1: Ellipse und Hyperbel

Dies ist wieder eine Quadrik. Es folgt leicht, dass das bijektive affine Bild einerQuadrik wieder eine Quadrik ist. 2

6.105. Bemerkung: Fur nicht-bijektive affine Abbildungen ist das Bild ei-ner Quadrik im Allgemeinen keine Quadrik. So ist zum Beispiel das Bild derKugeloberflache

S2 = {x ∈ R3 : xTx = ‖x‖2 = 1}

unter der Projektion x1

x2

x3

7→ (x1

x2

)der ausgefullte Einheitskreis

D1 = {x ∈ R2 : ‖x‖ ≤ 1}.

Dies ist keine Quadrik.

6.106. Bemerkung: Sei F (x) = c die Gleichung einer Quadrik, also

Q = {x ∈ Rn : F (x) = c}.

Falls dann φ : Rm → Rn eine Abbildung ist, so ist

φ−1(Q) = {y ∈ Rm : φ(y) ∈ Q}= {y ∈ Rm : F (φ(y)) = c}

Page 236: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

236 KAPITEL 6. EIGENWERTE

das Urbild von Q und die Gleichung von φ−1(Q) lautet also einfach F (φ(y)) = c.Sei nun ψ : Rn → Rn eine bijektive Abbildung, Dann gilt also (mit ψ−1 = φ)

ψ(Q) = {y ∈ Rn : F (ψ−1(y)) = c}.

Die Gleichung fur ψ(Q) ist also F (ψ−1(y)) = 0.

6.107. Definition: Unter der Normalform einer Quadrik versteht manQuadriken in Rn mit einer der folgenden Gleichungen

λ1x21 + . . .+ λnx

2n = c,

λ1x21 + . . .+ λn−1x

2n−1 = cxn.

6.108 Aufgabe: Zeigen Sie, dass im R2 Quadriken vom Typ Ellipse, Hyperbel,

Parabel, gekreuzte und parallele Geraden unter den Normalformen vorkommen.

6.109. Definition: Die Hauptachsentransformation einer Quadrik ist dieDarstellung der Quadrik in Normalform. Das heißt, es wird eine Bewegungφ(x) = Mx + d, M orthogonal, angegeben, so dass das Bild der Quadrik ei-ne Quadrik in Normalform ist. In diesem Fall nennt man

φ−1(0) = −M−1d

das Zentrum der Quadrik und φ−1(ei) die Hauptachsen der Quadrik.

6.110. Beispiel: Typische Normalformen im R3 sind die Quadriken mit derGleichung

λ1x21 + λ2x

22 + λ3x

23 = c > 0.

Es enstehen Quadriken nach folgender Tabelle.

Ellipsoid, λ1, λ2, λ3 > 0,einschaliges Hyperboloid, λ1, λ2 > 0, λ3 < 0,zweischaliges Hyperboloid, λ1 > 0, λ2, λ3 < 0.

Als Paraboloid bezeichnet man im R3 die Quadrik

x3 = ax21 + bx2

2

mit a, b > 0. Falls a > 0 und b < 0 ist, so entsteht eine Sattelflache.

6.111 Aufgabe: Berechnen Sie die Schnitte der folgenden Normalformen mit derEbene z = c.

x2 + y2 + z2 = 1, x2 + y2 − z2 = 1, −x2 − y2 + z2 = 1.

6.112 Aufgabe: Berechnen Sie Gleichungen der Figuren, die enstehen, indem man

die Hyperbel y2 − x2 = 1 um die x-Achse und die y-Achse dreht.

6.113 Aufgabe: Zeigen Sie dass die Ortslinie aller Punkte im R2, so dass die Sum-

me der Abstande zu zwei gegebenen Punkten konstant ist, eine Ellipse ist. Hinweis:

Page 237: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 237

Abbildung 6.2: Ellipsoid, ein- und zweischaliges Hyperboloid, Paraboloid

Reduzieren Sie das Problem auf den Fall P1,2 = (±1, 0) und leiten Sie in diesem Fall

die Gleichung der Ellipse her.

6.114 Aufgabe: Zeichnen Sie den Kegel

z2 = x2 + y2

im R3. Geben Sie die Gleichung des um den Winkel φ um die x − Achse gedrehten

Kegels an. Geben Sie die Gleichung des Schnittes dieses gedrehten Kegels mit der

Ebenen z = c an. Zeigen Sie, dass als Schnitt eine Ellipse, eine Hyperbel und eine

Parabel vorkommen kann. Auf diesem Sachverhalt beruht der Name Kegelschnitte

fur Quadriken im R2.

6.115 Aufgabe: Geben Sie die Gleichung fur einen Kreiszylinder mit Achse in der

z-Achse an. Drehen Sie diesen Zylinder um die x-Achse um einen Winkel 0 ≤ φ < π/2

und zeigen Sie, dass der Schnitt mit der Ebene z = 0 eine Ellipse ist.

6.116 Satz: Jede Quadrik kann durch eine Hauptachsentransformation inNormalform gebracht werden.

Beweis: Wir starten mit einer Quadrik Q mit Gleichung

xTAx+ bTx = c.

Page 238: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

238 KAPITEL 6. EIGENWERTE

Da A symmetrisch ist, existiert eine orthogonale Matrix M , so dass

A = MDMT

ist. Dann hat MTQ die Gleichung

(Mx)TA(Mx) + bT Mx = xTDx+ (MT b)Tx = c.

Man ersetzt namlich x durch Mx in der Gleichung von Q. Mit b = Mb, besagtdiese Gleichung

λ1x21 + . . .+ λnx

2n + b1x1 + . . .+ bnxn = c.

Dabei seien λ1, . . . , λn die Diagonalelemente von D, also die Eigenwerte von A.Wir konnen außerdem annehmen, dass

λ1 6= 0, . . . , λk 6= 0, λk+1 = . . . = λn = 0.

gilt.

Im zweiten Schritt ersetzen wir x durch x + d, das heißt wir ermitteln dieGleichung der Quadrik MTQ− d. Man erhalt

λ1x21 + . . .+ λnx

2n + (b1 + 2λ1d1)x1 + . . .+ (bn + 2λndn)xn

= c− λ1d21 − . . .− λnd2

n.

Wahlt man

di =

−bi

2λi, i = 1, . . . , k,

0, sonst,

so erhalt man eine Darstellung der Form

λ1x21 + . . .+ λkx

2k + hk+1xk+1 + . . .+ hnxn = c.

Falls k = n ist oder hk+1 = . . . = hn = 0, so sind wir nun fertig. DasZentrum von MTQ− d ist 0. Das Urbild dieses Punktes ist das Zentrum von Q,also

z = Md.

Die Spalten von M sind die Richtungen der Hauptachsen von Q. Im Fall vonpositiven Eigenwerten sind √

c

λ1, . . . ,

√c

λn

die Langen der Hauptachsen der Ellipse.

Andernfalls gibt es eine orthogonale Matrix H ∈ Rn−k×n−k, so dass

H

hk+1

...hn

=

0...0‖h‖

Page 239: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 239

Wir setzen

H =(Ik 00 H

).

Man erhalt als Gleichung fur die Quadrik H(MTQ− d)

c = (HTx)TDHTx+ (HTx)Th = xTDx+ ‖h‖xn= λ1x

21 + . . .+ λkx

2k + ‖h‖xn.

Um die Konstante c zu entfernen und die endgultige Darstellung zu erhalten,ersetzen wir x durch x+ αen mit α = −c/‖h‖. Die Gleichung der Quadrik

Q = H(MTQ− d)− αen

hat schließlich die gewunschte Normalform. 2

6.117. Beispiel: Wir betrachten die Quadrik mit der Gleichung

x2 + xy + y2 + x = 1.

In Matrixschreibweise ist dies die Gleichung(x y

)( 1 1/21/2 1

)(xy

)+(1 0

)(xy

)= 1.

Die Eigenwerte der Matrix A sind hier 1/2 und 3/2. Da diese Eigenwerte positivsind, kann man bereits schließen, dass Q eine Ellipse ist. Die orthogonale MatrixM wird

M =1√2

(1 1−1 1

)Dies ist eine Drehung um −π/4. Als Gleichung der um π/4 gedrehten QuadrikMTQ erhalten wir daher

x2

2+

3y2

2+

1√2

(x+ y) = 1.

Nun ersetzen wirx→ x− 1√

2, y → y − 1

3√

2,

wahlen also

d =

−1√

2−13√

2

und erhalten die Gleichung

x2

2+

3y2

2= 1− 1

4− 1

12− 1√

2(

1√2

+1

3√

2= 1.

Dabei haben wir die Ellipse verschoben. Das Zentrum der Ellipse liegt also bei

z = Md =(−2/31/3

)

Page 240: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

240 KAPITEL 6. EIGENWERTE

Die Hauptachsen gehen in die Richtungen(1−1

),

(11

)und haben die Langen

√2,

√23.

In Abbildung 6.3 ist Q mit seinem Zentrum, die gedrehte Quadrik MTQ unddie ins Zentrum verschobene Quadrik zu sehen.

Abbildung 6.3: Q mit Zentrum, Q gedreht und verschoben

6.118. Beispiel: Die Quadrik mit der Gleichung xy = 1 stellt sich als um π/4gedrehte Hyperbel heraus, die in Normalform die Gleichung

y2 − x2 = 1

hat. Die Hauptachsen sind die Halbierenden der Quadranten.

6.119. Beispiel: Die Quadrik mit der Gleichung

x2 − 2xy + y2 − x− y = 0

Page 241: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 241

stellt sich als um π/4 gedrehte Parabel heraus.

6.120 Aufgabe: Berechnen Sie die Lange der Hauptachsen des Ellipoids

x2 + y2 + z2 + xy + yz = 1.

6.121 Aufgabe: Berechnen Sie die Hauptachsen und deren Lange des Bildes desEinheitskreises unter der Scherung

φ

(xy

)=

(x+ yy

)Zeichnen Sie diese Ellipse.

6.122 Aufgabe: Zeigen Sie: Eine Quadrik mit der Gleichung

xTAx+ bTx = c

mit A ∈ Rn×n, b ∈ Rn, c ∈ R ist genau dann beschrankt in Rn, wenn A positiv definit

ist.

6.2.3 Singularwerte

6.123 Satz: Sei A ∈ Rn×m, n ≥ m. Dann existiert eine Matrix O ∈ Rn×k,k ≤ m, mit orthonormalen Spalten und eine orthogonale Matrix V ∈ Rm×msowie eine Diagonalmatrix

E =

d1

. . . 0dk

∈ Rk×m

mit d1, . . . , dk > 0, so dassA = OEV T

ist.

6.124. Bemerkung: Man kann D durch Nullelemente auch zu einer MatrixE ∈ Rn×m erganzen, sowie O zu einer orthogonalen Matrix O ∈ Rn×n, so dass

A = OEV T

gilt. Diese Darstellung ist ebenfalls ublich. Man nennt die durch 0 erganztenElemente d1, . . . , dm die Singularwerte von A.

6.125. Bemerkung: Offenbar spielen vk+1, . . . , vm keine Rolle. Reduziert manV auf diese Weise auf V ∈ Rm×k, so gilt also

A = ODV T

wobei D die Diagonalmatrix mit den Diagonalelementen d1, . . . , dk > 0 ist, sowieV eine Matrix mit orthonormalen Spalten.

Beweis: Die Matrix ATA ist symmetrisch und positiv semi-definit. Sie lasstsich daher in der Form

ATA = V LV T

Page 242: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

242 KAPITEL 6. EIGENWERTE

schreiben mit einer unitaren Matrix V ∈ Rm×m und einer Diagonalmatrix L ∈Rm×m mit den Eigenwerten λ1, . . . , λm von ATA in der Diagonalen. Sei

λ1 6= 0, . . . , λk 6= 0, λk+1 = . . . = λm = 0.

Wir setzen

E =

1√λ1

. . .1√λk

0

∈ Rm×k, E =

√λ1

. . . 0√λk

∈ Rk×m,

sowieO = AV E ∈ Rn×k.

Dann gilt

OTO = ETV TATAV E

= ETLE

= Ik.

Die k Spalten von O bilden also ein Orthonormalsystem. Wir zeigen nun

A = OEV T

Dazu multiplizieren wir die Gleichung mit den Spalten v1, . . . , vm von V . Furi = 1, . . . , k gilt

OEV T vi = AV EEV T vi

= AV

(Ik 00 0

)V T vi

= AV ei

= Avi.

Fur i = k + 1, . . . ,m ist vi ∈ Kern ATA = Kern A. Man erhalt in der Tat wieoben

OEV T vi = 0 = Avi.

2

6.126. Bemerkung: Es gibt Softwareroutinen, die sehr stabil die Singular-wertzerlegung von Matrizen A berechnen, ohne die instabile Matrix ATA zuverwenden. Wir halten aber fest, dass die Singularwerte die Wurzeln aus denEigenwerten von ATA sind, sowie V aus zugehorigen Eigenvektoren besteht.

6.127. Bemerkung: Hat man die Singularwertzerlegung, so kann man sehrleicht ein Orthonormalsystem des Bildes und des Kerns berechnen. Denn

Kern A = Kern ATA = span {vk+1, . . . , vm}.

Page 243: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 243

Folglich wird das Bild von A von den Bildern von v1, . . . , vi erzeugt.

Bild A = span {Av1, . . . , Avk}.

Es gilt aber fur i = 1, . . . , k

Avi = OEV T vi = dioi

so dass in der TatBild A = span {o1, . . . , ok}.

6.128. Bemerkung: Auch das Ausgleichsproblem

minx∈Rm

‖Ax− b‖

lasst sich mit einer Singularwertzerlegung sehr leicht losen. Mit y = EV Tx hatman das Minimum von

Oy − b =n∑i=0

yioi − b

zu finden. Die eindeutige Losung ist einfach eine orthogonale Projektion.

n∑i=0

〈b, oi〉oi,

alsoy = OT b.

Es folgtx = V EOT b

mit. Man bezeichnet die Matrix

V EOT ∈ Am×n

als Pseudoinverse von A.

6.129 Aufgabe: Zeigen Sie, dass auf diese Weise unter allen x, die ‖Ax − b‖ mini-

mieren, dasjenige mit minimaler Norm gewahlt wird.

6.130 Satz: Seien y1, . . . , ym ∈ Rn. Fur einen affinen Unterraum E des Rndefinieren wir

s(E) :=m∑ν=1

d(yν , E)2

Setzt man

a :=1m

m∑ν=1

und definiert mit der Singularwertzerlegung

A :=

(y1 − a)T...

(ym − a)T

= OEV T ,

Page 244: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

244 KAPITEL 6. EIGENWERTE

mit Singularwerten

|d1| ≥ |d2| ≥ . . . ≥ |dk| > dk+1 = . . . = dn = 0

den UnterraumU = span {v1, . . . , vl}

Dann wird s(E) fur dieses E = a+U unter allen l-dimensinalen Unterraumendes Rn minimal.

Beweis: Wir zeigen zunachst, dass s(E) bei festem U fur unser gewahltes aminimal wird. Es gilt

s(E) =m∑ν=1

‖πU⊥(yν − a)‖2 =m∑ν=1

‖πU⊥(yν)− πU⊥(a)‖2,

wobei πU⊥ die Projektion auf U⊥ bezeichne. Wir minimieren mit yν = πU⊥(yν)

m∑ν=1

‖yν − a‖2

fur a ∈ U . Setzt man

w =1m

m∑ν=1

so erhalt manm∑ν=1

‖yν − a‖2 =m∑ν=1

(‖yν − w‖2 − 2〈yν − w,w − a〉+ ‖w − a‖2)

=

(m∑ν=1

‖yν − w‖2)

+m‖w − a‖2.

Daher wird dieser Ausdruck fur a = w minimal. Setzt man a ∈ V wie behauptetan, so folgt, dass s(E) minimal fur dieses a ist.

Nun fixieren wir unser a und suchen U , so dass s(E) minimal wird. Wirkonnen o.B.d.A. a = 0 annehmen. Gesucht ist dann eine Orthonormalbasis

w1, . . . , wn

von Rn, so dass

s(U) =m∑ν=1

d(yν , U)2

fur U = span {w1, . . . , wl} minimal wird. Es gilt

d(yν , U)2 = ‖πU⊥(yν)‖2 =n∑

µ=l+1

〈yν , wµ〉2

fur alle ν = 1, . . . ,m. Also ist s(U) die Summe der Quadrate der Elemente inden letzten n− l Spalten von AW . Setzt man

B = (AW )T (AW ),

Page 245: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 245

so ist

S(U) =n∑

µ=l+1

|bµ,µ|2.

Man berechnetB = WTV ET EV TW,

und ET E ist die Diagonalmatrix D ∈ Rn×n mit den Elementen

d21 ≥ . . . ≥ d2

k > d2k+1 = . . . = d2

n = 0.

in der Diagonalen. Wir suchen also eine orthogonale Matrix W , so dass fur

B = WTDW

die Summe

S(W ) :=n∑

µ=l+1

|bµ,µ|2 =n∑

µ=l+1

n∑ν=1

d2νw

2ν,µ =

n∑ν=1

d2ν

n∑µ=l+1

w2ν,µ

minimal wird. Da auch die Zeilen von W ein Orthonormalsystem bilden, mussgelten

0 ≤ sν :=n∑

µ=l+1

w2ν,µ ≤ 1

Außerdemn∑ν=l

sν =n∑ν=l

n∑µ=l+1

w2ν,µ =

n∑µ=l+1

n∑ν=l

w2ν,µ = (n− l).

Es folgt, dass S(W ) sicher minimal wird, wenn man

s1 = . . . = sl = 0, sl+1 = . . . = sn = 1

erreichen kann. Dies ist in der Tat moglich, wenn W = In ist. Aber V TW = Inist gleichbedeutend mit W = V . Daraus folgt die Behauptung. 2

6.131. Bemerkung: Man kann das Problem also losen, indem man eine Or-thonormalbasis aus Eigenvektoren zu den l großten Eigenwerten λ1, . . . , λl vonATA bestimmt, nachdem man a als Mittelwert der yν berechnet hat. Fur denAbstand hat man dann

m∑ν=1

d(yµ, a+ U) =n∑

µ=l+1

λ2µ.

6.2.4 Drehungen

6.132 Aufgabe: Zeigen Sie, dass die Eigenwerte einer unitaren Matrix sowie deren

Determinante den Betrag 1 haben.

6.133 Aufgabe: (a) Berechnen Sie die komplexen Eigenwerte und Eigenvektoren derDrehung

Dα =

(cosα − sinαsinα cosα

).

Page 246: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

246 KAPITEL 6. EIGENWERTE

Welche Drehmatrizen sind also reell diagonalisierbar?

(b) Zeigen Sie umgekehrt, dass jede Matrix A ∈ R2×2 mit zwei komplex konjugierten,

nicht reellen Eigenwerten vom Betrag 1 eine Drehmatrix ist.

6.134 Aufgabe: Zeigen Sie, dass jede orthogonale Matrix A ∈ R2×2 mit Determi-

nante −1 eine Spiegelung an einer Geraden ist.

Zur Vorbereitung des Beweises des folgenden Satzes benotigen wir zwei Sach-verhalte, die wir als Aufgaben stellen.

6.135 Aufgabe: Fur jede unitare Abbildung φ : Cn → Cn und jeden UnterraumU ⊆ Cn mit φ(U) ⊆ U gilt

φ(U⊥) = U⊥.

6.136 Satz: Jede unitare Matrix ist diagonalisierbar mit einer Orthonor-malbasis aus Eigenvektoren. Fur jede reelle orthogonale Abbildung gibt es eineOrthonormalbasis, fur die die darstellende Matrix die Form

−1. . .

−11

. . .1

Dα1

. . .Dαk

hat, wobei die Matrizen Dαν Drehmatrizen sind.

Beweis: Wenn v1, . . . , vk Eigenvektoren sind, so wird der von diesem Vekto-ren aufgespannte Raum in sich selbst abgebildet. Aufgrund der obigen Aufgabekann man wie im Beweis von Satz 6.64 argumentieren und findet eine Ortho-normalbasis aus Eigenvektoren.

Im reellen Fall behandelt man einen komplexen Eigenwert nach dem anderenper Induktion. Die reellen Eigenwerte ±1 und wir finden eine Orthonormalbasisvon der Summe dieser Eigenraume. Sei nun λ ein komplexer Eigenwert mitkomplexem Eigenvektor v. Dann gilt

Av = Av = lv.

Wir betrachtenW = span {Re v, Im v} ⊆ Rn.

Da v und v als Eigenvektoren zu verschiedenen Eigenwerten linear unabhangigsind, folgt dimW = 2. Man zeigt auch leicht, dass W in sich selber abgebildetwird. Wahlt man eine Orthonormalbasis von v1, v2 von W , so hat die darstel-lende Matrix von φA die Gestalt einer Drehmatrix. 2

Page 247: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 247

6.137. Bemerkung: Da man offensichtlich zwei Eigenwerte 1 bzw. zwei Eigen-werte −1 als Drehungen um 0 bzw. π zusammenfassen kann, kann man den Satzauch anders formulieren. Außer den Drehmatrizen kommen dann hochstens eineisolierte 1 und eine −1 vor. Falls beide Vorkommen, so hat man in der Ebenendieser beiden Eigenvektoren eine Spiegelung.

6.138. Beispiel: Sei φ : R3 → R3 orthogonal. Falls φ nur reelle Eigenwerte hat,dann kann der Eigenwert −1 einmal, zweimal oder dreimal vorkommen. φ istdann die Identitat, die Spiegelung an einer Ebene oder die Spiegelung an einerGerade. Der letzte Fall ist identisch mit einer Drehung um eine Achse um denWinkel π.

Falls aber φ einen komplexen, nicht reellen Eigenwert hat, so kann der zusatz-liche reelle Eigenwert noch ±1 sein. φ ist also eine Drehung um eine Achse odereine Drehung um eine Achse mit zusatzlicher Spiegelung an der senkrechtenEbene.

6.2.5 Differenzengleichungen

6.139. Beispiel: Das bekannteste Beispiel fur eine Differenzengleichung ist dieFibonacci-Folge, die durch

a0 = 0, a1 = 1, an+1 = an + an−1

fur alle n ∈ N rekursiv definiert ist. Macht man hier den Ansatz an = λn,so erhalt man aus der Rekursionsgleichung nach dem Kurzen durch λn−1 diecharakteristische Gleichung

λ2 = λ+ 1,

also

λ1,2 =1±√

52

.

Betrachtet man alle Folgen, die die Rekursionsgleichung erfullen, so sieht man,dass diese Menge einen Unterraum des Folgenraums bildet. Daher losen auchLinearkombinationen der beiden gefundenen Losungen (λn1 )n∈N und (λn2 )n∈N dieRekursionsgleichung und man erhalt fur gegebene c1, c2 ∈ R die Losungen

an = c1λn1 + c2λ

n2

Wir werden spater zeigen, dass dies in der Tat alle Losungen der Differenzen-gleichung sind. Die Konstanten c1, c2 ∈ R mussen so bestimmt werden, dass dieAnfangswerte a0 = a1 = 1 erfullt sind. Also mussen die Gleichungen

c1 + c2 = 0, c1λ1 + c2λ2 = 1

erfullt sein. Man erhalt

an =1√5

(1 +√

52

)n− 1√

5

(1−√

52

)n.

Page 248: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

248 KAPITEL 6. EIGENWERTE

In der Tat gilt wegen |λ2| < 1

an = round

(1√5

(1 +√

52

)n),

wobei round die Rundung auf die nachstgelegene ganze Zahl bedeutet. Naturlichgilt fur das Wachstumsverhalten

limn→∞

a1/nn =

1 +√

52

.

6.140. Beispiel: Die Rekursionsgleichung

an+1 = 2an − an−1

fuhrt auf die charakteristische Gleichung λ2−2λ+1 = 0 mit doppelter Nullstelle1. Die Losung an = 1n = 1 genugt aber nicht, um alle Anfangswerte sicher zustellen. Es stellt sich heraus, dass auch an = n eine Losung ist. Alle Folgenhaben die Form

an = c1 + c2n.

6.141. Beispiel: Die Rekursionsgleichung

an+1 = −an−1

fuhrt mit der charakteristischen Gleichung λ2 + 1 = 0 auf die komplexe Losung

an = c1in + c2(−i)n.

Da wir an komplexen Losungen nicht interessiert sind, mussen c1, c2 so gewahltwerden, dass an ∈ R wird. Wegen der Rekursionsgleichung genugt es dazu,a0, a1 ∈ R zu haben, also

c1 + c2 ∈ R, (c1 − c2)i ∈ R.

Dies ist genau dann der Fall, wenn

c1 = a+ ib, c2 = a− ib,

also c1 = c2 ist mit a, b ∈ R. Man uberlegt sich, dass dann

an = d1 sin(nπ/2) + d2 cos(nπ/2)

mit d1, d2 ∈ R gilt.

6.142 Aufgabe: Berechnen Sie den Realteil der Folge c1in + c2(−i)n mit c1 = c2

und zeigen Sie, dass diese Folge tatsachlich von der obigen Form ist.

Der Ansatz an = λn liefert nicht immer alle Folgen, die der Rekursionsglei-chung genugen. Zum einen kann es komplexe Losungen λ geben, zum anderenmuss man bei doppelten Nullstellen zusatzliche Losungen nehmen. Die folgendenSatze beschreiben die Losungen der Differenzengleichungen vollstandig.

6.143 Satz: Sei (an)n∈N0 eine Folge in K, die die Rekursionsgleichung

an = α1an−1 + . . .+ αkan−k

Page 249: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

6.2. ANWENDUNGEN 249

fur n ≥ k erfullt mit α1, . . . , αk ∈ K, αk 6= 0. Dann ist die Folge (an)n∈N0

Linearkombination der Folgen

(nsλnν )n∈N0 , 1 ≤ ν ≤ k, 0 ≤ s < mν ,

wobei λ1, . . . , λk ∈ C die Nullstellen des charakteristischen Polynoms

χ(λ) = λn − α1λn−1 − . . .− αk

sind und mν die Vielfachheit der Nullstelle λν ist. Im Fall K = R und

λν = |λν |eiαν ∈ C \ R

ersetzt man die Folgen(nsλnν )n∈N0 , (n

sλn

ν )n∈N0

durch die reellen Folgen

(ns|λν |n cos(nαν))n∈N0 , (ns|λν |n sin(nαν))n∈N0

Beweis: Sei zunachst K = C. Sei L = A(N0,C) der Raum der Folgen aufC, und U ⊂ V der Unterraum der Folgen, die die Rekursionsgleichung erfullen.Wir betrachten die Abbildung φ : Cn → L, die den Anfangswerten a0, . . . , an−1

die Folge zuordnet, die der Rekursionsgleichung genugt und mit diesen Anfangs-werten beginnt, also

φ(a0, . . . , an−1) = (a0, . . . , an−1, an, . . .) ∈ U.

Es ist klar, dass φ linear ist und injektiv, und dass

U = φ(Cn)

ist. Es folgt dimU = n. Wir haben aber im Satz genau n Folgen angegeben, dieU aufspannen sollen. Es genugt daher zu zeigen, dass diese Folgen in U liegenund linear unabhangig sind.

Anstatt dies direkt nachzurechnen, gehen wir einen anderen Weg. Wir setzenden Shift-Operator D aus Beispiel 6.80 in χ ein. Dann gilt fur das k-te Elementbk von D((an)n∈N)

bk = ak+n − α1ak+n−1 − . . .− αkak.

Fur Folgen a ∈ U muss daher χ(D)(a) = 0 sein. Es gilt also

U = Kern χ(D).

Wir habenχ(D) = (D − λ1In)m1 · . . . · (D − λkIn)mk .

Aufgrund von Aufgabe 6.86 gilt

U = Kern (D − λ1id)m1 ⊕ . . .⊕Kern (D − λkid)mk .

Page 250: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

250 KAPITEL 6. EIGENWERTE

Wir brauchen also nur nachzurechnen, dass fur ν = 1, . . . , k die Folgen

aν,0 = (λnν )n∈N0 , . . . , aν,mν−1 = (nmν−1λnν )n∈N0

in Kern (D − λν)mν liegen und linear unabhangig sind.

Falls die Folgen linear abhangig waren, so gabe es wegen λν 6= 0 Koeffizientenβ0, . . . , βmν−1 mit

β0 + β1n+ . . .+ βmν−1nmν−1 = 0 fur alle n ∈ N0

Das ist aber nicht moglich, weil Polynome nur endlich viele Nullstellen habenkonnen.

Man berechnet fur s ≥ 1

(n+ 1)sλn+1ν − λν(nsλnν ) = λν((n+ 1)s − ns)λnν .

Es folgt fur s ≥ 1

(D − λν id)(aν,s) =s−1∑µ=0

λν

(n

µ

)aν,µ ∈ span {aν,0, . . . , aν,s−1}.

Fur s = 0 gilt(D − λν id)(aν,0) = 0.

Es folgt induktiv fur 0 ≤ s < mν

aν,s ∈ Kern (D − λν id)s+1.

und damit die Behauptung.

Sei nun K = R. Dann finden wir Folgen wie im Fall K = C. Fur komplexe,nicht reelle Nullstellen λν beachten wir, dass der von

(nsλnν )n∈N0 , (nsλn

ν )n∈N0

aufgespannte Raum gleich dem von

(ns|λν |n cos(nαν))n∈N0 , (ns|λν |n sin(nαν))n∈N0

aufgespannten Raum im komplexen Folgenraum ist. Wir verlieren also durchdiese Ersetzung keine Losungen der Rekursionsgleichung. 2

6.144 Aufgabe: Schreiben Sie |λ|n cos(nα) und |λ|n sin(nα) als Linearkombination

von λn und λn

und umgekehrt.

Page 251: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

Index

Aquivalenzrelation, 138ahnlich, 131

Abbildung, 32Abbildungsraum, 66Abstraktion, 12abzahlbar, 52adjungierte Abbildung, 173adjungierte Matrix, 148affine Abbildung, 133affiner Unterraum, 82Affinkombination, 85algebraische Vielfachheit, 216alternierende Multilinearform, 183assoziative Algebra, 100Assoziativgesetz, 14aufgespannter Unterraum, 68Aufzahlung, 28Ausdividieren, 204Ausgleichsrechnung, 174Aussonderung, 27Austauschsatz, 77Auswahlaxiom, 55Auswertungsabbildung, 204

baryzentrische Koordinaten, 85Basis, 71Basiswechsel, 126Besselsche Ungleichung, 159Bewegung, 170bijektiv, 35Bild, 37, 95Bildbereich, 34Bilinearform, 146Binomialkoeffizient, 50Blockdiagonalmatrizen, 190Boolesche Aussagen, 16

Cantorsches Diagonalargument, 54charakteristische Gleichung, 247charakteristisches Polynom, 209

Cramersche Regel, 191

darstellende Matrix, 103Definitionsbereich, 34Determinantenform, 185diagonalisierbar, 212Dimension, 75Dimensionsformel, 97Direkte Summe, 80disjunkt, 48disjunkt (disjoint), 30Distributivgesetz, 58Dreiecksungleichung, 150duale Abbildung, 143duale Basis, 142Dualraum, 141

Eigenraum, 211Eigenvektor, 208Eigenwert, 208Einheitskugeln, 153Einheitsmatrix, 104Einheitsvektoren, 75Einschrankung, 34Element, 25Elementarmatrizen, 122elementweise, 108Ellipsen, 234endlich, 47endlich-dimensional, 75Endomorphismus, 100Entwicklungssatz von Laplace, 189Erzeugendensystem, 71erzeugter affiner Unterraum, 84Euklidscher Algorithmus, 206Euklidscher Vektorraum, 146Euklidsches Skalarprodukt, 146, 147

Fakultat, 46Fallunterscheidung, 23Fixpunktmenge, 135

251

Page 252: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

252 INDEX

Folge, 45Fortsetzung, 35Funktion, 34Funktional, 94Funktionenalgebra, 67

Gauß-Algorithmus, 112geometrische Vielfachheit, 216Gerade, 85gleichmachtig, 54großter gemeinsamer Teiler, 207Grad, 203Gram-Schmidt, 156Graph, 34Gruppe, 14Gruppe der Ismorphismen, 101

Hadamard-Produkt, 233Halbgruppe, 41Hauptachsen der Quadrik, 236Hauptachsentransformation, 236Hauptsatz der Algebra, 207Hermitesche Form, 146Hermitesche Matrix, 148Hilbertmatrix, 149homogenens Gleichungssystem, 112Hurwitz-Kriterium, 195Hyperbeln, 234Hyperebene, 131

identische Abbildung, 40Imaginarteil, 62indefinit, 197Induktionsanfang, 43Induktionsschritt, 43induktive Menge, 42injektiv, 35Interpolation, 137inverses Element, 14invertierbare Matrix, 107irreduzibel, 205isomorph, 99Isomorphismus, 99

Jordanblock, 222Jordanmatrix, 225

Korper, 58kanonische Basis, 75kanonisches Skalarprodukt, 147Kegelschnitte, 237

Kern, 95Klassenaufteilung, 50Kombinatorik, 49Kommutativgesetz, 14kommutierendes Diagramm, 126Komplexe Zahlen, 61Konklusion, 16konstruktiver Beweis, 23konvex, 89konvexe Hulle, 89Konvexkombination, 90Koordinatensystem, 34Kreuzprodukt, 32, 193Kronecker-Symbol, 142

L1-Norm, 154L2-Norm, 154L∞-Norm, 154Losungsmenge, 112Leibnitz-Formel, 186linear, 93linear unabhangig, 71lineare Regression, 176linearer Operator, 100lineares Gleichungssystem, 112Linearkombination, 69

Machtigkeit, 48Matrix, 101Matrix des Skalarproduktes, 147Maximumsnorm, 153Menge, 25Menge aller Abbildungen, 41Mengenlehre, 26Mengensysteme, 31Metrik, 150minimale induktive Menge, 42Minimalpolynom, 223Monomorphismus, 100Multilinearform, 183

naive Mengenlehre, 25negativ definit, 196neutrales Element, 14Norm, 150Normalform einer Quadrik, 236Normalgleichung, 175normierter Vektorraum, 150Nullraum, 65Nullstelle, 204

Page 253: Sozialinformatik · 4 INHALTSVERZEICHNIS 2 Vektorr aume 57 2.1 K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 2.1.1 De nition, Eigenschaften und Beispiele

INDEX 253

nullteilerfrei, 203

Operator, 34orthogonale Abbildung, 167orthogonale Matrix, 169orthogonale Projektion, 164Orthogonalsystem, 156Orthonormalbasis, 156Orthonormalsystem, 156

Paar, 32parallel, 85Parallelogrammgleichung, 153Parametrisierung, 112Parsevalsche Gleichung, 159Peano-Axiome, 41Permutation, 41, 49Polynom, 203positiv definite Matrix, 148positiv semi-definit, 148Pramissen, 16Produktschreibweise, 46Projektion, 136Pseudoinverse, 243punktweise, 66

quadratische Matrix, 107Quadrik, 234Quotientenraum, 138

Rang, 120rationale Funktion, 207Realteil, 62Regel von Sarrus, 180regulare Matrix, 107rekursiv, 45Relation, 32Restklassenkorper, 60Rieszscher Darstellungssatz, 172Ring, 203Russelsches Paradoxon, 26

Satz von Ceva, 198Schauder-Basis, 160Schnitt, 29Schwarzsche Ungleichung, 152selbstadjungiert, 174selbstadjungierte Matrix, 148semidefinite Matrix, 197senkrecht, 155Shift-Operator, 225

Signatur, 231Signum, 180simultan, 121Singularwerte, 241Skalarprodukt, 145Skalarproduktraum, 146Spaltenrang, 120spezielle Losung, 112Spiegelung, 135Spur, 210stochastische, 215Strecke, 88Summe der Unterraume, 80Summenschreibweise, 46surjektiv, 35

Tautologien, 17Teilmenge, 27Tragheitssatz von Sylvester, 231transponierte Matrix, 110Tupel, 51

Umkehrabbildung, 35unendlicher Abstieg, 45unitare Matrix, 169unitarer Raum, 146Unterraum, 67Urbild, 35, 37

Vektorraum, 63Venn-Diagramm, 29Vereinigung, 28Verkettung, 40vollstandige Induktion, 43

Wahrheitstafeln, 17

Zeilenrang, 120Zeilenstufenform, 113Zentrum der Quadrik, 236zerfallt, 205zugehorige Norm, 151zulassige Zeilenoperation, 113