Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung:...

109
Vorlesung Logik, Diskrete Mathematik und Lineare Algebra (Mathematik f¨ ur Bioinformatiker I) Wintersemester 2012/13 FU Berlin Institut f¨ ur Informatik Klaus Kriegel 1

Transcript of Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung:...

Page 1: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Vorlesung

Logik, Diskrete Mathematik und Lineare Algebra

(Mathematik fur Bioinformatiker I)

Wintersemester 2012/13

FU Berlin

Institut fur Informatik

Klaus Kriegel

1

Page 2: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Literatur zur Vorlesung:

C. Meinel, M. Mundhenk, Mathematische Grundlagen der Informatik,B.G.Teubner 2000

D. Hachenberger, Mathematik fur Informatiker,Pearson Studium

G. Haggard, J. Schlipf, S. Whitesides, Discrete Mathematics for ComputerScience, Brooks Cole

M. Aigner, Diskrete Mathematik,Vieweg & Sohn 1999

T. Ihringer, Diskrete Mathematik,Teubner 1994

K. H. Rosen, Discrete Mathematics and its Applications,McGraw-Hill 1991

K. Janich, Lineare Algebra,Springer 2000

2

Page 3: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Contents

1 Grundbegriffe der Logik 41.1 Aussagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Pradikate und Quantoren . . . . . . . . . . . . . . . . . . . . . . . . 81.3 Beweistechniken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Grundbegriffe der Mengenlehre 142.1 Mengen und Operationen auf Mengen . . . . . . . . . . . . . . . . . 142.2 Kartesisches Produkt und Relationen . . . . . . . . . . . . . . . . . . 182.3 Aquivalenzrelationen . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.4 Ordnungsrelationen . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.5 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.6 Naturliche Zahlen, Endlichkeit und Kardinalzahlen . . . . . . . . . . 28

3 Kombinatorik 323.1 Elementare Zahlprinzipien . . . . . . . . . . . . . . . . . . . . . . . 323.2 Die fundamentalen Zahlkoeffizienten . . . . . . . . . . . . . . . . . . 333.3 Zwolf Arten des Abzahlens . . . . . . . . . . . . . . . . . . . . . . . 363.4 Rekursionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.5 Losung von Rekursionen . . . . . . . . . . . . . . . . . . . . . . . . . 403.6 Das Schubfachprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4 Diskrete Wahrscheinlichkeitsverteilungen 434.1 Wahrscheinlichkeitsraume, Ereignisse und Unabhangigkeit . . . . . . 434.2 Zufallsvariable und Erwartungswert . . . . . . . . . . . . . . . . . . 48

5 Lineare Algebra 515.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 515.2 Gruppen und Korper . . . . . . . . . . . . . . . . . . . . . . . . . . . 535.3 Vektorraume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 565.4 Lineare Unabhangigkeit, Basis und Dimension . . . . . . . . . . . . . 595.5 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 665.6 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 735.7 Der Rang einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . 775.8 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . 845.9 Inverse Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 935.10 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 965.11 Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . 105

3

Page 4: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

1 Grundbegriffe der Logik

1.1 Aussagen

Die Grundlagen der Aussagenlogik gehen bereits auf die alten Griechen zuruck. Sobeschrieb Aristoteles eine Aussage als einen Satz, von dem es sinnvoll ist zu sagen,dass er wahr oder falsch sei. Diesen Gedanken findet man auch in der heute verwen-deten Definition wieder.

Definition: Eine Aussage ist ein (formal-)sprachliches Gebilde, das entweder wahroder falsch ist.

Der Zusatz formalsprachlich weist darauf hin, dass man auch mathematische Symboleund andere Zeichen einer formalen Sprache verwenden kann. Die klassische Aussagen-logik beruht auf zwei Grundprinzipien, dem bereits genannten Zweiwertigkeitsprinzip,welches fordert, dass jede Aussage einen eindeutig bestimmten Wahrheitswert hat,der nur wahr oder falsch sein kann, und dem Extensionalitatsprinzip, nach dem derWahrheitswert einer zusammengesetzten Aussage nur von den Wahrheitswerten ihrerBestandteile abhangt.

Wir werden im Folgenden (wie in der Informatik ublich) eine 1 fur den Wahrheitswertwahr und eine 0 fur falsch verwenden. Das Zusammensetzen von Aussagen erfolgtdurch die Verwendung von Verknupfungswortern wie und, oder, nicht, wenn . . . dann,welche auf formal-sprachlicher Ebene durch sogenannte logische Junktoren - das sindspezielle Verknupfungssymbole - dargestellt werden.

Beispiele:

1. Der Satz “7 ist eine Primzahl.” und der Satz “7 ist eine ungerade Zahl.” sindwahre Aussagen. Dagegen ist der Satz “7 ist eine gerade Zahl.” eine falscheAussage. Genauer gesehen ist der letzte Satz die Negation des zweiten Satzes,denn nicht ungerade zu sein, ist (zumindest fur ganze Zahlen) das gleiche, wiegerade zu sein.

2. Der Satz “7 ist eine Primzahl und 7 ist ungerade.” sowie der Satz “7 ist einePrimzahl oder 7 ist gerade.” sind wahre Aussagen. Achtung: Auch der Satz“7 ist eine Primzahl oder 7 ist ungerade.” ist eine wahre Aussage, denn daslogische oder ist kein ausschließendes entweder oder. Dagegen ist der Satz “7 isteine Primzahl und 7 ist gerade.” eine falsche Aussage, denn die zweite Aussageist falsch.

3. Der Satz “√

2 ist eine rationale Zahl.” ist – wie man aus der Schulmathematikweiß – eine falsche Aussage, aber es bedarf schon einiger Uberlegungen, um daszu zeigen.

4. Der Satz “Jede gerade Zahl großer als 2 ist die Summe zweier Primzahlen” isteine Aussage, denn entweder gibt es eine gerade Zahl, die sich nicht als Sum-me zweier Primzahlen darstellen lasst - dann ist die Aussage falsch, oder esgibt keine solche Zahl - dann ist die Aussage wahr. Man nimmt an, dass diese

4

Page 5: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Aussage wahr ist (Goldbachsche Vermutung), konnte das aber bisher noch nichtbeweisen.

5. Der Satz “Dieser Satz ist falsch.” ist als Russels Paradoxon bekannt. Durchdie spezielle Art des Bezugs auf sich selbst kann er weder wahr noch falsch seinund ist deshalb keine Aussage.

6. Ein typischer Vertreter fur eine ganze Klasse von sprachlichen Gebilden, diekeine Aussagen sind, ist der Satz “Die naturliche Zahl n ist eine Primzahl.”.Setzen wir fur n den Wert 7 ein, so entsteht offensichtlich eine wahre Aus-sage, dagegen fur n = 8 eine falsche Aussage. Sprachliche Gebilde dieses Typsnennt man auch Aussageformen oder Pradikate - wir werden sie spater genauerbesprechen.

Nach dem Extensionalitatsprinzip ergibt sich der Wahrheitswert einer zusammenge-setzten Aussage ausschließlich aus den Wahrheitswerten der Ausgangskomponen-ten. Deshalb werden wir uns zuerst damit beschaftigen, welche Operationen zumZusammensetzen neuer Aussagen verwendet werden sollen und wie diese Operatio-nen auf Wahrheitswerten wirken. Dazu werden Aussagevariable eingefuhrt und dieWahrheitwerte von zusammengesetzten Aussagen durch Wahrheitsswerttabellen (kurzWahrheitstafeln) beschrieben.

Die Negation einer Aussage x wird mit ¬x bezeichnet. Diese Operation kehrt denWahrheitswert von x um, d.h. man kann sie mit ¬0 = 1 und ¬1 = 0 als Funktionauf den Wahrheitswerten beschreiben. Zur Verknupfung von zwei Aussagen x und ystehen die folgenden Konstrukte zur Verfugung:

• die Konjunktion x ∧ y, gesprochen “x und y”;

• die Disjunktion x ∨ y, gesprochen “x oder y”;

• die Implikation x→ y, gesprochen “aus x folgt y” oder “wenn x, dann y”

• die Aquivalenz x↔ y, gesprochen “x genau dann, wenn y”,

• die Antivalenz x⊕ y, gesprochen “entweder x oder y”.

Die dazu korrespondierenden Funktionen auf Wahrheitswerten werden als Operatio-nen (unter Verwendung der gleichen Symbole) in der folgenden Tabelle beschrieben:

x y x ∧ y x ∨ y x→ y x↔ y x⊕ y0 0 0 0 1 1 00 1 0 1 1 0 11 0 0 1 0 0 11 1 1 1 1 1 0

Aus der Tabelle kann man ablesen, dass die Konjunktion x ∧ y dann und nur dannwahr ist, wenn beide Aussagen x und y wahr sind. Die Disjunktion x∨y ist dann und

5

Page 6: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

nur dann wahr, wenn mindestens eine der Aussagen x und y wahr ist. Die Implikationist dann und nur dann wahr, wenn x falsch oder y wahr ist. Versuchen Sie selbst, dieAquivalenz und die Antivalenz verbal zu beschreiben!

Ausdrucke, die durch (wiederholtes) Anwenden der Verknupfungsoperationen ausVariablen gewonnen werden, nennt man Formeln (oder Terme) der Aussagenlogik.Um eine Formel eindeutig erkennen zu konnen, musste man jeweils nach Anwendungeiner Verknupfung die neue Formel durch ein Klammerpaar einschließen. Das fuhrtzur folgenden Definition von Formeln der Aussagenlogik uber eine VariablenmengeV ar:

1. Alle Variablen aus der Menge V ar sowie die Symbole 0 und 1 sind Formeln derAussagenlogik.

2. Ist t eine Formel der Aussagenlogik, dann ist auch (¬t) eine Formel der Aus-sagenlogik.

3. Sind s und t Formeln der Aussagenlogik, dann sind auch die Ausdrucke (s∧ t),(s ∨ t), (s→ t), (s↔ t) sowie (s⊕ t) Formeln der Aussagenlogik.

4. Jede Formel der Aussagenlogik kann aus den Variablen und den Symbolen 0und 1 durch eine endliche Folge von Anwendungen der Regeln 2) und 3) erzeugtwerden.

Wir werden zur Abkurzung der Notation (insbesondere an der Tafel) auch haufig dieSymbole ⇒ und ⇔ verwenden. Sie drucken auch Implikationen und Aquivalenzenaus, aber nicht auf der Ebene der Formeln, sondern auf der Ebene der Sprache uberAussagen, der sogenannten Metasprache. Der Ausdruck A ⇒ B ist also ein Kurzelfur den Satz “Wenn Aussage A wahr ist, dann ist auch Aussage B wahr”.

Weil die Formeln durch die Klammersetzung sehr unubersichtlich werden konnen,vereinbart man einige Regeln zur Vereinfachung der Notation (ahnlich wie die be-kannte Regel, dass Punktrechnung vor Strichrechnung geht):

• Außenklammern konnen weggelassen werden.

• In der Reihenfolge ¬,∧,∨,→,↔ trennen die hinteren Junktoren starker als allevorangehenden, d.h. die Bindungsstarke nimmt in dieser Reihenfolge ab. AlleKlammerungen, die mit dieser Hierarchie der Bindungsstarke in Ubereinstim-mung stehen, konnen auch weggelassen werden.

Man kann also fur ((¬x1) ∨ (x2 ∧ x3)) auch ¬x1 ∨ x2 ∧ x3 schreiben. Dagegen wurdedas Weglassen der Klammern in der Formel ¬(x ∨ y) eine andere Formel erzeugen.

Legt man fur alle in einer Formel auftretenden Variablen Wahrheitswerte fest, soinduziert eine solche Belegung auch einen Wahrheitswert fur die Formel. Man nenntdiesen induktiven Prozess auch Auswertung der Formel. Die Ergebnisse der Auswer-tungen einer Formel unter allen moglichen Belegungen werden in einer Wahrheitstafelzusammengefasst.

6

Page 7: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Definition: Zwei Formeln s und t sind logisch aquivalent, wenn jede beliebige Bele-gung der Variablen fur beide Formeln den gleichen Wahrheitswert induziert. Wirschreiben dafur s ≡ t.Wie das folgende Beispiel zeigt, kann die Aquivalenz von zwei Formeln prinzipielldurch Wahrheitstafeln uberpruft werden. Zum Nachweis der Aquivalenz der Formelns = ¬(x1 ∨ ((x1 ∨ x2) ∧ x2) und t = ¬x1 ∧ ¬x2 stellt man folgende Tabelle auf:

x1 x2 x1 ∨ x2 (x1 ∨ x2) ∧ x2 x1 ∨ ((x1 ∨ x2) ∧ x2) s0 0 0 0 0 10 1 1 1 1 01 0 1 0 1 01 1 1 1 1 0x1 x2 ¬x1 ¬x2 t0 0 1 1 10 1 1 0 01 0 0 1 01 1 0 0 0

Am identischen Wahrheitswerteverlauf fur s und t kann man ablesen, dass die Formelnaquivalent sind.

Satz: Fur beliebige Formeln s, t, r gelten die folgenden Aquivalenzen:

Assoziativitat: (s ∧ t) ∧ r ≡ s ∧ (t ∧ r)(s ∨ t) ∨ r ≡ s ∨ (t ∨ r)

Kommutativitat: s ∧ t ≡ t ∧ ss ∨ t ≡ t ∨ s

Distributivitat: s ∧ (t ∨ r) ≡ (s ∧ t) ∨ (s ∧ r)s ∨ (t ∧ r) ≡ (s ∨ t) ∧ (s ∨ r)

Idempotenz: s ∧ s ≡ ss ∨ s ≡ s

Dominanz: s ∧ 0 ≡ 0s ∨ 1 ≡ 1

Neutralitat: s ∧ 1 ≡ ss ∨ 0 ≡ s

Absorbtion: s ∧ (s ∨ t) ≡ ss ∨ (s ∧ t) ≡ s

deMorgansche Regel: ¬(s ∧ t) ≡ ¬s ∨ ¬t¬(s ∨ t) ≡ ¬s ∧ ¬t

Komplementierung: s ∧ ¬s ≡ 0s ∨ ¬s ≡ 1

(doppelte Negation) ¬¬s ≡ s

Diese Aquivalenzen konnen leicht mit Wahrheitstafeln bewiesen werden. Der Wahr-heitstafelmethode sind jedoch enge Grenzen gesetzt, wenn die Anzahl n der ver-

7

Page 8: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

wendeten Variablen groß wird, denn die entsprechende Wahrheitstafel hat dann 2n

Zeilen.

Beispiel: Der Beweis der folgenden Aquivalenz mit Wahrheitstafeln wurde 16 Zeilenerfordern. Verwendet man dagegen die Absorbtion und die doppelte Negation zurErsetzung von Subformeln, so erhalt man einen einfachen und kurzen Beweis.

x1 ∨ ((x2 ∨ x3) ∧ ¬(¬x1 ∧ (¬x1 ∨ x4))) ≡ x1 ∨ ((x2 ∨ x3) ∧ ¬¬x1)≡ x1 ∨ ((x2 ∨ x3) ∧ x1)≡ x1

Die folgende Liste enthalt weitere Aquivalenzen, welche zum Beweis der Aquivalenzvon komplexen Formeln haufig angewendet werden:

(1) s→ t ≡ ¬s ∨ t(2) s↔ t ≡ s ∧ t ∨ ¬s ∧ ¬t(3) s→ t ∧ r ≡ (s→ t) ∧ (s→ r)(4) s→ t ∨ r ≡ (s→ t) ∨ (s→ r)(5) s ∧ t→ r ≡ (s→ r) ∨ (t→ r)(6) s ∨ t→ r ≡ (s→ r) ∧ (t→ r)

Definition: Eine Formel s wird erfullbar genannt, wenn es eine Belegung der Vari-ablen von s gibt, die fur s den Wert 1 induziert. Die Formel s wird allgemeingultig,logisch gultig oder eine Tautologie genannt, wenn sie fur jede Belegung den Wert 1annimmt. Eine Formel, die unerfullbar ist, wird Kontradiktion genannt.

1.2 Pradikate und Quantoren

Definition: Ein Pradikat ist eine Aussageform, die eine (oder mehrere) Variableenthalt, so dass bei Ersetzung der Variablen durch Elemente aus einem gegebenenIndividuenbereich U eine Aussage mit eindeutig bestimmtem Wahrheitswert entsteht,z.B. P (x) : “x = 0” oder Q(x) : “x + 0 = x” oder R(x, y) : “x ≤ x + y” fur denBereich der ganzen Zahlen.

Die Belegung der Variablen durch konkrete Objekte ermoglicht somit (durch Betrach-tung eines Spezialfalls), ein Pradikat in eine Aussage umzuwandeln. So sind fur diegenannten Beispiele die Aussagen P (0), Q(5) und R(3, 4) wahr, dagegen sind P (3)und R(3,−2) falsche Aussagen.

Die sogenannten Quantoren erlauben es, aus diesen Spezialfallen allgemeinere Aus-sagen abzuleiten: Durch das Hinzufugen der Wendungen “fur alle ...”, symbolischausgedruckt durch den Allquantor ∀, oder “es gibt ein ...”, symbolisch ausgedrucktdurch den Existenzquantor ∃, werden die Variablen in einem Pradikat gebunden.Sind alle Variablen eines Pradikats gebunden, entsteht eine Aussage, also ein Satz,der wahr oder falsch ist.

Die Ausssage “∀x ∈ U P (x)” ist wahr, wenn fur jedes Element a ∈ U die AussageP (a) wahr ist. Dagegen ist “∃x ∈ U P (x)” eine wahre Aussage, wenn (mindestens)ein Element a ∈ U existiert, so dass die Aussage P (a) wahr ist.

8

Page 9: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Beispiele:

• Die Aussagen “∀x ∈ N x+ 0 = x” und “∃x ∈ N x2 = x” sind wahr, aber dieAussagen “∃x ∈ N x+ 1 = x” und “∀x ∈ N x2 = x” sind falsch.

• Die Aussage “∀x ∈ N ∃y ∈ N y ≤ x” ist wahr, denn fur einen beliebigen Wertx = a erfullt der Wert y = a die Ungleichung y ≤ x. Dagegen ist die Aussage“∀x ∈ N ∃y ∈ N y < x” falsch, denn fur x = 0 gibt es keine kleinere naturlicheZahl.

• Die falsche Aussage im letzten Punkt ist ein typisches Beispiel dafur, dass derBereich, uber dem die Aussage gemacht wird, von entscheidender Bedeutungsein kann: Wenn man den Bereich N der naturlichen Zahlen gegen die Berei-che Z,Q,R der ganzen, rationalen bzw. reellen Zahlen austauscht, entstehenoffensichtlich wahre Aussagen wie “∀x ∈ Z ∃y ∈ Z y < x”.

Allgemein ist die Frage, ob eine durch Quantoren gebildete Aussage wahr oder falschist, algorithmsch nicht entscheidbar. Die Goldbachsche Vermutung ist ein Beispieleiner Aussage, deren Wahrheitswert nicht bekannt ist. In vielen anderen Fallen kannman die Frage aber durch genauere Uberlegungen beantworten. Wie kann manin solchen Fallen sich selbst und andere von der Richtigkeit seiner Uberlegungenuberzeugen? Der typische Beweis dafur, dass eine quantisierte Aussage wahr ist,erfolgt in drei Stufen. Zuerst wird die Aussage durch Anwendung von aquivalentenUmformungen aus der Aussagenlogik und aus dem nachfolgenden Satz in eine Stan-dardform gebracht, bei der alle auftretenden Quantoren am Anfang stehen (mannennt dies eine Pranexform). Danach erfolgt die Belegung der Variablen in Formeines Spiels zwischen zwei Parteien: Einem Beweiser und seinem Gegenspieler, dernachzuweisen versucht, dass die Ausage falsch ist. Dabei darf der Gegenspieler beijedem Allquantor die entsprechende Variable x durch ein beliebiges Objekt a ausdem Individuenbereich belegen. Sollte die Aussage doch falsch sein (also nicht furalle Objekte gelten), wurde der Gegenspieler gerade ein solche Objekt wahlen. Istdie Aussage wahr, dann ist es (fur den Beweiser) egal, welches Objekt a der Gegen-spieler gewahlt hat. Der Beweiser ist bei allen Existenzquantoren am Zuge und mussein passendes Objekt (in Abhangigkeit von den vorher vom Gegenspieler gwahltenObjekten) finden, fur welches die nachfolgende Ausssage wahr ist. Nachdem alleVariablen belegt sind, haben wir eine (variablenfreie) Aussage. Im letzten Schrittmuss diese Aussage verifiziert (als wahr bewiesen) werden.

Beginnen wir mit den Umformungsregeln.

Satz: Fur beliebige Pradikate P (x), Q(x) undR(x, y) gelten die folgenden Aquivalenzen:

(1) ¬∀x P (x) ≡ ∃x¬P (x)(2) ¬∃x P (x) ≡ ∀x¬P (x)(3) ∀x P (x) ∧ ∀x Q(x) ≡ ∀x (P (x) ∧Q(x))(4) ∃x P (x) ∨ ∃x Q(x) ≡ ∃x (P (x) ∨Q(x))(5) ∀x ∀y R(x, y) ≡ ∀y ∀x R(x, y)(6) ∃x ∃y R(x, y) ≡ ∃y ∃x R(x, y)

9

Page 10: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Achtung: Die folgenden Formelpaare sind im allgemeinen nicht aquivalent:

∀x P (x) ∨ ∀x Q(x) und ∀x (P (x) ∨Q(x))∃x P (x) ∧ ∃x Q(x) und ∃x (P (x) ∧Q(x))∀x (∃y R(x, y)) und ∃y (∀x R(x, y))

Konkrete Gegenbeispiele fur das erste und zweite Paar erhalt man fur den Bereich derganzen Zahlen, wenn P (x) (bzw. Q(x)) aussagt, dass x eine gerade (bzw. ungerade)Zahl ist. Fur das dritte Paar kann man das Pradikat R(x, y) :“x ≤ y” uber denreellen Zahlen verwenden.

Wir wollen die drei Stufen eines solchen Beweises an einem einfachen Beispiel demon-strieren und die folgende Aussage fur den Bereich der rationalen Zahlen beweisen.

Satz: Fur beliebige x, y ∈ Q mit x < y gibt es eine von x und y verschiedene Zahlz ∈ Q, die zwischen x und y liegt.

Die Beweisidee liegt klar auf der Hand: man setzt fur z den Mittelwert aus x undy und kann dann die Behauptung nachrechnen. Wir stellen die Aussage als Formelmit Quantoren dar. Der Bereich Q ist durch Verabredung festgelegt und wird nichtexplizit genannt:

∀x ∀y [(x < y)→ ∃z (x < z ∧ z < y)]

In diesem Fall konnte man die erste Stufe uberspringen und gleich mit dem Spiel derFestlegung der Werte beginnen, bei dem der Gegner x und y vorgibt und wir im Fallx < y (als Beweiser) z = x+y

2setzen. Um das dreistufige Verfahren formal korrekt

umzusetzen, wurden wir aber zuerst die Implikation hinter den beiden Allquatorenaquivalent umformen:

(x < y)→ ∃z (x < z ∧ z < y) ⇔ ¬(x < y) ∨ ∃z (x < z ∧ z < y)⇔ ∃z (x ≥ y) ∨ ∃z (x < z ∧ z < y)⇔ ∃z (x ≥ y ∨ (x < z ∧ z < y))

Im ersten Schritt wurde die Regel p → q ≡ ¬p ∨ q angewendet. Im zweiten Schrittwurde die Negation von x < y in x ≥ y umgewandelt und der Existenzquantor ∃zdavorgesetzt - das kann man machen, weil x ≥ y in keiner Weise von z abhangt.Im letzten Schritt wurde die vierte Regel aus obigem Satz verwendet. Jetzt liegt dieAussage in Pranexform vor:

∀x ∀y ∃z [x ≥ y ∨ (x < z ∧ z < y)].

Das Spiel beginnt mit der Vorgabe von zwei Werten x = a und y = b durch denGegenspieler. Der Beweiser setzt z = (a+ b)/2.Nun erfolgt die Verifikation der Aussage a ≥ b∨ (a < (a+ b)/2∧ (a+ b)/2 < y) durchBetrachtung von zwei Fallen: Entweder es gilt a ≥ b, dann wird die Aussage durchden linken Term der Disjunktion wahr oder es gilt a < b. In diesem Fall mussenbeide Ungleichungen auf der rechten Seite der Disjunktion erfullt sein, aber beidesfolgt uber den Zwischenschritt a/2 < b/2 jeweils kombiniert mit den Ungleichungena/2 ≤ a/2 bzw. b/2 ≤ b/2.

10

Page 11: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Bleibt die Frage, warum man diese Argumentation nicht fur den Bereich N dernaturlichen Zahlen wiederholen kann. Die Antwort ist wieder nicht schwer: DerAusdruck a+b

2fuhrt in vielen Fallen aus dem Bereich N heraus. Das ist aber noch

kein Beweis dafur, dass die Aussagge uber diesem Bereich falsch ist. Um das zuzeigen, beweist man, dass die negierte Aussage wahr ist. Wir bilden die Negation mitHilfe der Regeln (1) und (2) aus obigem Satz und der deMorganschen Regel:

∃x ∃y ∀z [(x < y) ∧ (x ≥ z ∨ z ≥ y)].

Da die Aussage bereits in Pranexform vorliegt, kann das Spiel der Variablenbelegungbeginnen. Wir setzen als Beweiser x = 0 und y = 1. Der Gegenspieler belegt z miteinem Wert c. Wir mussen jetzt die Aussage 0 < 1 ∧ (0 ≥ c ∨ c ≥ 1) verifizieren.Offensichtlich ist 0 < 1 wahr und wir mussen nur noch zeigen, dass mindestens eineder Ungleichungen aus (0 ≥ c ∨ c ≥ 1) wahr ist. Wenn aber die erste Ungleichungnicht erfullt ist, muss c eine naturliche Zahl großer als 0, also mindestens 1 sein unddamit ist die zweite Ungleichung erfullt.

1.3 Beweistechniken

In diesem Abschnitt geht es darum, einige grundlegende Beweisstrategien kennen-zulernen. Da das prinzipielle Verstandnis im Mittelpunkt stehen soll, sind die in denBeispielen bewiesenen Aussagen sehr einfach gewahlt. Grundsatzlich muss man sichbei Beweisen auch immer danach richten, fur welchen Leser der Beweis aufgeschrie-ben wird. Bei einem Beweis fur Experten kann man mehr Vorwissen voraussetzenund deshalb auch mehrere Gedanken zu einem Schritt zusammenfassen. Dagegensollte bei Beweisen fur Nicht-Experten moglichst jeder Schritt elementar und einfachnachvollziehbar sein.Gerade bei den scheinbaren Selbstverstandlichkeiten wird ein weiteres Problem deut-lich: Bevor man an einen Beweis geht, muss man sich klarmachen, was man schon alsBasiswissen voraussetzen kann, und was man noch beweisen muss. Oft ist als ersterhilfreicher Schritt eine geeignete Formalisierung der Aussage notwendig.

Viele mathematische Satze haben die Form einer Implikation, sie sagen, dass aus einerbestimmten Voraussetzung in Form einer Aussage p eine Behauptung in Form einerAussage q folgt. Wir wollen uns zuerst mit den verschiedenen Techniken zum Beweisvon solchen Implikationen beschaftigen. Basis fur die Gultigkeit solcher Beweise sindeinige einfache Aquivalenzen und Implikationen, die man leicht mit der Wahrheits-tafelmethode nachweisen kann.

Direkte Beweise

Der direkte Beweis beruht darauf, die Implikation p → q in mehrere elementareTeilschritte zu zerlegen, wobei man die folgende Tautologie nutzt:

((p→ r) ∧ (r → q))→ (p→ q).

Naturlich kann man die zwei Teilschritte auf der linken Seite weiter unterteilen, bisman bei einer Kette elementarer Implikationen angekommen ist. Wie das folgende

11

Page 12: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Beispiel zeigt, bewegt man sich bei der Begrundung der Elementarschritte in einemSystem, das sich auf einigen Axiomen (Grundannahmen) aufbaut und in dem manauf bereits bewiesene Tatsachen zuruckgreifen kann.

Satz: Ist eine naturliche Zahl n durch 6 teilbar, so ist ihr Quadrat durch 9 teilbar.

Beweis: Die Idee ist offensichtlich – ist n durch 6 teilbar, so kann man den Faktor6 und damit auch den Faktor 3 von n abspalten. Folglich kann man den Faktor 3mindestens zweimal von n2 abspalten. Wenn wir diese Idee etwas formaler umsetzenwollen, mussen wir mit der Definition von Teilbarkeit beginnen:

n ∈ N ist durch k ∈ N teilbar, falls ein l ∈ N existiert, so dass n = k · l.

Die Tatsache, dass n durch k teilbar ist (also k ein Teiler von n ist) wird symbolischdurch k |n ausgedruckt. Damit kann man die Voraussetzung des Satzes durch eineeinfache Formel ausdrucken und die folgende Beweiskette bilden:

6 |n Hypothese∃l ∈ N n = 6 · l Teilbarkeitsdefinition∃l ∈ N n = (3 · 2) · l 6 = 3 · 2∃l ∈ N n2 = ((3 · 2) · l)((3 · 2) · l) Quadrieren∃l ∈ N n2 = (3 · 3)((2 · 2) · (l · l)) Muliplikation ist assoziativ und kommutativ∃l ∈ N n2 = 9 · (4 · l2) 3 · 3 = 9 und 2 · 2 = 4∃l′ ∈ N n2 = 9 · l′ l′ = 4l2

9 |n2 TeilbarkeitsdefinitionGenau betrachtet haben wir beim Schritt von der vierten zur funften Zeile sogarmehrere Elementarschritte zu einem Schritt zusammengefasst.

Indirekte Beweise

Manchmal ist es schwierig, den Beweis direkt zu fuhren. Als Alternativen bieten sichindirekte Beweise durch Kontraposition oder in der Form von Widerspruchs-Beweisenan. Beim Beweis durch Kontraposition wird anstelle von p→ q die logisch aquivalenteAussage ¬q → ¬p bewiesen. Beim Widerspruchs-Beweis wird an Stelle von p → qdie logisch aquivalente Aussage (p ∧ ¬q) → 0 bewiesen. Wir demonstrieren beideBeweisverfahren an einfachen Beispielen.

Satz: Fur jede naturliche Zahl n gilt: Ist n2 ungerade, so ist auch n ungerade.

Beweis durch Kontraposition: Da die Negation von “ungerade sein” die Eigen-schaft “gerade sein” ist, lautet die Kontraposition “Ist n gerade, so ist auch n2 ger-ade”. und dafur gibt es einen einfachen direkten Beweis:Ist n gerade, so gibt es eine ganze Zahl k mit n = 2k. Folglich ist n2 = (2k)2 = 2·(2k2)und somit ist n2 gerade.

Satz: Fur jede naturliche Zahl n gilt: Ist√n keine ganze Zahl, dann ist

√n auch

nicht rational.

Beweis durch Widerspruch: Man geht von der Annahme aus, dass√n keine

naturliche Zahl, aber eine rationale Zahl ist, und muss daraus einen Widerspruch

12

Page 13: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

ableiten. Sei n = pk11 · . . . ·pkll die eindeutige Primzahlzerlegung von n, wobei p1, . . . , pl

die paarweise verschiedenen Primfaktoren von n sind und k1, . . . , kl die Vielfachheitendieser Primfaktoren. Waren alle Werte k1, . . . , kl gerade Zahlen, dann ware

√n eine

ganze Zahl, namlich pk1/21 ·. . .·pkl/2l . Nach unserer Annahme muss also mindestens einer

dieser Werte ungerade sein, o.B.d.A. (d.h. ohne Beschrankung der Allgemeinheit) seidas k1.Daruber hinaus soll

√n rational, also als Quotient aus zwei naturlichen Zahlen m und

m′ darstellbar sein. Damit ist n =(mm′

)2und n ·m′2 = m2. Kombiniert man diese

Gleichung mit den Primzahlzerlegungen von m = qi11 · . . . · qijj und m′ = r

i′11 · . . . · r

i′j′

j′ ,ergibt sich:

pk11 · . . . · pkll · r

2i′11 · . . . · r

2i′j′

j′ = q2i11 · . . . · q

2ijj .

Folglich tritt der Primfaktor p1 auf der linken Seite in ungerader Vielfachheit auf undauf der rechten Seite in gerader Vielfachheit (unabhangig davon, ob p1 uberhaupt in moder m′ vorkommt). Das ist aber ein Widerspruch zur eindeutigen Primzahlzerlegungvon naturlichen Zahlen.

Beweise durch Fallunterscheidung

Haufig ist es notwendig, verschiedene Falle zu analysieren. Das dabei verwendetelogische Prinzip ist Aquivalenz der Aussagen p→ q und (p ∧ r → q) ∧ (p ∧ ¬r → q),wir unterscheiden also die Falle r und ¬r.

Beispiel: Wir beweisen durch Fallunterscheidung, daß fur jede Primzahl p ≥ 5 dieZahl p2 − 1 durch 24 teilbar ist.Zuerst formen wir p2−1 in (p+1)(p−1) um und beobachten, dass von drei aufeinan-derfolgenden ganzen Zahlen genau eine durch 3 teilbar ist. Da p > 3 und Primzahlist, muss p−1 oder p+1 und damit auch p2−1 durch 3 teilbar sein. Bleibt zu zeigen,dass p2 − 1 durch 8 teilbar ist. Da p ungerade ist, sind sowohl p − 1 als auch p + 1gerade und damit ist p2 − 1 durch 4 teilbar. Den noch fehlenden Faktor 2 kann mandurch Fallunterscheidung nachweisen:1. Fall: Ist p − 1 durch 4 teilbar, so ist p − 1 = 4k und p + 1 = 4k + 2 = 2(2k + 1)und damit p2 − 1 = 8k(2k + 1) fur eine naturliche Zahl k.2. Fall: Ist p − 1 nicht durch 4 teilbar, so hat es die Form 4m + 2 = 2(2m + 1) fureine naturliche Zahl m und folglich ist p + 1 = 4m + 4 = 4(m + 1). Damit erhaltenwir p2 − 1 = 8(2m+ 1)(m+ 1).

13

Page 14: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

2 Grundbegriffe der Mengenlehre

2.1 Mengen und Operationen auf Mengen

Moderne Mengentheorie wird in Form eines axiomatischen Kalkuls betrieben. DieserAnsatz hat aber den Nachteil, daß einfache inhaltliche Fragen oft durch einen tech-nisch komplizierten Apparat verdeckt werden. Wir werden uns deshalb auf die Ent-wicklung einer “naiven” Mengenlehre beschranken, die als sprachliches Werkzeug furdie nachfolgenden Teile der Vorlesung vollig ausreichend ist.Nach Georg Cantor ist eine Menge “eine Zusammenfassung von bestimmten wohlun-terschiedenen Objekten unserer Anschauung oder unseres Denkens (welche die Ele-mente der Menge genannt werden) zu einem Ganzen”.Der Sachverhalt, dass ein Objekt a Element einer Menge A ist, wird durch a ∈ Adargestellt, anderenfalls schreibt man a 6∈ A. Zwei Mengen A und B sind gleich,wenn sie die gleichen Elemente besitzen, d.h. wenn fur alle a gilt: a ∈ A dann undnur dann, wenn a ∈ B.

Darstellungen von Mengen

a) Mengen konnen durch Auflistung ihrer Elemente in geschweiften Klammern darge-stellt werden. Das betrifft insbesondere endliche Mengen, wie z.B. A = 2, 3, 5, 7oder B = rot, gelb, blau. Dabei ist die Reihenfolge der Elemente in der Auflistungohne Bedeutung. Auch die Mehrfachnennung von Elementen ist erlaubt (sollte aberzur Vermeidung von Missverstandnissen moglichst vermieden werden), sie hat abernur Einfluss auf die Darstellung der Menge und nicht auf die Menge selbst, z.B.2, 3, 5, 7 = 5, 7, 3, 2, 2, 5, 2.Wir vereinbaren, dass auch unendliche Mengen durch Auflistung dargestellt werdenkonnen, sofern dies unmissverstandlich ist, wie z.B. 0, 1, 2, 3, . . . fur die naturlichenZahlen oder 2, 4, 6, 8, . . . fur die positiven, geraden Zahlen.

b) Die in der Mathematik gebrauchlichste Darstellungsform von Mengen beruht aufdem sogenannten Abstraktionsprinzip, nach dem man Mengen – im Sinne der Can-torschen Definition – durch wohlbestimmte Eigenschaften definieren kann. Dazu wer-den Pradikate P (x) uber einem festgelegten Individuenbereich fur x benutzt. Dannwird mit x | P (x) oder (wenn der Bereich B explizit genannt werden soll) mitx ∈ B | P (x) die Menge bezeichnet, die sich aus allen Individuen aus dem Bereichzusammensetzt, fur die P (x) wahr ist. Man bezeichnet diese Darstellungsart vonMengen nach den Mathematikern Ernst Zermelo und Abraham Fraenkel auch alsZF-Notation.

c) Zur Veranschaulichung konnen Mengen durch sogenannte Venn–Diagramme alsKreisscheiben oder andere Flachen in der Ebene dargestellt werden.

Oft ist es sinnvoll, den zu betrachtenden Individuenbereich generell festzulegen, z.B.wenn man nur Mengen von naturlichen Zahlen betrachten will. Ein solcher Bereichwird Universum genannt und allgemein mit U bezeichnet. Es ist klar, dass Aussage-formen uber U immer Teilmengen von U definieren. Im folgenden Venn-Diagrammsind zwei Mengen A und B als Kreisflachen in dem durch das Rechteck symbolisierten

14

Page 15: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Universum U dargestellt:

Bemerkung: In manchen Anwendungen (z.B. fur die Buchstaben in einem Wort)benotigt man auch ein Konstrukt, in dem Elemente auch mehrfach auftreten konnen.In diesem Fall sprechen wir von einer Multimenge. Obwohl sich diese konzeptionellwesentlich von einer Menge unterscheidet, wird in der Regel die gleiche Notationverwendet, was naturlich zu Missverstandnissen fuhren kann. Deshalb werden wirbei Verwendung von Multimengen diesen Begriff explizit nennen, anderenfalls istimmer eine Menge gemeint. Demnach sind b, a, b, b und a, b (ohne Zusatz) zweiidentische Mengen, die Multimengen b, a, b, b und a, b unterscheiden sich, aberdie Multimengen b, a, b, b und a, b, b, b sind wiederum identisch.

Definition: Eine Menge A ist Teilmenge (oder Untermenge) einer Menge B (Schreib-weise A ⊆ B), wenn aus a ∈ A auch a ∈ B folgt.

Die Teilmengenrelation entspricht also einer Implikation der definierenden Pradikate.Deshalb kann man aus den Eigenschaften der logischen Implikation zwei elementareEigenschaften der Teilmengenrelation ableiten:

• Die Mengen A und B sind gleich genau dann, wenn A ⊆ B und B ⊆ A.

• Ist A eine Teilmenge von B und B eine Teilmenge von C, dann ist auch A eineTeilmenge von C.

Die folgende Definition enthalt eine Zusammenfassung der wichtigsten Mengenope-rationen. Man beachte insbesondere den Zusammenhang zu den entsprechenden lo-gischen Operationen.

Definition:

• Zwei Mengen A und B sind disjunkt, wenn sie keine gemeinsamen Elementebesitzen, d.h wenn aus a ∈ A folgt a 6∈ B.

• Die Vereinigung A ∪ B der Mengen A und B besteht aus allen Objekten, dieElemente von A oder von B sind, dh. A ∪B = x | x ∈ A ∨ x ∈ B.

• Der Durchschnitt A ∩ B der Mengen A und B besteht aus allen Objekten, dieElemente von A und von B sind, dh. A ∩B = x | x ∈ A ∧ x ∈ B.

15

Page 16: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• Die Differenz A \ B der Mengen A und B besteht aus allen Objekten, dieElemente von A, aber nicht von B sind, dh. A \B = x | x ∈ A ∧ x 6∈ B.

• Die Vereingung der Mengendifferenzen A \B und B \A wird die symmetrischeDifferenz aus A und B genannt und mit A⊕B oder auch mit A÷B bezeichnet.

• Die Menge, die kein Element enthalt, wird leere Menge genannt und mit ∅bezeichnet.

• Ist A Teilmenge eines festgelegten Universums U , dann ist das Komplement vonA definiert als U \ A. Es wird mit A bezeichnet.

Der Zusammenhang zwischen Teilmengenbeziehungen sowie Operationen auf Mengenund den entsprechenden logischen Operationen wird noch einmal in der folgendenTabelle zusammengefasst:

Mengenlehre Logik

Gleichheit A = B x ∈ A↔ x ∈ B AquivalenzInklusion A ⊆ B x ∈ A→ x ∈ B Implikation

Vereinigung A ∪B x ∈ A ∨ x ∈ B DisjunktionDurchschnitt A ∩B x ∈ A→ x ∈ B Konjunktion

Komplement A = B x ∈ A↔ ¬(x ∈ B) Negationsymmetr. Differenz A⊕B = A÷B x ∈ A⊕ x ∈ B Antivalenz

Damit konnen auch - wie im nachfolgenden Satz formuliert - die bekannten Gesetzeder Aussagenlogik in die Mengenlehre ubertragen werden.

Satz: Folgende Identitaten gelten fur alle Untermengen A,B,C eines Universums U :

Kommutativitat: A ∪B = B ∪ A und A ∩B = B ∩ AAssoziativitat: A ∪ (B ∪ C) = (A ∪B) ∪ C

und A ∩ (B ∩ C) = (A ∩B) ∩ CDistributivitat: A ∩ (B ∪ C) = (A ∩B) ∪ (A ∩ C)

und A ∪ (B ∩ C) = (A ∪B) ∩ (A ∪ C)Idempotenz: A ∪ A = A und A ∩ A = ADominanz: A ∪ U = U und A ∩ ∅ = ∅Identitat: A ∪ ∅ = A und A ∩ U = AAbsorbtion: A ∪ (A ∩B) = A und A ∩ (A ∪B) = ADe Morgan’sche Regel: A ∪B = A ∩B und A ∩B = A ∪ BKomplementierung: A ∪ A = U und A ∩ A = ∅

(A) = A und A \B = A ∩B

Auf Grund der Assoziativitat kann man bei der Vereinigung (bzw. beim Durch-schnitt) von n Mengen A1, A2, . . . , An auf Klammerungen verzichten und die folgende

16

Page 17: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Schreibweise nutzen:A1 ∪ A2 ∪ . . . ∪ An =

⋃ni=1 Ai

A1 ∩ A2 ∩ . . . ∩ An =⋂ni=1 Ai

Die Bildung einer solchen Vereinigung bzw. eines solchen Duchschnitts erfolgt somit(in Analogie zu endlichen Summen oder Produkten von n Zahlen) durch die (n −1)-fache Anwendung der einfachen Vereinigungs- bzw. Durchschnittsoperation. ImGegensatz zu den Zahlen kann man aber fur Mengen auch uneingeschrankt unendlicheVereinigungen und Durchschnitte bilden.Definition: Ist I eine beliebige Menge und ist fur jedes i ∈ I eine Menge Ai gegeben,dann nennen wir die Multimenge dieser Mengen eine Mengenfamilie und bezeichnensie durch Ai | i ∈ I. Die Vereinigung (bzw. der Durchschnitt) dieser Mengenfamilieist definiert durch⋃

i∈I Ai = x | es gibt ein i ∈ I, so dass x ∈ Ai⋂i∈I Ai = x | fur alle i ∈ I gilt x ∈ Ai

Beispiel: Sei I = 2, 3, 4, . . . die Menge der naturlichen Zahlen, die großer odergleich 2 sind und sei Ai = n ∈ N | i|n die Menge der durch i teilbaren Zahlen furjedes i ∈ I. Dann ergibt sich⋃

i∈I

Ai = 0, 2, 3, . . . = N \ 1 und⋂i∈I

Ai = 0.

Zur Begrundung betrachten wir jeweils drei Falle. Da die 0 durch jede andere Zahlteilbar ist, liegt sie in jedem Ai und somit auch in der Vereinigung und im Durch-schnitt. Die 1 ist durch keine andere Zahl teilbar, gehort also zu keinem Ai und liegtsomit weder im Durchschnitt noch in der Vereingung. Da fur jedes i ∈ I gilt i ∈ Aiund i 6∈ A2i gilt, gehort i zur Vereinigung, aber nicht zum Durchschnitt.

Bemerkung: Fur die Vereinigung und den Durchschnitt ist es unerheblich, ob wir dieMengenfamilie als Multimenge oder als Menge auffassen, fur andere Betrachtungenkonnte dieser Unterschied aber durchaus bedeutsam sein.

Definition: Eine Familie Ai | i ∈ I von nichtleeren Mengen wird Partition oderZerlegung einer Menge A genannt, falls

1. A =⋃i∈I Ai

2. Fur beliebige, voneinander verschiedene i, j ∈ I gilt Ai ∩ Aj = ∅.

Beispiele: a, c, b, e, f, d ist eine Partition der Menge a, b, c, d, e, f in dreiTeilmengen. Die Menge der geraden und die Menge der ungeraden Zahlen bilden einePartition der Menge N in zwei Teilmengen.

Definition: Ist A eine Menge, dann wird die Menge aller Untermengen von A diePotenzmenge von A genannt und mit P(A) bezeichnet.

Satz: Ist A eine endliche, n-elementige Menge, dann hat die Potenzmenge P(A)genau 2n Elemente.

17

Page 18: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

2.2 Kartesisches Produkt und Relationen

Definition: Ein geordnetes Paar (a, b) ist eine (den Objekten a und b zugeordnetes)Konstrukt mit der folgenden Eigenschaft: (a, b) = (a′, b′) genau dann, wenn a = a′

und b = b′.

Definition: Das kartesische Produkt A× B von zwei Mengen A und B ist definiertals die Menge aller geordneten Paare (a, b) mit a ∈ A und b ∈ B, als Formel:

A×B = (a, b) | a ∈ A ∧ b ∈ B

Beispiel: a, b, c × 1, 2 = (a, 1), (a, 2), (b, 1), (b, 2), (c, 1), (c, 2).Definition: Eine Untermenge R eines kartesischen Produkts A×B wird binare Rela-tion oder kurz Relation zwischen A und B genannt. Im Fall (a, b) ∈ R sagt man, dassa in Relation zu b steht. Fur (a, b) ∈ R kann auch aR b geschrieben werden. Diesealternative Notation wird vor allem dann verwendet, wenn der Relationsbezeichnerkein Buchstabe sondern ein Relationssymbol wie <,≤,≡ oder ∼ ist.Eine Untermenge R eines kartesischen Produkts der Form A×A wird (binare) Rela-tion auf A (oder uber A) genannt.

Die ersten drei Relationen in den folgenden Beispielen sind generisch, d.h. man kannsie uber beliebigen Grundmengen betrachten:

• ∅ ⊆ A×B wird leere Relation genannt.

• A×B wird Allrelation zwischen A und B genannt.

• Die Menge (a, a) | a ∈ A wird die identische Relation uber A genannt undkurz mit IdA bezeichnet.

• Die Teilbarkeitsrelation | kann man als Relation uber den naturlichen Zahlen(aber auch uber den ganzen Zahlen) betrachten. Wie bereits besprochen, istdiese Relation wie folgt definiert:

∀ a, b ∈ N a | b ⇐⇒ ∃c ∈ N b = a · c

• Uber den naturlichen Zahlen N, den ganzen Zahlen Z, den rationalen ZahlenQ und den reellen Zahlen R kennen wir eine Reihe von Vergleichsrelationen,namlich <,≤,≥, >.

• Ist A die Menge aller Informatikstudenten an der FU Berlin und B die Mengealler Pflichtmodule im Informatikstudium, dann istR = (a, b) ∈ A × B | Student a hat das Modul b abgeschlossen eine binareRelation.

• Jede Abbildung f : A −→ B kann auch als binare Relationf = (a, b) ∈ A×B | a ∈ A ∧ b = f(a) gesehen werden.

18

Page 19: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Zur Darstellung von Relationen sind verschiedene Methoden gebrauchlich:

• Darstellungen in Tabellenform, bei denen fur jedes a ∈ A eine Spalte und furjedes b ∈ B eine Zeile angelegt wird. Die Zelle in der Spalte von a und derZeile von b wird mit einer 1 gefullt, wenn aR b gilt, und sonst mit einer 0.(Verwendung in relationalen Datenbanken);

• Anschauliche Darstellungen durch Diagramme in einem Rechteck;

• Bipartite Graphen, bei denen die Elemente aus A und B als Knoten getrennt aufzwei Seiten gezeichnet werden, wobei zwei Elemente, die zueinander in Relationstehen, durch eine Kante (Verbindungsstrecke) verbunden werden.

• Fur Relationen uber einer Menge A kann man gerichtete Graphen verwenden.Dabei wird jedes Element von A als ein Knoten und jedes Paar (a, b) ∈ R durcheine von a nach b gerichtete Kante gezeichnet.

Relationsoperationen

1. Sind R und R′ Relationen zwischen A und B, dann sind auch die VereinigungR ∪ R′, der Durchschnitt R ∩ R′ sowie das Komplement R = (A × B) \ RRelationen zwischen A und B.

2. Die zu einer Relation R ⊆ A × B inverse Relation R−1 ⊆ B × A ist definiertdurch R−1 = (b, a) ∈ B × A | (a, b) ∈ R.

3. Die Verkettung oder Komposition R S von zwei Relationen R ⊆ A × B undS ⊆ B × C ist definiert durch

(a, c) ∈ A× C | es gibt ein b ∈ B mit (a, b) ∈ R und (b, c) ∈ S.

Beispiele:

1) Wir betrachten die Vergleichsrelationen <, ≤, ≥ und = uber den naturlichenZahlen N. Offensichtlich ist die Vereinigung der Relationen < und = die Relation ≤.Das Komplement der Relation < ist die Relation ≥. Der Durchschnitt der Relationen≤ und≥ ist die identische Relation IdN. Die zu≤ inverse Relation ist≥, die identischeRelation ist zu sich selbst invers.

2) Sei M die Menge aller Menschen und R ⊆ M ×M “Elternrelation”, also aR b,falls a Vater oder Mutter von b ist. Dann kann man die inverse Relation R−1 sowiedie Verkettungen R R, R R−1 und R−1 R wie folgt charakterisieren:

• aR−1 b, falls a Kind von b ist,

• aR R b, falls a Großvater oder Großmutter von b ist,

• aR R−1 b, falls a und b ein gemeinsames Kind haben oder falls a = b und ahat ein Kind,

19

Page 20: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• aR−1R b, falls a = b oder falls a und b Geschwister oder Halbgeschwister sind.

Eigenschaften von Relationen uber Mengen

Definition: Sei R eine Relation uber A.

• R ist reflexiv, falls fur jedes a ∈ A gilt, dass aR a, d.h. IdA ⊆ R.

• R ist symmetrisch, falls aus aR b folgt, dass bR a , d.h. R−1 ⊆ R.

• R ist transitiv, falls aus aR b und bR c folgt, dass aR c, d.h. R R ⊆ R.

• R ist antisymmetrisch, falls aus aR b und bR a die Gleichheit von a und b folgt,d.h. R ∩R−1 ⊆ IdA.

• R ist asymmetrisch, falls aus aR b folgt, dass (b, a) 6∈ R, d.h. R ∩R−1 = ∅.

Beispiele:

1) Die Vergleichsrelationen ≤ und ≥ sind uber N,Z,Q und R reflexiv, transitiv undantisymmetrisch. Die Relationen < und > sind nicht reflexiv, aber transitiv, anti-symmetrisch und asymmetrisch.

2) Die oben definierte Teilbarkeitsrelation ist reflexiv und transitiv uber N und uber Z.Sie ist antisymmetrisch uber N, aber als Relation uber Z ist sie nicht antisymmetrisch,denn 1| − 1 und −1|1, aber 1 6= −1.

2.3 Aquivalenzrelationen

Definition: Eine Relation uber einer Menge A wird Aquivalenzrelation genannt,wenn sie reflexiv, symmetrisch und transitiv ist.

Beispiele:

• Sei N die Menge der naturlichen Zahlen und R definiert durch aR b, genau dannwenn a und b beim Teilen durch 5 den gleichen Rest haben. Dann ist R eineAquivalenzrelationuber N.

• Die Relation≡ der logischen Aquivalenz uber der Menge der Booleschen Formelnist eine Aquivalenzrelation.

• Sei M die Menge aller Menschen und R die Relation, die zwei Menschen inBeziehung setzt, wenn sie denselben Vater und dieselbe Mutter haben. DieseGeschwisterrelation ist offensichtlich eine Aquivalenzrelation. Die Halbgeschwister-Relation ist im Allgemeinen nicht transitiv und somit keine Aquivalenzrelation.

20

Page 21: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Definition: Ist R ⊆ A× A eine Aquivalenzrelation und ist a ∈ A, dann nennt mandie Menge x ∈ A | xRa die Aquivalenzklasse von a (bezuglich R). Sie wird mit [a]Roder auch mit a/R bezeichnet. Ein Element einer Aquivalenzklasse wird Reprasentantdieser Klasse genannt.

Lemma: Sei R eine Aquivalenzrelation, dann sind zwei Aquivalenzklassen [a]R und[b]R entweder gleich oder disjunkt. Sie sind genau dann gleich, wenn aR b gilt.

Beweis: Wir verifizieren dazu die folgende Schlusskette:

[a]R ∩ [b]R 6= ∅(1)

=⇒ aR b(2)

=⇒ [a]R = [b]R

(1) Sei c ∈ [a]R ∩ [b]R, dann gilt cRa und cRb, wegen der Symmetrie auch aRc undwegen der Transitivitat auch aRb.(2) Sei d ein beliebiges Element aus [a]R und gelte aRb. Dann gilt dRa und wegender Transitivitat auch dRb. Damit liegt d in der Aquivalenzklasse[b]R und folglichist [a]R ⊆ [b]R. Wegen der Symmetrie kann man aber auch die Rollen von a und bvertauschen und somit [b]R ⊆ [a]R ableiten, woraus letztlich die Gleichheit der beidenAquivalenzklassen folgt.

Die erste Aussage des folgenden Satzes kann als einfache Schlussfolgerung aus demLemma abgeleitet werden.

Satz: Ist R ⊆ A × A eine Aquivalenzrelation, dann bildet die Menge aller Aquiva-lenzklassen eine Partition von A. Umgekehrt, ist eine Partition Ai | i ∈ I von Agegeben, dann ist die durch

aR b ⇐⇒ ∃i ∈ I a ∈ Ai ∧ b ∈ Aidefinierte Relation R eine Aquivalenzrelation.

Definition: Sei R ⊆ A × A eine Aquivalenzrelation. Eine Untermenge von A wirdReprasentantensystem von R genannt, wenn sie aus jeder Aquivalenzklasse genau einElement enthalt.

Beispiel: Wir verallgemeinern das Beispiel der Relation, die durch gleiche Reste beimTeilen durch 5 definiert ist, indem wir an Stelle der 5 einen beliebigen ganzzahligenTeiler d ≥ 2 betrachten. Man nennt zwei Zahlen a, b ∈ N kongruent modulo d, wennsie beim Teilen durch d den gleichen Rest haben (Kongruenzrelationen sind spezielleAquivalenzrelationen, die vertraglich mit bestimmten Operationen sind, in diesemFall mit Addition und Multiplikation). Zur Notation verwendet man a mod d furden Rest beim Teilen von a durch d und den Ausdruck a ≡ b ( mod d) furdie Tatsache, dass a und b beim Teilen durch d den gleichen Rest haben, also dassa mod d und b mod d gleich sind.Bei der Kongruenzrelation modulo d werden die einzelnen Aquivalenzklassenjeweilsdurch die Zahlen mit gleichem Rest gebildet, was im Beispiel d = 5 zu der folgendenPartition von N fuhrt:

0, 5, 10 . . ., 1, 6, 11, . . ., 2, 7, 12, . . ., 3, 8, 13, . . ., 4, 9, 14, . . .

21

Page 22: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Offensichtlich bilden die Reste 0,1,2,3,4 ein Reprasentantensystem (das sogenannteStandard–Reprasentantensystem), aber auch die Menge 3, 10, 7, 21, 9 ist ein Repra-sentantensystem.

Satz: Die identische Relation IdA und die Allrelation A × A sind Aquivalenzrela-tionen. Sind R und R′ Aquivalenzrelationen in A, dann ist auch R∩R′ eine Aquiva-lenzrelation in A.

Achtung: Die letzte Aussage gilt im Allgemeinen nicht fur Vereinigungen. AlsGegenbeispiel kann man die Kongruenzrelationen modulo 2 und modulo 3 betrachten.Offensichtlich ist das Paar (1, 6) nicht in der Vereinigung, denn 1 und 6 haben sowohlbeim Teilen durch 2 als auch beim Teilen durch 3 verschiedene Reste. Andererseitssind die Paare (1, 4) - gleicher Rest beim Teilen durch 3 - und (4, 6) - gleicher Restbeim Teilen durch 2 - in der Relationsvereinigung. Folglich ist diese Vereinigung nichttransitiv.

Allgemein kann jede Relation R ⊆ A × A durch die folgenden 3 Schritte zu einerAquivalenzrelation erweitert werden:

1) reflexiver Abschluss: Rr = R ∪ IdA2) symmetr. Abschluss: Rrs = Rr ∪R−1

r = R ∪R−1 ∪ IdA3) transitiver Abschluss: Rrst = Rrs ∪Rrs Rrs ∪Rrs Rrs Rrs ∪ . . . =

⋃∞i=1 R

irs

wobei Rirs die i-fache Verkettung von Rrs ist.

Beispiel: Der reflexiv–symmetrisch–transitive Abschluss der Nachfolgerrelation aufden naturlichen Zahlen ist die Allrelation. Setzt die Relation R jede naturliche Zahln zum Nachfolger ihres Nachfolgers, also zu n+2 in Beziehung, dann ist der reflexiv–symmetrisch–transitive Abschluss dieser Relation die Kongruenz modulo 2.

2.4 Ordnungsrelationen

Definition: Eine Relation R uber einer Menge A, die reflexiv, transitiv und an-tisymmetrisch ist, wird Halbordnungsrelation oder auch partielle Ordnungsrelationgenannt. Das Paar (A,R) nennt man eine halb– (partiell) geordnete Menge oder kurzposet als Abkurzung fur partially ordered set.

Endliche, halbgeordnete Mengen werden oft durch sogenannte Hasse–Diagrammedargestellt. Dabei werden die Elemente der Menge als Punkte in der Ebene gezeich-net, wobei direkte Nachfolger jeweils hoher als ihre Vorganger liegen und mit ihnendurch ein Liniensegment verbunden sind. Formal betrachtet beschreibt das Hasse–Diagramm eines Posets (A,R) die kleinste Unterrelation von R, deren reflexiver undtransitiver Abschluss R ergibt. Die folgende Abbildung zeigt das Hasse–Diagrammder Potenzmenge einer 3–elementigen Menge M = a, b, c:

22

Page 23: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

a b c

a,b,c

a,b a,c b,c

Beispiele:1) Fur jede beliebige Menge M ist (P(M),⊆) eine halbgeordnete Menge.2) Die Teilbarkeitsrelation | ist eine Halbordnungsrelation in der Menge der positivenganzen Zahlen Z+.3) In der Menge der reellen Zahlen R ist die Relation ≤ eine Halbordnungsrelation.4) Die Menge der Worter einer Sprache wird durch die “lexikographische Ordnung”geordnet.

Zwei Begriffe sind eng verwandt mit partiellen Ordnungsrelationen: totale Ord-nungsrelationen und strikte (oder strenge) Ordnungsrelationen. Diese Begriffe werdendurch die folgenden Definitionen genauer erlautert.

Definition: Zwei Elemente a und b einer halbgeordneten Menge (A,R) nennt manvergleichbar, falls aR b oder bR a gilt. Anderenfalls nennt man sie unvergleichbar.Eine Halbordnungsrelation R in einer Menge A wird totale (oder auch lineare) Ord-nungsrelation genannt, wenn jedes Paar von Elementen vergleichbar ist.

Beispiele: In den obigen Beispielen sind die Relationen aus 1) und 2) keine totalenOrdnungsrelationen. So sind fur M = a, b, c die Untermengen a und c unver-gleichbar bezuglich der Teilmengenrelation. Die Zahlen 6 und 20 sind unvergleichbarbezuglich der Teilbarkeitsrelation. Dagegen ist ≤ eine totale Ordnungsrelation furdie reellen Zahlen. Die lexikographische Ordnung ist eine totale Ordnungsrelation.

Bemerkung: Taucht in der Literatur der Begriff “Ordnungsrelation” auf, so istdarunter in der Regel eine “Halbordnungsrelation” zu verstehen.

Definition: Eine Relation R uber einer Menge A wird strikte oder strenge Ord-nungsrelation genannt, wenn sie transitiv und asymmetrisch ist.

Typische Beispiele fur strikte Ordnungsrelationen sind die “echt–kleiner”–Relation< oder die Relation, ein echter Teiler zu sein. Generell kann man aus jeder Halb-ordnungsrelation R uber einer Menge A eine strikte Ordnungsrelation R′ = R \ IdAableiten und umgekehrt kann aus jeder strikten Ordnungsrelation durch Vereinigungmit IdA eine Halbordnungsrelation gemacht werden.

Weitere Begriffe, die wie das Maximum und Minimum aus der Schulmathematik

23

Page 24: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

bekannt sind, mussen im Kontext mit Halbordnungsrelationen noch einmal neu defi-niert werden.

Definition: Sei (A,≺) ein Poset, B 6= ∅ eine Teilmenge von A und a ∈ A.

• a ist eine obere (bzw. untere) Schranke von B, wenn b ≺ a (bzw. a ≺ b) fur alleb ∈ B gilt.

• a ist ein maximales (bzw. minimales) Element von B, wenn a ∈ B und es keinvon a verschiedenes b ∈ B gibt, so dass a ≺ b (bzw. b ≺ a).

• a wird großtes Element von B (bzw. kleinstes Element von B) genannt, wenna ∈ B und a eine obere (bzw. untere) Schranke von B ist.

• a wird Supremum oder obere Grenze von B (bzw. Infimum oder untere Grenzevon B) genannt, wenn die Menge O(B) der oberen Schranken von B (bzw. dieMenge U(B) der unteren Schranken von B) nicht leer ist und a das kleinsteElement von O(B) (bzw. das großte Element von U(B)) ist.

Bemerkungen zur Definition:

• Eine Teilmenge B kann mehrere maximale bzw. mehrere minimale Elementehaben. Ist B endlich, dann gibt es mindestens ein maximales und ein minimalesElement von B.Dagegen gibt es einfache Beispiele von endlichen Mengen, furdie es keine obere und untere Schranken und somit auch weder großte oderkleinste Elemente noch obere oder untere Grenzen gibt.

• Existiert ein großtes (bzw. kleinstes) Element von B, dann ist es eindeutig.Somit ist auch die obere bzw. untere Grenze vonB eindeutig sofern sie uberhauptexistiert.

• Etwas verwirrend ist die Konvention, das großte (bzw. kleinste) Element vonB, sofern es existiert, als Maximum (bzw. Minimum von B zu bezeichnen. Esgilt der Merksatz, dass das Maximum (wenn existent) immer ein maximalesElement ist, aber nicht die Umkehrung.

• Da Maximum, Minimum, Supremum oder Infimum einer Teilmenge B bei Exi-stenz immer eindeutig sind, kann man fur sie die Bezeichnungen max(B),min(B), sup(B),inf(B) einfuhren. Diese stehen dann entweder fur ein ein-deutig existierendes Element oder fur nicht existierend.

Beobachtung: Wenn fur eine Teilmenge B einer Halbordnung (A,≺) das Maximum(bzw. Minumum) existiert, dann existiert auch das Supremum (bzw. das Infimum)und es gilt sup(B) = max(B) (bzw. inf(B) = min(B)).

Beweis: Sei a das Maximum von B, dann gilt (i) a ∈ B und (ii) ist a obereSchranke von B, d.h. b ≺ a fur alle b ∈ B. Man muss zeigen, dass a in der Mengeder oberen Schranken O(B), das kleinste Element ist. Nach Definition muss also aElement und untere Schranke von O(B) sein. Die erste Eigenschaft ist bereits durch

24

Page 25: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

die Voraussetzung (ii) gegeben. Fur die zweite Eigenschaft mussen wir a ≺ c furalle c ∈ O(B) nachweisen. Aus c ∈ O(B) folgt aber b ≺ c fur alle b ∈ B, also auchinsbesondere fur b = a. Somit ist a auch das Supremum von B.

Beispiel: Wir betrachten die durch nachfolgendes Hasse-Diagramm dargestellte Hal-bordnung (A,≺) mit den Teilmengen B = d, e und C = f, g, h:

a b c

d e

h

f g

• Die Gesamtmenge A hat ein maximales Element, namlich h und drei minimaleElemente, namlich a, b und c. Damit is h auch das Maximum und Supremumvon A, Minimum und Infimum existieren nicht.

• B hat zwei obere Schranken, namlich f und h und zwei untere Schranken,namlich a und b.

• Sowohl d als auch e sind maximale und minimale Elemente von B.

• B hat weder ein Maximum noch ein Minimum noch ein Infimum, aber einSupremum sup(B) = f .

• C hat eine obere Schranke, namlich h und vier untere Schranken, namlich a, b, cund e.

• C besitzt ein maximales Element, namlich h, und die minimalen Elemente fund g.

• C hat kein Minimum, aber inf(C) = e und sup(C) = max(C) = h.

2.5 Funktionen

Definition: Unter einer Funktion (oder Abbildung) f von einer Menge A in eineMenge B versteht man eine Zuordnung, bei der jedem Element aus A ein eindeutigbestimmtes Element aus B entspricht. Formal kann f als eine Relation zwischen Aund B charakterisiert werden, so dass fur jedes a ∈ A genau ein b ∈ B existiertmit a f b. Als ubliche Schreibweise verwenden wir f : A −→ B um auszudrucken,

25

Page 26: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

dass f eine Funktion von A nach B ist, und f(a) = b, um auszudrucken, dass demElement a durch die Funktion f der Wert b zugeordnet wird. Die Menge A wirdDefinitionsbereich von f und die Menge B wird Wertebereich oder Wertevorrat vonf genannt.

Anmerkung: Die hier verwendete Definition von Funktionen ist die in der Mathema-tik ubliche Form. In der Informatik spielen oft auch sogenannte partielle Funktioneneine Rolle. Das sind Relationen zwischen A und B, so dass jedes a ∈ A zu hochstenseinem b ∈ B in Beziehung steht. Im Sinne der oben gegebenen Definition ist alsoeine partielle Funktion nicht ein Spezialfall einer Funktion, sondern im Allgemeinengar keine Funktion, aber eine Funktion ist auch immer eine partielle Funktion.

Definition: Ist f : A −→ B eine Funktion, M ⊆ A und N ⊆ B, dann nennt mandie Mengef(M) = y ∈ B | es gibt ein x ∈M mit f(x) = y das Bild von M unter f

und die Mengef−1(N) = x ∈ A | f(x) ∈ N das vollstandige Urbild von N unter f .

Definition:

• Eine Funktion f : A −→ B heißt surjektiv, falls jedes Element von B im Bildvon A auftritt, d.h. f(A) = B. Man kann sagt dann auch, dass f die Menge Aauf die Menge B abbildet.

• Eine Funktion f : A −→ B heißt injektiv oder eineindeutig, falls je zwei ver-schiedene Elemente aus A auch verschiedene Bilder haben, d.h. wenn ausf(a) = f(a′) die Gleichheit von a und a′ folgt.

• Eine Funktion wird bijektiv genannt, wenn sie injektiv und surjektiv ist.

Beispiel: Wir betrachten die bekannte Sinusfunktion. Als Funktion von den reellenZahlen in die reellen Zahlen ist sin : R −→ R weder injektiv noch surjektiv.Durch Einschrankungen von Definitions– und/oder Wertebereich kann man dieseEigenschaften erzwingen:

• sin : R −→ [−1, 1] ist surjektiv, aber nicht injektiv

• sin : [−π2, π

2] −→ R ist injektiv, aber nicht surjektiv

• sin : [−π2, π

2] −→ [−1, 1] ist bijektiv.

Betrachtet man eine Funktion f : A −→ B als Relation, dann ist die zu f inverseRelation f−1 genau dann eine Funktion, wenn f bijektiv ist. In diesem Fall wird f−1

die zu f inverse Funktion genannt.

Definition: Sind f : A −→ B und g : B −→ C Funktionen, dann ist die Rela-tionsverkettung f g eine Funktion von A in C. Sie wird Verknupfung oder Komposi-tion von f und g genannt und durch gf : A −→ C bezeichnet, wobei gf(a) = g(f(a))

26

Page 27: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

gilt. Man beachte, dass Relationsverkettungen von links nach rechts und Funk-tionsverknupfungen von rechts nach links geschrieben werden.

Satz: Die folgenden Fakten ergeben sich als einfache Schlussfolgerungen aus denDefinitionen. Seien f : A −→ B und g : B −→ C zwei Funktionen, dann gilt:

• Ist f bijektiv, dann ist f−1f = IdA und ff−1 = IdB

• f ist genau dann injektiv, wenn eine Funktion h : B −→ A existiert mithf = IdA.

• f ist genau dann surjektiv, wenn eine Funktion h : B −→ A existiert mitfh = IdB.

• Sind f und g injektiv, dann ist auch gf injektiv.

• Sind f und g surjektiv, dann ist auch gf surjektiv.

• Sind f und g bijektiv, dann ist auch gf bijektiv und es gilt (gf)−1 = f−1g−1.

Beispiel 1: Die folgende Abbildung illustriert den zweiten Fakt. Die links darge-stellte Funktion f : A −→ B ist injektiv. Zur Konstruktion der Funktion h : B −→A bilden wir alle Elemente b aus dem Bild f(A) auf das eindeutige Element ausdem Urbild f−1(b) ab (die Eindeutigkeit folgt aus der Injektivitat von f , in dergraphischen Darstellung bedeutet das einfach die Umkehrung der Pfeile). Zusatzlichfixieren wir ein beliebiges Element a ∈ A und bilden alle Elemente aus B \ f(A) aufa ab (gestrichelte Pfeile in der Mitte). Die Komposition hf ist dann die IdentischeAbbildung auf A (rechts).

BA

f

a

A A

h

A B

h f

Beispiel 2: Bezeichne R die Menge der reellen Zahlen und R≥0 die Menge der nichtnegativen reellen Zahlen. Dann ist die Funktion f(x) = x2 eine surjektive Funktionvon R auf R≥0. Wir suchen eine passende Funktion h : R≥0 −→ R, so dass fh = idR≥0 ,d.h. h muss jedes y ∈ R≥0 auf eine Zahl x abbilden, deren Quadrat wieder y ist.Diese Eigenschaft wird offensichtlich durch die Quadratwurzelfunktion erfullt, d.h.h(y) =

√y ware eine geeignete Wahl, aber auch die Funktion h(y) = −√y hat die

geforderte Eigenschaft.

Satz: Jede Funktion f : A −→ B induziert eine Aquivalenzrelation ∼f uber A durcha ∼f b genau dann, wenn f(a) = f(b).

Diese Aquivalenzrelation wird auch die Faserung von A durch f genannt.

27

Page 28: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

2.6 Naturliche Zahlen, Endlichkeit und Kardinalzahlen

Peano-Axiome Alle aus der Schulmathematik bekannten Aussagen uber naturlicheZahlen konnen aus einigen wenigen Grundannahmen abgeleitet werden. Diese grundle-genden Voraussetzungen fur die Existenz der naturlichen Zahlen (und letzlich Grund-lagen der gesamten Zahlentheorie) gehen auf Richard Dedekind und Giuseppe Peanozuruck und sind als die Peano-Axiome bekannt:

1. 0 ist eine naturliche Zahl.

2. Jede naturliche Zahl n hat einen eindeutigen Nachfolger S(n), der auch einenaturliche Zahl ist.

3. Aus S(n) = S(m) folgt n = m.

4. 0 ist kein Nachfolger einer naturlichen Zahl.

5. Jede Menge X, die 0 enthalt und fur die gilt, dass aus n ∈ X auch S(n) ∈ Xfolgt, enthalt alle naturlichen Zahlen.

Achtung: Wir schreiben fur den Nachfolger S(n) auch n+1, aber das ist als symbol-ische Schreibweise und nicht als Anwendung der Operation Addition zu verstehen. ImGegenteil - man kann die Addition durch Anwendung der Nachfolgerfunktion rekursivdefinieren.

Konsequenz 1: Man kann Funktionen f : N −→ A definieren, indem man f(0) fest-legt und f(S(n)) auf f(n) zuruckfuhrt. Dieses Prinzip der Definition von Funktionennennt man Rekursion.

Konsequenz 2: Man kann allgemeine Aussagen uber naturliche Zahlen nach dem fol-genden Schema beweisen. Eine Aussageform P (x) uber dem Bereich der naturlichenZahlen ist wahr fur alle naturlichen Zahlen, wenn sie die folgenden zwei Bedingungenerfullt:

1. P (0) ist wahr.

2. Fur beliebige n ∈ N gilt: Ist P (n) wahr, dann ist auch P (n+ 1) wahr.

Dieses Beweisprinzip nennt man vollstandige Induktion.

Die beide Themen in der Vorlesung Informatik A ausfuhrlich behandelt wurden,verzichten wir hier auf weitere Einzelheiten und auf Beispiele.

Endliche Mengen und Kardinalzahlen

Definition: Zwei Mengen A und B werden gleichmachtig genannt, wenn eine bijek-tive Funktion f : A −→ B existiert.In diesem Sinne bedeutet eine Abzahlung einer endlichen (n-elementigen) MengeM , dass eine Bijektion zwischen der Menge 1, 2, . . . , n und M (oder zwischen

28

Page 29: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

0, 1, . . . , n−1 und M) konstruiert wird. Problematisch ist dabei, dass die Beschrei-bung von 1, 2, . . . , n (oder 0, 1, . . . , n−1) genau gesehen eine rekursive Definitionist. John von Neumann loste dieses Problem durch eine spezielle Konstruktion dernaturlichen Zahlen.Definition: Die naturlichen Zahlen in Sinne von von Neumann bilden die kleinsteMenge mit den folgenden zwei Eigenschaften:

1) 0 = ∅ ∈ N2) Ist n ∈ N, dann ist auch der Nachfolger S(n) := n ∪ n in N.

Damit erhalten wir die folgende Darstellung der naturlichen Zahlen:0 = ∅,1 = ∅ = 0,2 = ∅, ∅ = 0, 1,3 = ∅, ∅, ∅, ∅ = 0, 1, 2. . . . . .Jede naturliche Zahl ist nach dieser Konstruktion durch die Anzahl ihrer Elementebestimmt.

Definition: Eine Menge A wird endlich genannt, wenn es eine von Neumannschenaturliche Zahl n gibt, so dass A und n gleichmachtig sind. In diesem Fall wird n dieKardinalzahl von A genannt (Schreibweise |A| = n). Zwei endliche Mengen sind alsogleichmachtig, wenn die Anzahlen ihrer Elemente gleich sind.

Satz: Sind A,B und M endliche Mengen, dann gelten die folgenden Aussagen uberihre Machtigkeiten:

1. |A \B| = |A| − |A ∩B|

2. |A ∪B| = |A|+ |B| − |A ∩B|

3. |A×B| = |A| · |B|

4. |P(M)| = 2|M |

Anmerkungen zu diesen Punkten 1) Die Summenregel ist eine Grundregel derKombinatorik, die besagt, dass die Große der Vereinigung von zwei disjunkten endlichenMengen A und B sich als Summe aus |A| und |B| ergibt. Diese Regel ist als Spezialfallin der ersten und zweiten Aussage enthalten.

2) Die Verallgemeinerung der zweiten Aussage fur drei und mehr Mengen fuhrt zumsogenannten Prinzip der Inklusion–Exklusion:

|A ∪B ∪ C| = |A|+ |B|+ |C| − (|A ∩B|+ |A ∩ C|+ |B ∩ C|) + |A ∩B ∩ C|

|k⋃i=1

Ai| =∑

1≤i≤k|Ai| − (

∑1≤i1<i2≤k

|Ai1 ∩ Ai2|) + (∑

1≤i1<i2<i3≤k|Ai1 ∩ Ai2 ∩ Ai3|)−

. . .+ . . . + (−1)k+1|k⋂i=1

Ai|

29

Page 30: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

3) Die dritte Aussage ist auch eine Grundregel der Kombinatorik und wird Produkt-regel genannt.

4) Wie man leicht sieht, gibt es eine bijektive Abbildung von P(M) auf die Menge derFunktionen von M nach 0, 1. Dabei wird jedem A ∈ P(M) die charakteristischeFunktion χA : M −→ 0, 1 zugeordnet, welche jedes x ∈ A auf 1 abbildet und furalle x 6∈ A den Wert 0 hat. Bezeichnet man fur zwei Mengen N und M mit NM dieMenge aller Funktionen von M nach N , dann kann die oben beschriebene Bijektionauch wie folgt gelesen werden:P(M) ist gleichmachtig mit 0, 1M (also mit 2M , da 2 = 0, 1 im Sinne der vonNeumannschen naturlichen Zahlen).

Aus dieser Sicht kann man die vierte Aussage wie folgt verallgemeinern: Sind N undM zwei beliebige endliche Mengen, dann ist die Anzahl der Funktionen von M in Ngleich |N ||M |, also |NM | = |N ||M |.

Abzahlbarkeit

Definition: Eine Menge A, die nicht endlich ist, wird unendlich genannt (Schreib-weise |A| =∞).Eine Menge A wird abzahlbar genannt, wenn sie endlich ist oder wenn sie mit derMenge der naturlichen Zahlen N gleichmachtig ist.

Satz: Die Menge Z der ganzen Zahlen und die Menge Q der rationalen Zahlen sindabzahlbar.

Beweisidee: Fur Z reicht es aus, eine unendliche Folge z0, z1, z2, . . . zu bilden in derjede ganze Zahl genau einmal auftritt, denn dann wird durch f(n) := zn eine Bijektionzwischen N und Z definiert. Eine solche Folge ist z.B. 0, 1,−1, 2,−2, 3,−3, . . .. Indiesem Fall ist es auch leicht, eine geschlossene Formel fur die Bijektion f : N −→ Zanzugeben:

f(n) = (−1)n+1 ·⌈n

2

⌉=

−n

2falls n gerade

n+12

falls n ungerade

Fur Q kombiniert man diesen Trick der alternierenden Aufzahlung mit einem Schemazur Aufzahlung aller positiven rationalen Zahlen. Dazu schreibt man alle Bruche mitpositiven Zahlern und Nennern in eine Tabelle und lauft die Zellen systematisch nachfolgendem Schema ab. Daraus ergibt sich eine surjektive Abbildung g : N −→ Q+.

3

3

3

2

3

4

13

2

2

2

2

3

4

21

4

4

4

2

3

4

14

5

5

5

2

3

4

15

1

1

1

2

3

4

11

30

Page 31: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Um nicht nur eine surjektive Abbildung, sondern eine Bijektion zu erhalten, muss manletzlich noch dafur sorgen, dass alle Bruche ubersprungen werden, deren rationalerWert schon vorher erreicht wurde (das sind alle Bruche, die sich kurzen lassen). Imabgebildeten Schema ist der Bruch 2

2der erste, den man uberspringen muss, danach

die Bruche 42, 3

3und 2

4. Da es in diesem Fall wesentlich schwerer ist, eine geschlossene

Formel fur g anzugeben, begnugen wir uns hier mit der verbalen Konstruktionsbe-schreibung einer solchen Bijektion.

Satz: Die Menge der reellen Zahlen ist nicht abzahlbar.

Beweis: Wir fuhren einen Widerspruchsbeweis, um zu zeigen, dass schon die reellenZahlen aus dem Intervall [0, 1] nicht abzahlbar sind. Dazu nehmen wir an, dass es einebijektive Abbildung f : N −→ [0, 1] gibt und schreiben die Bilder f(0), f(1), f(2), . . .als Dezimalbruche

f(0) = 0, a0,0 a0,1 a0,2 a0,3 . . .f(1) = 0, a1,0 a1,1 a1,2 a1,3 . . . ai,j ∈ 0, 1, 2, . . . , 9f(2) = 0, a2,0 a2,1 a2,2 a2,3 . . .: : :

Es ist bekannt, dass Dezimalbruch–Darstellungen von reellen Zahlen immer danneindeutig sind, wenn sie nicht mit 9 (d.h. 9–Periode) enden und auch nicht abbrechen(d.h. 0–Periode).Jetzt ist es leicht, eine Zahl r ∈ [0, 1] mit der Darstellung 0, b0b1b2 . . . zu konstruieren,die nicht im Bild von f liegt, indem man die einzelnen Dezimalstellen wie folgt festlegt

bi =

1 falls ai,i 6= 12 falls ai,i = 1

Offensichtlich hat die Zahl r eine eindeutige Darstellung und liegt nicht im Bild vonf , weil sie sich von jedem f(n) aus dem Bild an der n–ten Stelle unterscheidet.Folglich ist die Abbildung f nicht surjektiv, ein Widerspruch zur Annahme, dass feine Bijektion ist.

Die hier verwendete Beweistechnik bezeichnet man als Diagonalisierung. In der theo-retischen Informatik wird sie in abgewandelter Form fur Unmoglichkeitsbeweise einge-setzt (z.B. um zu zeigen, dass bestimmte Funktionen nicht berechenbar sind). Derfolgende Satz beinhaltet eine weitere Anwendung dieser Technik.

Satz: Es gibt keine surjektive Abbildung von einer Menge M auf ihre Potenzmenge.

Beweis durch Widerspruch: Angenommen M ware eine Menge mit einer surjek-tiven Abbildung f : M −→ P(M). Wir bilden die Menge A = x ∈M |x 6∈ f(x).Da A Untermenge von M , also Element von P(M) ist, muss es ein a ∈ M mitf(a) = A geben, anderenfalls ware f nicht surjektiv. Der Widerspruch besteht darin,dass aus der Definition von A die logische Aquivalenz der Aussagen a ∈ A und a 6∈ Afolgt.

31

Page 32: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

3 Kombinatorik

3.1 Elementare Zahlprinzipien

Die Abzahlung von endlichen Mengen ist das klassische Thema der Kombinatorik.Dabei wird eine unendliche Familie An | n ∈ I von endlichen Mengen An betrachtet,wobei n eine Indexmenge I durchlauft (in der Regel die naturlichen Zahlen). Zubestimmen ist die Zahlfunktion f : I −→ N mit f(n) = |An| fur alle n ∈ I. Hier undim Folgenden bezeichnet |M | die Anzahl der Elemente (Machtigkeit) einer Menge M ,falls diese endlich ist und ∞ anderenfalls.

Oft werden die Mengen An aus einer gegebenen n–elementigen Menge M (auch kurzn–Menge genannt) durch einfache strukturelle oder kombinatorische Bedingungenabgeleitet, z.B. die Menge S(M) aller Permutationen von M (das sind bijektive Ab-bildungen von M nach M), die Menge P(M) aller Untermengen oder die Menge(Mk

)aller k–Untermengen von M . Im letzten Fall ist die Zahlfunktion von den zwei

Großen n und k abhangig. Ziel ist es, eine moglichst kurze, geschlossene Formel furf(n) bzw. f(n, k) zu finden.Die meisten Aufgabenstellungen dieser Art lassen sich (auch wenn die Losung teilweiseenormen technischen Aufwand erfordert) auf vier Grundregeln zuruckfuhren.

• Summenregel: Ist S die Vereinigung von paarweise disjunkten, endlichenMengen S1, S2, . . . , St, dann gilt |S| =

∑ti=1 |Si|.

• Produktregel: Ist S das Kartesische Produkt von t endlichen Mengen S1, S2, . . . , St,dann gilt |S| =

∏ti=1 |Si|.

• Gleichheitsregel: Existiert eine bijektive Abbildung zwischen zwei Mengen Sund T , so gilt |S| = |T |.

• Die Regel vom doppelten Abzahlen wird etwas spater erklart.

Die Gleichheitsregel ist letzlich nur eine Umformulierung der Definition fur die Gleich-machtigkeit von zwei Mengen. Die Summen- und Produktregel kann man mit vollstandigerInduktion beweisen.

Eine typische Anwendung der Summenregel besteht darin, die Elemente der MengeS nach gewissen, sich gegenseitig ausschließenden Eigenschaften Ei (i = 1, . . . , t) zuklassifizieren und die Mengen Si wie folgt zu setzen x ∈ S | x hat Eigenschaft Ei.Beispiel: Wir haben bereits eine Plausibilitatserklarung gefunden, warum die Potenz-menge einer n–Menge M genau 2n Elemente hat. Hier ist ein kompletter Beweis mitvollstandiger Induktion nach n.

Induktionsanfang: Fur n = 0 ist M = ∅, P(M) = ∅ und folglich |P(M)| = 1 = 20.Induktionsschritt von n nach n+1: Sei M eine (n+1)–Menge und a ein fest gewahltesElement aus M . Wir zerlegen P(M) in zwei disjunkte Teilmengen S1 = A ⊆M | a ∈ A und S2 = A ⊆ M | a 6∈ A. Offensichtlich ist S2 = P(M \ a)die Potenzmenge einer n–Menge und nach Induktionsvoraussetzung gilt |S2| = 2n.

32

Page 33: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Wir konstruieren eine Bijektion zwischen S1 und S2, indem wir jeder Menge A ∈S1 die Menge B = A \ a ∈ S2 zuordnen. Man erkennt die Bijektivitat dieserAbbildung daran, dass eine Umkehrabbildung existiert, die jedem B ∈ S2 die MengeA = B ∪ a ∈ S1 zuordnet. Aus der Gleichheitsregel folgt |S1| = |S2| und aus derSummenregel |P(M)| = |S1|+ |S2| = 2|S2| = 2 · 2n = 2n+1.

Man kann die gleichen Argumente verwenden, um eine Rekursion fur die Anzahlder k-Teilmengen einer n-Menge zu entwickeln. Sei S =

(Mk

)die Menge aller k–

Untermengen einer n–Menge M und bezeichne(nk

)die Kardinalzahl von S (zunachst

nur als ein formaler Ausdruck). Wir fixieren ein a ∈ M und klassifizieren die k–Untermengen von M nach der Eigenschaft, ob sie a enthalten (E1) oder nicht (E2).Also ist S1 = A ∈ S | a ∈ A und S2 = A ∈ S | a 6∈ A. Wie man leicht sieht, istS2 =

(M\ak

)und auf der anderen Seite gibt es eine Bijektion zwischen S1 und der

Menge aller (k− 1)–Untermengen von M \ a. Durch Anwendung von Gleichheits–und Summenregel erhalten wir die folgende rekursive Formel(

n

k

)=

(n− 1

k − 1

)+

(n− 1

k

)Definitition: Ein Inzidenzsystem (S, T, I) besteht aus zwei (endlichen) Mengen Sund T und einer Inzidenzrelation I ⊆ S × T .

Regel vom zweifachen Abzahlen: Sei (S,T,I) ein Inzidenzsystem und sei r(a) =|b ∈ T | (a, b) ∈ I|, r(b) = |a ∈ S | (a, b) ∈ I| fur alle a ∈ S, b ∈ T , dann gilt:∑

a∈S

r(a) =∑b∈T

r(b).

In der Tat sind beide Summen gleich |I|, denn die Paare der Relation I wurdennur auf zwei verschiedene Weisen aufgezahlt. Oft wird diese Regel auch in etwasmodifizierter Form unter Verwendung von Inzidenzmatrizen oder bipartiten Graphenverwendet:

Sei M = (mij) eine m×n Matrix, d.h. ein Rechteck–Schema mit m Zeilen und n Spal-ten in dem Zahlen mij (i-te Zeile, j-te Spalte) eingetragen sind. Sind zi =

∑nj=1mij

(1 ≤ i ≤ m) die Zeilensummen, und sj =∑m

i=1mij (1 ≤ j ≤ m) die Spaltensummen,dann gilt

∑mi=1 zi =

∑nj=1 sj, denn beide Summen sind gleich der Summe aller Ma-

trixelemente. Die Regel vom zweifachen Abzahlen ergibt sich nun als Spezialfall furdie sogenannte Inzidenzmatrix. Dazu werden die Elemente aus S und T nummeriert,

S = a1, . . . , am, T = b1, . . . , bn und mij =

1 falls (ai, bj) ∈ I0 sonst

gesetzt.

3.2 Die fundamentalen Zahlkoeffizienten

k-Kombinationen und k-Variationen

Sei eine n–Menge N gegeben (ohne Einschrankung kann man N = 1, 2, . . . , n an-nehmen) und 0 ≤ k ≤ n eine naturliche Zahl. In diesem Abschnitt werden wir

33

Page 34: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

die Werte einiger Zahlfunktionen bestimmen, die sehr haufig auftreten und deshalbmit eigenen Symbolen bezeichnet werden. Eine k–elementige Untermenge von Nwird auch k–Kombination genannt. Die Anzahl der k–Kombinationen einer n–Mengewird mit

(nk

)bezeichnet, und diese Anzahlen werden Binomialkoeffizienten genannt.

Dabei werden k–Kombinationen (wie fur Mengen ublich) als nicht geordnet betra-chtet, d.h. 1, 3, 5 und 3, 5, 1 sind ein und dieselbe 3–Kombination. “Geordnete”k–Untermengen werden auch k–Variationen (ohne Wiederholung) genannt, alterna-tiv kann dafur auch der Begriff k–Permutation einer n–Menge verwendet werden.Achtung: Geordnet heißt hier gerade nicht nach Große geordnet, sondern in einerbestimmten Reihenfolge angeordnet! Man kann sie als Worter der Lange k ausvoneinander verschiedenen Elementen aus N kodieren (also 135 6= 351).

k-Partitionen

Der Begriff der Partition wurde bereits eingefuhrt und im Zusammenhang mit Aqui-valenzrelationen verwendet. Wir verstehen darunter die Zerlegung einer Menge indisjunkte, nichtleere Untermengen (Blocke). Bezeichnet k die Anzahl der Blocke, sosprechen wir von k–Partitionen. An dieser Stelle ist es wichtig, auf einen bisher ehernebensachlichen Aspekt einzugehen: Betrachtet man die Partion als Menge von kBlocken, dann spielt die Reihenfolge der Blocke keine Rolle und wir sprechen einfachvon einer k–Partition, oder (wenn wir diesen Aspekt besonders betonen wollen) voneiner ungeordneten k–Partition. Die Anzahl der k–Partitionen einer n–Menge wirdmit Sn,k bezeichnet. Die Zahlen Sn,k werden Stirling–Zahlen zweiter Art genannt.Will man dagegen auch die Reihenfolge des Auftretens der Blocke berucksichtigen,so spricht man von geordneten k–Partitionen. Zur Unterscheidung umfasst man dieBlocke einer ungeordneten Partition in Mengenklammern, wahrend geordnete Parti-tionen als Tupel geschrieben werden (runde Klammern).

Beispiel: Die Mengen 2, 1, 3, 5, 4, 6 und 3, 5, 1, 2, 4, 6 sind gleich,d.h. sie stellen ein und dieselbe (ungeordnete) 3–Partition dar.Dagegen sind (2, 1, 3, 5, 4, 6) und (1, 3, 5, 4, 6, 2) zwei verschiedene geord-nete 3–Partitionen.

Binomialkoeffizienten und fallende Faktorielle

Die Anzahl der k–Variationen von N kann mit der Produktregel bestimmt werden (nMoglichkeiten fur die erste Stelle und ist diese festgelegt, dann n − 1 Moglichkeitenfur die zweite Stelle,. . . ):

n(n− 1) . . . (n− k + 1) =n!

(n− k)!

Diese Anzahlen werden auch kurz mit nk bezeichnet und fallende Faktorielle genannt.Streng genommen muss ein solcher Beweis auch wieder mit vollstandiger Induktiongefuhrt werden, aber inzwischen sollte jeder genug Ubung darin haben, dieses Detailauszufullen. Analog definiert man die steigenden Faktoriellen mit

nk = n(n+ 1) . . . (n+ k − 1) =(n+ k)!

n!,

34

Page 35: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

wobei wir n0 = n0 = 1 setzen.

Da jede k–Untermenge sich auf k! Arten als k–Permutation darstellen lasst, gilt nachProduktregel nk = k!

(nk

). Daraus kann eine explizite Formel fur die Binomialkoef-

fizienten abgeleitet werden: (n

k

)=nk

k!=

n!

(n− k)!k!

Analog kann auch die Anzahl der geordneten k–Partitionen durch das Produkt k!Sn,kbeschrieben werden.

Beispiel: Der Ziehungsvorgang beim Lotto “6 aus 49” liefert zunachst eine 6–Variation der Menge 1, 2, . . . , 49 (wir vernachlassigen hier die Zusatzzahl). DieAnzahl dieser 6–Variationen ist 496. Fur das Ergebnis der Ziehung ist nur die Mengeder gezogenen Zahlen entscheidend und nicht die Reihenfolge, in der sie gezogen wur-den. Da jedes Ziehungsergebnis in 6! verschiedenen Reihenfolgen gezogen werdenkann, ist die Anzahl der moglichen Ziehungsergebnisse (und damit auch die Anzahlder moglichen Tipps) gleich 496

6!=(

496

).

Geordnete und ungeordnete Zahlpartitionen

Eine Abwandlung des Begriffs der Mengenpartition fuhrt zu den sogenannten Zahlpar-titionen. Ist n ∈ N dann wird eine Summe n = n1 +. . .+nk mit ni ∈ N, ni > 0 eine k–Zahlpartition von n genannt. Die Anzahl solcher Partitionen wird mit Pn,k bezeichnet.Auch hier spielt die Reihenfolge der ni keine Rolle, so dass man ohne Einschrankungn1 ≥ n2 ≥ . . . ≥ nk annehmen kann. Soll die Reihenfolge Berucksichtigung finden, sosprechen wir von geordneten Zahlpartitionen.Achtung: Geordnete Zahlpartitionen sind also gerade solche, in denen die Sum-manden in der Regel nicht nach ihrer Große sortiert auftreten. Dagegen kann manungeordnete Zahlpartitionen (in denen die Reihenfolge egal ist) immer so darstellen,dass die Summanden aufsteigend geordnet sind.

Lemma: Die Anzahl der geordneten k–Zahlpartitionen von n ist(n−1k−1

).

Beweis: Die Grundidee ist sehr einfach. Wir schreiben die Zahl n als Summe von nEinsen, also mit n − 1 Pluszeichen. Fur eine Zahlpartition n = n1 + n2 + . . . + nkfassen wir die ersten n1 Einsen zu einem Block zusammen, markieren das darauf fol-gende Pluszeichen, fassen die nachsten n2 Einsen wieder zu einem Block zusammenund markieren das darauf folgende Pluszeichen usw. Bei k Summanden markiertman k− 1 der n− 1 Pluszeichen und jede solche Markierung beschreibt eindeutig dieentsprechende Zahlpartition.Fur einen formalen Beweis konstruieren wir eine Bijektion von der Menge S der geord-neten k–Zahlpartitionen auf die Menge T der (k−1)–Untermengen von 1, 2, . . . , n−1 durch:n = n1 + n2 + . . . + nk ∈ S 7→ n1, n1 + n2, . . . , n1 + n2 + . . . + nk−1 ∈ T . DieBijektivitat dieser Abbildung kann durch die Konstruktion der Umkehrabbildungnachgewiesen werden, und die Behauptung folgt nun aus der Gleichheitsregel.

35

Page 36: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Stirlingzahlen und surjektive Funktionen

Die hier besprochenen Zahlkoeffizienten sind auch sehr gut zum Abzahlen von Funk-tionenmengen geeignet. Sei N eine n–Menge und R eine r–Menge. Aus der Mengen-lehre wissen wir, dass die Anzahl der Abbildungen von N nach R gleich rn ist.Ist n ≤ r, dann sind injektive Abbildungen von N in R durch n–Variationen von Rcharakterisiert, d.h. |Inj(N,R)| = rn.

Ist n ≥ r, dann sind surjektive Abbildungen von N auf R durch geordnete r–Partitionen von N charakterisiert, d.h. |Surj(N,R)| = r!Sn,r.

Die Anzahl der bijektiven Abbildungen ist n! (falls n = r) oder 0. Klassifizieren wirdie Menge aller Abbildungen f : N −→ R nach ihren Bildern A = f(x) | x ∈ N ⊆R, so ergibt die Summenregel:

rn = |Abb(N,R)| =∑

A⊆R |Surj(N,A)|

=∑r

k=0

∑|A|=k |Surj(N,A)|

=∑r

k=0

(rk

)k!Sn,k =

∑rk=0 r

k Sn,k

3.3 Zwolf Arten des Abzahlens

Eine zusammenfassende Interpretation der Zahlkoeffizienten erhalten wir durch diefolgende Fragestellung:Sei eine Menge von n Ballen gegeben, die in r Facher verteilt werden sollen. Gesuchtist die Anzahl solcher Verteilungen allgemein und unter der zusatzlichen Bedingung,dass nur injektive (jedes Fach hochstens ein Ball), surjektive (jedes Fach mindestensein Ball) bzw. bijektive (jedes Fach genau ein Ball) Verteilungen zu betrachten sind.Naturlich hangt die Problemstellung auch davon ab, ob die Balle bzw. die Facher un-terscheidbar sind oder nicht. Offensichtlich korrespondieren die obigen Abzahlungenvon Abbildungen zu dem Fall, dass sowohl die Balle als auch die Facher unterscheid-bar sind. Da die Frage der bijektiven Verteilungen relativ leicht zu beantworten sind,reduziert sich die Problemstellung auf zwolf Varianten.

Sind nur die Balle unterscheidbar, aber nicht die Facher, dann korrespondieren surjek-tive Verteilungen zu r–Partitionen einer n–Menge und die Menge aller Verteilungenkann mit der Summenregel uber die Klassifizierung nach Anzahl der belegten Facherabgezahlt werden.

Sind Balle und Facher nicht unterscheidbar, dann korrespondieren surjektive Verteilun-gen zu r–Zahlpartitionen von n und auch hier kann die Menge aller Verteilungen mitder Summenregel uber die Klassifizierung nach Anzahl der belegten Facher abgezahltwerden.

Sind nur die Facher unterscheidbar, aber nicht die Balle, dann korrespondieren diesurjektiven Verteilungen zu geordneten r–Zahlpartitionen von n. Die injektivenVerteilungen sind durch die Auswahl der n belegten Facher aus der r–Menge allerFacher vollstandig charakterisiert. Eine beliebige Abbildung ist durch eine geordnete

36

Page 37: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Summenzerlegung der Form n = n1 + . . .+nr mit ni ∈ N charakterisiert. Um darauseine r–Zahlpartition im Sinne der Definition zu machen (Zusatzbedingung ni ≥ 1),addiert man zu jedem Summanden eine 1. Damit erhalten wir eine Bijektion aufdie Menge der geordneten r–Zahlpartitionen von (n + r). Diese Menge hat

(n+r−1r−1

)Elemente.

Die folgende Tabelle gibt einen vollstandigen Uberblick.

beliebig injektiv surjektiv bijektivN unterscheidbarR unterscheidbar

rn rn r!Sn,r 0 oder n!

N nicht untersch.R unterscheidbar

(n+r−1r−1

) (rn

) (n−1r−1

)0 oder 1

N unterscheidbarR nicht untersch.

∑rk=1 Sn,k 0 oder 1 Sn,r 0 oder 1

N nicht untersch.R nicht untersch.

∑rk=1 Pn,k 0 oder 1 Pn,r 0 oder 1

3.4 Rekursionen

Pascalsches Dreieck

Oft ist es schwierig, fur die zu untersuchenden kombinatorischen Großen f(n) einegeschlossene Formel anzugeben, z.B. fur die Stirling Zahlen zweiter Art Sn,k. Insolchen Fallen kann eine Rekursion, das ist eine Formel, die f(n) auf f(n−1) und/oderf(n − 2), . . . zuruckfuhrt, ein wirkungsvolles Hilfsmittel sein. Sind dann noch diebenotigten Anfangswerte f(0) und/oder f(1) bekannt, kann man jedes f(n) effektivberechnen.Wir haben bereits eine Rekursion fur die Binomialkoeffizienten kennengelernt:(

nk

)=(n−1k

)+(n−1k−1

)fur alle n, k > 0.

Mit den trivialen Zusatzinformationen(nn

)=(n0

)= 1 und

(nk

)= 0 falls k > n,

konnen alle Binomalkoeffizienten berechnet werden. Das dafur verwendete Schemawird Pascalsches Dreieck genannt:

n k 0 1 2 3 4 5 6 . . .0 11 1 12 1 2 13 1 3 3 14 1 4 6 4 15 1 5 10 10 5 16 1 6 15 20 15 6 1:

Es ist klar, dass die Summe aller Eintrage in der n–ten Zeile die Anzahl aller Unter-

37

Page 38: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

mengen einer n–Menge ergibt:n∑k=0

(n

k

)= 2n.

Die folgenden zwei Identitaten machen Aussagen uber Spalten- und Diagonalsummen,die an einer beliebigen Stelle abzubrechen sind:∑n

m=0

(mk

)=

(n+1k+1

)fur alle n, k ≥ 0∑n

k=0

(m+kk

)=

(m+n+1

n

)fur alle m,n ≥ 0

Beide Formeln kann man mit vollstandiger Induktion und auch durch kombinatorischeArgumentationen beweisen.

Binomialsatz: (x+ y)n =∑n

k=0

(nk

)xkyn−k

Der induktive Beweis nutzt die Rekursion der Binomialkoeffizienten.

Als unmittelbare Folgerung aus dem Binomialsatz erhalten wir die folgenden zweiFormeln:

(x+ 1)n =∑n

k=0

(nk

)xk

2n =∑n

k=0

(nk

)Monotone Gitterwege

Eine weitere geometrisch-anschauliche Deutung der Binomialkoeffizienten ergibt sichaus der Abzahlung von sogenannten Gitterwegen. Dazu betrachten wir die Punkt-menge Gk,m = 0, 1, . . . , k × 0, 1, . . . ,m in der Ebene und verbinden zwei Punktedurch eine Kante, wenn sie auf einer Koordinate ubereinstimmen und sich auf deranderen Koordinate um 1 unterscheiden. Dieses Gebilde nennt man ein k×m-Gitter.Unter einem monotonen Gitterweg im k × m-Gitter verstehen wir eine Punktfolge,die mit (0, 0) beginnt, mit (k,m) endet und bei der fur zwei aufeinanderfolgendePunkte (a, b), (c, d) gilt, dass entweder c = a und d = b + 1 oder c = a + 1 undd = b. Anschaulich bedeutet das, dass ein monotoner Gitterweg von der Ecke linksunten in die Ecke recht oben verlauft und jeder Schritt entweder nach rechts odernach oben erfolgt (Abbildung links)). Der Zusammenhang zwischen monotonen Git-terwegen und Binomialkoeffizienten beruht auf einer simplen Beobachtung: Da sichjeder monotone Gitterweg in einem k ×m-Gitter aus k +m Kanten zusammensetzt,von denen genau k horizontal (und die anderen m vertikal) verlaufen, kann man sieals k-Kombinationen aus einer (k +m)-Menge beschreiben.

Lemma: Die Anzahl der montonen Gitterwege in einem k ×m-Gitter ist(k+mk

).

38

Page 39: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

k−1

m

k

i

54321

3

2

1

00

m

k5431 2

3

2

1

00

Viele Fakten uber Binomialkoeffizienten lassen sich mit diesem Modell anschaulicherklaren. Hier sind einige Beispiele dazu:

• Die Menge der monotonen Gitterwege im k × m-Gitter kann man durch dieAuswahl der k horizontalen Schritte aus k+m Gesamtschritten oder alternativdurch die Auswahl von m vertikalen Schritten aus k+m Gesamtschritten gene-rieren. Daraus folgt

(k+mk

)=(k+mm

). Wenn wir n = k+m setzen, ist m = n−k

und wir erhalten die bekannte Formel(nk

)=(

nn−k

).

• Partitioniert man die Menge der monotonen Gitterwege im k×m-Gitter danach,ob der letzte Schritt horizontal oder vertikal gemacht wird, so ergibt sich dieFormel

(k+mk

)=(k+m−1k−1

)+(k−1+m

k

). Mit der oben verwendeten Ersetzung

erhalten wir die bekannte Rekursion(nk

)=(n−1k−1

)+(n−1k

).

• Wir partitionieren die Menge der monotonen Gitterwege im k×m-Gitter danach,in welcher Hohe der letzte horizontale Schritt (von k− 1 nach k) gemacht wird.Dafur kommen alle y-Werte zwischen 0 und m in Frage. Diese Situation ist inder Abbildung auf der rechten Seite schematisch dargestellt: Der letzte horizon-tale Schritt erfolgt von (k−1, i) nach (k, i) und darauf folgen nur noch vertikaleSchritte bis (k,m). Die Anfangsstucke aller Wege dieser Klasse sind beliebigemonotone Gitterwege im (k − 1) × i-Gitter, die im der Abbildung durch einemonotone Kurve symbolisiert sind. Daraus folgt die Identitat(

k +m

k

)=

m∑i=0

(k − 1 + i

k − 1

)=

m∑i=0

(k − 1 + i

i

).

Rekursion fur die Stirling Zahlen zweiter Art

Satz: Fur alle n, k ∈ N mit n ≥ k > 0 gilt Sn,k = Sn−1,k−1 + k · Sn−1,k.

Man beachte, dass diese Formel eine große Ahnlichkeit mit der Rekursionsformel furBinomialkoeffizienten aufweist. Auch der Beweis ist sehr ahnlich:

Sei a ein fest gewahltes Element der n–Menge N . Die k–Partitionen von N konnennun danach klassifiziert werden, ob a einen Block der Partition bildet oder nicht.Bei positiver Antwort kann der Partition auf eineindeutige Weise (Streichung von a)eine (k − 1)–Partition von N \ a zugeordnet werden. Zur Begrundung des zweiten

39

Page 40: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Summanden uberlegt man sich, das man alle k–Partitionen von N , in denen akeinen Block bildet, auf folgende Art erhalt: Man betrachte alle k–Partitionen vonN \a und erganze eine ihrer Klassen um a (dafur gibt es jeweils k Moglichkeiten).

Aus der Definition ergeben sich die Anfangsbedingungen Sn,0 = 0 fur n > 0 undS0,k = 0 fur k > 0. Wie man leicht sieht, muß S0,0 = 1 gesetzt werden, damit dieFormel auch fur S1,1 ihre Gultigkeit behalt.

3.5 Losung von Rekursionen

In diesem Abschnitt werden zwei Methoden beschrieben, mit deren Hilfe man (ineinigen Fallen) aus Rekursionen geschlossene Formeln ableiten kann. Wir beginnenmit Rekursionen der Form

an = can−1 + d, a0 = C, c, d, C ∈ ROffensichtlich konnen wir c = 1 als Trivialfall (dann ist an = nd + C) ausschließen.Fur c 6= 1 erhalten wir durch elementare Umformungen:

an = d+ can−1 = d+ c(d+ can−2)= d+ cd+ c2an−2 = d+ cd+ c2(d+ can−3)= . . . = d+ cd+ c2d+ . . .+ cn−1d+ cna0

= cn−1c−1

d+ cnC

Wir betrachten jetzt sogenannte homogene lineare Rekursionen vom Grad k, das sindRekursionen der Form

an = c1an−1 + c2an−2 + . . .+ ckan−k

wobei c1, . . . , ck ∈ R und ck 6= 0 vorausgesetzt sind. Daruber hinaus sollen die reelleZahlen a0 = C0, . . . , ak−1 = Ck−1 als Anfangsbedingungen bekannt sein.

Der Basisansatz besteht darin, eine Losung der Form an = rn fur eine Konstante r zusuchen. Gabe es eine solche Losung, dann ware rn = c1r

n−1 + c2rn−2 + . . .+ ckr

n−k,also ware r eine Nullstelle des sogenannten charakteristischen Polynoms xk−c1x

k−1−c2x

k−2 . . . − ck der Rekursion. Eine solche Losung konnte aber im Widerspruch zuden Anfangsbedingungen stehen.

Satz: Angenommen, das charakteristische Polynom der Rekursionan = c1an−1 + c2an−2 + . . . + ckan−k hat k verschiedene Nullstellen r1, . . . , rk. Danngibt es Konstanten α1, . . . , αk, so dass an = α1r

n1 + . . .+ αkr

nk fur alle n ∈ N.

Diese Konstanten sind durch die k Anfangsbedingungen a0 = C0, . . . , ak−1 = Ck−1

eindeutig bestimmt.

Wir verzichten auf den Beweis. Es sei aber angemerkt, dass zur Bestimmung der Kon-stanten ein lineares Gleichungssystem von k Gleichungen (jeder Anfangswert lieferteine Gleichung) mit den gesuchten Konstanten α1, . . . , αk als Variable gelost werdenmuss. Die Verschiedenheit der Nullstellen sichert, dass dieses LGS eine eindeutigeLosung besitzt.

40

Page 41: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Beispiel: Die Rekursion fn = fn−1 +fn−2 mit den Anfangsbedingungen f0 = 0, f1 =1 beschreibt die sogenannten Fibonacci Zahlen.Das charakteristische Polynom dieser Rekursion hat die Formx2 − x− 1. Die Nullstellen dieses Polynoms sind 1+

√5

2und 1−

√5

2.

Zur Bestimmung der Konstanten α1 und α2 muss das folgende LGS gelost werden:

α1+ α2 = 01+√

52α1+ 1−

√5

2α2 = 1

Aus der ersten Gleichung folgt α2 = −α1. Verwendet man diese Substitution in derzweiten Gleichung, dann ergibt sich

√5α1 = 1, also α1 = 1/

√5. So erhalt man

folgende geschlossene Formel fur die Fibonacci Zahlen:

fn =1√5

(1 +√

5

2

)n

− 1√5

(1−√

5

2

)n

3.6 Das Schubfachprinzip

In den bisherigen Themen zur Kombinatorik ging es immer um die genaue Bestim-mung von bestimmten Werten. Es kommt aber auch vor, dass die Informationen uberbestimmte Mengen nicht ausreichen, um genaue Angaben uber ihre Große machen zukonnen. Oft muss man sich in solchen Fallen damit zufrieden geben, moglichst guteobere und untere Schranken fur die Große zu kennen. Eine grundlegende und wichtigeMethode zur Herleitung solcher Ungleichungen mit kombinatorischen Mitteln bestehtin der Anwendung des sogenannten Schubfachprinzips.

Das Schubfachprinzip, in der englischsprachigen Literatur auch als Taubenschlag-prinzip bezeichnet, geht auf den Mathematiker G. L. Dirichlet zuruck:

Verteilt man n Gegenstande in k Schubfacher und ist n > k, dann gibt es mindestensein Schubfach, in dem mindestens 2 Gegenstande liegen.

Auf den ersten Blick scheint dieses Prinzip nur triviale Schlussfolgerungen zuzulassen,wie: “in jeder Gruppe von 367 Menschen gibt es mindestens zwei, die den gleichenGeburtstag haben”, aber wie die folgenden eleganten Anwendungen zeigen, trugt derSchein.

Satz: In jeder n+1 elementigen Untermenge M von 1, 2, . . . , 2n gibt es zwei Zahlena und b, so dass a Teiler von b ist.

Beweis: Sei M = a1, a2, . . . , an+1. Jedes Element dieser Menge hat eine eindeutigeProduktzerlegung der Form ai = 2kiqi, wobei qi eine ungerade Zahl ist. Da dieAnzahl der ungeraden Zahlen zwischen 1 und 2n gleich n ist, mussen mindestenszwei Elemente aus M bei der Zerlegung die gleiche ungerade Zahl liefern, und es istklar, dass dann die kleinere von beiden ein Teiler der großeren ist.

Satz von Erdos/Szekeres: Jede Folge von n2 + 1 verschiedenen Zahlen enthalteine monoton wachsende oder monoton fallende Unterfolge der Lange n+ 1.

41

Page 42: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Beweis: Ist die Folge a1, a2, . . . , an2+1 gegeben, dann hat eine Unterfolge der Langem die Form ai1 , ai2 , . . . , aim wobei 1 ≤ i1 < i2 < . . . < im ≤ n2 + 1 gelten muss. DieUnterfolge ist monoton wachsend (bzw. fallend), wenn auch ai1 < ai2 < . . . < aim(bzw. ai1 > ai2 > . . . > aim) gilt.Angenommen die gegebene Folge hat keine monoton wachsende oder monoton fallen-de Unterfolge der Lange n + 1, dann ordnen wir jedem k = 1, 2, . . . , n2 + 1 ein Paar(wk, fk) zu, wobei wk (fk) die maximale Lange einer monoton wachsenden (fallenden)Unterfolge ist, die mit ak beginnt. Da nur n2 Paare moglich sind, muss mindestensein Paar mehrfach auftreten, d.h. es gibt Zahlen 1 ≤ s < t ≤ n2 + 1, so dass ws = wtund fs = ft. Das ist aber bereits ein Widerspruch, denn ist as < at, dann konntejede mit at beginnende monoton wachsende Unterfolge von vorn durch as verlangertwerden, also ware ws > wt. Analog folgt aus as > at auch fs > ft und as = at istnach Voraussetzung nicht moglich.

Verallgemeinerung des Schubfachprinzips:Verteilt man n Gegenstande in k Schubfacher, dann gibt es mindestens ein Schubfach,in dem mindestens

⌈nk

⌉Gegenstande liegen.

Beispiele:

• In jeder Gruppe von 100 Menschen gibt es mindestens 9, die das gleiche Stern-zeichen haben.

• In jeder Menge A,B,C,D,E, F von 6 Besuchern einer Party gibt es eine Gruppevon mindestens drei Personen, die sich entweder vorher schon paarweise kanntenoder die sich vorher paarweise noch nicht kannten.

Das ist nicht ganz so offensichtlich. Fur A gibt es nach dem Schubfachprinzipmindestens

⌈52

⌉= 3 andere Personen, die A entweder alle kennt (Fall 1) oder

alle nicht kennt (Fall 2).Wenn sich im Fall 1 unter diesen Bekannten von A zwei Personen bereits kennen,bilden diese zusammen mit A die gesuchte Gruppe, sonst sind die Bekanntenvon A eine Gruppe von Personen, die sich nicht kennen. Der zweite Fall istanalog. Wenn unter den fur A fremden Personen sich zwei nicht kennen, bildensie zusammen mit A die gesuchte Gruppe, sonst bilden sie selbst eine Gruppevon Personen, die sich paarweise kennen.

42

Page 43: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

4 Diskrete Wahrscheinlichkeitsverteilungen

4.1 Wahrscheinlichkeitsraume, Ereignisse und Unabhangigkeit

Definition: Ein diskreter Wahrscheinlichkeitsraum ist ein Paar (Ω,Pr), wobei Ωeine endliche oder abzahlbar unendliche Menge von elementaren Ereignissen undPr : Ω −→ [0, 1] eine Wahrscheinlichkeitsverteilung ist, die jedem a ∈ Ω seineWahrscheinlichkeit Pr(a) zuordnet. Außerdem wird gefordert, dass

∑a∈Ω Pr(a) = 1

ist. Wenn |Ω| = n endlich ist und fur alle a ∈ Ω auch Pr(a) = 1n

gilt, dann wird Preine Gleichverteilung genannt.

Beispiele:

1. Fur einen (fairen) Wurfel ist Ω = 1, 2, 3, 4, 5, 6 und Pr(1) = Pr(2) = . . . =Pr(6) = 1

6eine Gleichverteilung.

2. Der diskrete Wahrscheinlichkeitsraum fur einen Munzwurf besteht aus Ω =0, 1 mit Pr(0) = Pr(1) = 1/2 (Gleichverteilung), wobei in der Regel die 0 denKopf und 1 die Zahl der Munze bezeichnet.

3. Die Ziehung von Kugeln aus einer Urne bildet die Grundlage fur ein anderesStandardmodell der Wahrscheinlichkeitsrechnung. So kann man eine Urne mitn nummerierten (also unterscheidbaren) Kugeln als ein physikalisches Modellfur eine Gleichverteilung ansehen. Alternativ kann man eine Urne mit k weißenund m schwarzen Kugeln betrachten. Auch wenn die weißen Kugeln nichtunterscheidbar sind, kann man sich eine unsichtbare Nummerierung der Kugelnvorstellen, bei denen die weißen von 1 bis k und die schwarzen von k + 1 bisn = k+m nummeriert sind. Die elementaren Ereignisse sind die Ziehungen einerKugel i jeweils mit der Wahrscheinlichkeit 1

n. Da es aber letztlich egal ist, welche

weiße bzw. welche schwarze Kugel gezogen wurde, betrachtet man hier nur zweiEreignisse, namlich die Ziehung einer weißen Kugel mit der Wahrscheinlichkeitkn

und die Ziehung einer schwarzen mit der Wahrscheinlichkeit mn

.

4. Der diskrete Wahrscheinlichkeitsraum fur zwei Munzwurfe besteht aus der MengeΩ = (0, 0), (0, 1), (1, 0), (1, 1) mit der Gleichverteilung Pr((i, j)) = 1/4. Dabeigeht man davon aus, dass die beiden Wurfe voneinander unabhangig sind undentweder hintereinander oder gleichzeitig mit zwei unterscheidbaren Munzenerfolgen.

5. Beim gleichzeitigen Werfen von zwei ununterscheidbaren Munzen musste manΩ = 0, 0, 0, 1, 1, 1 setzen. In diesem Fall ware Pr (faire Munzen vo-rausgesetzt) keine Gleichverteilung, denn Pr(0, 0) = Pr(1, 1) = 1/4 undPr(0, 1) = 1/2. Dieses Modell ist eher als Gedankenspiel zu betrachten, dennin der Realitat sind es zwei verschiedene Munzen, auch wenn sie außerlich nichtunterscheidbar sind. Wenn wir im Weiteren uber die Wahrscheinlichkeitsraumevon k Munzwurfen oder k Wurfeln sprechen, wird deshalb immer die k-fache

43

Page 44: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Wiederholung eines Experiments oder eine Ausfuhrung mit k unterscheidbarenund unabhangigen Objekten gemeint sein.

6. Definiert man eine Folge von Munzwurfen, bis das erste Mal Zahl (also 1)fallt, als elementares Ereignis, dann gibt es offensichtlich fur jedes n ∈ N+ einelementares Ereignis, namlich die Folge an = 0, 0, . . . , 0︸ ︷︷ ︸

(n−1) mal

, 1. Eine faire Munze

vorausgesetzt, gilt Pr(an) =(

12

)nund damit ist auch fur diesen unendlichen

Raum die Summenbedingung erfullt:

∞∑n=1

Pr(an) =∞∑n=1

(1

2

)n= 1

Definition: Eine beliebige Untermenge A ⊆ Ω wird Ereignis genannt, und mandefiniert Pr(A) =

∑a∈A Pr(a). Dadurch wird die Verteilungsfunktion zu einem

Wahrscheinlichkeitsmaß uber der Menge P(Ω) aller Ereignisse erweitert. Die Verwen-dung der gleichen Bezeichnung Pr fur die Verteilung und das Wahrscheinlichkeitsmaßist eine kleine technische Unsauberkeit, die aber in der Literatur weit verbreitet ist.

Beispiele:

• Bei der Urne mit k weißen und m schwarzen Steinen wurde dieser Schritt schonvorweg genommen, indem die Ziehungen der Kugeln 1 bis k (bzw. k + 1 bisk +m) zum Ereignis der Ziehung einer weißen (bzw. schwarzen) Kugel zusam-mengefasst wurden.

• Die Wahrscheinlichkeit, eine gerade Zahl zu wurfeln, ist gleich der Summe derWahrscheinlichkeiten, eine 2, 4 oder 6 zu wurfeln, also 1/2.

• Das Ereignis A, bei drei Munzwurfen genau zweimal Zahl zu erhalten, setzt sichaus den drei elementaren Ereignissen (0, 1, 1), (1, 0, 1) und (1, 1, 0) zusammenund somit ist Pr(A) = 3 · 1

8= 3

8.

Fur jedes Ereignis A ⊆ Ω bezeichnet A = Ω\A das sogenannte Komplementarereignisvon A.Aus der Definition und dem kombinatorischen Basiswissen kann man die folgendenEigenschaften von Wahrscheinlichkeitsmaßen ableiten:

1. Pr(Ω) = 1 und Pr(∅) = 0

2. A ⊆ B =⇒ Pr(A) ≤ Pr(B)

3. Pr(A ∪B) = Pr(A) + Pr(B)− Pr(A ∩B)

4. Pr(A) =∑k

i=1 Pr(Ai) fur jede Partition A =⋃ki=1Ai

44

Page 45: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

5. Pr(A)

= 1− Pr(A)

6. Pr(⋃k

i=1Ai

)≤∑k

i=1 Pr(Ai).

Bedingte Wahrscheinlichkeit und unabhangige Ereignisse

Oft taucht das Problem auf, die Wahrscheinlichkeit eines Ereignisses A unter derzusatzlichen Voraussetzung zu bestimmen, dass ein anderes Ereignis B eingetretenist. So ist offensichlich unter der Voraussetzung, dass eine gerade Zahl gewurfeltwurde, die Wahrscheinlichkeit der 1 gleich Null und die Wahrscheinlichkeit der 2gleich 1/3. Dieses Phanomen wird durch den Begriff der bedingten Wahrscheinlichkeitbeschrieben.

Definition: Seien A und B Ereignisse und Pr(B) > 0, dann nennt man den Ausdruck

Pr(A|B) =Pr(A ∩B)

Pr(B)die bedingte Wahrscheinlichkeit von A unter B.

Beispiele:

1. Im Wahrscheinlichkeitsraum eines fairen Wurfels sei A das Ereignis, eine geradeZahl zu werfen, B das Ereignis, eine Zahl großer als drei zu werfen, und C dasKomplementarereignis zu B. Offensichtlich gilt Pr(A) = Pr(B) = Pr(C) = 1

2.

Man bestimmt die Durchschnitte A∩B = 4, 6, A∩C = 2, B ∩C = ∅ undihre Wahrscheinlichkeiten Pr(A ∩B) = 2

6, Pr(A ∩ C) = 1

6sowie Pr(B ∩ C) = 0

und berechnet damit die bedingten Wahrscheinlichkeiten:Pr(B|A) = 2

3, Pr(C|A) = 1

3und Pr(B|C) = 0.

2. Wurfelt man mit zwei (unabhangigen und unterscheidbaren!) Wurfeln, dann istΩ = (i, j) | 1 ≤ i, j ≤ 6 und Pr((i, j)) = 1/36 fur jedes Paar (i, j) aus Ω. SeiA = (4, 6), (5, 5), (6, 4) das Ereignis, dass die Augensumme gleich 10 ist, undB = (1, 1), (2, 2), . . . , (6, 6) das Ereignis, dass beide Wurfel auf die gleicheZahl fallen. Dann ist Pr(A) = 3

36= 1

12, Pr(A) = 6

36= 1

6und Pr(A ∩B) = 1

36.

Daraus ergibt sich Pr(A|B) = 13

und Pr(B|A) = 16.

3. Wir bleiben im Wahrscheinlichkeitsraum von zwei Wurfeln. Bezeichne A1 =(i, j) ∈ Ω | i = 1 das Ereignis, dass der erste Wurfel eine 1 zeigt und derzweite beliebig ist. Analog lassen sich Ereignisse A2, . . . , A6 beschreiben. Aufder anderen Seite konnen durch Festlegung der Augenzahl des zweiten WurfelsEreignisse B1 = (i, j) ∈ Ω | j = 1, B2, . . . , B6 definiert werden. Offensichtlichist die Wahrscheinlichkeit dieser Ereignisse jeweils 1/6 und Durchschnitte wieA1 ∩B3 = (1, 3) haben die Wahrscheinlichkeit 1/36. Folglich ist

Pr(A1|B3) =Pr(A1 ∩B3)

Pr(B3)=

1/36

1/6=

1

6

und analog ist die bedingte Wahrscheinlichkeit von jedem Ai unter einem be-liebigen Bj gleich 1/6, also gleich der Wahrscheinlichkeit von Ai selbst. DieseEigenschaft ist durch die Unabhangigkeit der beiden Wurfe begrundet.

45

Page 46: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

4. In einigen Fallen kann es hilfreich sein, die Sachverhalte durch ein Diagramm zuveranschaulichen. Angenommen wir haben eine rote Urne mit zwei weißen undvier schwarzen Kugeln und eine blaue Urne mit funf weißen und drei schwarzenKugeln. Zuerst wird gewurfelt und wenn das Ergebnis 1 oder 2 ist, wird eineKugel aus der roten Urne, sonst eine Kugel aus der blauen Urne gezogen.Die elementaren Ereignisse sind Paare aus einer Zahl zwischen 1 und 6 undeiner Farbe Schwarz oder Weiß. Das folgende Diagramm zeigt, wie sich dieErgebnisse des Experiments aufspalten. Die Werte auf den Kanten geben bed-ingte Wahrscheinlichkeiten an, die Wahrscheinlichkeiten der Ereignisse auf derrechten Seite ergeben sich als Produkt der Wahrscheinlichkeiten auf den Kan-ten des jeweiligen Wegs. Die Wahrscheinlichkeit, eine weiße Kugel zu ziehen,ist demnach 1

9+ 5

12= 19

36.

3,4,5,6

1,2

weiss

schwarz

schwarz

weiss

2/3

1/3

1/3

2/35/8

3/8

Wahrscheinlichkeit

1/4

5/12

2/9

1/9

Definition: Zwei Ereignisse A und B werden unabhangig genannt, falls Pr(A ∩B) =Pr(A) · Pr(B).

Lemma: Sind A und B zwei unabhangige Ereignisse mitPr(A ∩B) > 0, dann gilt Pr(A|B) = Pr(A) und Pr(B|A) = Pr(B).

Ereignisse mit positver Wahrscheinlichkeit, die einander ausschließen, wie zum BeispielA1 und A2 aus dem letzten Beispiel sind voneinander nicht unabhangig, also abhangig.Weitere Beispiele fur abhangige Ereignisse beim Spiel mit einem Wurfel ist der Wurfeiner geraden Zahl und der Wurf einer 2 oder auch der Wurf einer geraden Zahl undder Wurf einer Zahl ≤ 3. Auch im folgenden Beispiel geht es um die Abhangigkeitvon Ereignissen.

Beispiel: Ein Krebstest fallt mit 96% Wahrscheinlichkeit positiv aus, wenn der Pa-tient Krebs hat und mit 94% Wahrscheinlichkeit negativ, wenn der Patient keinenKrebs hat. Bei einem Patienten in dessen Altersgruppe 0.5% aller Personen Krebshaben, fallt der Test positiv aus. Wie wahrscheinlich ist es, dass er tatsachlich Krebshat?Wir betrachten die folgenden Ereignisse

46

Page 47: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

K zufalliger Patient hat Krebs Pr(K) = 0.005N zufalliger Patient hat keinen Krebs Pr(N) = 0.995T Test positiv bei zufalligem Patienten Pr(T ) =??

Gesucht ist die bedingte Wahrscheinlichkeit Pr(K|T ) =Pr(K ∩ T )

Pr(T ).

Aus Pr(T |K) =Pr(K ∩ T )

Pr(K)= 0.96 kann man Pr(K ∩ T ) = 0.005 · 0.96 ausrechnen.

Dagegen ist Pr(T |N) = 1−Pr(T |N

)= 1− 0.94 = 0.06. Zur Bestimmung von Pr(T )

uberlegt man sich, dass das Ereignis T die disjunkte Vereinigung (T ∩K)∪(T ∩N) istund sich die Wahrscheinlichkeiten der beiden Komponenten wieder durch bedingteWahrscheinlichkeiten ausdrucken lassen:Pr(T ) = Pr(T |K) · Pr(K) + Pr(T |N) · Pr(N) = 0.96 · 0.005 + 0.06 · 0.995. Letztlicherhalten wir

Pr(K|T ) =Pr(K ∩ T )

Pr(T )=

0.005 · 0.96

0.96 · 0.005 + 0.06 · 0.995= 0.0744 . . .

Damit ist die Wahrscheinlichkeit, dass der Patient mit positivem Test wirklich Krebshat, kleiner als 7.5%.

Definition: Sind (Ω1,Pr1) und (Ω2,Pr2) zwei Wahrscheinlichkeitsraume, dann istder Produktraum (Ω1 × Ω2,Pr) definiert durch Pr((a1, a2)) = Pr1(a1) · Pr2(a2).

Diese Definition impliziert Unabhangigkeiten der folgenden Form: fur alle A ⊆ Ω1

und B ⊆ Ω2 sind die Ereignisse A × Ω2 und Ω1 × B voneinander unabhangig. EinBeispiel dafur wurde bereits behandelt, denn der Wahrscheinlichkeitsraum fur zweiWurfel ist das Produkt des Raums eines Wurfels mit sich selbst. Im folgenden werdenendliche Produkte des Munzwurfraums genauer analysiert:

• Eine faire Munze wird sechsmal geworfen. Der zugehorige Wahrscheinlichkeits-raum besteht aus allen 6-Tupeln (oder 0/1–Folgen der Lange 6) mit Gleich-verteilung, d.h. jedes Tupel hat die Wahrscheinlichkeit 1

26. Wie groß ist die

Wahrscheinlichkeit des Ereignisses, dass genau zwei Einsen in dem Tupel auftreten?Die Anzahl dieser Tupel stimmt offensichtlich mit der Anzahl der 2–Kombinationeneiner 6–Menge uberein. Folglich hat das Ereignis die Wahrscheinlichkeit

(62

)/26.

Allgemein ist die Wahrscheinlichkeit fur k mal Zahl bei n Munzwurfen gleich(nk

)1

2n.

• Sei eine “unfaire” Munze gegeben, die mit Wahrscheinlichkeit p (0 < p < 1)Zahl (d.h. 1) und mit Wahrscheinlichkeit q = 1 − p Kopf (d.h. 0) liefert.Betrachtet man den Wahrscheinlichkeitsraum fur n Munzwurfe, dann ist dieWahrscheinlichkeit einer festen Folge der Lange n mit genau k Einsen gleichpk(1 − p)n−k. Die Wahrscheinlichkeit des Ereignisses, dass eine Folge genau kEinsen enthalt, ist

(nk

)pk(1 − p)n−k. Deshalb werden Verteilungen dieser Art

auch Binomialverteilungen genannt.

47

Page 48: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

4.2 Zufallsvariable und Erwartungswert

Definition: Sei (Ω,Pr) ein Wahrscheinlichkeitsraum. Eine Zufallsvariable oderZufallsgroße ist eine Funktion X : Ω −→ R.

Im Fall eines Wurfels oder einer zufallig gezogenen Zahl aus einer Urne fallt der Un-terschied zwischen einem elementaren Ereignis und einer Zufallsvariable nicht auf,weil das Ereignis selbst schon eine Zahl ist, d.h. man kann die identische Abbil-dung als eine Zufallsvariable ansehen. Die folgenden Beispiele zeigen, dass man vieleZufallsexperimente auf sehr naturliche Weise mit Zufallsvariablen beschreiben kann.

Beispiele:

1) Auf dem diskreten Wahrscheinlichkeitsraum Ω = 1, 2, . . . , 6 × 1, 2, . . . , 6 furzwei Munzwurfe sind Zufallsvariablen fur die Summe und die Differenz der beidenWerte interessant: X(a, b) = a+ b Y (a, b) = |a− b|.2) Auf dem Wahrscheinlichkeitsraum fur n Munzwurfe Ω = 0, 1n interessiert mansich vor allem fur die Zufallsvariablen, welche die Anzahl der Zahl- bzw. Kopfergeb-nisse in einer solchen Serie zahlen, d.h.

X(a1, a2, . . . , an) = |i | 1 ≤ i ≤ n und ai = 1|Y (a1, a2, . . . , an) = |i | 1 ≤ i ≤ n und ai = 0| = n−X(a1, a2, . . . , an)

3) Bei der Wiederholung von Munzwurfen bis zur ersten Zahl (oder bis zum erstenKopf) ist offensichtlich die Lange des Experiments eine interessante zufallige Große:

X(0, 0, . . . , 0︸ ︷︷ ︸(n−1) mal

, 1) = n

Definition: Der Erwartungswert der Zufallsvariablen X ist definiert als E(X) =∑a∈Ω X(a)Pr(a).

Im ersten und dritten Beispiel kann man Erwartungswerte relativ leicht ausrechnen:

1) E(X) = 7 und E(Y ) = 7036

;

3) E(X) =∑∞

n=1 n ·1

2n= 2 (ist etwas schwerer).

Im zweiten Beispiel ist E(X) = n2

die richtige Antwort. Intuitiv ist das klar, aber einedirekte Berechnung durch konkrete Auswertung der Definition ist relativ aufwandig.Der folgende Fakt macht die Bestimmung des Erwartungswerts sehr einfach.

Lemma: Der Erwartungswert ist additiv, d.h. fur beliebige Zufallsvariable X, Y :Ω −→ R gilt E(X + Y ) = E(X) + E(Y ), wobei die neue Variable X + Y in nahe-liegender Weise durch (X + Y )(a) = X(a) + Y (a) definiert ist.

Anwendungen:

• Wir betrachten die binomialverteilte Zufallsvariable X aus Beispiel 2, die jedem0/1–Tupel der Lange n die Anzahl seiner Einsen zuordnet. Um das Beispielnoch etwas allgemeiner zu machen, betrachten wir eine unfaire Munze, die mitWahrscheinlichkeit p eine 1 (Zahl) und mit Wahrscheinlichkeit q = 1− p eine 0

48

Page 49: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

(Kopf) liefert. Gruppiert man die Folgen derart, dass alle Folgen mit genau kEinsen einer Gruppe angehoren, so erhalt man E(X) =

∑nk=0 k

(nk

)pk(1−p)n−k.

Es ist relativ aufwandig, daraus E(X) = np abzuleiten. Durch Nutzung derAdditivitat der Erwartungswerte kann man diese Formel einfacher erhalten:Offensichtlich ist X = X1 + X2 + . . . + Xn, wobei die Variable Xi angewendetauf eine Folge von Munzwurfergebnissen (a1, . . . , an) das Ergebnis des i-tenWurfs auswertet, also Xi((a1, . . . , an)) = ai. Da die Erwartungswerte dieserSummanden jeweils p sind, folgt E(X) = E(X1) + . . .+ E(Xn) = np.

• An einem Tisch sitzen 12 Personen. Von jeder Person wurde ein Foto gemacht.Diese 12 Bilder liegen verdeckt auf dem Tisch. Jede Person zieht zufallig einFoto (zufallig bedeutet hier, dass alle moglichen Zuordnungen der Bilder gleichwahrscheinlich sein sollen). Wie hoch ist die erwartete Anzahl der Personen,die ihr eigenes Foto gezogen haben?

Wieder kann man die Zufallsvariable X, welche die Anzahl dieser Personenzahlt, als Summe von zwolf Variablen X1, . . . , X12 darstellen, wobei Xi denWert 1 hat, wenn Person i ihr eigenes Foto gezogen hat, und 0 sonst. Offen-sichtlich ist E(Xi) = 1

12fur alle i und folglich ist E(X) = 12 · 1

12= 1.

Aus dieser Betrachtung ergibt sich außerdem die (vielleicht etwas uberraschende)Tatsache, dass der Erwatungswert nicht von der Anzahl der Personen abhangt- auch bei 100 Personen zieht im Erwartungswert eine Person ihr eigenes Foto.

• Eine Versicherung macht folgende Kalkulation: Jeder Versicherte zahlt 100Euro ein. Mit Wahrscheinlichkeit von 1/20 (also 5 %) muss eine Leistungvon 1000 Euro und mit Wahrscheinlichkeit 1/10 muss eine Leistung von 400Euro erbracht werden. Wie hoch ist der Erwartungswert fur den Gewinn (proVersicherungsnehmer)?

Der zu betrachtende Wahrscheinlichkeitsraum hat drei Elementarereignisse a1, a2

und a3 mit Pr(a1) = 1/20, Pr(a2) = 1/10 und Pr(a3) = 1−1/20−1/10 = 17/20.Die Zufallsvariable X, die den Gewinn der Versicherung beschreibt, ist die Dif-ferenz aus einer Zufallsvariablen Y fur die Einnahmen und einer ZufallsvariablenZ fur die Ausgaben in den einzelnen Ereignissen: Dabei hat Y in jedem Fallden Wert 100 und Z(a1) = 1000, Z(a2) = 400 und Z(a3) = 0. Nach Definitionerhalten wir fur den Erwartungswert

E(X) = E(Y )− E(Z) = 100− (1000 · 1

20+ 400 · 1

10+ 0) = 100− 90 = 10

In vielen praktischen Anwendungen entstehen Zufallsvariable durch Messung vonzufalligen Großen, die auf sehr schwer zu analysierende Wahrscheinlichkeitsraumezuruckgehen. Beispiele dafur sind die Zeit, die man fur seinen taglichen Arbeitswegbraucht oder die Korpergroße einer Person. Deshalb spricht man haufig auch von derVerteilung einer Variablen, d.h. man interessiert sich fur die Wahrscheinlichkeit,

49

Page 50: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

dass die Variable einen bestimmten Wert (oder einen Wert aus einem bestimm-ten Intervall) annimmt und weniger fur die Wahrscheinlichkeiten der einzelnen ele-mentaren Ereignisse. Die Wahrscheinlichkeit, dass eine Zufallsvariable X den Wert x0

bzw. einen Wert kleiner oder gleich x0 annimmt wird mit Pr(X = x0) bzw. Pr(X ≤ x0)notiert. In den gerade genannten Beispielen sind das sogenannte Normalverteilungen,die man nicht mit einem diskreten Modell beschreiben kann. Es gibt aber auch eineReihe von diskreten Zufallsvariablen, die haufig auftreten und deshalb in bestimmteTypen eingeteilt werden.

• Eine Gleichverteilung liegt vor, wenn eine Zufallsvariable k verschiedene Werteannehmen kann und jeder Wert die Wahrscheinlichkeit 1/k hat.

• Eine Bernoulli–Verteilung mit dem Parameter p liegt vor, wenn eine Zufallsvari-able X nur die Werte 0 und 1 annimmt und Pr(X = 1) = p, Pr(X = 0) = 1−pgilt.

• Eine ZufallsvariableX ist binomialverteilt mit den Parametern n und p, wenn siedie Werte 0, 1, 2, . . . , n annimmt und Pr(X = k) =

(nk

)pk(1−p)n−k fur alle k aus

dem Wertebereich gilt. Mit anderen Worten entsteht eine Binomialverteilungimmer dann, wenn man ein Bernoulli–Experiment n–mal wiederholt und dieZufallsvariable die Anzahl der 1–Ergebnisse zahlt.

• Eine Zufallsvariable X ist geometrisch verteilt mit dem Parameter p, wenn siealle Werte aus N+ annehmen kann und Pr(X = k) = (1−p)k−1p fur alle k ∈ N+

gilt. Mit anderen Worten entsteht eine geometrische Verteilung immer dann,wenn man ein Bernoulli–Experiment so lange wiederholt, bis zum ersten Maleine 1 fallt und die Zufallsvariable die Anzahl der Versuche zahlt.

Wichtige Anwendungen von Erwartungswerten in der Informatik sind die Analyse derdurchschnittlichen Laufzeit von Algorithmen (Ω besteht dann aus den Eingaben einerbestimmten Große und X(a) ist die Laufzeit fur eine konkrete Eingabe a) und dieAnalyse randomisierter Algorithmen. Im letzten Fall wird die Arbeit des Algorithmusdurch eingebaute Zufalle gesteuert (z.B. Auswahl eines zufalligen Pivotelements beiQuicksort) und somit ist die Laufzeit fur jede konkrete Eingabe eine Zufallsvariable,deren Wert von den zufalligen Entscheidungen im Ablauf des Algorithmus abhangt.

50

Page 51: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

5 Lineare Algebra

5.1 Einfuhrung: Anschauliche Vektorrechnung

Zur Vorbereitung auf die Beschaftigung mit abstrakten Vektorraumen ist es ange-bracht, sich noch einmal mit intuitiven, elementargeometrischen Grundgedanken zudieser Theorie zu beschaftigen. Dabei geht man von Punkten in der EuklidischenEbene bzw. im (dreidimensionalen) Euklidischen Raum aus, die durch Koordinaten-paare bzw. Koordinatentripel beschrieben sind. Zur leichteren Veranschaulichungwerden wir im Folgenden vorwiegend Punkte in der Ebene betrachten, aber alleUberlegungen lassen sich sinngemaß auf den Raum ubertragen.

Freie und gebundene Vektoren

Jedes geordnete Punktepaar beschreibt einen gebundenen Vektor−→AB, veranschaulicht

durch die gerichtete Strecke von A nach B. Auf der Menge der gebundenen Vektoren

kann man eine Aquivalenzrelation einfuhren, unter der zwei Vektoren−→AB und

−−→A′B′

aquivalent sind, wenn es eine Parallelverschiebung (Translation) gibt, die A in A′ und

B in B′ uberfuhrt. Es ist klar, dass die Vektoren−→AB und

−−→A′B′ genau dann aquivalent

sind, wenn die Tupel der Koordinatendifferenzen zwischen B und A bzw. zwischenB′ und A′ gleich sind.

A’

B’

B

A

Eine Aquivalenzklasse dieser Relation nennt man einen freien Vektor. Anschaulichkann man also einen freien Vektor als ein Objekt beschreiben, das eine bestimmteRichtung und eine bestimmte Lange, aber keinen festgelegten Anfangspunkt hat. Daein freier Vektor durch das Differenzentupel der zu Grunde liegenden gebundenenVektoren eindeutig charakterisiert wird, verwendet man dieses Tupel auch als Beze-ichnung fur den freien Vektor. Eine besondere Rolle unter den freien Vektoren spieltder Nullvektor (0, 0), der die Aquivalenzklasse aller gebundenen Vektoren der Form−→AA ist. Fur den Nullvektor wird auch oft die Kurzbezeichnung ~0 verwendet.

Beispiel: Fur die Punkte A = (−1, 2) und B = (1, 3) und den gebundenen Vektor−→AB entsteht das Differenzentupel (1−(−1), 3−2) = (2, 1), das den zugehorigen freienVektor bezeichnet.

Der Standardreprasentant eines freien Vektors (a1, a2) ist der gebundene Vektor−→OA,

der vom Koordinatenursprung O = (0, 0) zum Punkt A = (a1, a2) fuhrt. Man nenntdiesen Vektor deshalb auch Ortsvektor des Punkts A.

51

Page 52: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Addition von Vektoren

Gebundene Vektoren sind ein nutzliches Werkzeug in der Physik, z.B. kann man−→AB

zur Beschreibung einer Kraft verwenden, die auf den Punkt A wirkt, wobei Richtungund Betrag der Kraft durch den freien Vektor beschrieben sind. Daruber hinaussind sie sehr gut dazu geeignet, die Addition von Vektoren zu veranschaulichen: Die

Summe von zwei Vektoren der Form−→AB und

−−→BC ist der Vektor

−→AC. Uns inter-

essiert vor allem die Ubertragung dieser Idee auf die freien Vektoren. Dazu mussman die Addition durch komponentenweise Addition der Koordinaten realisieren,d.h. (s1, s2) + (t1, t2) = (s1 + t1, s2 + t2).Zur Veranschaulichung der Addition von zwei freien Vektoren, die durch entsprechendeOrtsvektoren gegeben sind, konstruiert man ein Parallelogramm, dessen vom Koor-dinatenursprung abgehende Diagonale die Summe der zwei Vektoren reprasentiert.

v

w

w

v

v+w

Durch die Parallelogrammkonstruktion wird auch die Kommutativitat der Vektorad-dition sehr gut veranschaulicht. Zu jedem freien Vektor ~v kann man durch Umkehrungder Vorzeichen bei allen Komponenten den sogenannten inversen Vektor −~v kon-

struieren, der sich durch die Eigenschaft ~v + (−~v) = ~0 auszeichnet. Ist−→AB ein

Reprasentant von ~v, dann ist−→BA ein Reprasentant von −~v.

Multiplikation mit Skalaren

Freie Vektoren konnen verlangert oder verkurzt (skaliert) werden, indem die Langedes Vektors ~v mit einem bestimmten Faktor multipliziert wird, aber die Richtunggleich bleibt. Diese Faktoren - man nennt sie Skalare - konnen zunachst beliebigepositiv-reelle Zahlen sein, aber auch negative Zahlen r ∈ R kommen in Frage, wennman den inversen Vektor −~v mit dem Absolutbetrag |r| skaliert. Die Skalierung einesVektors ~v = (s1, s2) mit einem Faktor r ∈ R wird als Multiplikation r · ~v notiert unddurch die Regel r · (s1, s2) = (rs1, rs2) ausgefuhrt.

Verbindung zu linearen Gleichungssystemen und geometrischen Fragen

Durch Anwendung von Multiplikation mit Skalaren und Vektoraddition entstehensogenannte Linearkombinationen von Vektoren, also Ausdrucke der Form r1 · ~v1+. . .+rk · ~vk. Ein wichtiges Problem, mit dem wir uns genauer beschaftigen werden, ist die

52

Page 53: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Frage, ob ein bestimmter Vektor ~v als Linearkombination aus vorgegebenen Vektoren~v1, ~v2, . . . , ~vk erzeugt werden kann. Wir demonstrieren den Zusammenhang zwischendieser Frage, der Losung von linearen Gleichungssystemen und einem geometrischenProblem an einem Beispiel im dreidimensionalen Raum.

Problem 1: Kann man den Vektor ~v = (−1, 2, 5) als Linearkombination aus denVektoren ~v1 = (5, 4, 3) und ~v2 = (3, 1,−1) darstellen?

Problem 2: Hat das folgende lineare Gleichungssystem eine Losung?

5α + 3β = −14α + β = 23α − β = 5

Problem 3: Liegt der Punkt (−1, 2, 5) in der Ebene, die von den Punkten (0, 0, 0),(5, 4, 3) und (3, 1,−1) aufgespannt wird?

Man kann sich leicht von der Gleichwertigkeit der drei Probleme uberzeugen: Einekonkrete Losung des Gleichungssystems wurde die Koeffizienten fur die Linearkom-bination von ~v liefern und zeigen, wie man den Ortsvektor des Punkts (−1, 2, 5) ausden Ortsvektoren der Punkte (5, 4, 3) und (3, 1,−1) erzeugen konnte. Umgekehrtwaren Koeffizienten einer Linearkombination von ~v aus ~v1 und ~v2 auch Losungen desGleichungssystems, usw.

Wir werden die lineare Algebra als eine Theorie kennenlernen, die es erlaubt, Proble-me wie die oben genannten in ihrer allgemeinsten Form zu losen und Zusammenhangezu weiteren interessanten Fragestellungen herzustellen.

5.2 Gruppen und Korper

In diesem Abschnitt wollen wir uns damit beschaftigen, welche mathematischenStrukturen geeignet sind, Skalare eines Vektorraums zu beschreiben. Mit diesemstrukturellen Ansatz werden die Gemeinsamkeiten bzw. Analogien zwischen den ver-schiedenen Zahlenbereichen, aber auch zu anderen mathematischen Objekten heraus-gearbeitet. Eine mathematische Struktur wird in der Regel durch eine Tragermenge,Operationen auf dieser Tragermenge und Eigenschaften dieser Operationen beschrie-ben.

Definition: Eine Gruppe (G, ∗) besteht aus einer Tragermenge G und einer Oper-ation∗ : G×G −→ G mit den folgenden drei Eigenschaften:

(G1) ∀a, b, c ∈ G (a ∗ b) ∗ c = a ∗ (b ∗ c) (Assoziativitat)

(G2) ∃e ∈ G ∀a ∈ G a ∗ e = a = e ∗ a (e ist neutrales Element)

(G3) ∀a ∈ G ∃a ∈ G a ∗ a = e = a ∗ a (a ist das zu a inverse Element)

(G, ∗) ist kommutative (abelsche) Gruppe, falls zudem ∀a, b ∈ G a ∗ b = b ∗ a gilt.

53

Page 54: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Ist fur ein Paar (G, ∗) die Eigenschaft (G1) erfullt, spricht man von einer Halbgruppeund sind die Eigenschaften (G1) und (G2) erfullt, spricht man von einem Monoid.

Beispiele:

• (Z,+) ist eine kommutative Gruppe.

• (N,+) erfullt mit e = 0 nur die Kriterien (G1) und (G2) und ist deshalb einMonoid.

• (N+,+) erfullt nur das Kriterium (G1) und ist damit eine Halbgruppe.

• (Q,+) ist eine Gruppe.

• (Q, ·) ist ein Monoid (kein zu 0 inverses Element).

• (Q \ 0, ·) ist eine Gruppe.

• (S(M), ), wobei S(M) die Menge der bijektiven Funktionen von M auf Mund die Funktionskomposition darstellen, ist eine Gruppe. Dabei bildet dieidentische Funktion IdM das neutrale Element und die inversen Elemente sinddurch die Umkehrfunktionen f−1 gegeben.

• Bezeichne Bn die Menge aller n-stelligen Booleschen Funktionen und ∨,∧,⊕die Operationen Disjunktion, Konjunktion und Antivalenz.

• (Bn,∨) ist ein Monoid, wobei das neutrale Element die Uberall-Null-Funktionist.

• (Bn,∧) ist ein Monoid, wobei das neutrale Element die Uberall-Eins-Funktionist.

• (Bn,⊕) ist eine Gruppe wobei das neutrale Element wieder durch dieUberall-Null-Funktion gestellt wird und jede Funktion zu sich selbst in-vers ist.

Definition: Ein Korper (K,⊕,) besteht aus einer Menge K und zwei Operationen⊕, : K ×K −→ K mit den folgenden Eigenschaften:

(K1) (K,⊕) ist eine kommutative Gruppe mit einem neutralen Element 0.

(K2) (K \ 0,) ist eine kommutative Gruppe mit einem neutralen Element 1.

(K3) ∀a, b, c ∈ K a (b⊕ c) = a b⊕ a c.

Das zu einem a ∈ K ⊕-inverse Element wird mit −a bezeichnet. Ist a 6= 0, dannbezeichent man das -inverse Element mit a−1 oder mit 1

a.

Beispiele:

• (Q,+, ·) ist ein Korper.

54

Page 55: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• (R,+, ·) ist ein Korper.

• (C,+, ·) ist ein Korper.

• (Z,+, ·) ist kein Korper.

• Fur jede Primzahl p bezeichne Zp die Menge 0, 1, . . . , p − 1 der moglichenReste beim Teilen durch p. Definiert man darauf die Operationen Additionmodulo p und Multiplikation modulo p entsteht ein Korper. Der Beweis, dassimmer inverse Elemente bezuglich der Multiplikation existieren und Methodenzur Berechnung dieser Elemente, werden spater besprochen.

Schlussfolgerungen aus den Axiomen:

Ein wesentlicher Vorteil der strukturellen Betrachtungen zeigt sich darin, dass manSatze uber Strukturen beweisen kann, die dann in jedem konkreten Exemplar derStruktur gultig sind und somit angewendet werden konnen. Exemplarisch werdenhier ein paar einfache Schlussfolgerungen aus den Gruppen- und Korperaxiomenvorgestellt.

1. Das neutrale Element in einer Gruppe ist eindeutig.Beweis: Angenommen zwei Elemente e und e′ einer Gruppe erfullen (G2).Dann ware e ∗ e′ = e′ wegen (G2) fur e und e ∗ e′ = e wegen (G2) fur e′. Damitmuss e = e′ sein, d.h. das neutrale Element ist eindeutig.

2. In einer Gruppe ist fur jedes Element a ∈ G das zu a inverse Element eindeutig.Beweis: Angenommen a und a erfullen beide (G3). Wir betrachten dasGruppenelement b = (a ∗ a) ∗ a:

(a ∗ a) ∗ a = b = a ∗ (a ∗ a) |(G1)e ∗ a = b = a ∗ e |(G3) fur a und fur a

a = b = a |((G2))

3. In einer Gruppe hat jede Gleichung der Form (a ∗ x) ∗ b = c eine eindeutigeLosung fur die Variable x.Beweis: Die Gleichung wird aquivalent umgeformt, d.h. jeder Schritt derUmformung ist auch umkehrbar. Werden beide Seiten der Gleichung von rechtsmit dem zu b inversen Element verknupft, und auf der linken Seite (G3) und(G2) angewendet, enhalt man

(a ∗ x) ∗ b = c⇐⇒ a ∗ x = c ∗ b

Werden analog beide Seiten der neuen Gleichung von links mit a verknupft, soergibt sich die eindeutige Losung der Gleichung:

a ∗ x = c ∗ b⇐⇒ x = a ∗ (c ∗ b)

55

Page 56: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

4. In einem Korper hat jede Gleichung der Form a x ⊕ b = c eine eindeutigeLosung, wenn a 6= 0 ist.Beweis: Man verwendet das Symbol −b fur das bezuglich ⊕ zu b inverseElement und a−1 fur das bezuglich zu a inverse Element und erreicht mitahnlichen Umformungen wie beim dritten Punkt die folgende Aquivalenz:

a x⊕ b = c⇐⇒ x = a−1 ∗ (c⊕−b)

Die nutzliche Eigenschaft der eindeutigen Losbarkeit beschrankt sich in Korpernim Allgemeinen auf lineare Gleichungen. Eine einfache quadratische Gleichung,wie x x = 2 ist im Korper der rationalen Zahlen nicht losbar.

5.3 Vektorraume

In allen nachfolgenden Betrachtungen wird K einen Korper mit den Operationen +und · und den neutralen Elementen 0 und 1 bezeichnen.

Definition: Ein Vektorraum (abgekurzt VR) uber dem Korper K besteht aus einerMenge V mit zwei Operationen⊕ : V ×V → V und : K×V → V mit den folgendenEigenschaften:

• (V,⊕) ist eine kommutative Gruppe mit neutralem Element ~0

(~v bezeichnet das ⊕-inverse Element zu ~v)

• ∀ λ, µ ∈ K ∀ ~v ∈ V λ (µ ~v) = (λ · µ) ~v

• ∀ ~v ∈ V 1 ~v = ~v

• ∀ λ, µ ∈ K ∀ ~v ∈ V (λ+ µ) ~v = (λ ~v)⊕ (µ ~v)

• ∀ λ ∈ K ∀ ~v, ~w ∈ V λ (~v ⊕ ~w) = (λ ~v)⊕ (λ ~w)

Beispiele:

1. Der reelle Vektorraum Rn uber dem Korper R:

V = Rn = (x1, . . . , xn) | xi ∈ R

Die Addition und Multiplikation mit Skalaren erfolgen komponentenweise:

(x1, . . . , xn)⊕ (y1, . . . , yn) = (x1 + y1, . . . , xn + yn)

λ (x1, . . . , xn) = (λx1, . . . , λxn)

Es ist offensichtlich, dass (0, . . . , 0) der Nullvektor ist und dass man inverseVektoren durch komponentenweise Umkehrung des Vorzeichens erhalt:

(x1, . . . , xn) = (−x1, . . . ,−xn)

56

Page 57: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

2. Die auf dem Intervall [0, 1] definierten reellwertigen Funktionen bilden einenVektorraum uber dem Korper R:

V = f | f : [ 0, 1 ]→ R

Die Addition von zwei Funktionen f, g ∈ V und die Multiplikation einer Funk-tion f mit einem Skalar λ ergeben neue Funktionen f ⊕ g bzw. λ f , die wiefolgt punktweise definiert werden:

(f ⊕ g)(x) = f(x) + g(x)

(λ f)(x) = λ · (f(x))

3. Die reellen Zahlen R sind ein Vektorraum uber dem Korper Q.

Bemerkung 1: Die Frage, ob man Vektoren des Rn in Zeilen- oder Spaltenformschreibt, ist zunachst zweitrangig. Hier haben wir uns aus Platzgrunden fur dieZeilenform entschieden, aber insbesondere wenn lineare Abbildungen durch Matrizenreprasentiert werden, muss man die Spaltenform nutzen.

Bemerkung 2: Die Verwendung von verschiedenen Symbolen fur die Addition vonVektoren und von Skalaren hat rein didaktischen Charakter. Ab jetzt werden wir inbeiden Fallen das ubliche + verwenden. Welche Operation anzuwenden ist, ergibtsich eindeutig aus dem Kontext. Gleiches gilt fur die Multiplikationen und fur dieSubtraktion, welche eigentlich als Addition des inversen Elements zu verstehen ist,d.h. ~v − ~w := ~v ⊕ (~w).

Unterraume

Definition: Eine nichleere Teilmenge U eines Vektorraums V uber K wird Unter-raum oder genauer Untervektorraum von V (abgekurzt UR) genannt, falls

• ∀ ~v, ~w ∈ U ~v + ~w ∈ U

• ∀ ~v ∈ U ∀ λ ∈ K λ~v ∈ UDiese Eigenschaften bedeuten, dass die Menge U abgeschlossen gegen Vektoradditionund Multiplikation mit Skalaren sein muss.

Beispiele:

1. Fur den Vektorraum V = Rn = (x1, . . . , xn) | xi ∈ R ist die TeilmengeU = (x1, x2, 0, . . . , 0) | x1, x2 ∈ R ein Unterraum von V .

2. Fur den Vektorraum V = f | f : [0, 1]→ R sind die Teilmengen

• U = f | f : [0, 1]→ R, f ist stetig und

• U ′ = f | f : [0, 1]→ R, f ist linear, d.h. f(x) = ax+ b

Unterraume von V .

3. Betrachtet man V = R als Vektorraum uber dem Korper Q, dann ist die Teil-menge U = q1 + q2

√2 | q1, q2 ∈ Q ein Unterraum von V .

57

Page 58: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Satz: Sei V ein Vektorraum uber einem Korper K und Ui | i ∈ I eine Familievon Unterraumen, dann ist

⋂i∈IUi auch ein Unterraum von V .

Beweis: Sei ~u, ~v ∈⋂i∈IUi und λ ∈ K, dann gilt

• ~u und ~v sind Elemente von allen Ui

• ~u+ ~v und λ~u sind Elemente von allen Ui

Daraus folgt, dass ~u+ ~v ∈⋂i∈IUi und λ~u ∈

⋂i∈IUi.

Beispiel: Durchschnitt von xy-Ebene und der yz-Ebene im R3 ist die y-Achse.

x

y z

Die folgenden zwei Beobachtungen sollten als Ubung leicht zu beweisen sein. IstU ein Unterraum eines Vektorraums V , dann gilt:

• Der Nullvektor ~0 gehort zu U ;

• Fur jeden Vektor ~u ∈ U gehort auch der inverse Vektor −~u zu U .

Linearkombinationen und lineare Hulle

Definition: Sind ~v1, ~v2, . . . , ~vk ∈ V paarweise verschiedene Vektoren und λ1, λ2, . . . , λk ∈K beliebige Skalare, so nennt man den Vektor

λ1~v1 + λ2~v2 + . . .+ λk~vk

eine Linearkombination (abgekurzt LK) aus den Vektoren ~v1, ~v2, . . . , ~vk.

Lemma: Sei M ⊆ V eine Teilmenge eines Vektorraums V , dann bildet die MengeUM aller Linearkombinationen von Vektoren aus M einen Unterraum von V .

Beweis: Man muss die Abgeschlossenheit von UM bezuglich Vektoraddition undMultiplikation mit Skalaren nachweisen. Dazu betrachten wir ein Skalar α ∈ K undzwei Vektoren aus UM :

58

Page 59: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• ~v = λ1~v1 + λ2~v2 + . . .+ λk~vk mit ~vi ∈M fur 1 ≤ i ≤ k

• ~w = µ1 ~w1 + µ2 ~w2 + . . .+ µl ~wl mit ~wi ∈M fur 1 ≤ i ≤ l

Abgeschlossenheit bezuglich Multiplikation mit Skalaren:

α~v = α(λ1~v1 + λ2~v2 + . . .+ λk~vk) = (αλ1)~v1 + (αλ2)~v2 + . . .+ (αλk)~vk ∈ UM

Um die Abgeschlossenheit bezuglich Addition zu zeigen, nehmen wir oBdA. an (Kom-mutativgesetz anwenden), dass alle Vektoren, die in den Linearkombinationen von ~vund ~w gemeinsam auftreten (die Anzahl sei j), linksbundig stehen, d.h. ~vi = ~wi furalle i zwischen 1 und j und ~vj+1, . . . , ~vk ∩ ~wj+1, . . . , ~wl = ∅. Dieser kleine tech-nische Trick ist notwendig, um eine Linearkombination von paarweise verschiedenenVektoren zu konstruieren:

~v + ~w = (λ1~v1 + λ2~v2 + . . .+ λk~vk) + (µ1 ~w1 + µ2 ~w2 + . . .+ µ ~w)

= (λ1 + µ1)~v1 + . . .+ (λj + µj)~vj + λj+1~vj+1 + . . .+ λk ~vk + µj+1 ~wj+1 + . . .+ µl ~wl

Damit liegt ~v + ~w als Linearkombination von Vektoren aus M auch in UM .

Definition: Sei M ⊆ V eine Menge von Vektoren, dann ist die lineare Hulle Lin(M)von M der kleinste Unterraum von V (bezuglich Inklusion), der M enthalt, d.h.

Lin(M) =⋂

U ist UR von VM⊆U

U

Satz: Die lineare Hulle einer Menge M ⊆ V ist die Menge aller Linearkombinationender Vektoren aus M , d.h.

Lin(M) = λ1~v1 + . . .+ λk~vk | λi ∈ K,~vi ∈M

Beweis: Einerseits bildet die Menge UM aller Linearkombinationen von Vektorenaus M einen Unterraum (Lemma). Andererseits enthalt jeder Unterraum U , der Menthalt, auch alle Linearkombinationen von Vektoren aus M (Abgeschlossenheit vonUnterraumen bezuglich der Addition und der Multiplikation mit Skalaren). Darausfolgt, dass UM der kleinste Unterraum ist, der M enthalt.

5.4 Lineare Unabhangigkeit, Basis und Dimension

Definition: Eine Menge ~v1, ~v2, . . . , ~vk von k Vektoren heißt linear abhangig (l.a.),wenn eine Linearkombination existiert, mit

λ1~v1 + λ2~v2 + . . .+ λk~vk = ~0

wobei mindestens ein λi 6= 0 ist. Eine solche Linearkombination nennt man nicht-triviale Linearkombination des Nullvektors.

59

Page 60: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Definition: Eine Menge M ⊆ V ist linear unabhangig, wenn es keine nichttrivialeLinearkombination des Nullvektors von Vektoren aus M gibt.

Folgerung: Eine Menge M ⊆ V ist linear unabhangig, wenn jede endliche Teilmengevon M linear unabhangig ist.

Bemerkung 1: Man kann die Definition der linearen Unabhangigkeit auch sin-ngemaß auf Folgen von Vektoren anwenden. In diesem Fall reicht die Wiederholungeines Vektors in der Folge aber schon aus, lineare Abhangigkeit zu erzeugen, dennwenn ~vi = ~vj ist, dann ist 1 · ~vi + (−1) · ~vj einen nichttriviale Linearkombination desNullvektors.

Bemerkung 2: Aus ~0 ∈ M folgt lineare Abhangigkeit, denn ~0 = 1 · ~0 ist einenichttriviale Linearkombination des Nullvektors.

Beispiele:

1. Die Vektoren

~v1 =

011

, ~v2 =

111

∈ R3

sind linear unabhangig, denn fur jede Linearkombination λ1 ~v1 + λ2 ~v2 = ~0 gilt

0 = λ2

0 = λ1 + λ2

0 = λ1 + λ2

und daraus folgt, λ1 = λ2 = 0.

2. Im Vektorraum V = f | f : [ 0, 1 ] → R sind die Funktionen f und g, diedurch f(x) = x+1 und g(x) = 2 definiert sind, linear unabhangig, denn fur jedeLinearkombination λf + µg, die den Nullvektor, also die Funktion h0(x) = 0ergibt, ware

h0(0) = 0 = λf(0) + µg(0) = λ+ 2µ

h0(1) = 0 = λf(1) + µg(1) = 2λ+ 2µ

und daraus folgt, λ = µ = 0.

Satz: Fur jede Teilmenge M eines Vektorraums V sind die folgenden Aussagenaquivalent:

1. Die Menge M ist linear unabhangig.

2. Kein Vektor ~v ∈ M kann als Linearkombination aus den ubrigen Vektoren ausM dargestellt werden.

3. Jeder Vektor ~v ∈ Lin(M) hat eine eindeutige Darstellung als Linearkombinationaus M .

60

Page 61: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Beweis: Der Satz wird uber die negierten Aussagen nach folgendem Schema be-wiesen:

¬(1) ⇒1. Schritt

¬(2) ⇒2. Schritt

¬(3) ⇒3. Schritt

¬(1)

Zuerst formulieren wir die Negationen der drei Aussagen:

¬(1): Es gibt eine nichttriviale Linearkombination von ~0.

¬(2): Es gibt einen Vektor ~v ∈M , der Linearkombination der ubrigen Vektoren ist.

¬(3): Es gibt einen Vektor ~v ∈ Lin(M) mit verschiedenen Linearkombinationen ausM .

Die drei Implikationen aus dem Schema kann man wie folgt beweisen.

• Schritt 1: Angenommen es gibt eine nichttriviale Linearkombination von ~0:

~0 = λ1~v1 + λ2~v2 + . . .+ λk~vk

mit ~v1, ~v2, . . . , ~vk ∈M , λ1, λ2, . . . , λk ∈ K und ∃ λi 6= 0.

Ohne Beschrankung der Allgemeinheit konnen wir λ1 6= 0 annehmen. DieseGleichung wird in zwei Schritten nach ~v1 umgestellt:

(−λ1)~v1 = λ2~v2 + λ3~v3 + . . .+ λk~vk

~v1 = (−λ1)−1λ2~v2 + (−λ1)−1λ3~v3 + . . .+ (−λ1)−1λk~vk

Damit ist ~v1 eine Linearkombination aus den ubrigen Vektoren aus M .

• Schritt 2: Angenommen es gibt einen Vektor ~v, der Linearkombination derubrigen Vektoren ist:

~v = λ1~v1 + λ2~v2 + . . .+ λk~vk

wobei ~v 6∈ ~v1, . . . , ~vk. Damit existieren mindestens zwei verschiedene Linear-kombinationen von ~v:

~v = 1 · ~v + 0 · ~v1 + 0 · ~v2 + . . .+ 0 · ~vk= 0 · ~v + λ1 · ~v1 + λ2 · ~v2 + . . .+ λk · ~vk

• Schritt 3: Angenommen, es existiert ein Vektor ~v ∈ Lin(M) mit zwei verschiede-nen Linearkombinationen aus M :

~v = λ1~u1 + λ2~u2 + . . .+ λm~um

= µ1 ~w1 + µ2 ~w2 + . . .+ µn ~wn

Dann betrachten wir die Vereinigung der zwei Vektormengen

~u1, ~u2, . . . , ~um ∪ ~w1, ~w2, . . . , ~wn = ~v1, ~v2, . . . , ~vk ⊆M

61

Page 62: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

und erweitern die beiden gegebenen Linearkombinationen zu Linearkombinatio-nen uber dieser Vereinigung, indem fur die Koeffizienten der jeweils fehlendenVektoren Nullen gesetzt werden:

~v = λ′1~v1 + λ′2~v2 + . . .+ λ′k~vk

= µ′1~v1 + µ′2~v2 + . . .+ µ′k~vk

wobei

λ′i =

λj falls ~vi = ~uj0 sonst

und µ′i =

µj falls ~vi = ~wj0 sonst

Da auch diese Linearkombinationen verschieden sind, gibt es ein i0, so dassλ′i0 6= µ′i0 . Durch Subtraktion der beiden Gleichungen ergibt sich

~0 = ~v − ~v = (λ′1~v1 + λ′2~v2 + . . .+ λ′k~vk)− (µ′1~v1 + µ′2~v2 + . . .+ µ′k~vk)

= (λ′1 − µ′1)~v1 + . . .+ (λ′i0 − µ′i0

)︸ ︷︷ ︸6=0

~vi0 + . . .+ (λ′k − µ′k)~vk

Damit wurde die Existenz einer nichttrivialen Linearkombination von~0 abgeleitet.

Erzeugendensystem und Basis

Definition: Eine Teilmenge M ⊆ V heißt Erzeugendensystem von V , wenn dielineare Hulle von M der Vektorraum V ist, d.h. wenn Lin(M) = V .

Definition: Eine Teilmenge M ⊆ V heißt Basis von V , wenn sie ein Erzeugenden-system von V und linear unabhangig ist.

Folgerung: Eine Teilmenge M ⊆ V ist genau dann eine Basis von V , wenn jederVektor ~v ∈ V eine eindeutige Darstellung als Linearkombination aus M hat.

Beispiele:

• Die Vektoren

~e1 =

10...0

, ~e2 =

01...0

, . . . , ~en =

00...1

bilden eine Basis des Vektorraums Rn, welche man kanonische Basis oderStandardbasis von Rn nennt. Zum Nachweis der Basiseigenschaften reicht die

62

Page 63: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Uberlegung, dass jeder Vektor aus Rn eindeutig als Linearkombination darstell-bar ist:

a1

a2...an

= a1~e1 + a2~e2 + . . .+ an~en

• Die Vektoren

~v1 = ~e1 =

10...0

, ~v2 = ~e1 + ~e2 =

11...0

, . . . , ~vn = ~e1 + . . .+ ~en =

11...1

bilden eine andere Basis des Vektorraums Rn.

Satz: Fur jede Teilmenge M ⊆ V sind die folgenden Bedingungen aquivalent:

1. Die Menge M ist Basis von V .

2. Die Menge M ist ein minimales Erzeugendensystem von V .

3. Die Menge M ist eine maximale linear unabhangige Menge.

Die Begriffe ”‘minimal”’ und ”‘maximal”’ beziehen sich dabei auf die Inklusionsrela-tion von Mengen.

Wahrend man die Aquivalenz der ersten beiden Bedingungen aus dem Satz uberdie verschiedenen Charakterisierungen der linearen Unabhangigkeit ableiten kann,hilft bei der Aquivalenz zwischen der ersten und der dritten Bedingung das folgendeLemma.

Lemma: Ist eine Teilmenge M ⊆ V linear unabhangig und der Vektor ~v ∈ V nicht inder linearen Hullen von M , dann ist die Menge M ∪~v ebenfalls linear unabhangig.

Beweis (indirekt): Angenommen M∪~v ware linear abhangig, dann existiert einenichttriviale Linearkombination

~0 = λ1~v1 + λ2~v2 + . . .+ λk~vk + λ~v

in der λ 6= 0 sein muss, denn anderenfalls ware das eine nichttriviale Linearkombina-tion des Nullvektors uber M . Durch Gleichungsumstellung ergibt sich

~v = (−λ)−1λ1~v1 + (−λ)−1λ2~v2 + . . .+ (−λ)−1λk~vk

Damit ist ~v ∈ Lin(M), ein Widerspruch zur Annahme.

Basiserganzungssatz von Steinitz : Sei V ein Vektorraum uber dem Korper K,M = ~v1, . . . , ~vk eine linear unabhangige Teilmenge von V und N = ~w1, . . . , ~wl

63

Page 64: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

eine weitere endliche Teilmenge von V , so dass die Vereinigung M ∪N ein Erzeugen-densystem von V ist. Dann kann man die Menge M durch eventuelle Hinzunahmevon Vektoren aus der Menge N zu einer Basis des Vektorraumes V erweitern.

Beweisidee: Man beweist diesen Satz mit vollstandiger Induktion nach l = |N |.

• Der Induktionsanfang mit l = 0 ist einfach, denn dann ist M nach den Voraus-setzungen bereits eine Basis und muss nicht erganzt werden.

• Fur den Induktionsschritt von l− 1 nach l macht man eine Fallunterscheidung:

1. Ist Lin(M) = V , dann ist M bereits eine Basis.

2. Ist Lin(M) 6= V , dann muss es ein ~wi ∈ N geben, das nicht zu Lin(M)gehort (anderenfalls ware Lin(M ∪ N) = Lin(M) 6= V ). Nach obigenLemma ist dann die Menge M ′ = M ∪ ~wi linear unabhangig und dasMengenpaar M ′ und N ′ = N \ ~wi erfullt die Induktionsvoraussetzung,weil |N ′| = l−1. Folglich kann man M ′ durch eventuelle Hinzunahme vonVektoren aus der Menge N ′ zu einer Basis des Vektorraumes V erweitern.

Beispiel: Sei M =

1

00

,

110

und N die Standardbasis von R3.

Der Vektor ~e1 ist bereits in M2 enthalten und damit keine geeignete Erganzung furM . Der Vektor ~e2 ist auch keine Basiserganzung, weil M ∪~e2 linear abhangig ware,doch der dritte Vektor ~e3 erganzt die Menge M zu einer Basis.

Die folgenden zwei Aussagen sind unmittelbare Konsequenzen aus dem Basisergan-zungssatz.

Austauschlemma: Sind die Mengen ~v1, ~v2, . . . , ~vn und ~w1, ~w2, . . . , ~wm zweiBasen eines Vektorraums V , dann gibt es fur jeden Vektor ~vi einen Vektor ~wj, sodass die Menge (~v1, ~v2, . . . , ~vn \ ~vi) ∪ ~wj ebenfalls Basis von V ist, d.h. mankann in der ersten Basis ~vi gegen ~wj. austauschen.

Satz: Besitzt ein Vektorraum V eine endliche n-elementige Basis, dann ist jedeandere Basis von V auch endlich und hat n Elemente.

Beweis: Sei eine n-elementige Basis B1 und eine weitere Basis B2 von V gegeben.Wendet man auf B1 n-mal das Austauschlemma an, so entsteht einen Basis B vonV , die keine Elemente aus B1, sondern nur Elemente aus B2 enthalt. Da man weiß,dass kein Element aus B2 mehrfach eingetauscht wurde (anderenfalls wurde lineareAbhangigkeit entstehen), mussen es genau n Elemente sein. Damit ist |B1| = n ≤|B2|. Andererseits kann B2 nicht mehr als n Elemente haben, denn B ⊆ B2 istbereits ein Erzeugendensystem von V und B2 ist als Basis von V ein minimalesErzeugendensystem.

64

Page 65: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Dimension

Definition: Besitzt ein Vektorraum V eine endliche Basis ~v1, ~v2, . . . , ~vn, dannnennt man V einen endlich-dimensionalen und konkreter einen n-dimensionalen Vektor-raum. Die Dimension des Raums wird mit dem Symbol dim V = n bezeichnet.Ein Vektorraum, der keine endliche Basis besitzt, wird unendlich-dimensional genanntund man verwendet dafur die formale Schreibweise dim V =∞.

Satz: Ist M = ~v1, ~v2, . . . , ~vk eine Teilmenge eines Vektorraums V mit k > dim V ,so ist M linear abhangig.

Beweis: Ware M linear unabhangig, konnte man durch k-fache Anwendung desBasiserganzungssatzes die Vektoren aus M gegen Vektoren einer Basis von V aus-tauschen. Da dabei zwangslaufig mindestens ein Basisvektor mehrfach in M eingefugtwerden musste, entstunde lineare Abhangigkeit - ein Wiederspruch.

Satz: Jeder Vektorraum besitzt eine Basis.

Dieser Satz ist von fundamentaler Bedeutung, aber leider ubersteigt sein Beweisunsere bisher zur Verfugung stehenden mathematischen Mittel. Deshalb kann er imRahmen dieser Vorlesung nur genannt, aber nicht bewiesen werden.Im Gegensatz dazu sind die folgenden Aussagen einfache Konsequenzen aus demBasiserganzungssatz und dem Austauschlemma.

Satz: Ist die Dimension eines Vektorraumes V endlich und U ein Unterraum von V ,

dann gilt:i) dim U ≤ dim Vii) dim U < dim V ⇔ U 6= V

Definition: Sind U1 und U2 Unterraume von V , so nennt man die Menge

U1 + U2 = ~x+ ~y | ~x ∈ U1, ~y ∈ U2

die Summe von U1 und U2.

Beispiel: Sei V = R4 mit den Unterraumen U1 = Lin(~e1, ~e2, ~e4) und U2 =Lin(~e1, ~e3, ~e4) sowie U3 = Lin(~e1 + ~e2, ~e1 + ~e4) , dann ist

U1 + U2 = R4 und U1 + U3 = U1

Satz: Die Summe von zwei Unterraumen ist ein Unterraum. Fur zwei endlich-dimen-sionale Unterraume U1 und U2 gilt:

dim(U1 + U2) = dim U1 + dim U2 − dim(U1 ∩ U2)

Beweisidee:

• Die Abgeschlossenheit von U = U1 +U2 bezuglich Addition und Multiplikationmit Skalaren ist trivial.

• Sei B = ~v1, ~v2, . . . , ~vr eine Basis von U1 ∩ U2.

65

Page 66: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• Wir erganzen B zu einer Basis B1 von U1:

B1 = ~v1, ~v2, . . . , ~vr, ~u1, ~u2, . . . , ~us

• Wir erganzen B zu einer Basis B2 von U2:

B2 = ~v1, ~v2, . . . , ~vr, ~w1, ~w2, . . . , ~wt

• Man weist nach, dass B1 ∪ B2 = ~v1, ~v2, . . . , ~vr, ~u1, ~u2, . . . , ~us, ~w1, ~w2, . . . , ~wteine Basis von U = U1 + U2 ist.

• Damit gilt fur die Dimensionen:

dim(U1 +U2) = r+ s+ t = r+ s+ r+ t− r = dim U1 + dim U2− dim(U1 ∩U2)

Beispiele:

• Sei V = R3, der Unterraum U1 eine Ebene durch den Koordinatenursprung undder Unterraum U2 eine Gerade durch den Koordinatenursprung, die aber nichtin U1 liegt. Dann ist dim U1 = 2, dim U2 = 1 und dim(U1 ∩ U2) = 0 (wegenU1 ∩ U2 = ~0). Aus dem Satz folgt dann:

dim(U1 + U2) = dim U1 + dim U2 − dim(U1 ∩ U2) = 2 + 1− 0 = 3

Damit ist U1 + U2 = R3.

• Sind U1 und U2 zwei verschiedene Unterraume des Rn mit dim U1 = dim U2 =n− 1, dann ist U1 + U2 = Rn und folglich dim (U1 ∩ U2) = n− 2.

5.5 Lineare Abbildungen

Definition: Seien V und W zwei Vektorraume uber einem Korper K. Eine Ab-bildung f : V → W heißt linear (oder Vektorraumhomomorphismus), wenn fur alle~v, ~w ∈ V und fur alle λ ∈ K gilt:

f(~v + ~w) = f(~v) + f(~w)

f(λ · ~v) = λ · f(~v)

Hom(V,W ) bezeichnet die Menge aller linearer Abbildungen f : V → W .

Beobachtungen:

• Sei f ∈ Hom(V,W ), dann gilt:

f(λ1~v1 + λ2~v2 + . . .+ λk~vk) = λ1 · f(~v1) + λ2 · f(~v2) + . . .+ λk · f(~vk)

fur alle ~v1, ~v2, . . . , ~vk ∈ V und alle λ1, λ2, . . . , λk ∈ K.

• Die Verknupfung von linearen Abbildungen f : V → W und g : W → Y isteine lineare Abbildung gf : V → Y , wobei die Verknupfung wie folgt operiert:

gf(~v) = g(f(~v))

66

Page 67: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• Die Menge aller linearen Abbildungen Hom(V,W ) ist selbst ein Vektorraummit den Operationen:

• (f + g)(~v) = f(~v) + g(~v)

• (λ · f)(~v) = λ · f(~v)

Dazu muss man nur nachprufen, dass fur alle f, g ∈ Hom(V,W ) und λ ∈ K dieAbbildungen f+g und λ·f auch linear sind. Das kann man aus den Definitionender Operationen in Hom(V,W ), den Eigenschaften von linearen Abbildungenund den Vektorraumeigenschaften ableiten:

(f + g)(~u+ ~v) = f(~u+ ~v) + g(~u+ ~v)

= f(~u) + f(~v) + g(~u) + g(~v)

= f(~u) + g(~u) + f(~v) + g(~v)

= (f + g)(~u) + (f + g)(~v)

Analog erfolgt auch die Ableitung der drei anderen Bedingungen:

(λ · f)(~u+ ~v) = (λ · f)(~u) + (λ · f)(~v)

(f + g)(µ~u) = µ(f + g)(~u)

(λ · f)(µ~u) = µ(λ · f)(~u)

Eine Reihe haufig verwendeter geometrischer Transformationen, wie Drehungen umden Koordinatenursprung, Spiegelungen an Geraden bzw. Ebenen, die durch denKoordinatenursprung verlaufen, sowie Projektionen auf solche Geraden und Ebenensind lineare Abbildungen. Die folgenden Beispiele demonstrieren das in der Ebene:

a) Die Spiegelung an der x-Achse erfolgt durch die Abbildung f

(xy

)=

(x−y

)b) Die Spiegelung an der Geraden y = x erfolgt durch g

(xy

)=

(yx

)

v

g(v)

y=x

x

y

67

Page 68: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

c) Die Projektion auf die y-Achse erfolgt durch die Abbildung h

(xy

)=

(0y

)d) Die Drehung um 45 in R2 erfolgt durch eine Abbildung j, die man zuerst auf

den Basisvektoren beschreibt:

j

(10

)=

(1√2

1√2

)j

(01

)=

(− 1√

21√2

)Das erweitert man zu einer linearen Abbildung:

j

(xy

)= j

(x ·(

10

)+ y ·

(01

))= x · j

(10

)+ y · j

(01

)=

(1√2x− 1√

2y

1√2x+ 1√

2y

)

v

j(v)

j(u)u

Man beachte, dass Translationen (also Verschiebungen) keine linearen Abbildungensind, da eine lineare Abbildung immer den Nullvektor auf den Nullvektor abbildenmuss. Man kann Translationen erst durch einen Trick, namlich die Einfuhrung ho-mogener Koordinatensysteme, als lineare Abbildung darstellen.

Kern und Bild von linearen Abbildungen

Definition: Der Kern Ker f und das Bild Im f einer linearen Abbildung f ∈Hom(V,W ) sind wie folgt definiert:

Ker f = ~v ∈ V | f(~v) = ~0Im f = ~w ∈ W | ∃~v f(~v) = ~w

Beispiele: Wir bestimmen die Kerne und Bilder der oben eingefuhrten geometrischenTransformationen.

68

Page 69: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

a) Ker f = ~0, denn

f

(xy

)=

(x−y

)=

(00

)⇔ x = 0 ∧ y = 0

Im f = R2, denn (xy

)= f

(x−y

)fur alle

(xy

)∈ R2

Damit ist F eine bijektive Abbildung von R2 nach R2 mit der Umkehrabbildungf−1 = f .

b) Ker g = ~0 und Im g = R2. Damit ist auch g eine bijektive Abbildung von R2

nach R2 mit der Umkehrabbildung g−1 = g.

c) Ker h = Lin

(10

), denn

h

(xy

)=

(0y

)=

(00

)⇔ y = 0

Im h = Lin

(01

), denn die x-Komponente aller Elemente aus dem Bild ist

0.

d) Ker j = ~0, denn

j

(xy

)=

(1√2x− 1√

2y

1√2x+ 1√

2y

)=

(00

)⇔ x = 0 ∧ y = 0

Die Abbildung j ist eine bijektive Abbildung von R2 nach R2, weil mit

j−1

((xy

))=

(1√2x+ 1√

2y

− 1√2x+ 1√

2y

)

eine Umkehrabbildung existiert. Daraus folgt Im f = R2.

Lemma: Der Kern einer linearen Abbildung f ∈ Hom(V,W ) ist ein Unterraum vonV und das Bild von f ist ein Unterraum von W .

Beweis (Kern): Seien ~u,~v ∈ Ker f und λ ∈ K (Korper zu V ).

• Ker f ist nicht leer, denn:

f(~0) = f(~0−~0) = f(~0)− f(~0) = ~0

Damit ist ~0 ∈ Ker f .

69

Page 70: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• Abgeschlossenheit bezuglich der Addition:

Fur alle ~u,~v ∈ Ker f : f(~u+ ~v) = f(~u) + f(~v)

= ~0 +~0

= ~0

Damit ist auch ~u+ ~v ∈ Ker f .

• Abgeschlossenheit bezuglich der Multiplikation mit Skalaren:

Fur alle ~u ∈ Ker f und fur alle λ ∈ K: f(λ~u) = λ · f(~u)

= λ ·~0 (da ~u ∈ Ker f)

= ~0

Damit ist auch λ~u ∈ Ker f .

Beweis (Bild): Seien ~u,~v ∈ Im f und λ ∈ K (Korper zu W ).

• Im f ist nicht leer, denn f(~0) = ~0 ∈ Im f .

• Abgeschlossenheit bezuglich der Addition:

Fur alle ~w = f(~v), ~w′ = f(~v′) ∈ Im f ~w + ~w′ = f(~v) + f(~v′)

= f(~v + ~v′) ∈ Im f

• Abgeschlossenheit bezuglich der Multiplikation mit Skalaren:

Fur alle ~w = f(~v) ∈ Im f und alle λ ∈ K λ~w = λ · f(~v)

= f(λ~v) ∈ Im f

Lemma: Eine lineare Abbildung f ∈ Hom(V,W ) ist genau dann injektiv, wenn ihrKern nur aus dem Nullvektor besteht, d.h.

f ist injektiv ⇐⇒ Ker f = ~0

Beweis: Die Richtung⇒ ist offensichtlich, denn da f(~0) = ~0 und f injektiv ist, kannkein anderer Vektor auf ~0 abgebildet werden.

Fur die Richtung ⇐ erfolgt der Beweis durch Widerspruch:Angenommen Ker f = ~0 und f ist nicht injektiv, dann existieren zwei Vektoren~u,~v ∈ V , so dass ~u 6= ~v aber f(~u) = f(~v). Daraus folgt

f(~u− ~v) = f(~u)− f(~v) = ~0

und damit liegt ~u− ~v 6= ~0 in Ker f , ein Widerspruch zur Annahme.

Spezielle Homomorphismen

Definitionen: Einen Homomorphismus f ∈ Hom(V,W ) nennt man einen

70

Page 71: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• Monomorphismus , wenn f injektiv ist,

• Epimorphismus , wenn f surjektiv ist,

• Isomorphismus , wenn f bijektiv ist,

• Endomorphismus , wenn V = W ,

• Automorphismus , wenn V = W und f bijektiv ist.

Der folgende Satz ist eine einfache Konsequenz aus den bekannten Fakten, dass dieKomposition von bijektiven Abbildungen auch bijektiv und die Komposition vonlinearen Abbildungen auch linear ist.

Satz: Die Komposition (Verkettung) von zwei Isomorphismen ist auch wieder einIsomorphismus.

Satz: Ist f ∈ Hom(V,W ) ein Isomorphismus, dann ist auch f−1 ∈ Hom(W,V ) einIsomorphismus.

Beweis: Da ein Isomorphismus bijektiv ist, gibt es eine eindeutige Umkehrfunktionf−1 : W −→ V , die durch

f(~v) = ~w ⇐⇒ f−1(~w) = ~v

charakterisiert ist. Man muss nur noch die Abbildung f−1 auf Linearitat uberprufen:Seien ~w = f(~v) und ~w′ = f(~v′) gegeben. Da f linear ist, gilt f(~v+~v′) = f(~v)+f(~v′) =~w + ~w′ und f(λ~v) = λf(~v) = λ~w. Jetzt ergibt sich die Linearitat von f−1 durchAnwendung der oben beschriebenen Aquivalenz auf die zwei Gleichungen:

f−1(~w + ~w′) = ~v + ~v′ = f−1(~w) + f−1( ~w′)

f−1(λ~w) = λ~v = λf−1(~w)

Satz: Seien V und W zwei Vektorraume uber K, ~v1, ~v2, . . . , ~vn ⊆ V eine Basisvon V und ~w1, ~w2, . . . , ~wn ∈ W eine beliebige Folge von Vektoren aus W , dann gibtes eine eindeutige lineare Abbildung f ∈ Hom(V,W ) definiert durch

f(~vi) = ~wi fur i = 1, 2, . . . , n

Beweis: Jeder Vektor ~v ∈ V hat eine eindeutige Darstellung als Linearkombinationaus den Basisvektoren ~v1, ~v2, . . . , ~vn:

~v = λ1~v1 + λ2~v2 + . . .+ λn~vn

Wenn eine lineare Abbildung mit der Eigenschaft f(~vi) = ~wi fur i = 1, 2, . . . , nexistiert, dann muss

f(~v) = λ1 ~w1 + λ2 ~w2 + . . .+ λn ~wn = λ1 · f(~v1) + λ2 · f(~v2) + . . .+ λn · f(~vn)

71

Page 72: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

gelten. Es bleibt also nur noch zu zeigen, dass diese eindeutige Zuordnungsregel einelineare Abbildung beschreibt. Dazu muss die Vertraglichkeit mit der Addition undmit der Multiplikation mit Skalaren uberpruft werden. Dazu seien λ ∈ K sowie

~v = λ1~v1 + λ2~v2 + . . .+ λn~vn

~u = µ1~v1 + µ2~v2 + . . .+ µn~vn gegeben, woraus

~v + ~u = (λ1 + µ1)~v1 + (λ2 + µ2)~v2 + (λn + µn) ~vn folgt.

Nach der Zuordnungsregel ist

f(~v + ~u) = (λ1 + µ1)f(~v1) + (λ2 + µ2)f(~v2) + (λn + µn)f( ~vn)

= λ1f(~v1) + λ2f(~v2) + λnf( ~vn) + µ1f(~v1) + µ2f(~v2) + µnf( ~vn)

= f(~v) + f(~u)

Analog kann man die zweite Eigenschaft f(λ~v) = λf(~v) nachrechnen.

Folgerung: Zu zwei n-dimensionalen Vektorraumen existiert mindestens ein Isomor-phismus, der den einen Vektorraum in den anderen uberfuhrt.

Rang einer linearen Abbildung

Definition: Der Rang einer linearen Abbildung f ∈ Hom(V,W ) ist die Dimensiondes Bildes von f :

rg f = dim(Im f)

Satz (Dimensionsformel fur lineare Abbildungen): Fur jede lineare Abbildungf ∈ Hom(V,W ) auf einem endlichdimensionalen Vektorraum V gilt:

dim V = dim(Ker f) + dim(Im f) = dim(Ker f) + rg f

Beweis: Zuerst betrachten wir eine Basis B1 = ~v1, ~v2, . . . , ~vk des Kerns Ker f ⊆ V .Man kann B1 zu einer Basis B von V erweitern. Sei B = ~v1, ~v2, . . . , ~vn, d.h.~vk+1, . . . , ~vn sind die Erganzungsvektoren.

Wir betrachten die Bilder der Erganzungsvektoren und werden zeigen, dass sie eineBasis B2 = f( ~vk+1), . . . , f( ~vn) des Unterraums Im f bilden.

• Erzeugendensystem: Da man jeden Vektor ~w aus Im f als Linearkombina-tion ~w = λ1f(~v1) + . . . + λnf( ~vn) darstellen kann und außerdem f(~v1) = . . . =f(~vk) = ~0 gilt, reichen die Vektoren aus B2 aus, um Im f zu erzeugen.

• Lineare Unabhangigkeit: Wir betrachten eine Linearkombination des Nul-lvektors aus B2

~0 = λk+1f( ~vk+1) + . . .+ λnf( ~vn)

Damit ist

f(λk+1 ~vk+1 + . . .+ λn ~vn) = ~0 = λk+1f( ~vk+1) + . . .+ λnf( ~vn) = ~0

72

Page 73: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

und folglich ist ~v = λk+1 ~vk+1 + . . . + λn ~vn Element des Kerns von f . Alssolches muss ~v aber auch als Linearkombination aus B1 darstellbar sein, d.h.~v = µ1~v1 + µ2~v2 + . . . + µk~vk. Da jeder Vektor aus V , also insbesondere auch~v, eine eindeutige Basisdarstellung aus V hat, kann es nur eine Konsequenzgeben: ~v = ~0 und µ1 = . . . = µk = λk+1 = . . . = λn = 0, womit gezeigt ist, dassdie eingangs betrachtete Linearkombination des Nullvektors aus B2 trivial seinmuss.

Da wir nach den oben gewahlten Bezeichnungen von dim(Ker f) = k, dim V = nund dim(Im f) = n − k ausgehen konnen, ergibt sich die Dimensionsformel durcheinfache Zusammenfassung

dim(Ker f) + dim(Im f) = k + (n− k) = n = dim V

5.6 Matrizen

Definition: Eine m×n-Matrix uber einem Korper K ist eine Anordnung von m×nElementen aus K nach dem folgenden Schema:

A =

a1 1 a1 2 · · · a1n

a2 1 a2 2 · · · a2n...

.... . .

...am 1 am 2 · · · amn

Alternativ kann man auch die Schreibweise A = (ai j)(i,j)∈m×n verwenden. Die hori-zontalen n-Tupel werden Zeilen und die vertikalen m-Tupel werden Spalten der Ma-trix genannt. Die Skalare ai j nennt man die Koeffizienten (oder Eintrage) der Matrix.Die Menge aller m× n-Matrizen uber K wird mit M(m× n,K) bezeichnet.

Beobachtung: Die Menge M(m × n,K) ist ein Vektorraum mit den folgendenOperationen (λ ∈ K): a1 1 . . . a1n

: :am 1 . . . amn

+

b1 1 . . . b1n

: :bm 1 . . . bmn

=

a1 1 + b1 1 . . . a1n + b1n

: :am 1 + bm 1 . . . amn + bmn

λ ·

a1 1 . . . a1n

: :am 1 . . . amn

=

λa1 1 . . . λa1n

: :λam 1 . . . λamn

Multiplikation von Matrizen

Definition: Ist A ∈M(m×n,K) und B ∈M(n×r,K) (wichtig ist der gemeinsameParameter n), dann kann man das Produkt dieser Matrizen als eine Matrix C = AB ∈

73

Page 74: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

M(m× r,K) definieren, deren Koeffizienten ci j die folgende Form haben:

ci j = ai 1 · b1 j + ai 2 · b2 j + . . .+ ai n · bn j

=n∑k=1

ai k · bk j

Man kann sich diese Regel so einpragen, dass man um ci j zu erhalten, die i-te Zeilevon A mit der j-ten Spalte von B ”‘multipliziert”’, wobei multiplizieren hier bedeutet,die Produkte der sich entsprechenden Koeffizientenpaare aufzuaddieren.

Beispiel:

(1 0 −12 1 0

0 21 −13 1

=

(0 + 0− 3 2 + 0− 10 + 1 + 0 4− 1 + 0

)=

(−3 1

1 3

)

Eine spezielle Auspragung bekommt diese Regel bei der Multiplikation einer m× n-Matrix mit einem Spaltenvektor aus Kn, der gleichzeitig eine n × 1-Matrix ist. DasErgebnis ist eine m×1-Matrix, also ein Spaltenvektor aus Km. Auf diese Weise kanndie Matrix A als Abbildung von Kn nach Km interpretiert werden.

Satz: Die Multiplikation von Matrizen ist assoziativ, d.h. fur alle A ∈M(m×n,K),B ∈M(n× r,K) und C ∈M(r × s,K) gilt

(A ·B) · C = A · (B · C)

Da der Beweis bis auf das Jonglieren mit komplizierten Summenformeln keine heraus-ragenden Uberraschungsmomente enthalt, werden wir uns Zeit und Aufwand dafursparen.

Achtung: Wie das folgende Beispiel zeigt, ist die Multiplikation von Matrizen imAllgemeinen nicht kommutativ:(

1 01 0

)·(

0 01 1

)=

(0 00 0

)6=(

0 02 0

)=

(0 01 1

)·(

1 01 0

)

Matrixdarstellung von lineare Abbildungen

Wir haben bereits gesehen, wie man eine Matrix als lineare Abbildung interpretierenkann. Jetzt geht es um den umgekehrten Weg, bei dem eine lineare Abbildung f ∈Hom(V,W ) gegeben ist, die als Matrix dargestellt werden soll. Das ist aber nurmoglich, wenn man vorher eine Basis von V und eine Basis von W festlegt.

Definition: Sei f ∈ Hom(V,W ) eine lineare Abbildung, B1 = ~v1, ~v2, . . . , ~vn Basisvon V und B2 = ~w1, ~w2, . . . , ~wm Basis von W , dann wird der Abbildung f eineMatrix A ∈M(m×n,K) zugeordnet, deren Koeffizienten ai j sich aus der Darstellung

74

Page 75: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

der Bilder der Basisvektoren f(~vi) in der Basis ~w1, ~w2, . . . , ~wm wie folgt ergeben:

f(~v1) = a1 1 ~w1 + a2 1 ~w2 + . . .+ am 1 ~wm

f(~v2) = a1 2 ~w1 + a2 2 ~w2 + . . .+ am 2 ~wm...

f(~vn) = a1n ~w1 + a2n ~w2 + . . .+ amn ~wm

Umgekehrt bestimmt jede Matrix A ∈ M(m × n,K) durch die oberen Formeln einelineare Abbildung f ∈ Hom(V,W ), denn wir wissen, dass eine lineare Abbildungbereits durch die Bilder der Basisvektoren eindeutig beschrieben ist.

Haufig trifft man auf die besondere Situation, dass B1 die Standardbasis von V = Rn

und B2 die Standardbasis von W = Rm ist. Fur diesen Fall kann man sich diefolgende Regel einpragen:

die j-te Spalte der Matrix A ist das Bild des j-ten Basisvektors von V , also f(~ej)

Folgerung 1: Die Vektorraume der linearen Abbildungen Hom(V,W ) und der Ma-trizen M(m × n,K) sind isomorph. Der Isomorphismus wird (nach Festlegung vonzwei Basen fur V und W ) durch die oben beschriebene Zuordnung zwischen linearenAbbildungen und Matrizen realisiert.

Folgerung 2: Seien fur V = Kn und W = Km die jeweiligen Standardbasen fest-gelegt und sei A ∈ M(m × n,K) die zu einer Abbildung f ∈ Hom(V,W ) gehorigeMatrix, dann erhalt man das Bild f(~v) eines beliebigen Spaltenvektors ~v ∈ V durchMultiplikation der Matrix A mit ~v, d.h.

A · ~v = f(~v)

Man kann die zweite Folgerung durch einfaches Nachrechnen uberprufen:

A · ~v =

a1 1 · · · a1n...

...am 1 · · · amn

·x1

...xn

=

a1 1 · x1 + . . .+ a1n · xn...

am 1 · x1 + . . .+ amn · xn

75

Page 76: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

f(~v) = f

x1...xn

= f(x1 · ~e (n)

1 + . . .+ xn · ~e (n)n

)

= x1 · f(~e

(n)1

)+ . . .+ xn · f

(~e (n)n

)

= x1 ·

a1 1...

am 1

+ . . .+ xn ·

a1n...

amn

=

a1 1 · x1 + . . .+ a1n · xn...

am 1 · x1 + . . .+ amn · xn

⇒ A · ~v = f(~v)

Satz: Seien f ∈ Hom(Kq, Kp) sowie g ∈ Hom(Kr, Kq) lineare Abbildungen undA ∈ M(p × q,K) bzw. B ∈ M(q × r,K) die zu f bzw. g gehorigen Matrizenbezuglich der Standardbasen von Kp, Kq und Kr. Dann entspricht das Produkt derMatrizen A ·B der Abbildungskomposition fg, vereinfacht geschrieben:

C = A ·B ∈M(p× r,K) ←→ fg ∈ Hom(Kr, Kp)

Auf den Beweis dieses Satzes wird verzichtet, weil er auch in die Kategorie der rech-nerisch aufwandigen, aber nicht sehr originellen Beweise gehort.

Beispiele:

a) Die Skalierung des Raumes Rn um einen Faktor c ∈ R wird durch die folgendeMatrix realisiert:

A =

c 0 · · · 00 c · · · 0...

.... . .

...0 0 · · · c

b) Die Projektion des Raums R3 auf die xy-Ebene im gleichen Raum wird durch

die folgende Matrix realisiert:

B =

1 0 00 1 00 0 0

c) Die Drehung der Ebene R2 mit dem Winkel ϕ um den Koordinatenursprung

wird durch die folgende Matrix realisiert:

C =

(cosϕ − sinϕsinϕ cosϕ

)

76

Page 77: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

ϕ

ϕ sin

cos

ϕ

ϕ

1

Die Drehung des Punkts

(24

)mit dem Winkel π

3um den Koordinatenursprung

kann man dann wie folgt berechnen:(cos π

3− sin π

3

sin π3

cos π3

)·(

24

)=

(12−√

32√

32

12

)·(

24

)=

(1− 2

√3√

3 + 2

)

5.7 Der Rang einer Matrix

Der Rang einer Matrix kann auf drei verschiedene Arten definiert werden. Um diesebesser unterscheiden zu konnen, fuhren wir zuerst drei Begriffe ein, von denen spatergezeigt wird, dass sie immer denselben Wert haben.

Definition: Sei A ∈M(m×n,K) eine Matrix und f ∈ Hom(Kn, Km) die zugehorigelineare Abbildung (bezuglich der Standardbasen).

• Der Rang von A ist definiert durch rg A := rg f = dim (Im f)

• Der Zeilenrang von A ist die maximale Anzahl von linear unabhangigen Zeilen-vektoren aus A.

• Der Spaltenrang vonA ist die maximale Anzahl von linear unabhangigen Spalten-vektoren aus A.

Satz: Der Rang und der Spaltenrang einer Matrix A sind gleich.

Beweis: Die Spalten von A sind die Bilder der Basisvektoren. Folglich bilden dieSpaltenvektoren der Matrix ein Erzeugendensystem von Im f . Damit ist jede max-imale linear unabhangige Teilmenge der Spaltenvektoren eine Basis von Im f , unddaraus folgt, dass der Spaltenrang von A gleich dim (Im f) = rg f = rg A ist.

Lemma: Ist ~wk ein Spaltenvektor von A ∈M(m× n,K), der sich als Linearkombi-nation der ubrigen Spalten darstellen lasst und ist A′ die Matrix A ohne Spalte ~wk,dann gilt:

Spaltenrang A′ = Spaltenrang A und Zeilenrang A′ = Zeilenrang A

77

Page 78: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Die gleiche Aussage gilt auch, wenn man aus der Matrix einen Zeilenvektor streicht,der sich als Linearkombination aus den anderen Zeilen darstellen lasst.

Beweis: Die maximale Anzahl von linear unabhangigen Spaltenvektoren ist gle-ichzeitig die Dimension der linearen Hulle der Menge aller Spaltenvektoren ~w1, . . . , ~wnvon A. Ist der Vektor

~wk =n∑

j=1j 6=k

λj ~wj

eine Linearkombination der anderen Spaltenvektoren, dann bleibt die lineare Hullenach seiner Streichung unverandert und deshalb bleibt der Spaltenrang gleich.Fur die Betrachtung des Zeilenrangs sei I ⊆ 1, 2, . . . ,m eine maximale Menge, sodass die Zeilenvektoren ~ui | i ∈ I linear unabhangig sind, und sei ~ui′ | i ∈ I dieentsprechende Menge von Zeilenvektoren aus A′, in denen also jeweils die k-te Stellegestrichen ist. Um die Gleichheit des Zeilenrangs von A und A′ zu zeigen, genugt es,die lineare Unabhangigkeit von ~ui′ | i ∈ I nachzuweisen. Sei∑

i∈I

µi ~ui′ = ~0

eine Linearkombination des Nullvektors in Kn−1. Wir werden zeigen, dass dannauch die Linearkombination

∑i∈I µi~ui den Nullvektor in Kn erzeugt. Damit mussen

alle Skalare µi gleich 0 sein und folglich ist ~ui′ | i ∈ I linear unabhangig. In derLinearkombination

∑i∈I µi~ui sind bereits alle Stellen bis auf die k-te gleich Null.

Bleibt also∑

i∈I µiai k = 0 zu zeigen. Nach Voraussetzung uber den Spaltenvektor~wk wissen wir fur alle i ∈ I

ai k =n∑

j=1j 6=k

λjai j und folglich

∑i∈I

µiai k =∑i∈I

(µin∑

j=1j 6=k

λj ai j)

=n∑

j=1j 6=k

(λj∑i∈I

µi ai j︸ ︷︷ ︸= 0 da j 6= k

)

=n∑

j=1j 6=k

0 = 0

Satz: Der Spaltenrang und der Zeilenrang einer Matrix A sind gleich und damit gilt:

rg A = Spaltenrang A = Zeilenrang A

78

Page 79: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Beweis: Wir streichen aus A Zeilen bzw. Spalten, die jeweils Linearkombinationender ubrigen Zeilen bzw. Spalten sind, solange das moglich ist.

A 7→ A′ 7→ A′′ 7→ . . . 7→ A(end)

Dann ist in der Matrix A(end) die Menge der Zeilenvektoren linear unabhangig undauch die Menge der Spaltenvektoren ist linear unabhangig. Sei A(end) eine m × n–Matrix, dann gilt nach dem Lemma:

Spaltenrang A = Spaltenrang A(end) = n

Zeilenrang A = Zeilenrang A(end) = m

Es gibt m linear unabhangige Zeilenvektoren in A(end), aber das sind Vektoren ausKn und deshalb muss m ≤ n sein. Andererseits gibt es n linear unabhangige Spal-tenvektoren in A(end), aber das sind Vektoren aus Km und deshalb muss n ≤ m sein.Folglich ist Spaltenrang A = n = m = Zeilenrang A.

Definition: Sei A = (ai j) ∈ M(m × n,K) eine Matrix, dann ist die transponierteMatrix von A definiert durch

At = (ati j) ∈M(n×m,K) mit ati j = aj i

Beispiel: 1 02 14 0

t

=

(1 2 40 1 0

)Folgerung: Der Rang einer Matrix A und der transponierten Matrix At ist gleich.

rg A = rg At

Elementare Umformungen

Definition: Die folgenden Operationen auf einer Matrix werden elementarenUmformungen genannt:

• Typ 1: Vertauschung von zwei Zeilen bzw. von zwei Spalten.

• Typ 2: Multiplikation einer Zeile bzw. Spalte mit einem Skalar λ 6= 0.

• Typ 3: Addition des λ-fachen einer Zeile bzw. Spalte zu einer anderen Zeilebzw. Spalte.

Satz: Elementare Umformungen andern den Rang einer Matrix nicht.

Beweis: Man muss sich nur davon uberzeugen, dass sich die lineare Hulle der Zeilen-bzw. Spaltenvektoren durch die Umformungen nicht andert. Fur Umformungen vomTyp 1 und Typ 2 ist das offensichtlich.

79

Page 80: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Fur eine Umformungen vom Typ 3 seien ~vi, ~vk zwei Zeilenvektoren und λ ∈ K einSkalar. Nach der Umformung hat man an Stelle von ~vi den Vektor

~v ∗i = ~vi + λ~vk

Es ist eine leichte Ubung, in Linearkombinationen ~vi gegen ~v ∗i auszutauschen:

µ1~v1 + . . .+ µi~vi + . . .+ µk~vk + . . .+ µn~vn = µ1~v1 + . . .+ µi~v∗i + . . .+ (µk − λµi)~vk + . . .

. . .+ µn~vn

µ1~v1 + . . .+ µi~v∗i + . . .+ µk~vk + . . .+ µn~vn = µ1~v1 + . . .+ µi~vi + . . .+ (µk + λµi)~vk + . . .

. . .+ µn~vn

Obere Dreiecksform

Definition: Die MatrixA ist in oberer Dreiecksform, wenn die Matrix die folgendeForm hat, wobei das Symbol ∗ fur beliebige Inhalte steht:

A =

a1 1 ∗ ∗ · · · ∗ ∗ · · · ∗0 a2 2 ∗ · · · ∗ ...

. . ....

0 0 a3 3. . .

......

. . ....

......

. . . . . . ∗ .... . .

...0 0 · · · 0 ar r ∗ · · · ∗0 · · · · · · · · · 0 0 · · · 0...

. . . . . . . . ....

.... . .

...0 · · · · · · · · · 0 0 · · · 0

und die Werte a1 1, a2 2, a3 3, . . . , ar r ungleich Null sind, d.h.

a1 1 · a2 2 · a3 3 · . . . · ar r 6= 0

Beobachtung: Der Rang einer solchen Matrix ist r.

Algorithmus zur Umwandlung in eine obere Dreiecksform:

Mit dem folgenden Verfahren kann man eine beliebige Matrix A ∈M(m× n,K) mitelementaren Umformungen in eine obere Dreiecksform uberfuhren und damit auchihren Rang bestimmen. Das Verfahren arbeitet in r = rg A Stufen.

Zustandsinvariante: Nach jeder Stufe k ≥ 1 wird eine Matrix Ak der folgenden

80

Page 81: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Form erreicht:

Ak =

a1 1 ∗ ∗ · · · ∗ ∗ · · · ∗0 a2 2 ∗ · · · ∗ ...

. . ....

0 0 a3 3. . .

......

. . ....

......

. . . . . . ∗ .... . .

...0 0 · · · 0 ak k ∗ · · · ∗0 · · · · · · · · · 0 bk+1 k+1 · · · bk+1 n...

. . . . . . . . ....

.... . .

...0 · · · · · · · · · 0 bm k+1 · · · bm n

Dabei konnen die Koeffzienten bi j im Rechteck rechts unten (also mit i = k + 1, k +2, . . . ,m und j = k + 1, k + 2, . . . , n) beliebig sein, aber gefordert ist a1 1 · a2 2 · a3 3 ·. . . · ak k 6= 0.

Sei Bk =

bk+1 k+1 · · · bk+1 n...

. . ....

bm k+1 · · · bm n

die rechte untere Teilmatrix von Ak.

Initialisierung: Wir setzen A0 = A. Offensichtlich gibt es fur A0 keine Ein-schrankungen, denn B0 = A0.

Abbruchkriterium: Das Verfahren ist beendet, wenn Bk die Nullmatrix ist, denndann ist Ak in oberer Dreiecksform.

Umwandlung von Ak in Ak+1: Wenn das Abbruchkriterium fur Ak noch nichterfullt ist, gibt es in Bk einen Koeffizienten bi j 6= 0.

• Vertausche Zeilen und/oder Spalten, die durch B gehen, um den Koeffizientenbi,j an die Stelle von bk+1 k+1 zu bringen. Die so entstandene Matrix A′k hatfolgende Gestalt:

A′k =

a1 1 ∗ · · · ∗ ∗ ∗ · · · ∗0 a2 2

. . . ∗ ......

. . ....

.... . . . . . ∗ ...

.... . .

...0 0 0 ak k ∗ ∗ · · · ∗0 · · · · · · 0 b′k+1 k+1 · · · · · · b′k+1 n...

. . . . . .... b′k+2 k+1 · · · · · · b′k+2 n

.... . . . . .

......

. . . . . ....

0 · · · · · · 0 b′m k+1 · · · · · · b′m n

wobei nun b′k+1 k+1 = bi,j 6= 0 ist.

• Fur die Stellen b′k+2 k+1, b′k+3 k+1, . . . , b

′m k+1 werden durch Typ-3-Umformungen

Nullen erzeugt. Man verwendet fur die Zeilen i = k + 2, k + 3, . . . ,m die

81

Page 82: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

folgenden Umformungen:

Zeilei := Zeilei −(b′i k+1 · (b′i k+1)−1

)· Zeilek+1

Dadurch entsteht die neue Matix A′′k = Ak+1:

A′′k =

a1 1 ∗ · · · ∗ ∗ ∗ · · · ∗0 a2 2

. . . ∗ ......

. . ....

.... . . . . . ∗ ...

.... . .

...0 0 0 ak k ∗ ∗ · · · ∗0 · · · · · · 0 b′k+1 k+1 · · · · · · b′k+1 n...

. . . . . .... 0 b′′k+2 k+2 · · · b′′k+2 n

.... . . . . .

......

.... . .

...0 · · · · · · 0 0 b′′m k+2 · · · b′′m n

wobei fur alle i = k+2, k+3, . . . ,m und j = k+1, k+2, . . . , n die Koeffizientenin Bk+1 die folgenden Werte haben:

b′′i j := b′i j − b′i k+1 ·b′k+1 j

b′k+1 k+1

Beispiel: Die folgende Matrix A soll in eine obere Dreiecksform uberfuhrt werden:

A =

0 −2 42 1 01 0 22 0 3

• Vertausche die erste und die dritte Zeile, so dass an der Stelle a1 1 ein Koeffizient6= 0 steht:

1 0 22 1 00 −2 42 0 3

• Erzeuge an den Stellen a2 1 und a4 1 Nullen durch Typ-3-Umformungen mit der

ersten Zeile: 1 0 2

2− 2 · 1 1− 2 · 0 0− 2 · 20 −2 4

2− 2 · 1 0− 2 · 0 3− 2 · 2

=

1 0 20 1 −40 −2 40 0 −1

82

Page 83: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• An der Stelle a2 2 befindet sich ein Koeffizient 6= 0. Damit muss nur noch ander Stelle a2 3 eine Null erzeugt werden:

1 0 20 1 −40 −2− (−2) · 1 4− (−2) · (−4)0 0 −1

=

1 0 20 1 −40 0 −40 0 −1

• An der Stelle a4 4 muss eine Null erzeugt werden:

1 0 20 1 −40 0 −40 0 −1− 1

4· (−4)

=

1 0 20 1 −40 0 −40 0 0

Elementarmatrizen

Elementare Matrixumformungen kann man auch durch Multiplikation der umzu-formenden Matrix mit einer sogenannten Elementarmatrix beschreiben. Fur je-den Umformungstyp gibt es eine Elementarmatrix–Standardkonstruktion, so dassdie Multiplikation mit der Elementarmatrix auf der linken Seite die entsprecheneZeilenumformung und die Multiplikation mit der Elementarmatrix auf der rechtenSeite die entsprechene Spaltenumformung realisiert.

• Typ 1: Fur die Vertauschung der i-ten und der j-ten Zeile (Spalte) in einerMatrix A wird eine Matrix Ti j konstruiert, so dass die Multiplikation A′ =Ti j · A die Vertauschung der i-ten und der j-ten Zeile von A bewirkt und dieMultiplikation A′ = A ·Ti j die Vertauschung der i-ten und der j-ten Spalte vonA bewirkt.

Dazu muss Ti j die folgende Form haben:

Ti j =

1. . . 0

10 · · · → · · · 1... 1

...

↓ . . . ↑... 1

...1 · · · ← · · · 0

1

0. . .

1

←− i-te Zeile

←− j-te Zeile

83

Page 84: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• Typ 2: Fur die Multiplikation einer Zeile (Spalte) mit dem Faktor λ ineiner Matrix A wird eine Matrix Si λ konstruiert, so dass die MultiplikationA′ = Si λ · A die Multiplikation der i-ten Zeile von A mit λ bewirkt und dieMultiplikation A′ = A · Si λ die Multiplikation der j-ten Spalte von A mit λbewirkt.

Si λ =

1. . . 0

1

0. . .

1

←− i-te Zeile

• Typ 3: Man konstruiert eine Matrix Ki j λ, so dass die MultiplikationA′ = Ki j λ · A die Addition des λ-fachen der j-ten Zeile zur i-ten Zeile vonA bewirkt und die Multiplikation A′ = A ·Ki j λ die Addition des λ-fachen deri-ten Spalte zur j-ten Spalte von A bewirkt.

Ki j λ =

1. . . 0

. . .. . . λ

. . .

0. . .

1

←− i-te Zeile

↑j-te Spalte

5.8 Lineare Gleichungssysteme

Definition: Ein lineares Gleichungssystem (LGS) mit Koeffizienten in einem KorperK, mitmGleichungen und nUnbekannten wird durch eine MatrixA = (ai j)(i,j)∈m×n ∈M(m × n,K) und einem Spaltenvektor ~b ∈ Km reprasentiert und wie folgt als Gle-ichungssystem (∗) interpretiert:

a1 1 · x1 + a1 2 · x2 + . . . + a1n · xn = b1

a2 1 · x1 + a2 2 · x2 + . . . + a2n · xn = b2...

......

...am 1 · x1 + am 2 · x2 + . . . + amn · xn = bm

(∗)

Die Matrixreprasentation von linearen Gleichungssystemen hat den Vorteil, dass mandas Gleichungsystem (*) mit Hilfe des Matrixprodukts auch als eine Vektor–Gleichung

84

Page 85: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

beschreiben kann:

(∗) ⇐⇒ A ·

x1...xn

= ~b

Ein Tupel (x1, x2, . . . , xn) ∈ Kn ist also genau dann eine Losung des linearen Gleichungs-

systems, wenn A · ~x = ~b gilt, wobei ~x die Spaltenvektor–Darstellung des Tupels beze-ichnet.

Man bezeichnet mit (A |~b) die Erweiterung der Matrix A mit der zusatzlichen (n+1)-

ten Spalte ~b:

(A |~b) =

a1 1 · · · a1n b1...

. . ....

...am 1 · · · amn bm

Satz: Das lineare Gleichungssystem A · ~x = ~b ist genau dann losbar, wenn

rg A = rg(A |~b)

Beweis: rg A = rg(A | b)

⇔ Spaltenrang(A) = Spaltenrang(A | b)

⇔ ~b ∈ Lin

a1 1

...am 1

, . . .

a1n...

amn

⇔ ∃x1, . . . , xn ∈ K ~b = x1 ·

a1 1...

am 1

+ . . .+ xn ·

a1n...

amn

⇔ ∃x1, . . . , xn ∈ K A ·

x1...xn

=

b1...bn

Definition: Ein lineares Gleichungssystem A · ~x = ~b wird homogenes Gleichungssys-tem genannt, wenn der Vektor ~b der Nullvektor ist.

Jedes lineare Gleichungssystem hat ein assoziiertes homogenes Gleichungssystem,welches durch die Ersetzung des Vektors ~b durch den Nullvektor entsteht.

Definition: Die Losungsmenge eines linearen Gleichungssystems A · ~x = ~b ist dieVektormenge

Los(A,~b) = ~x | A · ~x = ~bSatz: Sei A ∈ M(m × n,K) die Matrix einer linearen Abbildung f : Kn → Km

bezuglich der Standardbasis und ~b ∈ Km, dann gilt:

85

Page 86: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

a) Die Losungsmenge Los(A,~0) ist gleich Ker f . Damit ist Los(A,~0) ein Unter-raum von Kn.

b) Sei ~x, ~y ∈ Los(A,~b), dann ist ~x− ~y ∈ Los(A,~0).

c) Sei ~x ∈ Los(A,~b) und ~z ∈ Los(A,~0), dann ist ~x+ ~z ∈ Los(A,~b).

Beweis:

a) Es genugt, die entsprechenden Definitionen anzuwenden:

Los(A,~0) = ~x | A · ~x = ~0= ~x | f(~x) = ~0= Ker f

b) Seien ~x, ~y ∈ Los(A,~b), dann gilt:

f(~x) = ~b und f(~y) = ~b

Daraus folgt:f(~x− ~y) = f(~x)− f(~y) = ~b−~b = ~0

Das heißt:~x− ~y ∈ Los(A,~0)

c) Seien ~x ∈ Los(A,~b) und ~z ∈ Los(A,~0 (m)), dann gilt:

f(~x) = ~b und f(~z) = ~0

Daraus folgt:f(~x+ ~z) = f(~x) + f(~z) = ~b+~0 = ~b

Das heißt:~x+ ~z ∈ Los(A,~b)

Beobachtung: Sei A ∈ M(m × n,K) die Matrix einer linearen Abbildung f :

Kn → Km bezuglich der Standardbasis, dann ist die Losungsmenge Los(A,~b) genau

dann nicht leer, wenn ~b ∈ Im f .

Gaußscher Algorithmus

Das folgende Losungsverfahren fur lineare Gleichungssysteme geht auf Carl FriedrichGauß zuruck. Es ist auch unter dem Namen Gauß–Elimination bekannt. Die Losungdes Gleichungssystems erfolgt dabei in drei Stufen. In der ersten Stufe wird durchEntwicklung einer oberen Dreiecksform und Rangbetrachtungen festgestellt, ob dasSystem uberhaupt eine Losung hat. Wenn die Antwort positiv ist, wird in der zweiten

86

Page 87: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Stufe eine spezielle Losung bestimmt. In der dritten Stufe werden alle Losungen desassoziierten homogenen Systems bestimmt und daraus die komplette Losungsmengegeneriert.

Sei ein Gleichungssystem der Form A · ~x = ~b mit A ∈ M(m × n,K) und ~b ∈ Km

gegeben.

a) Zur Uberprufung, ob das Gleichungssystem eine Losung hat, wird die MatrixA in obere Dreiecksform gebracht, aber dabei alle Zeilenumformungen auf dieerweiterte Matrix (A | b) angewendet.

Achtung: Spaltenvertauschungen in A bedeuten Variablenvertauschung imlinearen Gleichungssystem.

Sei das Ergebnis dieses ersten Schritts das System:

A′ =

a′1 1 ∗ ∗ · · · ∗ ∗ · · · ∗ b′1

0 a′2 2 ∗ · · · ∗ .... . .

... b′2

0 0 a′3 3. . .

......

. . .... b′3

......

. . . . . . ∗ .... . .

......

0 0 · · · 0 a′r r ∗ · · · ∗ b′r0 · · · · · · · · · 0 0 · · · 0 b′r+1...

. . . . . . . . ....

.... . .

......

0 · · · · · · · · · 0 0 · · · 0 b′m

• Fall 1: Falls mindestens einer der Werte b′r+1, b

′r+2, . . . , b

′m ungleich Null

ist, dann ist rg (A) < rg(A | b), und das System hat keine Losung. DasVerfahren wird abgebrochen.

• Fall 2: Falls b′r+1 = b′r+2 = . . . = b′m = 0, dann ist rg (A) = rg(A | b), undfolglich hat das System eine Losung.

b) Zur Bestimmung einer speziellen Losung werden die Zeilen (r+1) bism gestrichenund die Koeffizientenmatrix zwischen der r-ten und (r + 1)-ten Spalte in zweiTeilmatrizen T und S getrennt:

(T | S | b′) =

a′1 1 ∗ ∗ · · · ∗ ∗ · · · ∗ b′1

0 a′2 2 ∗ · · · ∗ .... . .

... b′2

0 0 a′3 3. . .

......

. . .... b′3

......

. . . . . . ∗ .... . .

......

0 0 · · · 0 a′r r ∗ · · · ∗ b′r

87

Page 88: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Das Gleichungssystem nimmt dadurch die folgende Gestalt an:

(T | S) ·

x1

x2...xrxr+1

...xn

= T ·

x1

x2...xr

+ S ·

xr+1

xr+2...xn

= ~b′

Man setzt xr+1 = xr+2 = . . . = xn = 0 und reduziert das System dadurch auf:

T ·

x1

x2...xr

= ~b′ ⇒

a′1 1 a′1 2 · · · a′1 r0 a′2 2 · · · a′2 r...

. . . . . ....

0 · · · 0 a′r r

·x1

x2...xr

=

b′1b′2...b′r

Die Werte von x1, x2, . . . , xr konnen nun direkt bestimmt werden:

b′r = a′r r · xr ⇒ xr = b′ra′r r

b′r−1 = a′r−1 r−1 · xr−1 + a′r−1 r · xr ⇒ xr−1 =b′r−1−a′r−1 r·xr

a′r−1 r−1

...

b′1 = a′1 1 · x1 + . . .+ a′1 r · xr ⇒ x1 =b′1−a′1 r·xr−...−a′1 2·x2

a′1 1

Somit wurde eine spezielle Losung des linearen Gleichungssystems berechnet,die im Weiteren mit ~v bezeichnet wird:

~v =

x1

x2...xrxr+1

...xn

=

x1

x2...xr0...0

c) Auf Grund der Voruberlegungen wissen wir, dass die Losungsmenge des homo-

genen Gleichungssystems ein Vektorraum der Dimension n− r ist. Man erhaltden j-ten Basisvektor dieses Raums (1 ≤ j ≤ n − r), indem die Variablenxr+1, . . . , xn jeweils mit den folgenden Werten belegt werden:

xr+j = 1 und xr+1 = . . . = xr+j−1 = xr+j+1 = . . . = xn = 0

88

Page 89: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Bezeichnet man die Koeffizienten der rechten Teilmatrix S durch

S = (si j)(i,j)∈r×(n−r)

so nimmt das Gleichungssystem die folgende Form an

(T | S)·

x1

x2...xrxr+1

...xn

=

a′1 1 a′1 2 · · · a′1 r0 a′2 2 · · · a′2 r...

. . . . . ....

0 · · · 0 a′r r

·x1

x2...xr

+

s1 1 . . . s1n−r...

. . ....

sr 1 . . . sr r

·xr+1

xr+2...xn

= ~0

Berucksichtigt man die speziellen Werte xr+j = 1 und xr+1 = . . . = xr+j−1 =xr+j+1 = . . . = xn = 0, ergibt sich das folgende lineare Gleichungssystem

a′1 1 a′1 2 · · · a′1 r0 a′2 2 · · · a′2 r...

. . . . . ....

0 · · · 0 a′r r

·x1

x2...xr

=

−s1 j

−s2 j...−sr j

Die Werte von x1, x2, . . . , xr konnen nun wie bei der speziellen Losung bestimmtwerden.

Das Verfahren muss fur alle n − r Spalten von S durchgefuhrt werden. Sei~uj der dabei berechnete j-te Basisvektor des Losungsraums des homogenenGleichungssystems.

Bleibt nur noch, die Losungsmenge des linearen Gleichungssystems aus derspeziellen Losung und der Losungsmenge des homogenen Systems zusammen-zusetzen:

Los(A | b) = Los(T |S | b′) =

~v +

n−r∑j=1

λj · ~uj | λ1, λ2, . . . , λn−r ∈ R

Beispiel: Gegeben sei das folgende Gleichungssystem:

2x2 + x3 − x4 = 6x1 − x2 + 2x3 = −1

2x1 + 5x3 = 3− x1 − x2 − 3x3 + 2x4 = −6

a) Die dazugehorige Matrix ist

(A | ~b) =

0 2 1 −1 61 −1 2 0 −12 0 5 0 3−1 −1 −3 2 −6

89

Page 90: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Diese Matrix muss zuerst in obere Dreiecksform uberfuhrt werden.

Erste und zweite Zeile vertauschen:1 −1 2 0 −10 2 1 −1 62 0 5 0 3−1 −1 −3 2 −6

In der ersten Spalte unter a1 1 Nullen erzeugen:

1 −1 2 0 −10 2 1 −1 60 2 1 0 50 −2 −1 2 −7

In der zweiten Spalte unter a2 2 Nullen erzeugen:

1 −1 2 0 −10 2 1 −1 60 0 0 1 −10 0 0 1 −1

Dritte und vierte Spalte tauschen, um an der Stelle a3 3 einen Wert 6= 0 zuerzeugen (Achtung: x3 ↔ x4):

1 −1 0 2 −10 2 −1 1 60 0 1 0 −10 0 1 0 −1

In der dritten Spalte unter a3 3 Nullen erzeugen:

1 −1 0 2 −10 2 −1 1 60 0 1 0 −10 0 0 0 0

Die Matrix hat nun obere Dreiecksform.

Es existiert eine Losung, da der untere Teil von ~b aus einer Null besteht. DieMatrix kann nun folgendermaßen reduziert werden: 1 −1 0 2 −1

0 2 −1 1 60 0 1 0 −1

Das lineare Gleichungssystem wird geteilt: 1 −1 0

0 2 −10 0 1

·x1

x2

x4

+

210

· (x3) =

−16−1

90

Page 91: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

b) Bestimmung der speziellen Losung: 1 −1 00 2 −10 0 1

·x1

x2

x4

=

−16−1

Wahle x3 = 0 und bestimme die ubrigen Variablen:

1 · x4 = −1 ⇒ x4 = −12 · x2 + (−1) · x4 = 6 ⇒ x2 = 2, 5

1 · x1 + (−1) · x2 + 0 · x4 = −1 ⇒ x1 = 1, 5

c) Bestimmung des ersten (und einzigen) Basisvektors von (A | ~0 (4)): 1 −1 00 2 −10 0 1

·x1

x2

x4

=

−2−1

0

Wahle x3 = 1 und bestimme die ubrigen Variablen:

1 · x4 = 0 ⇒ x4 = 02 · x2 + (−1) · x4 = −1 ⇒ x2 = −0, 5

1 · x1 + (−1) · x2 + 0 · x4 = −2 ⇒ x1 = −2, 5

d) Losungsmenge:

Los(A | b) =

1, 52, 50−1

+ λ ·

−2, 5−0, 5

10

∣∣∣∣∣∣∣∣ λ ∈ R

Quotientenraume

Wir haben gesehen, dass die Losungsmenge eines linearen Gleichungssystems inder Regel keinen Unterraum bildet, sondern eine “Verschiebung” eines Unterraumsist. Durch die folgende Begriffsbildung kann man eine etwas allgemeinere Sicht aufdiese Konstruktion gewinnen.

Definition: Sei V ein Vektorraum, U ein Unterraum von V und ~v ein Vektor aus V ,dann nennt man

~v + U = ~v + ~u | ~u ∈ U

die Nebenklasse von ~v bezuglich U .

91

Page 92: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Satz: Sei V ein Vektorraum, U ein Unterraum von V und ~v, ~w zwei Vektoren ausV , dann gilt:

~v + U = ~w + U ⇔ ~v − ~w ∈ U ⇔ ~w ∈ ~v + U

Definition: Sei V ein Vektorraum, U ein Unterraum von V und K der Korper vonV , dann bezeichnet man die Menge

V/U = ~v + U | ~v ∈ V

als Quotientenraum von V nach U .

Beobachtung: Der Quotientenraum V/U ist ein Vektorraum mit den Operationen

(~v + U) + (~w + U) = (~v + ~w) + U

λ · (~v + U) = (λ · ~v) + U

und dem neutralen Element ~0 + U = U.

U

w

v

λ v

+U

+U

+U

+U

w

v

(v+w)

Satz: Sei V ein Vektorraum, U ein Unterraum von V , dann ist

dim V/U = dim V − dim U

Beweis: Man definiert eine Abbildung ϕ : V → V/U durch

~v 7→ ~v + U

Die Abbildung ϕ ist linear und surjektiv (d.h. Im ϕ = V/U ) und Ker ϕ = U , denn

~v + U = U ⇐⇒ ~v ∈ U

Dann folgt aus der Dimensionsformel:

dim V = dim(Ker ϕ) + dim(Im ϕ) = dim U + dim V/U

Ist A ∈ M(m × n,K) eine Matrix und ~b ∈ Kn ein Spaltenvektor, dann ist dieLosungsmenge U = Los(A,~0) des homogenen Gleichungssystems ein Unterraum vonV = Kn.Die Losungsmenge Los(A,~b) des linearen Gleichungssystems A ·~x = ~b ist eine Neben-klasse von U . Die Menge der Losungsmengen bildet den Quotientenraum V/U , in

dem die Operationen die folgenden zusatzlichen Eigenschaften haben:

92

Page 93: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• Addition:

Ist Los(A,~b) = ~x+U und Los(A,~c) = ~y+U , dann ist (~x+~y)+U = Los(A,~b+~c)

• Multiplikation mit Skalaren:

Ist Los(A |~b) = ~x+ U und λ ∈ K, dann ist λ~x+ U = Los(A |λ~b)

5.9 Inverse Matrizen

Der Ring M(n× n,K)

Die (n × n)–Matrizen uber einem Korper K bilden einen Vektorraum und damiteine kommutative Gruppe bezuglich der Addition. Wie wir bereits wissen, ist dieMultiplikation von Matrizen aus M(n×n,K) assoziativ. Daruber hinaus gibt es mitder Einheitsmatrix En ein neutrales Element:

En =

1 0 · · · 0

0 1. . .

......

. . . . . ....

0 · · · · · · 1

∈M(n× n,K),

denn fur jede Matrix A ∈ M(n × n,K)) gilt En · A = A = A · En. Daaußerdem das Assoziativgesetz gilt, bilden die (n × n)–Matrizen einen sogenanntenRing. Diese Struktur ist ahnlich zu der eines Korpers, aber die Multiplikation istnicht notwendigerweise kommutativ und es muss nicht fur jedes nicht-Null Elementein inverses Element bezuglich der Multiplikation geben.

Definition: Sei A ∈M(n× n,K), dann ist A−1 die zu A inverse Matrix, wenn

A · A−1 = En = A−1 · A

Man nennt eine Matrix A invertierbar, wenn eine zu A inverse Matrix A−1 existiert.

Satz: Eine Matrix A ∈M(n× n,K) ist genau dann invertierbar, wenn rg A = n.

Beweis: Man beweist diesen Satz, indem man die Bijektion zwischen Matrizen undlinearen Abbildungen verwendet und dann die Dimensionsformel fur lineare Abbil-dungen anwendet. Ist f ∈ Hom(Kn, Kn) die zur Matrix A ∈M(n×n,K) assoziiertelineare Abbildung, dann gilt die folgende Kette von Aquivalenzen:

rg A = n ⇐⇒ dim(Im f) = n

⇐⇒ dim(Im f) = n und dim(Ker f) = 0

⇐⇒ f ist surjektiv und injektiv ⇐⇒ f ist bijektiv

⇐⇒ Es gibt fur f eine Umkehrfunktion g mit fg = IdKn und gf = IdKn

⇐⇒ Fur die zu g assoziierte Matrix B gilt AB = En und BA = En

⇐⇒ A ist invertierbar

93

Page 94: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Da man nun mit der Umwandlung in obere Dreiecksform ein einfaches Mittel zurVerfugung hat, das Entscheidungsproblem der Invertierbarkeit einer Matrix zu beant-worten, bleibt noch die Frage offen, wie man fur eine invertierbare Matrix A die in-verse Matrix berechnen kann.Wir werden dazu mehrere Verfahren kennen lernen. Zuerst uberlegen wir uns, wieman dieses Problem als lineares Gleichungssystem formulieren kann, danach werdenwir den Algorithmus zur Entwicklung der oberen Dreiecksform zu einem Verfahrenzur Matrixinvertierung modifizieren.

Bestimmung der inversen Matrix mit linearen Gleichungssystemen

Eine einfache Uberlegung zu der mit A assoziierten linearen Abbildung f fuhrt zueiner ersten, naiven Methode zum Invertieren einer Matrix. Wenn eine inverse Matrixexistiert, korrespondiert sie zur inversen linearen Abbildung f−1. Damit muss in derj-ten Spalte von A−1 das Bild des j-ten Basisvektors unter f−1 stehen, also derSpaltenvektor f−1(ej). Dieser Vektor ist aber gerade die (eindeutige!) Losung deslinearen Gleichungssystems A · ~x = ~ej. Man kann also die inverse Matrix durchLosung von n Gleichungssystemen bestimmen.

Bestimmung der inversen Matrix mit elementaren Umformungen

Dieses zweite Verfahren basiert auf einer Reihe von einfachen Beobachtungen:

a) Seien A,B,C ∈ M(n × n,K) Matrixen und A · B = C. Uberfuhrt man mitden gleichen elementaren Zeilenumformungen A in A′ und C in C ′ (B bleibtunverandert), so gilt A′ ·B = C ′.Begrundung: Jede Zeilenumformung kann durch Multiplikation von links miteiner entsprechenden Elementarmatrix ausgefuhrt werden:

A′ ·B = Dk · . . . ·D2 ·D1︸ ︷︷ ︸Elementarmatrizen

·A ·B = Dk · . . . ·D2 ·D1︸ ︷︷ ︸Elementarmatrizen

·C = C ′

b) Ist eine Matrix A ∈M(n× n,K) invertierbar, so kann man A mit elementarenZeilenumformungen in En uberfuhren.Begrundung: Da A den vollen Rang n hat, sind nach Uberfuhrung in eineobere Dreiecksform alle Diagonalelemente ungleich Null und man kann schrit-tweise mit Umformungen vom Typ 3 alle Elemente uber der Diagonale in Nullenverwandeln und letztlich mit Umformungen vom Typ 2 alle Diagonalelementein Einsen verwandeln.

c) Uberfuhrt man die Matrix A durch Zeilenumformungen in En und wendet diegleichen Umformungen auf En an, so erhalt man A−1.

Zur Begrundung wendet man die Beobachtung a) an. Wir betrachten die Folgevon Zeilenumformungen, die A in En uberfuhren. Sei X die Matrix, die mandurch Anwendung der gleichen Folge von Umformungen auf En erhalt. Wir

94

Page 95: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

wollen zeigen, dass X = A−1 ist. Das folgt aber aus der Anwendung von a) inder folgenden Situation:

A = A B = A−1 und C = En

Offensichtlich ist mit AB = C die Voraussetzung erfullt und wir haben

A A′ = En

C = En C ′ = X

Nach a) ist dann A′B = C ′, damit En · A−1 = X und letztlich A−1 = X.

Wir demonstrieren das beprochene Verfahren an einem Beispiel:

A =

1 2 01 1 20 −1 4

1 0 00 1 00 0 1

= En

1 2 00 −1 20 −1 4

1 0 0−1 1 00 0 1

1 2 0

0 −1 20 0 2

1 0 0−1 1 01 −1 1

1 0 4

0 −1 20 0 2

−1 2 0−1 1 01 −1 1

1 0 4

0 −1 00 0 2

−1 2 0−2 2 −11 −1 1

1 0 0

0 −1 00 0 2

−3 4 −2−2 2 −11 −1 1

En =

1 0 00 1 00 0 1

−3 4 −22 −2 1

0, 5 −0, 5 0, 5

= A−1

Probe: 1 2 01 1 20 −1 4

·−3 4 −2

2 −2 10, 5 −0, 5 0, 5

=

1 0 00 1 00 0 1

95

Page 96: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

5.10 Determinanten

Begriffseinfuhrung fur den Anwender

Definition: Die Determinante det A ist eine Kenngroße einer quadratischen Ma-trix A ∈M(n× n,K), die man rekursiv bestimmen kann:

• Fall 1: n = 1det (a1 1) = a1 1

• Fall 2: n > 1

Entwicklung nach der ersten Spalte:

det A =n∑i=1

(−1)i+1ai 1 · det Ai 1

Dabei ist Ai 1 die Matrix, die man aus A durch Streichen der i-ten Zeile undder ersten Spalte enthalt.

An Stelle der Schreibweise det A kann man die Matrix auch mit Betragsstrichenbegrenzen:

det

a1 1 · · · a1 n...

. . ....

an 1 · · · an n

=

∣∣∣∣∣∣∣a1 1 · · · a1 n

.... . .

...an 1 · · · an n

∣∣∣∣∣∣∣Beispiel: ∣∣∣∣∣∣∣∣

0 1 2 01 2 4 60 1 5 10 0 2 0

∣∣∣∣∣∣∣∣ = (−1)2+1 · 1 ·

∣∣∣∣∣∣1 2 01 5 10 2 0

∣∣∣∣∣∣= −

(1 ·∣∣∣∣5 12 0

∣∣∣∣− 1 ·∣∣∣∣2 02 0

∣∣∣∣)= − ((5 · 0− 2 · 1)− (2 · 0− 2 · 0))

= 2

Beobachtung: Fur die Spezialfalle n = 2 und n = 3 ergibt sich aus der angegebe-nen Formel ein einfaches Schema zur Bestimmung der Determinanten, die sogenannteRegel von Sarrus:

96

Page 97: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

∣∣∣∣a1 1 a1 2

a2 1 a2 2

∣∣∣∣ = a1 1 · a2 2 − a1 2 · a2 1∣∣∣∣∣∣a1 1 a1 2 a1 3

a2 1 a2 2 a2 3

a3 1 a3 2 a3 3

∣∣∣∣∣∣ = (a1 1 · a2 2 · a3 3 + a1 2 · a2 3 · a3 1 + a1 3 · a2 1 · a3 2)

− (a1 3 · a2 2 · a3 1 + a1 1 · a2 3 · a3 2 + a1 2 · a2 1 · a3 3)

Das Schema fur (3× 3)–Matrizen erhalt man, indem die erste und die zweite Spaltenoch einmal auf der rechten Seiten der Matrix angehangt werden:

a1 1 a1 2 a1 3 a1 1 a1 2

a2 1 a2 2 a2 3 a2 1 a2 2

a3 1 a3 2 a3 3 a3 1 a3 2

Alle Summanden mit positiven Vorzeichen ergeben sich dann als Produkte der Werteauf den Diagonalen von links oben nach rechts unten und alle Summanden mit neg-ativen Vorzeichen ergeben sich dann als Produkte der Werte auf den Diagonalen vonrechts oben nach links unten.

Achtung: Ab n = 4 funktioniert dieses Schema nicht mehr!

Begriffseinfuhrung fur den Mathematiker

Ublicherweise werden Determinanten durch den folgenden Satz eingefuhrt, dessenBeweis aber technisch sehr aufwandig ist.

Satz: Es gibt genau eine Abbildung det : M(n × n,K) → K mit den folgendenEigenschaften:

1. Die Abbildung det ist linear in jeder Zeile.

2. Wenn rg A < n, dann gilt det A = 0.

3. Fur die Einheitsmatrix En gilt: det En = 1.

Diese Abbildung lasst sich durch die am Anfang angegebene Entwicklungsformel bes-timmen.

Dabei bezieht sich der Begriff linear in jeder Zeile zu sein auf zwei Matrizen A undA′, die sich nur in einer (der i-ten) Zeile unterscheiden und an allen anderen Stellenidentisch sind:

A =

a1 1 · · · a1n

......

ai 1 · · · ai n...

...an 1 · · · ann

und A′ =

a1 1 · · · a1n

......

a′i 1 · · · a′i n...

...an 1 · · · ann

97

Page 98: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Die Determinante muss dann die folgenden Bedingungen erfullen:

det

a1 1 · · · a1n

......

ai 1 + a′i 1 · · · ai n + a′i n...

...an 1 · · · ann

= detA+detA′ und det

a1 1 · · · a1n

......

λai 1 · · · λai n...

...an 1 · · · ann

= λ·detA

Wir verzichten auf einen vollstandigen Beweis und werden nur einige Ideen ableiten,die sich unmittelbar aus den drei Eigenschaften ergeben. Zuerst untersuchen wir dasVerhalten bei elementaren Zeilenumformungen.

• Bei Typ 2 Umformungen, d.h. Multiplikation einer Zeile mit einem Skalar λ,folgt schon aus der ersten Eigenschaft, dass die Determinante der alten Matrix auchmit λ multipliziert werden muss.

• Jede Abbildung det mit den Eigenschaften 1) bis 3) ist invariant bei Zeilenum-formungen vom Typ 3, d.h. die Determinante bleibt bei solchen Umformungen gleich:

det

a1 1 · · · a1n...

...aj 1 · · · aj n...

...ai 1 + λaj 1 · · · ai n + λaj n

......

an 1 · · · ann

= det

a1 1 · · · a1n...

...aj 1 · · · aj n...

...ai 1 · · · ai n...

...an 1 · · · ann

+ det

a1 1 · · · a1n...

...aj 1 · · · aj n...

...λaj 1 λaj n

......

an 1 · · · ann

= detA+ 0

Dabei ist die zweite Determinante gleich Null, weil in der Matrix die j-te und die i-teZeile linear abhangig sind und folglich der Rang kleiner als n ist.

• Jede elementare Zeilenumformung vom Typ 1 (Vertauschung von zwei Zeilen)bewirkt die Anderung des Vorzeichens der Determinate bei gleichbleibendem Betrag.Man kann eine solche Umformung durch drei Umformungen vom Typ 3 und eineUmformung vom Typ 1 simulieren:

A(0) Beginn mit Matrix A

A(1) Zeile i := Zeile i+ Zeile j

A(2) Zeile j := Zeile j− Zeile i = − Zeile i von A

A(3) Zeile i := Zeile i+ Zeile j = Zeile j von A

A(4) Zeile j := (−1) · Zeile j = Zeile i von A

Die Umformungen (1) bis (3) sind vom Typ 3 und andern die Determinate nicht, dieletzte Umformung andert das Vorzeichen.

98

Page 99: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Folgerung: Die Determinante kann als Produkt der Diagonalelemente einer Matrixin oberer Dreiecksform berechnet werden, wobei man die Uberfuhrung in diese Formnur durch Zeilenumformungen realisieren und fur jeden Zeilentausch zusatzlich mit(-1) multiplizieren muss.

Beispiel:

A =

1 1 21 1 32 5 3

7→

1 1 20 0 10 3 −1

7→

1 1 20 3 −10 0 1

︸ ︷︷ ︸

Zeilentausch

und folglich ist det A = (−1) · 1 · 3 · 1 = −3.

Man beachte, dass wir bisher die Kernaussage des Satzes, namlich dass eine solcheAbbildung det uberhaupt existiert, noch nicht bewiesen haben, sondern nur unter derAnnahme, dass die Abbildung existiert, einige nutzliche Eigenschaften nachgewiesenhaben. Der Kernbeweis erfordert einigen technischen Aufwand, den wir hier vermei-den werden. Als Nebenprodukt ergibt sich dabei auch die Tatsache, dass die Deter-minante durch Entwicklung nach einer beliebigen Spalte oder nach einer beliebigenZeile berechnet werden kann:

det A =n∑i=1

(−1)i+kai kdet Ai k Entwicklung nach Spalte k

=n∑j=1

(−1)l+jal jdet Al j Entwicklung nach Zeile l

Die Regel, welches Vorzeichen fur welchen Summanden verwendet werden muss, kannman sich als Schachbrettmuster einpragen:

+ − + . . .− + − . . .+ − + . . ....

......

. . .

Wie das folgende Beispiel zeigt, kann man diese Eigenschaften sehr gut zur Ver-einfachung der Determinantenberechnung nutzen, indem man vorrangig nach Zeilenbzw. Spalten mit vielen Nullen entwickelt:∣∣∣∣∣∣∣∣

7 3 0 −12 4 0 58 −5 2 42 1 0 0

∣∣∣∣∣∣∣∣ = (−1)3+3 · 2 ·

∣∣∣∣∣∣7 3 −12 4 52 1 0

∣∣∣∣∣∣= 2 ·

(2 ·∣∣∣∣3 −14 5

∣∣∣∣− 1 ·∣∣∣∣7 −12 5

∣∣∣∣) = 2 · (2 · 19− 1 · 37) = 2

99

Page 100: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Letztlich kann man aus den oben genannten Fakten auch die folgende Beobachtungableiten.Folgerung: Die Determinanten einer Matrix A und der zu A transponierten MatrixAt sind gleich:

det A = det At

Anwendungen von Determinanten

Determinanten haben sich als ein außerst nutzliches Werkzeug fur vielfaltige Anwen-dungen (in der Linearen Algebra und daruber hinaus) erwiesen. Wir werden uns hiermit drei Anwendungsfeldern genauer beschaftigen:

1. Losung von (speziellen) linearen Gleichungssystemen (Cramersche Regel)

2. Geometrische Anwendungen

3. Invertierung von Matrizen

Cramersche Regel

Sei A ∈ M(n × n,K) eine Matrix mit rg A = n und ~b ∈ Kn ein Vektor. Dann hat

das lineare Gleichungssystem A · ~x = ~b eine eindeutige Losung, die man wie folgtbestimmen kann:

~x =

x1...xn

mit xi =det Aidet A

fur alle 1 ≤ i ≤ n

Dabei ist Ai die Matrix, die man erhalt, wenn man die i-te Spalte von A durch ~bersetzt.

Beispiel: Es ist die Losung des folgenden linearen Gleichungssystems zu bestimmen:

2x1 + 3x2 = 5x1 − 2x2 = 2

↔(

2 31 −2

)·(x1

x2

)=

(52

)Anwendung der Cramerschen Regel:

x1 =

∣∣∣∣5 32 −2

∣∣∣∣∣∣∣∣2 31 −2

∣∣∣∣ =−10− 6

−4− 3=

16

7

x2 =

∣∣∣∣2 51 2

∣∣∣∣∣∣∣∣2 31 −2

∣∣∣∣ =4− 5

−4− 3=

1

7

100

Page 101: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Geometrische Anwendungen I: Baryzentrische Koordinaten

Im Folgenden werden Punkte in der Ebene R2 und im Raum R3 betrachtet. Wirwerden die Punkte mit Großbuchstaben und die zugehorigen Ortsvektoren mit denentsprechenden Kleinbuchstaben bezeichnen.

Seien P,Q,R ∈ R2 drei Punkte in der Ebene, die nicht auf einer Geraden liegen,dann kann man den Ortsvektor ~t eines beliebigen Punkts T ∈ R2 eindeutig als Lin-earkombination

~t = a · ~p+ b · ~q + c · ~r mit a+ b+ c = 1

darstellen. Die Koeffizienten a, b und c nennt man die baryzentrischen Koordinatenoder auch Schwerpunktskoordinaten von T bezuglich P,Q und R. Man kann dieseKoordinaten als Losung eines linearen Gleichungssystems berechnen:

px · a+ qx · b+ rx · c = txpy · a+ qy · b+ ry · c = ty

a+ b+ c = 1

Die Voraussetzung, dass P,Q und R nicht auf einer Geraden liegen, sorgt dafur, dassdieses System eine eindeutige Losung hat, die man mit der Cramerschen Regel findenkann. Wir verwenden dazu eine spezielle Funktion, die wir mit pdet (abgekurzt furPunktdeterminante) bezeichnen:

pdet : R2 × R2 × R2 → R

pdet (~p, ~q, ~r) := det

px qx rxpy qy ry1 1 1

Aus der Cramerschen Regel ergeben sich die baryzentrischen Koordinaten wie folgt:

a =pdet(~t, ~q, ~r)

pdet(~p, ~q, ~r)b =

pdet(~p,~t, ~r)

pdet(~p, ~q, ~r)c =

pdet(~p, ~q,~t)

pdet(~p, ~q, ~r)

Eine wichtige Eigenschaft der baryzentrischen Koordinaten besteht darin, dass derPunkt T genau dann in dem von P,Q und R aufgespannten Dreieck liegt, wennalle baryzentrischen Koordinaten von T im Intervall [ 0 , 1 ] liegen. Der Punkt T liegtgenau dann auf dem Rand des Dreiecks, wenn eine baryzentrischen Koordinate gleichNull ist und die anderen beiden in [ 0 , 1 ] liegen.

Mit Hilfe der baryzentrischen Koordinaten kann man auch Bildverzerrungen wie dasin der Computergrafik verwendete Warping realisieren. Dabei wird vorausgesetzt,dass uber ein gegebenes Bild ein Dreiecksgitter gelegt ist und die verzerrte Abbil-dung der Gitterpunkte bekannt ist. Zu bestimmen ist, wohin die inneren Punkte derDreiecke abzubilden sind. Dazu berechnet man die baryzentrischen Koordinaten desabzubildenden Punktes T in einem Dreieck ∆(P,Q,R) und definiert den BildpunktT ′ als Punkt mit den gleichen baryzentrischen Koordinaten im verzerrten Dreieck∆(P ′, Q′, R′).

101

Page 102: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

T

R

Q

P

P’Q’

R’

T’

Geometrische Anwendungen II: Dreiecksflache und Volumen eines Sim-plexes

Seien ~p, ~q, ~r ∈ R2 die Ortsvektoren der Punkte P , Q und R, dann kann man ausder oben eingefuhrten Punktdeterminate die folgenden geometrischen Eigenschaftenablesen:

• Die Punkte P , Q und R liegen genau dann auf einer Linie, wenn

pdet(~p, ~q, ~r) = 0

• Der Punkt R liegt genau dann links von der gerichteten Geraden−→PQ, wenn

pdet(~p, ~q, ~r) > 0

• Der Punkt R liegt genau dann rechts von der gerichteten Geraden−→PQ, wenn

pdet(~p, ~q, ~r) < 0

• Die Flache des von P , Q und R aufgespannten Dreiecks betragt:∣∣∣∣pdet(~p, ~q, ~r)

2

∣∣∣∣Beispiel: P = (−3,−2), Q = (5, 3) und R = (14, 8) in R2:

P

Q

R

102

Page 103: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

pdet(~p, ~q, ~r) =

∣∣∣∣∣∣−3 5 14−2 3 81 1 1

∣∣∣∣∣∣ = −9 + 40− 28− 42 + 10 + 24 = −5 < 0

Daraus folgt, dass (14, 8) rechts von der gerichteten Geraden−−−−−−−−−→(−3,−2)(5, 3) liegt und

dass die Flache des von den drei Punkten aufgespannten Dreiecks 2, 5 betragt.

Diese Eigenschaften lassen sich auch auf hohere Dimensionen ubertragen. Seien P ,Q, R und S Punkte in R3, dann ist die Große∣∣∣∣∣∣∣∣

1

6· det

px qx rx sxpy qy ry sypz qz rz sz1 1 1 1

∣∣∣∣∣∣∣∣

das Volumen des von den vier Punkten aufgespannten Simplexes. Falls die vierPunkte auf einer Ebene liegen, ist der Wert 0.

Komplementarmatrix

Definition: Die zu einer Matrix A ∈ M(n × n,K) komplementare Matrix A =(ai j)(i,j)∈n×n ist wie folgt definiert:

ai j = (−1)i+j · det Aj i

Dabei ist Aj i die Matrix, die man aus A durch Streichen der j-ten Zeile und der i-tenSpalte enthalt.

Satz: A · A = (det A) · En

Beweis: Auf der Diagonalen von C := A · A steht immer det A, denn der Koeffizientci i kann leicht in die Entwicklung von det A nach der i–ten Zeile umgewandelt werden:

ci i =n∑k=1

ai k · ak i

=n∑k=1

ai k · (−1)k+i · det Ai k

= det(A)

Bei der Berechnung eines Koeffizienten ci j, der nicht auf der Diagonalen liegt, beginntman mit dem gleichen Ansatz, stellt dann aber fest, dass die Werte der Terme det Aj kuberhaupt nicht vom Inhalt der j-ten Zeile von A abhangen, d.h. wenn man aus Aeine Matrix A′ bildet, bei der die j–te Zeile durch die i–te Zeile ersetzt ist, erhaltman die gleiche Formel. In A′ gilt wegen der Identitat der i–ten und j–ten Zeilea′j k = a′i k = ai k. Auf diesem Umweg kommt man zur Entwicklung der Determinate

103

Page 104: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

von A′ nach der j–ten Zeile. Da aber A′ zwei identische Zeilen hat, ist det A′ = 0.

ci j =n∑k=1

ai k · ak j

=n∑k=1

ai k · (−1)k+j · det Aj k

=n∑k=1

(−1)k+j · a′j k · det A′j k

= det(A′) = 0

Folgerung: Ist det A 6= 0, dann ist A invertierbar und A−1 =A

det A.

Spezialfall: Fur A ∈M(2× 2, K) gilt:(a bc d

)−1

=1

ad− bc·(d −b−c a

)fur ad− bc 6= 0

Die Determinate eines Endomorphismus

Satz: Fur alle A,B ∈M(n× n,K) gilt:

det(A ·B) = det A · det B

Wir verzichten auf einen Beweis diese Satzes, wollen aber dafur eine wichtige Schlussfol-gerung ziehen.

Satz: Sei f : Kn → Kn ein Endomorphismus, A die zu f gehorende Matrixbezuglich der Standardbasis B1 und B eine zu f gehorende Matrix bezuglich eineranderen Basis B2, dann ist det A = det B.

Beweis: Sie C die Matrix, deren Spalten die Vektoren aus B2 sind. Damit beschreibtC die Abbildung des Basiswechsels von B1 nach B2 bezuglich der Standardbasis. DieMatrix C ist invertierbar und die inverse Matrix C−1 beschreibt den umgekehrtenBasiswechsel. Offensichtlich gilt nun:

C−1 · A · C = B.

Durch Anwendung des Satzes uber die Determinante des Matrixprodukts erhaltenwir:

det B = det (C−1) · det A · det C = det A · det (C−1 · C) = det A · det En = det A.

104

Page 105: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Folgerung: Man kann jedem Endomorphismus f : Kn → Kn eindeutig seine Deter-minante det f = det A zuordnen, wobei A die Abbildung f bezuglich einer beliebigenBasis reprasentiert.

Beispiel: Wir wollen die im Beweis beschriebene Methode zum Basiswechsel aneinem einfachen Beispiel nachvollziehen. Dazu betrachten wir als Endomorphismusf die Spiegelung des Raums R2 an der x–Achse. Wir wahlen

B1 =

(10

),

(01

)die Standardbasis und B2 =

(11

),

(1−1

)eine andere Basis.

Das hat den Vorteil, dass wir nicht nur die Matrix A kennen, sondern auch schonB, denn durch die Spiegelung an der x–Achse wird der erste Vektor von B2 auf denzweiten und der zweite Vektor von B2 auf den ersten abgebildet, d.h.

A =

(1 00 −1

)und B =

(0 11 0

)Damit kennen wir schon das Ergebnis, das eigentlich noch berechnet werden soll.

Wir wissen, dass C =

(1 11 −1

)ist und konnen C−1 durch die Komplementarmatrix

bestimmen:

C−1 =1

det C· C =

1

−2

(−1 −1−1 1

)=

(0.5 0.50.5 −0.5

)Durch Ausfuhrung der Matrixmultiplikation C−1 · A · C erhalt man tatsachlich dieoben dargestellte Matrix B.

5.11 Eigenwerte und Eigenvektoren

Diagonalisierbarkeit

Wir haben bereits im Zusammenhang mit inversen Matrizen die Auswirkungen einesBasiswechsels fur die Matrixdarstellung eines Endomorphismus kennengelernt, sinddabei aber noch nicht auf die Frage eingegangen, ob und wann ein solcher Basiswechseleigentlich sinnvoll ist. Der Nutzen eines Basiswechsels liegt sicherlich immer dann klarauf der Hand, wenn durch diesen Wechsel eine sehr einfache Matrix entsteht. Dastrifft insbesondere auf den folgenden Fall zu.

Definition: Ein Endomorphismus f ∈ Hom (V, V ) wird diagonalisierbar genannt,wenn eine Basis von V existiert, fur die die Matrixdarstellung A von f Diagonalgestalthat, d.h. wenn A außerhalb der Diagonalen nur Nullen hat. Eine solche Basis nenntman Diagonalbasis von f .

Zu den wesentlichen Vorteilen einer Diagonalmatrix A ∈ M(n × n,K) gehoren diefolgenden Aspekte:

• Das Bild eines beliebigen Vektors ~v ∈ V kann mit n Multiplikationen und n−1Additionen bestimmt werden.

105

Page 106: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

• Man kann die Determinante von A mit n− 1 Multiplikationen bestimmen unddamit auch entscheiden, ob A invertierbar ist.

• Falls A invertierbar ist, kann man A−1 mit n Divisionen berechnen.

Der Fakt, dass jeder Vektor ~v einer Diagonalbasis die Eigenschaft f(~v) = λ~v hat,fuhrt zur folgenden Begriffsbildung.

Definition: Ist f ∈ Hom (V, V ) ein Endomorphismus, ~v 6= ~0 ein Vektor aus V undλ ∈ K, so dass

f(~v) = λ~v

gilt, so wird ~v Eigenvektor von f zum Eigenwert λ genannt.

Lemma: Ist M = ~v1, ~v2, . . . , ~vr eine Menge von Eigenvektoren eines Endomor-phismus f zu paarweise verschiedenen Eigenwerten λ1, . . . , λr, so ist M linear un-abhangig.

Beweis durch Induktion nach r:Der Induktionsanfang fur r = 1 ist trivial, denn ein Eigenvektor ist nach Definitionnicht der Nullvektor und damit ist ~v1 linear unabhangig.Sei die Aussage wahr fur alle Mengen mit r Vektoren und sei M ′ = ~v1, ~v2, . . . , ~vr+1eine Menge von Eigenvektoren eines Endomorphismus f zu paarweise verschiedenenEigenwerten λ1, . . . , λr+1. Zu zeigen ist, dass jede Linearkombination

~0 = µ1~v1 + . . .+ µr~vr + µr+1~vr+1

trivial ist, d.h. dass µ1 = . . . = µr = µr+1 = 0 ist. Dazu betrachtet man dieAbbildung dieser Linearkombination unter f :

~0 = f(~0) = f(µ1~v1 + . . .+ µr~vr + µr+1~vr+1)

= µ1f(~v1) + . . .+ µrf(~vr) + µr+1f(~vr+1)

= µ1λ1~v1 + . . .+ µrλr~vr + µr+1λr+1~vr+1

Durch subtraktive Verknupfung dieser Gleichung mit der Gleichung

~0 = λr+1~0 = λr+1 (µ1~v1 + . . .+ µr~vr + µr+1~vr+1)

= µ1λr+1~v1 + . . .+ µrλr+1~vr + µr+1λr+1~vr+1

erhalt man

~0 = µ1(λ1 − λr+1)~v1 + . . .+ µr(λr − λr+1)~vr + µr+1 (λr+1 − λr+1)︸ ︷︷ ︸=0

~vr+1.

Da ~vr+1 in dieser Linearkombination verschwindet und nach Induktionsvoraussetzungdie Menge ~v1, ~v2, . . . , ~vr linear unabhangig ist, muss die Linearkombination trivialsein. Unter Berucksichtigung der Verschiedenheit der Eigenwerte ergibt sich

µ1 (λ1 − λr+1)︸ ︷︷ ︸6=0

= . . . = µr (λr − λr+1)︸ ︷︷ ︸6=0

= 0 =⇒ µ1 = . . . = µr = 0

106

Page 107: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

und daraus folgt auch µr+1 = 0, womit die Induktionsbehauptung bewiesen ist.

Folgerung: Ist dim V = n und der Endomorphismus f ∈ Hom (V, V ) hat n Eigen-werte, dann ist f diagonalsierbar.

Auf Grund des Lemmas bildet jede Menge von Eigenvektoren zu den n Eigenwerteneine Basis von V . Offensichtlich ist das eine Diagonalbasis, denn die zugehorigeMatrixdarstellung von f hat auf der Diagonalen die Eigenwerte und sonst nur Nullen.

Wie wir sehen werden, ist die Existenz von n Eigenwerten aber keine notwendigeVoraussetzung fur die Diagonalisierbarkeit.

Eigenraume

Sind ~v und ~w zwei Eigenvektoren von f ∈ Hom (V, V ) zum selben Eigenwert λ,dann ist auch jede (von ~0 verschiedene) Linearkombination aus ~v und ~w ein Eigen-vektor zum Eigenwert λ, mit anderen Worten bilden die Eigenvektoren zu λ zusam-men mit dem Nullvektor einen Unterraum von V . Da f(~v) = λ~v aquivalent ist zu(f − λ IdV ) (~v) = ~0, kann man diesen Unterraum auch als Kern des Endomorphismusf − λ IdV charakterisieren.

Definition: Ist λ ein Eigenwert von f ∈ Hom (V, V ), dann nennt man den Un-terraum Eλ := Ker (f − λ IdV ) den Eigenraum von λ. Die Dimension von Eλ wirdgeometrische Vielfachheit von λ genannt.

Satz: Ein Endomorphismus f ∈ Hom (V, V ) mit den Eigenwerten λ1, . . . , λr istgenau dann diagonalisierbar, wenn

r∑k=1

dim Eλk = dim V.

Beweis: Man verwendet das Lemma uber die lineare Unabhangigkeit von Eigen-vektoren zu verschiedenen Eigenwerten um zu zeigen, dass die Vereinigung der Basender Eigenraume Eλ1 , . . . , Eλr auch eine linear unabhangige Menge ist. Damit ist dieseVereinigung genau dann eine Basis von V , wenn sie n = dimV Elemente hat.

Wenn man alle Eigenwerte von f kennt, ist es nicht schwer, die Diagonalisierbarkeitvon f zu uberprufen, denn die Eigenraume zu den Eigenwerten λi sind die Kerneder Endomorphismen f − λi IdV . Es bleibt also zu klaren, wie man die Menge derEigenwerte von f bestimmen kann.

Charakteristisches Polynom

Definition: Sei V ein n–dimensionaler Vektorraum und f ∈ Hom (V, V ), dannnennt man die Determinante det (f − λ · IdV ) das charakteristische Polynom von f .Da wir wissen, dass die Determinante eines Epimorhismus auf V nicht von der Wahlder Basis von V abhangig ist, kann man das charakteristische Polynom von f auch alsdet (A− λ · En) definieren, wobei A eine Matrixdarstellung von f fur eine beliebig

107

Page 108: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

gewahlte Basis von V ist. Das charakteristische Polynom ist ein Polynom vom Gradn mit der Unbekannten λ und wird mit Pf (λ) bezeichnet.

Satz: Sei V ein n–dimensionaler Vektorraum und f ∈ Hom (V, V ). Ein Element αdes Korpers ist genau dann Eigenwert von f , wenn es Nullstelle des charakteristischenPolynoms Pf (λ) ist.

Beweis: Wie wir bereits wissen, ist ein α genau dann ein Eigenwert von f , wennes einen (von ~0 verschiedenen!) Eigenvektor zu α gibt, d.h. wenn der EigenraumEα = Ker (f − α · IdV ) mindestens Dimension 1 hat. Nach Dimensionsformel giltdann:

dim (Im (f − α · IdV )) = dim V − dim (Ker (f − α · IdV )) ≤ n− 1

Da ein Endomorphismus genau dann vollen Rang hat, wenn seine Determinante un-gleich 0 ist, kann man obige Bedingung aquivalent in det (f − α · IdV ) = 0 umwan-deln und damit ist α Nullstelle des charakteristischen Polynoms.

Beispiel:

Fur den durch die Matrix A =

1 0 20 −1 22 0 1

gegebenen Endomorphismus f sollen

alle Eigenwerte und Basen der jeweiligen Eigenraume bestimmt werden.

• Charakteristisches Polynom:

Pf (λ) = det (A− λ · En) = det

1− λ 0 20 −1− λ 22 0 1− λ

= −λ3 + λ2 + 5λ+ 3

• Nullstellen des charakteristischen Polynoms:λ1 = −1 (eine doppelte Nullstelle) und λ2 = 3 (einfache Nullstelle)

• Basis des Eigenraums E−1:

Dazu betrachtet man den Kern der Matrix (A− (−1)En) =

2 0 20 0 22 0 2

.

Da der Rang dieser Matrix 2 ist, hat der Kern nur Dimension 1 und offensichtlich

ist der Vektor

010

ein Basisvektor des Kerns.

• Basis des Eigenraums E3:

Dazu betrachtet man den Kern der Matrix (A− 3En) =

−2 0 20 −4 22 0 −2

.

108

Page 109: Vorlesung Logik, Diskrete Mathematik und Lineare Algebra · 5 Lineare Algebra 51 5.1 Einfuhrung: Anschauliche Vektorrechnung . . . . . . . . . . . . . . . 51 ... Die Grundlagen der

Da der Rang dieser Matrix 2 ist, hat der Kern nur Dimension 1 und offensichtlich

ist der Vektor

212

ein Basisvektor des Kerns.

• Schlussfolgerung: Da die Summe der Eigenraumdimensionen kleiner als 3 ist,ist die Abbildung f nicht diagonalisierbar.

109