hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de...

75
Diskrete Mathematik A HP Butzmann Vorlesung im FSS 2010

Transcript of hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de...

Page 1: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Diskrete Mathematik A

HP Butzmann

Vorlesung im FSS 2010

Page 2: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Inhaltsverzeichnis

1 Lineare Programmierung 2

2 Elementare Zahlentheorie 42

3 Polynome 54

4 Endliche Korper 67

1

Page 3: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Kapitel 1

Lineare Programmierung

Vorbemerkung Auch in diesem Kapitel werden, wie in der Linearen Program-mierung ublich, die Elemente des Rn als Spaltenvektoren dargestellt.

Beispiele 1.1

(i) In einem Unternehmen werden Produkte P1, . . . , Pn hergestellt. Dafur ste-hen Rohstoffe R1, . . . , Rk zur Verfugung, und zwar bj Einheiten vom RohstoffRj (j = 1, . . . , k). Zur Herstellung des Produkts Pi werden ai,j Einheiten desRohstoffs Rj benotigt. Der Verkauf einer Einheit Pi bringt einen Gewinn von ci.Dann ist ein Produktionsplan gesucht, der den Gewinn maximiert. Werden nunxi Einheiten von Pi produziert, dann muss gelten:∑n

i=1 ai,jxi ≤ bj fur j = 1, . . . , k

xi ≥ 0 fur i = 1, . . . , n

und der Gewinnn∑i=1

cixi

soll maximiert werden.

(ii) Ein Unternehmen stellt ein Produkt in den Fabriken F1, . . . , Fk her und liefertes in die Stadte S1, . . . , Sn. In der Fabrik Fi konnen pro Tag hochstens αi Einhei-ten hergestellt werden, in der Stadt Sj werden pro Tag wenigstens βj Einheitenbenotigt. Die Kosten des Transports einer Einheit von Fi nach Sj betragen γi,j.Gesucht ist ein Produktionsplan, der die Kosten minimiert.

Es sei xi,j die Anzahl der Einheiten, die von der Fabrik Fi in die Stadt Sj geliefertwerden soll. Dann muss offenbar gelten:∑n

j=1 xi,j ≤ αi fur alle 1 ≤ i ≤ k∑ki=1 xi,j ≥ βj fur alle 1 ≤ j ≤ n

xi,j ≥ 0 fur alle i, j

2

Page 4: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

und es soll ∑i,j

γi,jxi,j

unter diesen Nebenbedingungen minimiert werden.

Diese Beispiele kann man auf das folgende Problem zuruckfuhren:

Definition 1.2 Es seien (ai,j) ∈ M(k, n,R) und c = (c1, . . . , cn)t ∈ Rnsowieb = (b1, . . . , bk)

t ∈ Rk. Ein Lineares Programm (LP) ist die Aufgabe, einMinimum (oder Maximum) der folgenden Menge zu finden:

L =

c1x1 + · · ·+ cnxn :

a1,1x1 + · · ·+ a1,nxn ≤ b1...

ap,1x1 + · · ·+ ap,nxn ≤ bpap+1,1x1 + · · ·+ ap+1,nxn = bp+1

......

...ak,1x1 + · · ·+ ak,nxn = bkx1, . . . , xn ≥ 0

Die Bedingungen

a1,1x1 + · · ·+ a1,nxn ≤ b1...

......

ap,1x1 + · · ·+ ap,nxn ≤ bpap+1,1x1 + · · ·+ ap+1,nxn = bp+1

......

...ak,1x1 + · · ·+ ak,nxn = bkx1, . . . , xn ≥ 0

heißen die Nebenbedingungen des Linearen Programms und

M =

(x1, . . . , xn) ∈ Rn :

a1,1x1 + · · ·+ a1,nxn ≤ b1...

......

ap,1x1 + · · ·+ ap,nxn ≤ bpap+1,1x1 + · · ·+ ap+1,nxn = bp+1

......

...ak,1x1 + · · ·+ ak,nxn = bkx1, . . . , xn ≥ 0

heißt der zulassige Bereich des Linearen Programms.

Schließlich nennt man die Abbildung

x 7→ ctx

die Zielfunktion.

3

Page 5: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Ein Punkt x∗ ∈ Rn heißt Losung des LPs wenn x∗ zulassig ist, wenn also x∗ ∈Mgilt, und wenn gilt

ctx∗ ≤ ctx fur alle x ∈M

bzw.ctx∗ ≥ ctx fur alle x ∈M

Man sagt, das Lineare Programm hat Standardform, wenn p = k gilt, wennalso keine Gleichheitsbedingungen vorliegen und es hat kanonische Form, wennp = 0 gilt, wenn also keine Ungleichungen vorliegen.

Man beachte, dass man die Bedingung

k∑i=1

ξi,j ≥ βj

in 1.1 in der Formk∑i=1

−ξi,j ≤ −βj

formulieren kann.

Offenbar kann man jedes LP in ein Standardprogramm uberfuhren, denn es giltja

ap+1,1x1 + · · ·+ ap+1,nxn = bp+1

genau dann, wenn gelten

ai,1x1 + · · ·+ ai,nxn ≤ bi und (−ai,1)x1 + · · ·+ (−ai,n)xn ≤ −bi

so dass man jede Gleichheits-Nebenbedingung durch zwei Ungleichheits-Neben-bedingungen ersetzen kann.

Interessanter ist die Tatsache, dass man ein beliebiges Programm in ein kanoni-sches Programm uberfuhren kann. Dazu fuhrt man sogenannte Schlupfvariableein. Setzt man

L =

ctx : x ≥ 0,

a1,1x1 + · · ·+ a1,nxn ≤ b1...

......

ap,1x1 + · · ·+ ap,nxn ≤ bpap+1,1x1 + · · ·+ ap+1,nxn = bp+1

......

...ak,1x1 + · · ·+ ak,nxn = bk

4

Page 6: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

dann gilt offenbar

L =

ctx : x ∈ Rn, u ∈ Rp, x, u ≥ 0,

a1,1x1 + · · ·+ a1,nxn + u1 = b1...

......

ap,1x1 + · · ·+ ap,nxn + up = bpap+1,1x1 + · · ·+ ap+1,nxn = bp+1

......

...ak,1x1 + · · ·+ ak,nxn = bk

Ein Lineares Programm besteht also in der Aufgabe, eine lineare Abbildung vonRn nach R (namlich x 7→ ctx) unter (linearen) Nebenbedingungen zu maximierenoder zu minimieren. Die beiden Aufgaben sind naturlich sehr verwandt, dennwenn K ⊆ Rn und c ∈ Rn gilt, folgt:

min{ctx : x ∈ K} = −max{(−c)tx : x ∈ K}

Also gibt es zu jedem Ergebnis uber ein Minimumproblem ein entsprechendesuber ein Maximumproblem.

Die folgende Definition erlaubt es, viele Lineare Programme einfacher zu formu-lieren:

Definition 1.3 Fur alle x = (x1, . . . , xn)t, y = (y1, . . . , yn)t ∈ Rn definiere man

x ≤ y ⇐⇒ xi ≤ yi fur alle i

Bemerkung 1.4 ≤ ist eine Ordnung auf Rn, d.h. es gelten fur alle x, y, z ∈ Rn:

x ≤ x (Reflexivitat)x ≤ y und y ≤ x⇒ x = y (Antisymmetrie)x ≤ y und y ≤ z ⇒ x ≤ z (Transitivitat)

Offenbar gilt fur n ≥ 2 weder e1 ≤ e2 noch e2 ≤ e1, also kann man in der Regelzwei Elemente nicht vergleichen. (Die Ordnung ist nicht linear.)

Bezeichnungsweise 1.5 Es seien A = (ai,j) ∈ M(n, k,R), b ∈ Rk und c ∈ Rn,dann schreibt man

min ctxbez. Ax ≤ b

x ≥ 0

bzw.max ctxbez. Ax ≤ b

x ≥ 0

5

Page 7: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

fur ein Standardprogramm und

min ctxbez. Ax = b

x ≥ 0

bzw.max ctxbez. Ax = b

x ≥ 0

fur ein kanonisches Programm.

Zur Motivation der folgenden Begriffe betrachte ich fur n = 2 das LP

max c1x1 + c2x2bez. Ax ≤ b

x ≥ 0

Dieses kann man auf die folgende Weise graphisch losen:

Es sei K der zulassige Bereich und die Gerade die Menge aller Punkte Gconst ={(x1, x2) : a1x1 + a2x2 = const} mit einer festen Konstanten const.

K

PPPPPPPPPPP����

QQQQQQQ@

@@@@@@@@@@@@@c1x1 + c2x2 = const

(x∗1, x∗2)

Wenn nun Gconst ∩ K 6= ∅ gilt, ist const. der Funktionswert eines zulassigenVektors. Also muss man const so wahlen, dass const moglichst groß ist, aberGconst ∩ K 6= ∅ gilt, und dadurch erhalt man die Parallele der Geraden durch(x∗1, x

∗2):

6

Page 8: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

K

PPPPPPPPPPP����

QQQQQQQ

@@@@@@@@@@@@@@@@

c1x1 + c2x2 = const

(x∗1, x∗2)

Also wird in (x∗1, x∗2) das Maximum der Zielfunktion angenommen und ihr Wert

ist der der entsprechenden Konstante const.

Die Frage ist nun, welche Ideen man hieraus fur den allgemeinen Fall ableitenkann. Nun (x∗1, x

∗2) ist eine “Ecke” von K. Die Frage ist also, wie man eine “Ecke”

analytisch beschreibt. Und das ist einer der Punkte der nachsten Definition:

Definition 1.6

(i) Es seien x, y ∈ Rn, dann heißt

[x, y] = {x+ t(y − x) : 0 ≤ t ≤ 1}

die Verbindungsgerade zwischen x und y.

(ii) Eine Menge K ⊆ Rn heißt konvex, wenn fur alle x, y ∈ K gilt [x, y] ⊆ K,wenn also die Verbindungsgerade von je zwei Punkten aus K wieder in K liegt.

(iii) Es sei K ⊆ Rn konvex. Ein Punkt x ∈ K heißt Extremalpunkt von K,wenn fur alle y, z ∈ K und 0 < α < 1 aus x = αy+(1−α)z stets folgt x = y = z,d.h. wenn x nicht im Inneren der Verbindungsgerade von zwei verschiedenenPunkten aus K liegt. Die Menge aller Extremalpunkte von K wird mit exKbezeichnet.

Extremalpunkte von zulassigen Bereichen werden in der Tat auch Ecken genannt.

Beispiele 1.7

(i) Alle Intervalle sind konvex.

(ii) Es seien A ∈M(k, n,R) und b ∈ Rk. Dann sind die Mengen

K(A, b) = {x ∈ Rn : x ≥ 0, Ax = b} = {x ∈ L(A, b) : x ≥ 0}

7

Page 9: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

undM(A, b) = {x ∈ Rn : x ≥ 0, Ax ≤ b}

sowie{Ax : x ≥ 0}

konvex.

(iii) Fur alle a < b giltex[a, b] = {a, b}

undex(a, b) = ∅

(iv) Fur alle a ∈ R gilt:

ex[a,∞) = {a} und ex(−∞, a] = {a}

(v) Es seien a < b und c < d sowie K = [a, b] × [c, d] ⊆ R2. Dann ist K konvexund es gilt

exK = {(a, c), (a, d), (b, c), (b, d)}(vi) in (ii) gelte 0 ∈ K(A, b) oder 0 ∈ M(A, b). Dann gilt 0 ∈ exK(A, b) bzw.0 ∈ exM(A, b).

(vii) Es seiS = {x ∈ Rn : ‖x‖ ≤ 1}

Dann ist S konvex und es gilt

ex S = {x ∈ Rn : ‖x‖ = 1}

Beweis Ich beweise nur einen Teil der Aussagen, die restlichen Beweise sindUbungsaufgaben oder verlaufen ahnlich.

(iii) Es sei I = [a, b] ein Intervall.

Behauptung I ist konvex.Beweis Es gelte x, y ∈ I und 0 ≤ α ≤ 1, dann gilt

αx+ (1− α)y ≤ αb+ (1− α)b = b

undαx+ (1− α)y ≥ αa+ (1− α)a = a

also αx+ (1− α)y ∈ I.

Behauptung ex I = {a, b}.Beweis “⊆”: Es sei x ∈ I \ {a, b}, dann gilt a < x < b, also gibt es ein ε > 0 sodass gilt x± ε ∈ I und es folgt

x =1

2(x+ ε) +

1

2(x− ε)

8

Page 10: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

also gilt x /∈ ex I.

“⊇” Ich zeige, dass a ∈ ex I gilt: Es gelte a = αy + (1 − α)z mit y, z ∈ I und0 < α < 1. Angenommen, y > a, dann folgt

a = αy + (1− α)z > αa+ (1− α)a = a

und daraus ein Widerspruch. Also gilt y = a und aus

a = αy + (1− α)z = αa+ (1− α)z

folgt (1− α)a = (1− α)z und daraus z = a.

(v) Die Konvexitat beweist man wie eben.

“⊆“: Es seien (x1, x2) ∈ K und a < x1 < b, dann gibt es ein ε > 0 so dass giltx1 ± ε ∈ [a, b]. Dann folgt (x1 + ε, x2), (x1 − ε, x2) ∈ K und

1

2(x1 + ε, x2) +

1

2(x1 − ε, x2) = (x1, x2)

also gilt (x1, x2) /∈ exK, wenn a < x1 < b gilt. Analog zeigt man, dass (x1, x2) /∈exK gilt, wenn c < x2 < d gilt.

“⊇“: Ich zeige, dass (a, c) ∈ exK gilt: Es gelte (a, c) = α(y1, y2) + (1− α)(z1, z2)mit (y1, y2), (z1, z2) ∈ K und 0 < α < 1. Dann folgt y1, z1 ∈ [a, b] und a =αy1 + (1 − α)z1. Wegen a ∈ ex[a, b] folgt daraus y1 = z1 = a. Analog gilty2 = z2 = c und daher (y1, y2) = (z1, z2) = (a, c).

(vi) Ich beweise, dass 0 ∈ exK(A, b) gilt, wenn 0 ∈ K(A, b) gilt: Es gelte0 = αy + (1 − α)z mit y, z ∈ K(A, b) und 0 < α < 1. Dann gilt y, z ≥ 0und es folgt 0 = αyi + (1− α)zi fur alle i. Da 0 ∈ ex[0,∞) gilt, folgt yi = zi = 0fur alle i, d.h. y = z = x. �

Offenbar ist K(A, b) der zulassige Bereich des LPs

min ctxbez. Ax = b

x ≥ 0

und M(A, b) ist der zulassige Bereich des LPs

min ctxbez. Ax ≤ b

x ≥ 0

Also besagt 1.7 dass die zulassigen Bereiche dieser LPe konvex sind.

9

Page 11: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Wie 1.7 auch zeigt, kann die Menge der Extremalpunkte einer Menge leer oderaber auch unendlich sein. Die im Zusammenhang mit der Linearen Program-mierung wesentliche Eigenschaft von Extremalpunkten ist die Tatsache, dassexK(A, b) und M(A, b) endlich sind und dass ein losbares kanonisches oderStandard-LP auch eine Losung aus exK(A, b) bzw. exM(A, b) besitzt. Daherist es prinzipiell moglich, so ein LP in endlich vielen Schritten zu losen (indemman z.B. alle Extremalpunkte abklappert). Aber um das zu beweisen, muss manein wenig arbeiten. Ich beginne mit einer Charakterisierung der Extremalpunktevon K(A, b):

Proposition 1.8 Es seien A = (a1, . . . , an) ∈M(k, n,R) und b ∈ Rk. Ein Punktx ∈ K(A, b) ist genau dann ein Extremalpunkt von K(A, b), wenn die Vektoren(ai)xi 6=0 linear unabhangig sind.

Beweis Es sei x = (x1, . . . , xn)t ∈ K(A, b). Ich nehme oBdA an, dass giltx1, . . . , xp 6= 0 und xp+1 = · · · = xn = 0, dann ist zu zeigen, dass genau dannx ∈ exK(A, b) gilt, wenn a1, . . . , ap linear unabhangig sind.

Es gilt x ∈ K(A, b) genau dann, wenn gilt

x1a1 + · · ·+ xnan = b

Es gelte zunachst x ∈ exK(A, b) und α1a1 + · · · + αpap = 0. Man wahle ε > 0und setze βi = εαi. Dann gilt β1a1 + · · · + βpap = 0. Weiterhin wahle man ε sodass gilt

|βi| ≤ min{x1, . . . , xp}

Setzt man noch βi = 0 fur i = p + 1, . . . , n und β = (β1, . . . , βn)t, dann giltx+ β ∈ K(A, b) und x− β ∈ K(A, b) und weiterhin x = 1

2(x+ β) + 1

2(x− β) und

daher x ∈ [x + β, x − β]. Da x ein Extremalpunkt ist, folgt β = 0 und darausα1 = · · · = αp = 0. Also sind die Vektoren a1, . . . , ap linear unabhangig.

Umgekehrt seien a1, . . . , ap linear unabhangig und es gelte x = αy+ (1−α)z mit0 < α < 1 und y, z ∈ K(A, b). Dann folgt

xi = αyi + (1− α)zi fur alle i

und daher fur alle i ≥ p+ 1:

0 = αyi + (1− α)zi

Wegen yi, zi ≥ 0 erhalt man dann yi = zi = 0 fur alle i ≥ p+ 1. Es folgt

y1a1 + · · ·+ ypap = y1a1 + · · ·+ ynan = b = z1a1 + · · ·+ znan = z1a1 + · · ·+ zpap

und daraus(y1 − z1)a1 + · · ·+ (yp − zp)ap = 0

10

Page 12: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Aus der linearen Unabhangigkeit von a1, . . . , ap folgt dann yi = zi fur alle i ≤ pund daraus y = z. Aus x = αy+ (1−α)z folgt dann unmittelbar, dass y = z = xgilt.

Es ist vielleicht nutzlich, den Fall p = 0 noch einmal anzuschauen, obgleich erformal im obigen Beweis enthalten ist. Es gilt p = 0 genau dann, wenn gilt{i : xi 6= 0} = ∅, d.h. x = 0. Dann ist (xi)xi 6=0 als leere Menge von Vektorenlinear unabhangig, also muss x = 0 ∈ exK(A, b) gelten. Aber das ist der Inhaltvon 1.7(vi). �

Korollar 1.9 K(A, b) besitzt nur endlich viele Extremalpunkte.

Beweis Fur alle x ∈ Rn sei

I(x) = {i : xi 6= 0}

Ich behaupte, dass fur alle x, y ∈ exK(A, b) gilt:

I(x) = I(y)⇒ x = y

Beweis OBdA gelte I(x) = {1, . . . , p}, dann folgt

x1a1 + · · ·+ xpap = x1a1 + · · ·+ xnan = b = y1a1 + · · ·+ ynan = y1a1 + · · ·+ ypap

Nach 1.8 sind die Vektoren a1, . . . , ap linear unabhangig, also folgt xi = yi furalle i ≤ p und daher fur alle i. Da es nur endlich viele Teilmengen von {1, . . . , n}gibt, ist exK(A, b) also ebenfalls endlich. �

Proposition 1.10 Es seien A = (a1, . . . , an) ∈ M(k, n,R) und b ∈ Rk. WennK(A, b) nicht leer ist, besitzt die Menge einen Extremalpunkt.

Beweis Fur x ∈ Rn setze man wieder

I(x) = {i : xi 6= 0}

Man wahle ein x ∈ K(A, b), so dass I(x) minimal ist, d.h. es gibt kein y ∈ K(A, b),so dass gilt I(y) ⊂ I(x). Ich behaupte, dass x ∈ exK(A, b) gilt:

Falls I(x) = ∅ gilt, folgt x = 0 ∈ K(A, b) und nach 1.7(vi).

Also gelte I(x) 6= ∅ und oBdA gelte x1, . . . , xp 6= 0 und xp+1 = · · · = xn =0. Nach 1.8 muss ich zeigen, dass a1, . . . , ap linear unabhangig sind: Also gelteα1a1 + · · · + αpap = 0 und αk > 0 fur ein k. Dann folgt εα1a1 + · · · + εαpap = 0fur alle ε und daraus

b = x1a1 + · · ·+ xnan = x1a1 + · · ·+ xpap = (x1 − εα1)a1 + · · ·+ (xp − εαp)ap

11

Page 13: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Setzt man nunε = min{xi

αi: αi > 0}

undy = (x1 − εα1, . . . , xp − εαp, 0, . . . , 0)

dann gilt y ∈ K(A, b) und I(y) ⊂ I(x), also ein Widerspruch. �

Interessanterweise kann man 1.10 benutzen, um zu beweisen, dass ein losbaresLP auch eine Losung besitzt, die ein Extremalpunkt des zulassigen Bereichs ist:

Satz 1.11 Wenn das LPmin ctxbez. Ax = b

x ≥ 0

losbar ist, gibt einen Punkt x ∈ exK(A, b), der das LP lost.

Beweis Es seien x∗ ∈ K(A, b) eine Losung des LPs, dann setze man µ∗ = ctx∗.Es folgt

µ∗ ≤ ctx fur alle x ∈ K(A, b)

Man setze

A =

(Act

)und b =

(bµ∗

)Dann gilt

Ax∗ =

(Ax∗

ctx∗

)=

(bµ∗

)= b

und daher x∗ ∈ K(A, b). Also gilt K(A, b) 6= ∅. Nach 1.10 gibt es ein x0 ∈exK(A, b). Ich zeige, dass x0 ∈ exK(A, b) gilt: Es gelte x0 = αy + (1− α)z mit0 < α < 1 und y, z ∈ K(A, b). Dann folgt

µ∗ = ctx0 = αcty + (1− α)ctz

Wegen cty, ctz ∈ [µ∗,∞) und µ∗ ∈ ex[µ∗,∞) folgt cty = ctz = µ∗ und daraus

y, z ∈ K(A, b). Da x0 ein Extremalpunkt von K(A, b) ist, folgt y = z = x0. �

Beispiel 1.12 Man betrachte das LP

min 3x1 − x2bez. x1 + x2 + x3 = 2

2x1 + x2 + x4 = 3x1, x2, x3, x4 ≥ 0

12

Page 14: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Setzt man

a1 =

(12

), a2 =

(11

), a3 =

(10

), a4 =

(01

)und

A = (a1, a2, a3, a4) =

(1 1 1 02 1 0 1

)sowie b = (2, 3)t und c = (3,−1, 0, 0)t, dann hat das LP die Form

min ctxbez. Ax = b

x ≥ 0

Wenn das LP losbar ist, gibt es nach 1.11 eine Losung, die ein Extremalpunkt vonK(A, b) ist. Zur Berechnung dieser Extremalpunkte muss man linear unabhangigeVektoren ai1 , . . . aip betrachten und das LGS

xi1ai1 + · · ·+ xipaip = b

losen. Wenn diese Losung nicht-negativ ist, bekommt man einen Extremalpunktvon K(A, b), wenn man diesen Vektor mit Nullen auffullt. Und alle Extemalpunk-te erhalt man auf diese Weise. Da b offenbar kein Vielfaches eines der Spalten-vektoren ist, muss in allen Fallen p = 2 gelten. Da je zwei Spaltenvektoren vonA linear unabhangig sind, muss man also fur i < j das LGS

xiai + xjaj = b

oder(ai, aj)X = b

losen.

i = 1, j = 2 :

x1 x21 1 22 1 3

−→ x1 x2

1 1 20 −1 −1

Die Losung ist (x1, x2)

t = (1, 1)t und daher ist (1, 1, 0, 0)t ein Extremalpunkt vonK(A, b).

i = 1, j = 3 :

x1 x31 1 22 0 3

−→ x1 x3

1 1 20 −2 −1

Die Losung ist (x1, x3)

t = (3/2, 1/2)t und daher ist (3/2, 0, 1/2, 0)t ein Extremal-punkt von K(A, b).

i = 1, j = 4 :

x1 x41 0 22 1 3

−→ x1 x4

1 0 20 1 −1

13

Page 15: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Die Losung ist (x1, x4)t = (2,−1)t, man erhalt also keinen Extremalpunkt von

K(A, b).

i = 2, j = 3 :

x2 x31 1 21 0 3

−→ x2 x3

1 1 20 −1 1

Die Losung ist (x2, x3)

t = (3,−1)t und daher erhalt man auch hier keinen Extre-malpunkt von K(A, b).

i = 2, j = 4 :

x2 x41 0 21 1 3

−→ x2 x4

1 0 20 1 1

Die Losung ist (x2, x4)

t = (2, 1)t und daher ist (0, 2, 0, 1)t ein Extremalpunkt vonK(A, b).

i = 3, j = 4 :

x3 x41 0 20 1 3

Die Losung ist (x3, x4)

t = (2, 3)t und daher ist (0, 0, 2, 3)t ein Extremalpunkt vonK(A, b).

Also gilt

exK(A, b) =

1100

,

3/20

1/20

,

0201

,

0023

Wenn das LP eine Losung hat, ist einer dieser Punkte eine Losung. Nun gilt

ct

1100

= (3,−1, 0, 0)

1100

= 2, ct

3/20

1/20

= (3,−1, 0, 0)

3/20

1/20

= 9/2

ct

0201

= (3,−1, 0, 0)

0201

= −2, ct

0023

= (3,−1, 0, 0)

0023

= 0

Also ist x∗ = (0, 2, 0, 1)t ein Kandidat fur die Losung des LPs und −2 ware derminimale Wert der Zielfunktion.

Die Frage der Losbarkeit dieses LPs werde ich in 1.27 beantworten.

14

Page 16: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Um ein Standardprogrammmin ctxbez. Ax ≤ b

x ≥ 0

in ein kanonisches LP zu ubertragen, braucht man ja Schlupfvariable, man be-trachtet also das LP

min ctxbez. Ax+ u = b

x, u ≥ 0

Matrizentechnisch gesehen heißt dieses LP

min ctx

bez. (A, Ik)

(xu

)= b(

xu

)≥ 0

und daher ist der zulassige Bereich dieses LPs K((A, Ik), b).

Der Beweis des folgenden Lemmas ist recht technisch und langlich, allerdings ankeine Stelle wirklich kompliziert:

Lemma 1.13 Es seien A ∈ M(k, n,R) und b ∈ Rk. Man setze A = (A, Ik).Dann gelten fur alle x ∈ Rn, u ∈ Rk:

(i) Aus

(xu

)∈ K(A, b) folgt x ∈M(A, b) und u = b− Ax.

(ii) Aus x ∈M(A, b) folgt

(x

b− Ax

)∈ K(A, b).

(iii) Es sei

(x0u0

)∈ exK(A, b), dann gilt x0 ∈ exM(A, b).

(iv) Es sei x0 ∈ exM(A, b). Dann gilt

(x0

b− Ax0

)∈ exK(A, b).

Beweis

(i) Aus

(xu

)∈ K(A, b) folgt x ≥ 0 und u ≥ 0 sowie

b = A

(xu

)= (AIk)

(xu

)= Ax+ u

und daraus u = b− Ax sowie Ax ≤ b, da u ≥ 0 und daher x ∈M(A, b).

15

Page 17: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

(ii) Es gelte x ∈ M(A, b), dann folgt Ax ≤ b und daher u = b − Ax ≥ 0. Manerhalt:

A

(xu

)= Ax+ u = b

(iii) Es gelte

(x0u0

)∈ exK(A, b), dann folgt

(x0u0

)∈ K(A, b) und daraus

x0 ∈ M(A, b) nach (i). Um zu zeigen, dass x0 ein Extremalpunkt von M(A, b)ist, seien y, z ∈M(A, b) sowie 0 < α < 1. Es gelte

x0 = αy + (1− α)z

Man setze v = b− Ay und w = b− Az ≥ 0, dann gilt

(yv

),

(zw

)∈ K(A, b)

nach (ii). Weiterhin gilt

αv + (1− α)w = α(b− Ay) + (1− α)(b− Az)

= b− (αAy + (1− α)Az)

= b− A(αy + (1− α)z)

= b− Ax0= u0

und daher

α

(yv

)+ (1− α)

(zw

)=

(αy + (1− α)zαv + (1− α)w

)=

(x0u0

)

Da

(x0u0

)ein Extremalpunkt von K(A, b) ist, folgt

(yv

)=

(zw

)=

(x0u0

)und daraus y = z = x0.

(iv) Es sei x0 ∈ exM(A, b). Man setze u0 = b−Ax0, dann gilt

(x0u0

)∈ K(A, b)

nach (ii). Es gelte (x0u0

)= α

(yv

)+ (1− α)

(zw

)

mit

(yv

),

(zw

)∈ K(A, b) und 0 < α < 1. Dann folgt y, z ∈ M(A, b) nach

(i) und x0 = αy + (1 − α)z. Da x0 ein Extremalpunkt von M(A, b) ist, folgt

16

Page 18: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

y = z = x0. Aus (i) folgt dann schließlich v = b − Ay = b − Ax0 = u0 undw = b− Az = b− Ax0 = u0 nach (i), also(

yv

)=

(zw

)=

(x0u0

)�

Proposition 1.14 Wenn das LP

min ctxbez. Ax ≤ b

x ≥ 0

losbar ist, gibt es einen Punkt x ∈ exM(A, b), der das LP lost.

Beweis Offenbar ist das LP

min ctxbez. Ax+ u = b

x, u ≥ 0

losbar. Man setze wieder A = (A, Ik). Dann ist das LP

min ctx

bez. A

(xu

)= b

x, u ≥ 0

losbar. Nach 1.11 gibt es einen Punkt

(x∗

u∗

)∈ K(A, b), der dieses LP lost, also

lost

(x∗

u∗

)das LP

min ctxbez. Ax+ u = b

x, u ≥ 0

lost. Dann lost x∗ das LPmin ctxbez. Ax ≤ b

x ≥ 0

und nach 1.13 ist x∗ ein Extremalpunkt von K(A, b). �ex lp 1

17

Page 19: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Beispiel 1.15 Man betrachte das LP

min 3x1 − x2bez. x1 + x2 ≤ 2

2x1 + x2 ≤ 3x1, x2 ≥ 0

Der zulassige Bereich:

@@@@@@@@@@@@@@

AAAAAAAAAAAAAAAAAAAAA

(1, 1)

(0, 0)

(0, 2)

(3/2, 0)

Mit

A =

(1 12 1

), b =

(23

), c =

(3−1

)liegt das LP

min ctxbez. Ax ≤ b

x ≥ 0

vor. Die Einfuhrung von Schlupfvariablen fuhrt zu dem LP

min ctxbez. Ax+ u = b

x, u ≥ 0

und mit

A = (A, I2) =

(1 1 1 02 1 0 1

)18

Page 20: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

erhalt man das LPmin ctx

bez. A

(xu

)= b

x, u ≥ 0

Dies ist aber gerade das Beispiel 1.12. Danach gilt:

exK(A, b) =

1100

,

3/20

1/20

,

0201

,

0023

Nach 1.13 folgt dann:

exK(A, b) =

{(11

),

(3/20

),

(02

),

(00

)}Weiterhin ist x∗ =

(02

)der einzige Kandidat fur eine Losung des Losung des

vorgegebenen LPs. Beides entspricht offenbar der obigen Skizze.

Wie oben erklart, ist eine einfache graphische Deutung des Resultats moglich: DieMenge alle Punkte, in denen die Zielfunktion den Wert γ annimmt, ist offenbar

{(x1, x2) : 3x1 − x2 = γ}

also eine Gerade. Also ist eine Gerade gesucht, die den zulassigen Bereich schnei-det mit minimalem Wert der Zielfunktion.

@@@@@@

@@

@@@@

AAAAAAAAAAAAAAAAAA

(1, 1)

(0, 0)

(0, 2)

(3/2, 0)

����������������������

�����

γ = 0

�������������

�������������

γ = −2

19

Page 21: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Damit haben wir das erste Ziel erreicht: Wenn ein LP losbar ist, gibt es einenExtremalpunkt, der das LP lost, und es gibt nur endlich viele Extremalpunkte.Diese bekommt man, indem man ein linear unabhangige Spaltenvektoren betrach-tet und ein lineares Gleichungssystem lost. Allerdings ist diese Prozedur in dieserForm nur fur kleine LPe praktikabel: Nehmen wir an, es gilt rg(A) = k, danngibt es maximal

(nk

)Extremalpunkte, und diese Zahl wird fur großes n und nicht

so großes k sehr groß. Daher ist es notwendig, ein Verfahren zu finden, dass dieseProzedur moglichst abkurzt.Das im Folgenden vorgestellte sogannte Simplexverfahren hat die merkwurdigeEigenschaft, dass es in der Regel einigermaßen schnell funktioniert, obgleich esim schlechtesten Fall alle Ecken abklappert (und damit naturlich extrem langsamist). Es ist einer dieser in der Numerik gelegentlich eintretende Fall, dass einVerfahren “in der Praxis” sehr gut funktioniert, obgleich man nicht genau weiß,warum. Ein typisches weiteres Verfahren dieses Typs ist das Newton-Verfahren.Zur Erklarung des Simplex-Verfahrens beginne ich mit einer

Vorbemerkung 1.16 Es seien wieder A = (a1, . . . , an) ∈ M(k, n,R), b ∈ Rk

und c ∈ Rn. Man betrachte das LP

min ctxbez. Ax = b

x ≥ 0

und es sei x ∈ exK(A, b), d.h. x sei eine Ecke. Nach 1.8 sind dann die Vektoren(ai)xi 6=0 linear unabhangig und man kann sie zu einer Basis des SpaltenraumsL({a1, . . . , an}) erganzen. Ich nehme an, {a1, . . . , ap} sei so eine Basis. Dann giltx ≥ 0, xi = 0 fur alle i ≥ p+ 1 und

x1a1 + · · ·+ xpap = b

Weiter gibt es fur alle j > p reelle Zahlen αj,i so dass gilt

aj =

p∑i=1

αj,iai

In einem Simplex-Schritt wird nun x durch eine andere Ecke x′ ersetzt, wobeinur ein Basisvektor ausgetauscht wird, d.h. es gibt 1 ≤ s ≤ p < r ≤ n so dassgilt x′s = 0 und x′i = 0 fur alle i ≥ p + 1, i 6= r. Um r und s zu finden betrachteman ein r ≥ p + 1 Weiter sei y = (y1, . . . , yn)t ∈ Rn und es gelte yi = 0 fur aller ≥ p+ 1, i 6= r. Dann gilt

n∑i=1

yiai =

p∑i=1

yiai + yrar =

p∑i=1

yiai + yr(

p∑i=1

αr,iai) =

p∑i=1

(yi + αr,iyr)ai

20

Page 22: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Nun gilt y ∈ K(A, b) genau dann, wenn gilt y ≥ 0 und∑n

i=1 yiai = b =∑p

i=1 xiai.Da {a1, . . . , ap} eine Basis ist, erhalt man

y ∈ K(A, b) ⇔ y ≥ 0 und xi = yi + αr,iyr fur alle i ≤ p

also

y ∈ K(A, b) ⇔ y ≥ 0 und yi = xi − αr,iyr fur alle i ≤ p

und daher

y ∈ K(A, b) ⇔ yr ≥ 0 und yi = xi − αr,iyr ≥ 0 fur alle i ≤ p

Weiterhin gilt:

cty =∑n

i=1 ciyi

=∑p

i=1 ci(xi − αr,iyr) + cryr

=∑p

i=1 cixi −∑p

i=1 ciαr,iyr + cryr

= ctx− (∑p

i=1 ciαr,i − cr)yr

Man setze δr =∑p

i=1 ciαr,i − cr, dann gibt es drei Falle:

1. Fall δr ≤ 0Dann kann man den Wert der Zielfunktion nicht verkleinern, indem man ar gegeneinen der Vektoren a1, . . . , ap austauscht.

2. Fall δr > 0, αr,i ≤ 0 fur alle 1 ≤ i ≤ pDann gilt yi = xi − αr,iyr ≥ 0 fur alle yr ≥ 0 und daher y ≥ 0 fur alle yr ≥ 0.Dann gilt aber

cty = ctx− δryr −→yr→∞ −∞

und die Zielfunktion ist auf K(A, b) nicht nach unten beschrankt. In diesem Fallist das LP nicht losbar.

3. Fall δr > 0, αr,ν > 0 fur ein 1 ≤ ν ≤ pEs sei yr ≥ 0, dann gilt

y ≥ 0 ⇐⇒ yi ≥ 0 fur alle i ≤ p

⇐⇒ xi − αr,iyr ≥ 0 fur alle i ≤ p

⇐⇒ αr,iyr ≤ xi fur alle i ≤ p

⇐⇒ yr ≤xiαr,i

fur alle αri > 0

Setzt man alsoyr = min{ xi

αr,i: αr,i > 0}

21

Page 23: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

dann gilt y ≥ 0. Schließlich wahle man ein 1 ≤ s ≤ p so dass gilt αr,s > 0 undyr = xs

αr,s. Man definiere nun x′ ∈ Rn durch:

x′i =

xi −

αr,iαr,s

xs 1 ≤ i ≤ p

xsαr,s

i = r

0 p+ 1 ≤ i ≤ n, i 6= r

dann gilt x′ ∈ K(A, b). Weiterhin gilt x′s = 0. Wegen ar =∑p

i=1 αr,iai undαr,s 6= 0, ist

{a1, . . . , as−1, ar, as+1, . . . , an}

nach dem Austauschlemma (LA , 4.15) eine Basis des Spaltenraums und es folgtx′ ∈ exK(A, b).

Schließlich gilt

ctx′ = ctx− δrxsαr,s

Also gilt ctx′ < ctx genau dann, wenn gilt xs > 0.

Also ist das LP im 2. Fall nicht losbar, im 3. Fall erhalt man in der Regel eineEcke mit kleinerem Funktionswert der Zielfunktion. Bleibt die Frage, was im 1.Fall los ist, wenn es also nicht moglich ist, dass durch einen Austauschschrittder Wert der Zielfunktion zumindest nicht vergroßert wird. Und das ist nun derspringende Punkt des Verfahrens: In diesem Fall ist x eine Losung des LPs:

Lemma 1.17 Mit den Bezeichnungen von 1.16 gelte δj ≤ 0 fur alle p+ 1 ≤ j ≤n, dann ist x eine Losung des LPs.

Beweis Es sei y ∈ K(A, b), dann gilt∑pi=1 xiai = b =

∑ni=1 yiai =

∑pi=1 yiai +

∑ni=p+1 yi(

∑pj=1 αi,jaj)

=∑p

i=1 yiai +∑n

i=p+1

∑pj=1 yiαi,jaj

=∑p

i=1 yiai +∑n

j=p+1

∑pi=1 yjαj,iai

=∑p

i=1 yiai +∑p

i=1

∑nj=p+1 yjαj,iai

=∑p

i=1(yi +∑n

j=p+1 yjαj,i)ai

und daher fur alle 1 ≤ i ≤ p:

xi = yi +n∑

j=p+1

yjαj,i

22

Page 24: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

also

yi = xi −n∑

j=p+1

yjαj,i

Dies ergibt:

cty =∑n

i=1 ciyi =∑p

i=1 ci(xi −∑n

j=p+1 yjαj,i) +∑n

i=p+1 ciyi

=∑p

i=1 cixi −∑n

j=p+1

∑pi=1 ciyjαj,i +

∑nj=p+1 cjyj

= ctx−∑n

j=p+1(∑p

i=1 ciαj,i − cj)yj= ctx−

∑nj=p+1 δjyj

≥ ctx �

Damit kann man einen Simplex-Schritt beschreiben:

Proposition 1.18 (Simplex-Schritt) Es seien A = (a1, . . . , an) ∈M(k, n,R), b ∈Rk und c ∈ Rn Weiter seien x ∈ exK(A, b) eine Ecke, {ai : i ∈ I} eine zugehori-ge Basis, d.h. es gelte xi = 0 fur alle i /∈ I und J = {1, . . . , n} \ I. Weitergelte:

aj =∑i∈I

αj,iai fur alle j ∈ J

Fur alle j ∈ J setze man

δj =∑i∈I

ciαj,i − cj

Dann gelten:

(i) Wenn δj ≤ 0 fur alle j ∈ J gilt, ist x eine Losung des LPs

min ctxbez. Ax = b

x ≥ 0

(ii) Es gebe ein j ∈ J mit δj > 0 und αj,i ≤ 0 fur alle i ∈ I, dann hat das LPkeine Losung.

(iii) Es gebe ein r ∈ J und j ∈ I mit δr > 0 und αr,j > 0, dann wahle man eins ∈ I mit αr,s > 0 so dass gilt

xsαr,s

= min{ xiαr,i

: i ∈ I, αr,i > 0}

Man definiere weiterhin x′ ∈ Rn durch

x′i =

xi − αr,i

αr,sxs i ∈ I

xsαr,s

i = r

0 i ∈ J, i 6= r

23

Page 25: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Dann gilt x′ ∈ exK(A, b), I ′ = {ai : i ∈ I, i 6= s}∪{ar} ist eine zugehorige Basisund es gilt

ctx′ = ctx− δrxsαr,s

Zusatz Setzt man I ′ = (I \ {s}) ∪ {r}, J ′ = {1, . . . , n} \ I ′ und

a′j =∑i∈I′

α′j,iai fur alle j ∈ J ′

sowieδ′j =

∑i∈I′

ciα′j,i − cj

Dann gelten fur alle i ∈ I ′, j ∈ J ′:

α′s,r = 1αr,s

α′s,i = −αr,iαr,s

i 6= r

α′j,r =αj,sαr,s

j 6= s

α′j,i = αj,i − αj,sαr,s

αr,i j 6= s, i 6= r

sowie

δ′s = − δrαr,s

δ′j = δj − αj,sαr,s

δr j 6= s

Beweis Fur alle j ∈ J gilt

aj =∑i∈I

αj,iai

also insbesondere

ar =∑i∈I

αr,iai =∑

i∈I,i 6=s

αr,iai + αr,sas

und daher

as =1

αr,s(ar −

∑i∈I,i 6=s

αr,iai) = −∑

i∈I,i 6=s

αr,iαr,s

ai +1

αr,sar

Es folgt

α′s,i =

{1αr,s

i = r

−αr,iαr,s

i ∈ I ′, i 6= r

24

Page 26: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Weiterhin gilt fur alle j ∈ J :

aj =∑

i∈I αj,iai =∑

i∈I,i 6=s αj,iai + αj,sas

=∑

i∈I,i 6=s αj,iai −∑

i∈I,i 6=sαj,sαr,s

αr,iai +αj,sαr,s

ar

=∑

i∈I,i 6=s(αj,i −αj,sαr,s

αr,i)ai +αj,sαr,s

ar

Es folgt fur alle j ∈ J ′, j 6= s:

α′j,i =

{αj,i − αj,s

αr,sαr,i i 6= r

αj,sαr,s

i = r

Schließlich gilt fur alle j ∈ J ′, j 6= s:

δ′j =∑i∈I′

ciα′j,i − cj =

∑i∈I′,i 6=r

ciα′j,i + crα

′j,r − cj

=∑

i∈I′,i 6=r

ci(αj,i −αj,sαr,s

αr,i) + crαj,sαr,s− cj

=∑

i∈I,i 6=s

ciαj,i −∑

i∈I,i 6=s

ciαj,sαr,s

αr,i + crαj,sαr,s− cj

=∑i∈I

ciαj,i − csαj,s −∑i∈I

ciαj,sαr,s

αr,i + csαj,s + crαj,sαr,s− cj

=∑i∈I

ciαj,i − cj −αj,sαr,s

(∑i∈I

ciαr,i − cr)

= δj −αj,sαr,s

δr

sowieδ′s =

∑i∈I′

ciα′s,i − cs = −

∑i∈I′,i 6=r

ciαr,iαr,s

+crαr,s− cs

= − 1

αr,s(∑

i∈I′,i 6=r

ciαr,i + csαr,s − cr)

= − 1

αr,s(∑i∈I

ciαr,i − cr)

= − 1

αr,sδr �

Definition 1.19 Die Hintereinanderausfuhrung mehrerer Simplex-Schritte nenntman das Simplex-Verfahren.

Die Ecken des zulassigen Bereichs eines LPs nennt man auch Basislosungen.

Eine schnelle Konsequenz aus 1.18 ist:

25

Page 27: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Korollar 1.20 Wenn beim Simplex-Verfahren keine ausgearteten Ecken entste-hen, d.h. wenn fur jede Iteration x die Menge {ai : xi 6= 0} eine Basis desSpaltenraums ist, bricht das Verfahren ab.

Beweis Wenn Fall (ii) in 1.18 nicht auftritt, wird nach 1.18 der Wert der Ziel-funktion in jedem Schritt verkleinert, wenn keine ausgearteten Ecken entstandensind. Da es nur endlich viele Ecken gibt, bricht das Verfahren ab. �

Die Tabellarisierung des Simplex-Verfahrens geschieht folgendermaßen: Es seien

I = {i1, . . . , ip} und J = {j1, . . . , jq}

Dann betrachtet man das folgende Tableau:

j1 j2 . . . r . . . jqi1 αj1,i1 αj2,i1 . . . αr,i1 · · · αjq ,i1 xi1i2 αj1,i2 αj2,i2 . . . αr,i2 · · · αjq ,i2 xi2...

......

......

......

...s αj1,2 αj2,s . . . αr,s . . . αjq ,s xs...

......

......

......

...ip αj1,ip αj2,ip . . . αr,ip · · · αjq ,ip xip

δj1 δj2 . . . δr . . . δjq ctx

Fall 1 Es gilt δjν ≤ 0 fur 1 ≤ ν ≤ q, dann ist x eine Losung.

Fall 2 Andernfalls wahle man ein r mit δr > 0.

Fall 2a Es gilt αr,iµ ≤ 0 fur alle 1 ≤ µ ≤ p. Dann hat das LP keine Losung.

Fall 2b Andernfalls erganze man das Tableau durch diexiµαr,µ

, fur die αr,µ > 0 gilt

und bestimme s so dass gilt

xsαr,s

= min{ xiαr,i

: αr,i > 0}

Man nennt dann αr,s das Pivot-Element, die Zeile, in der es steht, die Pivot-Zeile und die Spalte, in der es steht, die Pivot-Spalte. Das neue Tableau erhaltman dann folgendermaßen:

a) Man vertauscht r und s.

b) Man ersetzt αr,s durch1

αr,s.

c) Alle weiteren Elemente der Pivot-Zeile ersetzt man durch ihr1

αr,s- faches.

d) Alle weiteren Elemente der Pivot-Spalte ersetzt man durch ihr − 1

αr,s- faches.

26

Page 28: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

e) Alle ubrigen Elemente ersetzt man Nach der sogenannten Rechteck-Regel:

αr,s bc d

Man ersetzt d durch d− bc

αr,s.

Diese Regeln gelten auch fur die letzte Zeile und letzte Spalte des Tableaus.

Also ist das Verfahren selbst im Gegensatz zu seiner Herleitung ziemlich einfach!!

Beispiel 1.21 Man betrachte das LP

min −30x1 − 12x2bez. 3x1 + x2 ≤ 90

2x1 + x2 ≤ 754x1 + 3x2 ≤ 210x1, x2 ≥ 0

Durch die Einfuhrung von Schlupfvariablen erhalt man das LP:

min −30x1 − 12x2bez. 3x1 + x2 + x3 = 90

2x1 + x2 + x4 = 754x1 + 3x2 + x5 = 210x1, x2, x3, x4, x5 ≥ 0

Setzt man also

A =

3 1 1 0 02 1 0 1 04 3 0 0 1

und

b = (90, 75, 210)t und c = (−30,−12, 0, 0, 0)t

dann ist das folgende LP zu losen:

min ctxbez. Ax = b

x ≥ 0

Offenbar ist x = (0, 0, 90, 75, 210)t eine Basislosung des LPs und es gelten: I ={3, 4, 5}, J = {1, 2} und weiterhin

a1 = (3, 2, 4)t = 3a3 + 2a4 + 4a5

sowiea2 = (1, 1, 3)t = 1a3 + 1a4 + 3a5

27

Page 29: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

undδ1 = c3α1,3 + c4α1,4 + c5α1,5 − c1 = 30δ2 = c3α2,3 + c4α2,4 + c5α2,5 − c2 = 12

und schließlichctx = 0

Damit erhalt man das folgende Ausgangstableau:

1 23 3 1 904 2 1 755 4 3 210

30 12 0

Man wahlt die erste Spalte als Pivot-Spalte und fugt in der letzten Spaltexjα1,j

fur α1,j > 0 hinzu:1 2

3 3 1 90 304 2 1 75 37.55 4 3 210 52.5

30 12 0

Also wird die 1. Zeile die Pivot-Zeile. Im folgenden Diagramm ist das Pivot-Element fett geschrieben:

1 23 3 1 90 304 2 1 75 37.55 4 3 210 52.5

30 12 0

Der Simplex-Schritt ergibt dann:

3 21 1/3 1/3 304 −2/3 1/3 155 −4/3 5/3 90−10 2 −900

Die einzige mogliche Pivot-Spalte ist die zweite, ich erganze sie:

3 21 1/3 1/3 30 904 −2/3 1/3 15 455 −4/3 5/3 90 54−10 2 −900

28

Page 30: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

also wird die 2. Zeile die Pivot-Zeile:

3 21 1/3 1/3 304 −2/3 1/3 155 −4/3 5/3 90−10 2 −900

Der Simplex-Schritt ergibt:

3 41 1 −1 152 −2 3 455 2 −5 15−6 −6 −990

Also bricht das Simplex-Verfahren mit der Losung x = (15, 45, 0, 0, 15) des mo-difizierten LP ab und daher lost x = (15, 45) das LP und der minimale Wert derZielfunktion ist -990.

Bemerkung 1.22 Um mit dem Simplex-Verfahren beginnen zu konnen, brauchtman eine Ecke des zulassigen Bereichs. Dabei gibt es einige Varianten. Am Ein-fachsten ist der folgende Fall: Man betrachte das LP

min ctxbez. Ax ≤ b

x ≥ 0

mit b ≥ 0. (Dies ist in okonomischen Anwendungen oft gegeben, da b Material-oder Vorratsschranken beschreibt.) Durch Einfuhrung von Schlupfvariablen erhaltman das LP

min ctxbez. Ax+ u = b

x, u ≥ 0

und ein zugehoriges Anfangstableau hat die Form:

1 . . . nn+ 1 α1,1 . . . αn,1 b1

......

......

n+ k α1,k . . . αn,k bk−c1 . . . −cn 0

Man beachte, dass im Innern des Schemas gerade A steht, unten −ct und rechtsb.

29

Page 31: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Den allgemeinen Fall kann man mit dem Simplex-Algorithmus erledigen:

Bei dem LPmin ctxbez. Ax = b

x ≥ 0

kann man folgendermaßen vorgehen: Indem man die Zeilen gegebenenfalls mit−1 multipliziert, kann man annehmen, dass b ≥ 0 gilt. Dann betrachtet man dasLP

min y1 + · · ·+ ykbez. Ax+ y = b

x, y ≥ 0

Setzt manA = (A, Ik)

dann hat dieses LP die Form

min y1 + · · ·+ yk

bez. A

(xy

)= b

x, y ≥ 0

Wenn das ursprungliche LP einen zulassigen Vektor x0 besitzt, ist

(x00

)eine

Losung dieses LPs. Weiterhin gilt

(0b

)∈ exK(A, b), d.h.

(0b

)ist eine Ecke

von K(A, b), so das man das Simplex-Verfahren auf dieses LPs anwenden kann.

Schließlich sei

(x0y0

)eine Ecke, die dieses LP lost, dann gilt y0 = 0 und x0 ∈

exK(A, b).

Ich komme nun zu der wichtigen Frage der Losbarkeit eines LPs. Hierfur undfur den Beweis des Dualitatssates brauche ich ein wenig Analysis des Rn. In derfolgenden Bemerkung habe ich die Definitionen und die Ergebnisse, die ich imFolgenden brauche, zusammengestellt. Sollten Sie den Begriff der Abgeschlossen-heit auf andere Weise kennengelernt haben, betrachten Sie die unten stehendeDefinition als Proposition.

Bemerkung 1.23

(i) Fur alle ν ∈ N ∪ {0} seien vν = (vν,1, . . . vν,n)t ∈ Rn. Die Folge (vν) in Rn

konvergiert genau dann gegen ein v0 ∈ Rn, wenn sie komponentenweise konver-giert, d.h. wenn (vν,i)ν fur alle i ∈ {1, . . . , n} gegen v0,i konvergiert.

(ii) Eine Menge A ⊆ Rn heißt (oder ist) abgeschlossen, wenn gilt: Wenn (vν)eine Folge in A ist, die gegen ein v0 ∈ Rn konvergiert, gilt schon v0 ∈ Rn.

30

Page 32: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

(iii) Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen.

(iv) Es seien (vν) eine Folge in Rn, die gegen ein v0 ∈ Rn konvergiert und A ∈M(k, n,R). Dann konvergiert die Folge (Avν) in Rk gegen Av0.

(v) Es sei (vn) eine beschrankte Folge in Rn, d.h. es gebe ein c ∈ R so dass gilt‖vn‖ ≤ c fur alle n ∈ N. Dann enthalt (vn) eine konvergente Teilfolge.

Dabei bezeichnet wie in der Linearen Algebra ‖ · ‖ die euklidische Norm.

Beweis Ich zeige (iv) fur n = 2: Es sei also (vν) = (xν , yν) eine beschrankteFolge in R2. Dann sind die Folgen (xν) und (yν) beschrankte Folgen in R. Nachdem Satz von Bolzano-Weierstrass gibt es eine Teilfolge (xνk) die gegen ein x0konvergiert. Da (yνk) eine beschrankte Folge ist, gibt es eine Teilfolge (yνkr ), diegegen ein y0 konvergiert. Dann konvergiert (xνkr , yνkr ) gegen (x0, y0). �

Lemma 1.24 Es sei a1, . . . , an ∈ Rk. Man setze A = (a1, . . . , an). Dann ist{Ax : x ≥ 0} abgeschlossen.

Beweis Man setze M = {Ax : x ≥ 0}, dann gilt

M = {x1a1 + · · ·+ xnan : x1, . . . , xn ≥ 0}

Ich nehme zunachst einmal an, dass a1, . . . , an linear unabhangig sind. Dann gibtes eine lineare Abbildung ϕ : Rk → Rn so dass gilt ϕ(aj) = ej fur j = 1, . . . , n.Also gibt es eine Matrix T ∈M(n, k,R) so dass gilt Taj = ej. Es folgt

TA = (Ta1, . . . , Tan) = (e1, . . . , en) = In

Nun sei (vν) eine Folge in M , die gegen ein v0 ∈ Rn konvergiert. Dann gibt es zujedem ν ∈ N ein wν ≥ 0 so dass gilt vν = Awν . Dann konvergiert

(wν) = (TAwν) = (Tvν)

gegen Tv0 = w0. Wegen wν ≥ 0 fur alle ν gilt w0 ≥ 0. Weiterhin konvergiert(Awν) = (vν) sowohl gegen Aw0 also auch gegen v0. Es folgt v0 = Aw0 ∈M .

Im allgemeinen Fall setze man fur alle I ⊆ {1, . . . , n}

M(I) = {∑i∈I

xiai : xi ≥ 0}

Ich zeige dass gilt:

M =⋃{M(I) : (ai)i∈I ist linear unabhangig}

Als Vereinigung endliche vieler abgeschlossener Mengen ist M dann abgeschlos-sen.

Es sei b ∈M , und es gelte b = x1a1 + · · ·+xnan. Dann gilt x ∈ K(A, b) und nach1.10 gilt exK(A, b) 6= ∅. Sei x ∈ exK(A, b). Nach 1.8 ist dann (ai)xi 6=0 linearunabhangig. Es folgt x ∈M(I) mit I = {i : xi 6= 0}. �

31

Page 33: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Satz 1.25 Es seien A ∈M(k, n,R), b ∈ Rk und c ∈ Rn. Vorgegeben sei das LP

min ctxbez. Ax = b

x ≥ 0

Wenn der zulassige Bereich nicht leer ist und die Zielfunktion auf dem zulassigenBereich nach unten beschrankt ist, d.h. wenn

{ctx : x ∈ K(A, b)}

nach unten beschrankt ist, ist das LP losbar.

Beweis Nach Voraussetzung ist {ctx : x ∈ K(A, b)} nicht-leer und nach untenbeschrankt, besitzt also ein Infimum. Man setze

µ∗ = inf{ctx : x ∈ K(A, b)}

und

A =

(Ac

)und b =

(bµ∗

)Dann gibt es eine Folge (xν) ∈ K(A, b), so dass (ctxν) gegen µ∗ konvergiert. Furalle ν gilt

Axν =

(Axνctxν

)=

(b

ctxν

)−→

(bµ∗

)Also ist (Axν) eine Folge in K(A, b), die gegen

(bµ∗

)= b konvergiert. Aus

1.24 folgt dann

(bµ∗

)= b ∈ K(A, b), also gibt es ein x∗ ∈ K(A, b). Es folgt

x∗ ∈ K(A, b) und ctx∗ = µ∗. Also ist x∗ eine Losung des LPs. �

Korollar 1.26 Vorgegeben sei das LP

min ctxbez. Ax ≤ b

x ≥ 0

Wenn der zulassige Bereich nicht leer ist und die Zielfunktion auf dem zulassigenBereich nach unten beschrankt ist, ist das LP losbar.

Beweis Man betrachte wieder das LP mit den Schlupfvariablen:

min ctxbez. Ax+ u = b

x, u ≥ 0

Offenbar ist die Zielfunktion auf dem zulassigen Bereich nach unten beschranktund nach 1.25 gibt es eine Losung (x∗, u∗) dieses LPs. Aber dann ist x∗ eineLosung des ursprunglichen LPs. �

32

Page 34: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Bemerkung 1.27 (vgl. 1.15) Es sei (x1, x2) ein zulassiger Punkt des LPs

min 3x1 − x2bez. x1 + x2 ≤ 2

2x1 + x2 ≤ 3x1, x2 ≥ 0

Dann gilt x2 ≤ x1 + x2 ≤ 2 und daher

3x1 − x2 ≥ −2

also ist die Zielfunktion auf dem zulassigen Bereich beschrankt und das LP ist da-her nach 1.26 losbar. Also ist (0, 2) in der Tat eine Losung und −2 der minimaleWert der Zielfunktion.

Definition 1.28 Es seien A ∈ M(k, n,R), b ∈ Rk und c ∈ Rn. Vorgegeben seidas LP

(P)max ctxbez. Ax ≤ b

x ≥ 0

Dann heißt das LP

(D)min btybez. Aty ≥ c

y ≥ 0

das dazu duale Programm. Ublicherweise nennt man dann das vorgegebene LPdas primale LP.

Bemerkung 1.29 Vorgegeben sei das (duale) LP

min btybez. Aty ≥ c

y ≥ 0

Betrachtet man nun das LP

max (−b)tybez. (−A)ty ≤ −c

y ≥ 0

Dann hat dieses denselben zulassigen Bereich und dieselben Losungen wie dasduale LP, der optimale Wert der Zielfunktion ist gerade der negative optimaleWert der Zielfunktion des dualen LPs. Dieses neue LP hat nun das duale LP

min −ctxbez. ((−A)t)tx ≥ −b

x ≥ 0

33

Page 35: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

alsomin −ctxbez. Ax ≤ b

x ≥ 0

und dieses LP hat denselben zulassigen Bereich und dieselben Losungen wie dasprimale LP

max ctxbez. Ax ≤ b

x ≥ 0

Man sagt auch (nicht ganz korrekt), das duale LP des dualen LPs sei das primaleLP.

Falls nicht anders bemerkt, sind im folgenden immer das primale LP

(P)max ctxbez. Ax ≤ b

x ≥ 0

und das dazu duale LP

(D)min btybez. Aty ≥ c

y ≥ 0

vorgegeben.

Proposition 1.30 Es seien x zulassig fur das primale und y zulassig fur dasduale LP. Dann gilt

ctx ≤ bty

Beweis Nach Voraussetzung gelten Ax ≤ b und Aty ≥ c und daraus folgt

ctx = xtc ≤ xtAty = ytAx ≤ ytb = bty �

1.30 ist trotz seines einfachen Beweises ein nutzliches Resultat, gelegentlich nenntman es den schwachen Dualitatssatz. Unter anderem erlaubt er es, den optimalenWert der Zielfunktion des primalen LPs nach oben abzuschatzen.

Korollar 1.31 Es seien x0 bzw. y0 zulassig fur das primale bzw. das duale LPund es gelte bty0 ≤ ctx0. Dann ist x0 eine Losung des primalen, y0 eine Losungdes dualen LPs und beide LPe haben denselben optimalen Wert der Zielfunktion.

Beweis Fur alle primal-zulassigen x gilt nach 1.30:

ctx ≤ bty0 ≤ ctx0

34

Page 36: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

also ist x0 eine Losung des primalen LPs. Andererseits gilt fur alle dual-zulassigeny nach demselben Ergebnis:

bty ≥ ctx0 ≥ bty0

also ist y0 eine Losung des dualen LP. Schließlich gilt ctx0 ≤ bty0, noch einmalnach 1.30, und daher ctx0 = bty0. �

Ziel der folgenden Uberlegungen ist der Beweis des Dualitatsatzes, der besagt,dass das primale und das duale LP losbar sind, wenn sie beide einen zulassigenPunkt besitzen und dass die optimalen Werte der Zielfunktionen gleich sind.

Lemma 1.32 Es seien K ⊆ Rn abgeschlossen und nicht leer. Dann gibt es einy0 ∈ K so dass gilt

‖y0‖ = inf{‖y‖ : y ∈ K}

Beweis Man setzeN = {‖y‖ : y ∈ K}

Ich zeige zunachst, dass N ein Minimum besitzt:

Da N nicht-leer und nach unten beschrankt ist, besitzt N ein Infimum, es gelteµ = inf N . Weiterhin gibt es eine Folge (yν) in K, so dass (‖yν‖) gegen µ kon-vergiert. Da (yν) beschrankt ist, enthalt es eine konvergente Teilfolge, ich nehmean, dass (yν) selbst gegen ein y0 konvergiert. Da K abgeschlossen ist, gilt y0 ∈ Kund da (‖yν‖) gegen ‖y0‖ konvergiert, gilt ‖y0‖ = µ. �

Satz 1.33 (Trennungssatz) Es sei K ⊆ Rn eine nicht-leere, abgeschlossene, kon-vexe Menge und b /∈ K. Dann gibt es Elemente c ∈ Rn und γ ∈ R so dass gilt

ctb < γ ≤ cty fur alle y ∈ K

Beweis Ich betrachte zunachst den Fall b = 0. Nach 1.32 gibt es ein y0 ∈ K sodass gilt ‖y0‖ ≤ ‖y‖ fur alle y ∈ K.

Sei y ∈ K beliebig, dann gilt λy0 + (1− λ)y ∈ K fur alle 0 ≤ λ ≤ 1. Es folgt:

‖y0‖2 ≤ ‖λy0 + (1− λ)y‖2 = < λy0 + (1− λ)y, λy0 + (1− λ)y >

= λ2 < y0, y0 > +2λ(1− λ) < y0, y >

+(1− λ)2 < y, y >

= λ2‖y0‖2 + 2λ(1− λ) < y0, y > +(1− λ)2‖y‖2

Man erhalt:

(1− λ2)‖y0‖2 ≤ 2λ(1− λ) < y0, y > +(1− λ)2‖y‖2

35

Page 37: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

und daraus fur alle 0 ≤ λ < 1:

(1 + λ)‖y0‖2 ≤ 2λ < y, y0 > +(1− λ)‖y0‖2

Der Grenzubergang λ→ 1 liefert dann:

0 < 2‖y0‖2 ≤ 2 < y, y0 >

also0 < ‖y0‖2 ≤ < y, y0 >= yt0y

Also folgt die Behauptung mit γ = ‖y0‖2 und c = y0.

Im allgemeinen Fall gilt b /∈ K und daher 0 /∈ K0 = K − b = {y − b : y ∈ K}.Dann ist K0 nicht-leer, konvex und abgeschlossen und nach dem Bewiesenen gibtes c ∈ Rn und γ0 ∈ R so dass gilt

0 < γ0 ≤ ct(y − b) fur alle y ∈ K

Es folgtctb < γ0 + ctb ≤ cty fur alle y ∈ K

und daraus die Behauptung mit γ = γ0 + ctb. �

Satz 1.34 (Lemma von Farkas) Es seien A ∈M(k, n,R) und b ∈ Rk. Dann sindaquivalent:

(i) K(A, b) 6= ∅, d.h. es gibt ein x0 ∈ Rn, x0 ≥ 0 mit Ax0 = b.

(ii) Fur alle y ∈ Rk folgt aus Aty ≥ 0 stets bty ≥ 0.

Beweis “(i) ⇒ (ii)” Es gelte Aty ≥ 0. Nach Voraussetzung gibt es ein x0 ∈K(A, b), also folgt Ax0 = b und daraus

bty = (Ax0)ty = xt0A

ty ≥ 0

“(ii) ⇒ (i)” Es seiK = {Ax : x ≥ 0}

dann ist zu zeigen, dass b ∈ K gilt. Angenommen, b /∈ K. Da K nach 1.24abgeschlossen und konvex ist, gibt es nach 1.33 ein c ∈ Rk und ein γ ∈ R so dassgilt:

ctb < γ ≤ cty fur alle y ∈ KWegen 0 ∈ K gilt γ ≤ 0. Sei y ∈ K, dann folgt νy ∈ K fur alle ν ∈ N und daraus

γ ≤ ct(νy) = νcty fur alle ν ∈ N

und daraus cty ≥ 0. Also folgt

ctb < γ ≤ 0 ≤ cty fur alle y ∈ K

36

Page 38: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

und darausctb < 0 ≤ ctAx fur alle x ∈ Rn, x ≥ 0

Dies impliziertctb < 0 ≤ ctAei fur alle i ∈ {1, . . . , n}

und man erhalt0 ≤ ctAEn = ctA

Also folgt Atc ≥ 0 aber btc < 0 in Widerspruch zu Annahme. �

Proposition 1.35 Es sei y∗ eine Losung des dualen LPs. Dann ist das primaleLP losbar. Wenn x∗ eine Losung des primalen LPs ist, gilt

ctx∗ = bty∗

Beweis Es seien bty∗ = µ∗ sowie

A =

(A Ik 0−ct 0 1

)∈M(k + 1, n+ k + 1,R) , b =

(b−µ∗

)Ich zeige zunachst, dass K(A, b) 6= ∅ gilt: Nach dem Lemma von Farkas mussdazu gezeigt werden, dass fur alle y ∈ Rk und α ∈ R gilt:

At(yα

)≥ 0⇒ bt

(yα

)≥ 0

Offenbar gilt:

At =

At −cIk 00 1

Also ist zu zeigen, dass gilt:

Aty − cα ≥ 0, y ≥ 0, α ≥ 0 ⇒ bty − αµ∗ ≥ 0

1. Fall α = 0, dann folgt Aty ≥ 0 und daraus

At(y∗ + y) = Aty∗ + Aty ≥ Aty∗ ≥ c

Also ist y + y∗ ein fur das duale LP zulassiger Punkt und es folgt

bty∗ ≤ bt(y∗ + y) = bty∗ + btt

und daraus bty ≥ 0. Man erhalt

bty − αµ∗ = bty ≥ 0

37

Page 39: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

2. Fall Es gelte α > 0, dann folgt At(1tα) ≥ c und daher ist 1

αy ein dual-zulassiger

Vektor. Es folgt

bty∗ ≤ bt1

αy

und daraus0 ≤ bty − αbty∗ = bty − αµ∗

Also gibt es ein

x0y0α0

∈ K(A, b). Es folgt Ax0 +y0 = b und −ctx0 +α0 = −µ∗,

also Ax0 ≤ b und ctx0 ≥ µ∗ = bty∗. Nach 1.31 lost x0 das primale LP und es giltctx0 = bty∗. Offenbar gilt dann ctx∗ = bty∗ fur jede Losung des primalen LPs. �

Korollar 1.36 Es sei x∗ eine Losung des primalen LPs. Dann ist das duale LPlosbar. Wenn y∗ eine Losung des dualen LPs ist, gilt

ctx∗ = bty∗

Beweis Das folgt unmittelbar aus 1.29. �

Satz 1.37 (Dualitatssatz) Es seien A ∈ M(k, n,R), b ∈ Rk und c ∈ Rn. Vorge-geben seien das primale LP

(P)max ctxbez. Ax ≤ b

x ≥ 0

und das dazu duale LP

(D)min btybez. Aty ≥ c

y ≥ 0

Dann sind aquivalent:

(i) Das primale und das duale LP sind losbar und besitzen denselben Wert derZielfuktion.

(ii) Das primale und das duale LP besitzen einen zulassigen Punkt.

(iii) Das primale LP ist losbar.

(iv) Das duale LP ist losbar.

Beweis

“(i) ⇒ (ii)”: Klar.

“(ii) ⇒ (iii)”: Es sei y0 einzulassiger Punkt von (D), dann folgt fur alle (P)-zulassigen x nach 1.30:

ctx ≤ bty0

38

Page 40: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

und nach 1.25 ist (P) dann losbar.

“(iii) ⇒ (iv)”: 1.36

“(iv) ⇒ (i)”: 1.35. �

Nachtrag Naturlich ist es mathematisch nicht befriedigend, dass das Simplex-Verfahren nicht in jedem Fall nach endlich vielen Schritten abbricht. Um diesesProblem zu vermeiden, gibt es eine Reihe von Zusatzregeln, die verhindern, dassdas Verfahren im Kreis lauft. Das folgende “lexikographische” Simplex-Verfahrenist so eins:

Zunachst definiert man auf Rn die sogenannte lexikographische Ordnung:

Fur alle x = (x1, . . . , xn)t, y = (y1, . . . , yn)t ∈ Rn definiere man x ≺ y genaudann, wenn es ein i0 ∈ {1, . . . n} so gibt, dass gilt

xi = yi fur alle i < i0 und xi0 < yi0

sowiex � y ⇔ x = y oder x ≺ y

Man sieht leicht, dass � eine Ordnung auf Rn ist, die linear ist, d.h. fur je zweiElemente x, y ∈ Rn gilt x � y oder y � x.

Nun sei das LPmin ctxbez. Ax = b

x ≥ 0

vorgegeben und oBdA sei {a1, . . . , ap} eine Basis des Spaltenraums von A. Wennman nun mit dem Simplex-Verfahren eine Basis {ai : i ∈ I} konstruiert hat, gibtes reelle Zahlen αj,i, i ∈ I, j ∈ {1, . . . , n} so dass fur alle j ∈ {1, . . . , n} gilt

bj =∑i∈I

αj,ibi

Weiterhin setzt man fur alle j ∈ {1, . . . , n}:

δj =∑i∈I

αj,ici − cj

(Beachten Sie, dass das keine wesentlich Erweiterung der bisherigen Definitionist.) Da a1, . . . , ap linear unabhangig sind, sind die Vektoren der Form

1

αr,i(xi, α1,i, . . . , αp,i)

paarweise verschieden. Nun gelte wieder δr > 0 fur ein r /∈ I, dann gibt es alsoein eindeutig bestimmtes s so dass gilt αr,s > 0 und

1

αr,s(xs, α1,s, . . . , αp,s) ≺

1

αr,i(xi, α1,i, . . . , αp,i) fur alle i ∈ I \ {s} mit αr,i > 0

39

Page 41: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Nach der Zusatzregel wahlt man dieses s. Man kann dann zeigen, dass gilt

(ctx′, δ′1, . . . δ′p) ≺ (ctx, δ1, . . . δp)

d.h. dieser Vektor wird bei einem Simplex-Schritt immer (lexikographisch) echtverkleinert. Also kann keine Ecke zweimal beim Simplex-Verfahren auftauchen.Da es nur endlich viele Ecken gibt, bricht das Simplex-Verfahren mit Zusatzregelalso ab.

Beweis Ich zeige zunachst zu zeigen, dass die Vektoren ( 1αr,i

(xi, α1,i, . . . , αp,i))i∈Ipaarweise verschieden sind. Es sei B = (ai1 , . . . , aip), dann gilt α1,i1 . . . αp,i1

......

α1,ip . . . αp,ip

= ([a1]B, . . . , [ap]B)

Da die Vektoren a1, . . . , ap linear unabhangig sind, sind auch [a1]B, . . . , [ap]B linearunabhangig und daher hat diese Matrix den Rang p. Dann sind aber auch dieZeilenvektoren linear unabhangig. Insbesondere ist keiner ein Vielfaches einesanderen. Dies gilt dann erst recht fur die Vektoren ((xi, α1,i, . . . , αp,i))i∈I .

Fur alle i ∈ I setze manui = (xi, α1,i, . . . , αp,i)

Dann behaupte ich, dass bei jedem Simplex-Schritt ui � 0 fur alle i ∈ I gilt. Diesist offenbar beim Start der Fall, denn dann gilt I = {1, . . . , p} und es gilt αj,i = 1fur j = i und αj,i = 0 fur j 6= i.

Also gelte ui � 0 fur alle i ∈ I nach n Simplex-Schritten. Dann gilt zunachstnach dem Beweis von 1.18

x′i =

{xi − αr,i

αr,sxs i ∈ I ′, i 6= r

xsαr,s

i = r

Mit derselben Rechnung wie im Beweis von 1.18 zeigt man, dass fur alle j gilt:

α′j,i =

{αj,i − αr,i

αr,sαj,s i ∈ I ′, i 6= r

αj,sαr,s

i = r

und daher

u′i =

{ui − αr,i

αr,sus i 6= r

1αr,s

us i = r

Also gilt u′r � 0. Falls nun αr,i ≤ 0 gilt, folgtαr,iαr,s

us ≺ 0 und daraus

u′i = ui −αr,iαr,s

us � ui � 0

40

Page 42: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

und daraus u′i � 0. Falls aber αr,i > 0 gilt, hilft die Zusatzregel, denn es gilt jafur alle i 6= r:

1

αr,s(xs, α1,s, . . . , αp,s) ≺

1

αr,i(xi, α1,i, . . . , αp,i)

das heißt aber, dass gilt 1αr,s

us ≺ 1αr,i

ui und daherαr,iαr,s

us ≺ ui also

u′i = ui −αr,iαr,s

us � 0

Wie man sieht, ist die Zusatzregel also genau so gemacht, dass ui � 0 fur allei ∈ I gilt. Es bleibt noch zu zeigen, dass gilt:

(ctx′, δ′1, . . . δ′p) ≺ (ctx, δ1, . . . δp)

Nach 1.18 gilt

ctx′ = ctx− δrαr,s

xs

und dieselbe Rechnung wie im Beweis ergibt fur alle j:

δ′j = δj −δrαr,s

αj,s

Da δr > 0 gilt, folgt schließlich aus us � 0:

(ctx′, δ′1, . . . δ′p) = (ctx, δ1, . . . , δp)−

δrαr,s

us ≺ (ctx, δ1, . . . δp)

41

Page 43: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Kapitel 2

Elementare Zahlentheorie

Definition 2.1 Es seien a, b ∈ Z. Man sagt, “a teilt b” oder “a ist ein Teilervon b” und schreibt a|b, wenn es ein k ∈ Z so gibt, dass gilt ka = b.

Gelegentlich schreibt man a 6 | b, wenn a kein Teiler von b ist.

Bemerkung 2.2 Wenn a 6= 0 gilt, teilt a offenbar genau dann b, wenn ba∈ Z

gilt.

Proposition 2.3 Es seien a, b, c, d, k, n ∈ Z, dann gelten:

(i) Es gilt 1|a, −1|a, a|a, −a|a.

(ii) Aus a|b und a|c folgt a|(kb+ nc).

(iii) Aus a|b und c|d folgt ac|bd.

(iv) Aus a|b und b|a folgt a = b oder a = −b.(v) Aus a|b und b 6= 0 folgt |a| ≤ |b|.(vi) Aus a|1 folgt a = 1 oder a = −1.

(vii) Es gilt a|0.

Beweis Die Beweise sind alle einfach. �

Proposition 2.4 (Division mit Rest) Es seien a, b ∈ Z und b 6= 0. Dann gibt eseindeutig bestimmte Elemente k, r ∈ Z so dass gelten:

a = kb+ r und 0 ≤ r < |b|

Man sagt, r sei der Rest bei der Division von a durch b.

42

Page 44: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Beweis

Existenz Es seien

r0 = min{r ≥ 0 : es gibt ein k ∈ Z mit r = a− kb}

und k0 ∈ Z so gewahlt, dass gilt r0 = a − k0b ≥ 0. Dann gilt a = k0b + r0.Angenommen, r0 ≥ |b|. Falls b ≥ 0 gilt, folgt

0 ≤ r0 − b = a− (k0 + 1)b

falls b ≤ 0 gilt, folgt r0 ≥ −b und daraus

0 ≤ r0 + b = a− (k0 − 1)b

also in jedem Fall ein Widerspruch.

Eindeutigkeit: Es gelte

a = kb+ r = k′b+ r′ mit 0 ≤ r, r′ < |b|

Dann kann man oBdA annehmen, dass r ≤ r′ gilt. Dann folgt 0 ≤ r′ − r < |b|und

0 ≤ r′ − r = (k − k′)balso b|(r− r′). Aus |r′− r| < |b| folgt dann r− r′ = 0, z.B mit 2.3 (v), und darausk = k′. �

Definition 2.5 Es seien a, b ∈ Z, a, b 6= 0. Eine Zahl d ∈ N heißt großtergemeinsamer Teiler von a und b, wenn gelten

(i) d|a und d|b

(ii) Fur alle c ∈ N folgt aus c|a und c|b, dass c|d gilt.

Man beachte dass diese Definition von ggT gegen die naive Interpretation verstoßt,denn wenn T (a, b) die Menge aller naturlichen Zahlen bezeichnet, die Teiler vona und Teiler von b sind, dann ist ein großter gemeinsamer Teiler von a und bnaturlich das Maximum von T (a, b), aber ist ist nicht unbedingt klar (wenn auchrichtig), dass jedes Element aus T (a, b) auch ein Teiler von maxT (a, b) ist. Al-so bedeutet “großter gemeinsamer Teiler von a und b” nicht nur Maximum vonT (a, b). Und der Beweis der Existenz eines großten gemeinsamen Teilers gehtauch einen anderen Weg:

Proposition 2.6 Es seien a, b ∈ Z, a, b 6= 0. Man setze

d = min{ka+ nb : k, n ∈ Z} ∩ N

Dann ist d ein ggT von a und b.

43

Page 45: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Beweis Man wahle k, n ∈ Z so dass gilt d = ka+ nb.

Ich behaupte zunachst, dass d ein Teiler von a ist: Divison mit Rest liefert einm ∈ Z und 0 ≤ r < d, so dass gilt a = md+ r. Dann folgt

r = a−md = a−m(ka+ nb) = (1−mk)a−mnb

Wegen r < d folgt r ≤ 0 und daraus r = 0. Also folgt d|a und analog d|b.Ich behaupte, dass d ein großter gemeinsamer Teiler von a und b ist. Also seic ∈ N und es gelte c|a und c|b. Dann folgt c|(ka+ nb), also c|d. �

Korollar 2.7 Es seien a, b ∈ Z, a, b 6= 0. Dann gibt es genau einen großtengemeinsamen Teiler von a und b.

Beweis Nach 2.6 reicht es zu zeigen, dass es hochstens einen ggT gibt. Also seiend, d′ großte gemeinsame Teiler von a und b. Dann folgt d′|d und d|d′, also d = d′

oder d = −d′. Wegen d, d′ ∈ N folgt d = d′. �

Definition 2.8 Es seien a, b ∈ Z, a, b 6= 0, dann wird der großte gemeinsameTeiler von a und b mit ggT (a, b) bezeichnet.

a und b heißen teilerfremd oder relativ prim, wenn ggT (a, b) = 1.

Als Konsequenz der bisherigen Diskussion ergibt sich:

Satz 2.9 (Bezout) Es seien a, b ∈ Z, a, b 6= 0. Dann gibt es k, n ∈ Z so dass gilt

ggT (a, b) = ka+mb

Beweis 2.6. �

Korollar 2.10 Es seien a, b ∈ Z und a, b 6= 0. Es gilt genau dann ggT (a, b) = 1,wenn es k, n ∈ Z so gibt, dass gilt

ka+ nb = 1

Beweis Es gebe k, n ∈ Z so dass gilt ka + nb = 1 und es sei d ein Teiler von aund b. Dann gilt d|(ka+ nb und daher k|1 �

Ich komme nun zu der Frage, wie man den ggT von zwei Zahlen bestimmt. ZurVorbereitung dient das folgende

Lemma 2.11 Es seien a, b ∈ Z, a, b 6= 0 und k ∈ Z. Dann gilt

ggT (a− kb, b) = ggT (a, b− ka) = ggT (a, b)

44

Page 46: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Beweis Es sei d = ggT (a, b), dann gilt d|a und d|b, also d|(a − kb). Weiter seic ∈ N, und es gelte c|a−kb und c|b, dann folgt c|(a−kb+kb) also c|a und darausc|d. �

Obwohl 2.11 ein harmloses Resultat ist, ist es die Basis fur das wichtigste Ver-fahren zur Bestimmung des ggT: Es seien a, b ∈ Z, a, b 6= 0. Es gelte |a| > |b|.Division mit Rest von a durch b liefert k ∈ Z und 0 ≤ r < |b| so dass gilta = kb+ r. Falls r = 0 gilt, folgt b|a und daraus |b| = ggT (a, b). Andernfalls giltggT (a, b) = ggT (a − kb, b) = ggT (r, b) und r < |b|. Nun kann man b mit Restdurch r teilen und das Verfahren fortsetzen. Da die Reste immer kleiner werden,bricht das Verfahren mit dem Rest 0 ab und man hat den ggT gefunden. Ichbeginne mit einem Beispiel:

Beispiel 2.12 Fur a = 1272 und b = 912 ergibt sich:

1272 = 1 · 912 + 360 also ggT (1272, 912) = ggT (1272− 1 · 912, 912)= ggT (912, 360)

912 = 2 · 360 + 192 also ggT (912, 360) = ggT (360, 192)

360 = 1 · 192 + 168 also ggT (360, 192) = ggT (192, 168)

192 = 1 · 168 + 24 also ggT (192, 168) = ggT (168, 24)

168 = 7 · 24 + 0 also ggT (168, 124) = 24

Also gilt

ggT (1272, 912) = ggT (912, 360) = ggT (360, 192) = ggT (192, 168)

= ggT (168, 124) = 24

Wenn man in 2.12 zuruckrechnet erhalt man:

24 = 192− 1 · 168

= 1 · 192− (360− 1 · 192) = −360 + 2 · 192

= −1 · 360 + 2(912− 2 · 360) = 2 · 912− 5 · 360

= 2 · 912− 5(1272− 1 · 912) = −5 · 1272 + 7 · 912

Also gilt24 = (−5) · 1272 + 7 · 912

und das ist die im Satz von Bezout formulierte Darstellung des ggT.

Verfahren 2.13 (Euklidischer Algorithmus) Es seien a, b ∈ Z und a, b 6= 0. Mandefiniere induktiv die Folge (ri) durch: Man setze r0 = a und r1 = b. r0, r1, . . . , riseien definiert. Wenn ri = 0 gilt, bricht das Verfahren ab. Andernfalls sei ri+1

45

Page 47: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

der Rest, der entsteht, wenn man ri−1 durch ri teilt. Formal sei ri+1 die nach 2.4eindeutig bestimmte Zahl aus Z so dass gelten:

ri−1 = kiri + ri+1 und 0 ≤ ri+1 < |ri|

mit ki ∈ Z. (Man beachte, dass ri ≥ 0 fur alle i ≥ 2 gilt.)

Satz 2.14 Es seien a, b ∈ Z und a, b 6= 0. Dann bricht der euklidischer Algorith-mus fur a und b ab, d.h es gibt ein n mit rn+1 = 0 und ri 6= 0 fur alle i ≤ n.Wenn dies der Fall ist, ist rn der großte gemeinsame Teiler von a und b.

Beweis Da die Folge (ri)i≥2 eine streng monoton fallende Folge in N0 ist, brichtsie nach endlich vielen Schritten ab. Nun gilt fur alle i nach 2.11

ggT (ri, ri+1) = ggT (ri, ri+1 + kiri) = ggT (ri, ri−1)

Also folgt induktiv, dass gilt

ggT (a, b) = ggT (rn−1, rn)

Nun giltrn−1 = kn−1rn + rn+1 = kn−1rn

und daher ggT (rn−1, rn) = rn. �

Definition 2.15 Eine naturliche Zahl p > 1 heißt Primzahl, wenn sie nur dienaturlichen Teiler 1 und p besitzt.

Proposition 2.16 Es seien a, b ∈ Z und p eine Primzahl. Es gelte p|ab. Dannfolgt p|a oder p|b.

Beweis Ich nehme an, p teilt nicht a, dann gilt ggT (a, p) = 1. Also gibt esλ, µ ∈ Z so dass gilt λa+ µp = 1. Es folgt

b = λab+ µbp

und daraus die Behauptung. �

Korollar 2.17 Es seien p ∈ N eine Primzahl und a1, . . . an ganze Zahlen. Esgelte p|a1 · · · an. Dann gibt es ein i so dass gilt p|ai.

Beweis Beweis durch vollstandige Induktion.

(I) n = 1: Klar.

(II) Die Behauptung gelte fur ein beliebiges, festes n ∈ N.

(III) Es gelte p|a1 · · · an+1, d.h. p|(a1 · · · an)an+1. Dann folgt p|a1 · · · an oder p|an+1

nach 2.16. Im 2. Fall ist man fertig, im 1. Fall folgt die Behauptung aus (II). �

46

Page 48: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Satz 2.18 Es sei n ∈ N, n > 1. Dann gibt es Primzahlen p1, . . . , pk so dass giltn = p1 · · · pk. Diese Darstellung ist bis auf die Reihenfolge der Faktoren eindeutig.

Beweis Durch vollstandige Induktion. Ich behaupte:

Fur alle n ∈ N, n ≥ 2 gilt: Fur alle r ≤ n gilt die Behauptung des Satzes. l

(I) n = 2 ist klar, da 2 eine Primzahl ist.

(II) Die Behauptung gelte fur alle r ≤ n− 1.

(III) Existenz der Darstellung:

Es sei p1 der kleinste naturliche Teiler > 1 von n. Dann ist p1 offenbar einePrimzahl und auf n/p1 kann man die Induktionsvoraussetzung anwenden. Alsogibt es Primzahlen p2, . . . , pk so dass gilt n/p1 = p2 · · · pk, es folgt n = p1 · · · pk.Eindeutigkeit: Es gelte n = p1 · · · pk = q1 · · · qs mit Primzahlen pi, qi. Dann giltp1|q1 · · · qs. Nach 2.17 gibt es ein i so dass gilt p1|qi. Es folgt p1 = qi und daraus

p2 · · · pn = q1 · · · qi−1qi+1 · · · qs < n

Die Behauptung folgt jetzt aus der Induktionsannahme. �

Bemerkung 2.19 2.18 gibt eine weitere Moglichkeit, den ggT von zwei Zah-len a, b zu berechnen: Man schreibt a und b als Produkt von Primzahlen: a =p1 · · · pn, b = q1 · · · qs mit Primzahlen pi, qi. Dann gibt es paarweise verschiede-ne Primzahlen r1, . . . , rt und nicht-negative ganze Zahlen α1, . . . , αt, β1, . . . , βt sodass gelten:

a = rα11 · · · rαtt und b = rβ11 · · · r

βtt

In diesem Fall gilt mit γi = min{αi, βi}

ggT (a, b) = rγ11 · · · rγtt

Algorithmisch ist diese Methode allerdings vollig ungeeignet, da es schon einengroßen Aufwand bedeutet irgendeinen Primteiler einer (ziemlich großen) Zahl zufinden.

Proposition 2.20 (Euklid) Es gibt unendlich viele Primzahlen.

Beweis Angenommen, es gibt nur endlich viele Primzahlen p1, . . . , pk. Man setze

a = p1 · · · pk + 1

Es sei p ein Primteiler von a, dann teilt p kein pi, denn sonst wurde p aucha − p1 · · · pk = 1 teilen. Also ist p eine Primzahl, die von p1, . . . , pk verschiedenist. W. �

Ich komme nun zu einer weiteren wichtigen Konsequenz des Satzes von Bezout:

47

Page 49: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Proposition 2.21 Es seien n ∈ N und a ∈ Z, a 6= 0. Dann besitzt [a] genaudann ein multiplikatives Inverses in Z/nZ, wenn gilt ggT (a, n) = 1.

Zusatz: Es gelte λa + µn = 1 fur λ, µ ∈ Z. Dann ist [a] invertiertar und es gilt[a]−1 = [λ].

Beweis Es gebe ein b ∈ Z so dass gilt [ab] = [a][b] = [1], dann folgt 1− ab ∈ nZ,also gibt es ein c ∈ Z so dass gilt nc = 1− ab. Es folgt nc + ab = 1c und darausggT (a, n) = 1 nach 2.10.

Umgekehrt gelte ggT (a, n) = 1, dann gibt es nach dem Satz von Bezout (2.9)λ, µ ∈ Z so dass gilt λa+ µn = 1. Es folgt

[1] = [λa+ µn] = [λ][a] + [µ][n] = [λ][a] �

Beachten Sie, dass der Beweis von 2.21 konstruktiv ist: Um ein inverses Elementvon [a] zu finden, sucht man mit dem erweiterten Euklidischen Algorithmus ganzeZahlen λ, µ so dass gilt λa+ µn = 1. Dann ist [λ] das zu [a] inverse Element.

Korollar 2.22 Es sei n ∈ N, n ≥ 2. Dann ist Z/nZ genau dann ein Korper,wenn n eine Primzahl ist.

Beweis Z/nZ ist genau dann ein Korper, wenn alle Zahlen 0 < k < n zu nteilerfremd sind, und das ist genau dann der Fall, wenn n eine Primzahl ist. �

Man beachte, dass 2.22 auch fur n = 1 gilt, denn ist diesem Fall ist n keinePrimzahl, aber Z/nZ ist kein Korper, weil die Menge nur ein Element enthalt.

Fur das Folgende brauche ich ein paar elementare Tatsachen aus der Gruppen-theorie. Dabei werden im folgenden auch kommutative Gruppen multiplikativgeschrieben, da die Ergebnisse auf die multiplikative Gruppe eines Korpers (oderRinges) angewandt werden sollen. Also sei im folgenden (G, ◦) eine Gruppe undman schreibt xy = x ◦ y fur alle x, y ∈ G. Das neutrale Element wird dann mit ebezeichnet und das inverse mit x−1.

Definition 2.23 Es sei G eine endliche Gruppe. Dann nennt man o(G) = |G|die Ordnung von G.

Satz 2.24 (Satz von Lagrange) Es seien G eine endliche Gruppe und U ⊆ Geine Untergruppe. Dann gilt o(U)|o(G).

Beweis Der Beweis ist eine nicht-kommutative Version des Beispiels 2.13 aus derVorlesung Lineare Algebra:

48

Page 50: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Man definiere eine Relation ∼ auf G durch

x ∼ y ⇔ x−1y ∈ U

Behauptung ∼ ist eine Aquivalenzrelation:

Beweis

(R) Wegen x−1x = e ∈ U gilt x ∼ x fur alle x ∈ G.

(S) Es gelte x ∼ y, dann folgt x−1y ∈ U und daraus y−1x = (x−1y)−1 ∈ U , alsoy ∼ x.

(T) Es gelte x ∼ y und y ∼ z, dann folgt x−1y ∈ U und y−1z ∈ G. Man erhaltx−1z = (x−1y)(y−1z) ∈ U und daraus x ∼ z.

Behauptung Fur alle x ∈ G gilt

[x] = xU = {xu : u ∈ U}

Beweis Fur alle y ∈ G gilt:

y ∈ [x]⇔ y ∼ x⇔ x ∼ y ⇔ x−1y ∈ U ⇔ y ∈ xU

Behauptung Fur alle x ∈ G gilt

|[x]| = |U | = o(U)

Beweis Die Abbildung τx : U → xU definiert durch τx(u) = xu ist bijektiv unddaher gilt

|[x]| = |xU | = |U | = o(U)

Schließlich sei x1, . . . , xk ein vollstandiges Reprasentantensystem, d.h. es gelteG/ ∼= {[x1], . . . , [xk]} und [xi] 6= [xj] fur alle i 6= j. Dann gilt

G = [x1] ∪ . . . ∪ [xn]

und da die [xi] paarweise disjunkt sind, folgt

o(G) = |G| = |[x1]|+ · · ·+ |[xk]| = k|U | = ko(U) �

Wenn G eine kommutative Gruppe ist, ist G/U ebenfalls eine kommutative Grup-pe und der Beweis des Satzes von Lagrange zeigt, dass in diesem Fall gilt:

o(U)o(G/U) = o(G)

Definition 2.25 Es seien G eine Gruppe und a ∈ G. Fur alle n ∈ Z definiereman

an =

a · · · a︸ ︷︷ ︸n−mal

n ∈ N

(a−n)−1 n < 0

e n = 0

49

Page 51: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Proposition 2.26 Es seien G eine Gruppe, a, b ∈ G und r, s ∈ Z. Dann gelten:

(i) ar+s = aras

(ii) (ar)s = ars

(iii) Wenn G kommutativ ist, gilt (ab)r = arbr

Beweis erfolgt durch einfache Fallunterscheidung. �

Lemma 2.27 Es seien G eine endliche Gruppe und a ∈ G. Dann gibt es eink ∈ N so dass gilt ak = e.

Beweis Da G endlich ist, gibt es r, s ∈ N, r 6= s so dass gilt ar = as. OBdA gelter > s, dann folgt ar−s = e. �

Definition 2.28 Es seien G eine endliche Gruppe und a ∈ G. Dann heißt

o(a) = min{k ∈ N : ak = e}

die Ordnung von a.

Beispiel 2.29 In Z/6Z gelten:

o([0]) = 1, o([1]) = 6, o([2]) = 3, o([3]) = 2, o([4]) = 3, o([5]) = 6

Proposition 2.30 Es seien G eine endliche Gruppe und a ∈ G. Dann ist

< a >= {a, a2, . . . , ao(a)}

eine Untergruppe von G mit genau o(a) Elementen. Also gilt insbesondere o(a) =o(< a >).

Beweis Es sei k = o(a). Ich zeige zunachst:

(U1) Es gilt e ∈< a >.

(U2) Aus x, y ∈< a > folgt xy ∈< a >.

(U3) Aus x ∈< a > folgt x−1 ∈< a >.

Beweis

(U1): Es gilt e = ak ∈< a >.

(U2) Es seien x, y ∈< a >, dann gibt es 1 ≤ i, j ≤ k so dass gilt x = ai, y = aj.Es folgt

xy = aiaj = ai+j

mit 1 ≤ i+ j ≤ 2k. Falls i+ j ≤ k gilt, folgt xy ∈< a >, andernfalls gilt

ai+j = ai+j−kak = ai+j−k ∈< a >

50

Page 52: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

(U3) Es gelte x = aj mit 1 ≤ j ≤ k. Falls j = k gilt, gilt x = e und daherx−1 = x ∈< a >. Andernfalls gilt 1 ≤ k − j < k und ajak−j = ak = e und damitx−1 = ak−j ∈< a >.

Offenbar gilt ai 6= aj fur i 6= j und daher o(< a >) = k. �

Untergruppen der Form < a > nennt man auch zyklisch.

Korollar 2.31 Es seien G eine endliche Gruppe, a ∈ G und k ∈ N. Dann gelten

(i) ak = e⇔ o(a)|k.

(ii) ao(G) = e

Beweis (i)

“⇐”: Es gilt nach 2.26(ii):

ak = (ao(a))k/o(a) = ek/o(a)

“⇒”: Divison mit Rest von k durch o(a) liefert r, s ∈ Z, 0 ≤ r < o(a) so dassgilt k = o(a)s+ r. Es folgt aus 2.26(i),(ii):

e = ak = ao(a)s+r = (ao(a))sar = ar

und daher r = 0, denn es gilt o(a) = min{k ∈ N : ak = e}.(ii) Nach dem Satz von Lagrange (2.24) gilt o(< a >)|o(G), also also gilt o(a)|o(G).Daher gibt es ein k ∈ Z so dass gilt ko(a) = o(G) und aus 2.26(ii) folgt:

ao(G) = ao(a)k = (ao(a))k = ek = e �

Es ist ublich, die folgenden Resultate als Kongruenzen zu formulieren:

Definition 2.32 Es sei m ∈ N. Man sagt, zwei Zahlen a, b ∈ Z sind kongruentmodulo m und schreibt

a ≡ b mod m

wenn gilt m|b− a.

Bemerkung 2.33 Offenbar gilt a ≡ b mod m genau dann, wenn [a] = [b] gilt,wobei [ · ] die Aquivalenzklasse in Z/mZ ist. Also ist Kongruenz modulo m eineAquivalenzrelation und es gelten die ublichen Vertraglichkeitsregeln: Aus a ≡b mod m und c ≡ d mod m folgen a+ c ≡ b+d mod m und ac ≡ bd mod m.

Korollar 2.34 (Kleiner Satz von Fermat) Es sei p eine Primzahl. Dann gilt furalle a ∈ Z mit p 6 | a:

ap−1 ≡ 1 mod p

und daher fur alle a ∈ Z:ap ≡ a mod p

51

Page 53: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Beweis Da p eine Primzahl ist, ist Z/pZ ein Korper und daher (Z/pZ)∗ =Z/pZ \ {[0]} eine Gruppe der Ordnung p− 1.

Es gelte zunachst p 6 | a, dann folgt [a] ∈ (Z/pZ)∗ und daher [ap−1] = [a]p−1 = [1]nach 2.31. Es folgt [ap] = [a]p = [a]p−1[a] = [a], also ap ≡ a mod p fur diese a.Falls p|a gilt, folgt a ≡ 0 mod p und daher ap ≡ a mod p. �

2.34 ist ein Primzahltest: Wenn es ein 1 ≤ a ≤ p − 1 gibt so dass gilt ap−1 6≡ 1,dann ist p keine Primzahl. Allerdings gibt es zusammengesetzte Zahlen p so dassgilt ap−1 ≡ 1 mod p fur alle 1 ≤ a ≤ p − 1, diese Zahlen heißen CarmichaelZahlen. Die kleinste ist 561=3*11*17.

Zum Abschluss dieses Kapitels will ich noch den “Chinesischen Restsatz” bewei-sen, der es erlaubt, Kongruenzgleichungen mit sehr großen Moduln auf solche mitkleineren Moduln zuruckzufuhren. Als Vorbereitung dazu dient das folgene

Lemma 2.35

(i) Es seien a ∈ Z und m1, . . . ,mk paarweise teilerfremde Zahlen. Es gelte mi|afur i = 1, . . . , k. Dann gilt m1 · · ·mk|a.

(ii) Es seien a, b, c ∈ Z und es gelte a|bc. Wenn a und b teilerfremd sind, folgta|c.

Beweis

(i) Ich zeige die Behauptung induktiv und beginne mit dem Fall k = 2:

Nach Voraussetzung gibt es k1, k2 so dass gilt

k1m1 = k2m2 = a

Nach Bezout gibt es α1 und α2 so dass gilt α1m1 + α2m2 = 1. Es folgt:

α2m2k1m1 = α2m2a und α1m1k2m2 = α1m1a

und daraus(α2k1 + α1k2)m1m2 = (α1m1 + α2m2)a = a

also die Behauptung.

Fur den Induktionsschritt langt es zu zeigen, dass m1 · · ·mk−1 und mk teilerfremdsind, wenn m1, . . . ,mk paarweise teilerfremd sind. Angenommen, die beiden Zah-len sind nicht teilerfremd, dann besitzen sie einen gemeinsamen Teiler d. Sei pein Primteiler von d. Dann gilt p|mk und aus p|(m1 · · ·mk−1) folgt p|mi fur ein inach 2.17 und daher sind mi und mk nicht teilerfremd.

52

Page 54: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

(ii) Nach Bezout gibt es α, β ∈ Z so dass gilt αa+βb = 1. Es folgt αac+βbc = c.und daraus die Behauptung. �

Man kann 2.35 auch mit der eindeutigen Primfaktorzerlegung beweisen.

Satz 2.36 (Chinesischer Restsatz) Es seien m1, . . . ,mk paarweise teilerfremdenaturliche Zahlen und a1, . . . ak ∈ Z. Dann hat das System von Kongruenzen

x ≡ ai mod mi i = 1, . . . , k

eine Losung. Diese ist eindeutig modulo m = m1 · · ·mk.

Beweis Es seien x und y Losungen des Systems, dann gilt x − y ≡ 0 mod mi

fur alle i, also mi|(x − y) fur alle i. Aus 2.35 folgt dann m|(x − y) und daherx ≡ y mod m.

Zum Beweis der Existenz setze man m′i = mmi

, dann gilt m′i ≡ 0 mod mj fur allej 6= i und mi und m′i sind fur alle i teilerfremd. Also gibt es nach dem Satz vonBezout αi, βi ∈ Z so dass gilt

αimi + βim′i = 1

Ich behaupte, dassx = a1β1m

′1 + · · ·+ akβkm

′k

das Kongruenzsystem lost: Fur alle i gilt:

x ≡ a1β1m′1 + · · ·+ akβkm

′k mod mi

≡ aiβim′i mod mi

≡ ai(1− αimi) mod mi

≡ ai − aiαimi mod mi

≡ ai mod mi�

53

Page 55: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Kapitel 3

Polynome

Ein Polynom uber einem Korper K ist bekanntlich ein Ding der Form

anXn + an−1X

n−1 + · · ·+ a1X + a0

wobei an, . . . , a0 Elemente aus K sind. Was aber ist ein Polynom denn nun genau?Eine Abbildung von K nach K? Wenn das so ist, betrachte man K = Z/2Z unddas Polynom

P = X2 +X

Wenn man dieses Polynom als Abbildung von K nach K betrachtet, also dieAbbildung P : K → K definiert durch P (x) = x2 + x fur alle x ∈ K, ist P dieNullabbildung. Also gilt X2 + X = 0? Aber das widerspricht nun der ublichenVorstellung.

Die Losung des Problems ist relativ einfach, wenn man sich uberlegt, wie mandenn ein Polynom abspeichert: Naturlich speichert man die uberflussigenX,X2, . . .nicht ab, sondern nur die “Koeffizienten”, wobei man sich merken muss, welcherKoeffizient zu welcher Potenz von X gehort. Also speichert man das obige Poly-nom z.B. in der Form (a0, a1, . . . , an) ab, also als Element des Kn. Nun ist ja ndurchaus variabel, was mathematisch gesehen ein wenig lastig ist. Also betrachtetman ein Polynom als Folge (a0, a1, . . .) in K, wobei die Folgenglieder von einerStelle ab Null sein mussen. Da Folgen, die zu Polynomen gehoren, ein Folgengliedmit der Nummer 0 haben sollten, betrachtet man also Folgen, deren Index mit 0beginnt.

Die Operationen mit Polynomen sind nun ganz einfach: Man muss die gewohn-ten Operationen mit “Polynomen” ubersetzen in solche fur Koeffizientenfolgen.Seien also P = (an) und Q = (bn) Polynome, dann setze man heuristischP = anX

n + · · · + a0 und Q = bkXk + · · · + b0 und erhalt P + Q, indem man

die entsprechenden Koeffizienten addiert, und zur Berechnung von PQ betrachteman

PQ = (anXn + · · ·+ a0)(bkX

k + · · ·+ b0)

= anbkXn+k + (anbk−1 + an−1bk)X

n+k−1 + · · ·+ a0b0

54

Page 56: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Also gilt fur den Koeffizienten von Xr:

arb0 + ar−1b1 + · · ·+ a0br

wobei ai = 0 gelten soll, wenn i > n gilt und bj = 0 fur j > k.

Definition 3.1 Es sei K ein Korper. Ein Polynom mit Koeffizienten in Kist eine Folge (an)n∈N0 in K, so dass es ein r ∈ N so gibt, daß gilt an = 0 fur allen ≥ r.Die Menge aller Polynome mit Koeffizienten in K wird mit K[X] bezeichnet.Weiterhin heißt an der n-te Koeffizient von P = (an).

Die Operationen mit Polynomen sind nun ganz einfach: Man muss die gewohntenOperationen mit “Polynomen” ubersetzen in solche fur Koeffizientenfolgen. Seienalso P = (an) und Q = (bn) Polynome, dann setze man heuristisch P = anX

n +· · ·+a0 und Q = bkX

k+ · · ·+b0 und erhalt P +Q, indem man die entsprechendenKoeffizienten addiert, und zur Berechnung von PQ betrachte man

PQ = (anXn + · · ·+ a0)(bkX

k + · · ·+ b0)

= anbkXn+k + (anbk−1 + an−1bk)X

n+k−1 + · · ·+ a0b0

Also gilt fur den Koeffizienten von Xr:

arb0 + ar−1b1 + · · ·+ a0br

wobei ai = 0 gelten soll, wenn i > n gilt und bj = 0 fur j > k. Damit erhalt man:

Definition 3.2 Es seien P = (an) und Q = (bn) Polynome in K[X] und α ∈ K.Dann definiere man die Polynome P +Q, αP und PQ durch:

P +Q = (an + bn)αP = (αan)PQ = (

∑ni=0 aibn−i) = (a0bn + · · ·+ anb0)

Es ist klar, dass PQ wieder ein Polynom ist.

Nun ist auch die Frage einfach zu beantworten, was denn X ist: Es ist die Folge(0, 1, 0, . . .):

Definition 3.3 Es sei K ein Korper, dann definiere man das Polynom X =(an) ∈ K[X] durch:

an =

{1 n = 10 n 6= 1

55

Page 57: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Beispiel 3.4 Es seien k ∈ N und Xk = (an). Dann gilt:

an =

{1 n = k0 n 6= k

Dabei sei wie ublichXk = X · · · · ·X︸ ︷︷ ︸

k-mal

Schließlich definiert man das Polynom X0 = (an) durch:

an =

{1 n = 00 n 6= 0

Also ist Xn fur alle n ∈ N0 das Polynom, dessen n-ter Koeffizient 1 ist, wahrendalle anderen Koeffizienten 0 sind.

Proposition 3.5 Es seien K ein Korper und P = (ak) ∈ K[X] ein Polynom.Es gelte an = 0 fur alle n > r. Dann gilt

P = a0X0 + · · ·+ arX

r

Beweis Man muss den i-ten Koeffizienten der rechten Seite berechnen: Fur i > rist der i-te Koeffizient von X0, . . . , Xr gleich Null, also auch der der Summeauf der rechten Seite. Also sei 0 ≤ i ≤ r, dann ist der i-te Koeffizient vonX0, . . . , X i−1, X i+1, . . . , Xr gleich Null, aber der von Xi ist gleich ai, also ist deri-te Koeffizient der rechten Seite gleich ai. �

Damit haben wir fast die gewohnte Darstellung eines Polynoms bekommen. Esbleibt noch der Punkt mit X0. Dabei hilft:

Lemma 3.6 Man definiere

D : K −→ K[X]

durchD(α) = αX0

Dann ist D injektiv und es gelten fur alle α, β ∈ K:

(i) D(α + β) = D(α) +D(β)

(ii) D(αβ) = D(α)D(β)

Beweis Das einfach. �

Bemerkung 3.7 Wegen 3.6 schreibt man im allgemeinen α fur D(α) = αX0.Wenn also fur P = (an) ∈ K[X] gilt an = 0 fur alle n > r, dann folgt:

P = a0 + a1X + · · ·+ arXr

56

Page 58: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Also ist es ziemlich schnell gelungen, aus der formal einwandfreien Definiton ei-nes Polynoms die gewohnte Darstellung zuruckzugewinnen, allerdings weiß mandieses Mal genau, was X ist.

Zur Beschreibung der algebraischen Eigenschaften von K[X] erinnere ich nocheinmal an den Begriff eines kommutativen Ringes mit Eins, den ich am Ende vonKapitel 2 in Linearer Algebra I schon einmal erwahnt habe:

Definition 3.8 Es sei R eine Menge. Das Tripel (R,+, ·) heißt kommutativerRing mit Eins, wenn gelten:

(i) (R,+) ist eine kommutative Gruppe.

(ii) · ist eine Operation auf R so dass fur alle x, y, z ∈ R gelten (man schreibtxy fur x · y):

(a) (xy)z = x(yz)

(b) Es gibt ein Element 1 ∈ R so dass gilt 1x = x

(c) xy = yx

(d) (x+ y)z = xz + yz

In der Regel schreibt man naturlich R fur (R,+, ·).

Ein kommutativer Ring mit Eins R ist genau dann ein Korper, wenn 1 6= 0 giltund jedes Element aus R \ {0} ein multiplikatives Inverses besitzt. Also ist einkommutativer Ring mit Eins ein Korper, dem (neben dem trivialen 1 6= 0) dieseEigenschaft fehlt. Ubrigens folgt aus der Kommutativitat der Multiplikation, dassx1 = x fur alle x ∈ R gilt und auch das zweite Distributivgesetz: Fur alle x, y, z ∈R gilt:

x(y + z) = (y + z)x = yx+ zx = xy + xz

Proposition 3.9 Es sei K ein Korper. Dann ist K[X] ein kommutativer Ringmit Eins.

Beweis Das sind alles ein wenig lastige Rechnungen, ich zeige 3.8(ii)(a) undverspreche, dass das der unangenehmste Beweis ist:

Es seien P = (an), Q = (bn) und R = (cn), dann gilt

QR = (k∑j=0

bjck−j)k = (k∑j=0

bk−jcj)k

Also lautet der n-te Koeffizient von P (QR):

n∑i=0

ai

n−i∑j=0

bjcn−i−j =n∑i=0

ai

n−i∑j=0

bn−i−jcj =n∑i=0

n−i∑j=0

aibn−i−jcj

57

Page 59: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Andererseits gilt:

PQ = (i∑

j=0

ajbi−j)i

und daher lautet der n-te Koeffizient von (PQ)R:

n∑i=0

(i∑

j=0

ajbi−j)cn−i =n∑i=0

i∑j=0

ajbi−jcn−i

Setzt man nun bν = 0 fur alle ν < 0, dann erhalt mann∑i=0

i∑j=0

ajbi−jcn−i =n∑i=0

n∑j=0

ajbi−jcn−i

=n∑j=0

n∑i=0

ajbi−jcn−i

=n∑j=0

aj

n∑i=0

bi−jcn−i

=n∑j=0

n∑i=0

ajbn−i−jci

=n∑j=0

n−j∑i=0

ajbn−i−jci �

Eine der wichtigen Anwendungen des Polynomrings ist die Konstruktion end-licher Korper. Die Konstruktion eines Korpers mit p Elementen, wobei p einePrimzahl ist, verlauft ja folgendermaßen: Auf Z wird eine Aquivalenzrelation ein-gefuhrt (namlich x ∼ y genau dann, wenn p|(y−x)). Dann kann man zeigen, dassman auf Z/ ∼= Z/pZ in “naturlicher Weise” eine Addition und Multiplikation soeinfuhren kann, dass man einen Korper mit p Elementen erhalt. Nun gibt es wei-tere endliche Korper, die (z.B. in der Codierungstheorie) wichtig sind. Da Z/nZgenau dann ein Korper ist, wenn n eine Primzahl ist, ist Z als Ausgangspunktfur die Konstruktion weiterer Korper offenbar nicht geeignet. Also ersetzt manZ durch einen Polynomring (Z/pZ)[X]. Die weitere Konstruktion verlauft dannsehr ahnlich: In Polynomringen kann man ohne Muhe Teilbarkeit definieren, sodass man leicht einen Quotientenring definieren kann. Und die Frage, ob ein sol-ches Quotientenobjekt wirklich zu einem Korper wird, ist wieder die Frage, obdas entsprechende Polynom echte Teiler besitzt.

Definition 3.10 Es sei P ∈ K[X], P 6= 0 ein Polynom. Dann heißt

grad(P ) = max{n ∈ N0 : an 6= 0}der Grad von P .Gelegentlich setzt man grad(0) = −∞ .

58

Page 60: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Proposition 3.11 Es seien P,Q ∈ K[X], P,Q 6= 0, und α ∈ K dann gelten:

(i) grad(P + αQ) ≤ max{grad(P ), grad(Q)}, falls P + αQ 6= 0.

(ii) Es gilt PQ 6= 0 und grad(PQ) = grad(P ) + grad(Q)

(iii) P besitzt genau dann in multiplikatives Inverses, wenn grad(P ) = 0 gilt.

Beweis Es seien P = (ai) und Q = (bi).

(i) Es sei r = max{grad(P ), grad(Q)}, dann gilt an = bn = 0 fur alle n > r unddaraus folgt an + αbn = 0 fur alle n > t, also grad(P + αQ) ≤ r.

(ii) Es gelte grad(P ) = r und grad(Q) = s. Dann gilt an = 0 fur alle n > r undbn = 0 fur alle n > s sowie arbs 6= 0. Fur den (r+s)-ten Koeffizienten von PQ giltdann

r+s∑i=0

aibr+s−i

Aus aibr+s−i 6= 0 folgt dann i ≤ r und r + s− i ≤ s, also i = r und daraus

r+s∑i=0

aibr+s−i = arbs 6= 0

Es folgt PQ 6= 0 und grad(PQ) ≥ r+ s. Andererseits sei n > r+ s, dann gilt furden n-ten Koeffizienten von PQ:

n∑i=0

aibn−i

Aus ai 6= 0 folgt dann i ≤ r und daraus n− i ≥ n− r > r+ s− r = s und darausbn−i = 0. Man erhalt

n∑i=0

aibn−i = 0

(iii) Falls grad(P ) = 0 gilt, gilt P = α mit α ∈ K \ {0} und 1/α ist invers zu P .Wenn es umgekehrt ein Q ∈ K[X] gibt mit PQ = 1, folgt Q 6= 0 und daraus

0 = grad(1) = grad(PQ) = grad(P ) + grad(Q)

und daraus grad(P ) = grad(Q) = 0. �

Beim Rechnen in Z hat sich die Division mit Rest als außerst nutzliches Instru-ment erwiesen. Analoges gilt fur die Division mit Rest in K[X], die ich jetzteinfuhren werde:

Satz 3.12 (Division mit Rest)Es seien P,Q ∈ K[X], Q 6= 0. Dann gibt es ein-deutig bestimmte Polynome R, T ∈ K[X] so dass gelten:

P = QT +R mit R = 0 oder grad(R) < grad(Q)

59

Page 61: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Beweis

Existenz Es gelte grad(P ) = n, grad(Q) = k und P = anXn + · · · + a0 sowie

Q = bkXk + · · ·+ b0.

Falls P = 0 gilt, wahle man T = R = 0. Der weitere Beweis erfolgt durchvollstandige Induktion nach grad(P ):

(I) Es gelte grad(P ) = 0. Falls grad(Q) = 0 gilt (dann gilt Q = b0 ∈ K∗), wahleman T = P/Q und R = 0. Falls grad(Q) > 0 gilt, wahle man T = 0 und R = P .

(II) Die Behauptung gelte fur grad(Q) = n− 1.

(III) Falls grad(P ) < grad(Q) gilt, wahle man T = 0 und R = P . Also gelten = grad(P ) ≥ grad(Q) = k. Dann folgt

grad(P − anbkXn−kQ) < n

Also gibt es Polynome T0, R mit R = 0 oder grad(R) < grad(Q) so dass gilt

(P − anbkQXn−k) = QT0 +R

und man erhalt

P =anbkQXn−k +QT0 +R = Q(

anbkXn−k + T0) +R

Beweis der Eindeutigkeit Es gelte P = QT1 + R1 = QT2 + R2, dann folgtQ(T1−T2) = R2−R1. Aus grad(R2−R1) ≤ max{grad(R1), grad(R2)} < grad(Q)folgt T1 − T2 = 0 mit 3.11(ii) und daraus R2 −R1 = 0. �

Division mit Rest ist ja schon in Lineare Algebra I, Kapitel 9 vorgekommen, sodass ich mich auf ein Beispiel beschranke:

Beispiel 3.13 Es seien P = 2X5 + 2X4 − X3 + 3X2 + X + 1 ∈ R[X] undQ = X2 + 1 ∈ R[X]. Dann gilt

(2X5 + 2X4 − X3 + 3X2 + X + 1) : (X2 + 1) = 2X3 + 2X2 − 3X + 1

2X5 + 2X3

2X4 − 3X3

2X4 + 2X2

− 3X3 + X2

− 3X3 − 3XX2 + 4X + 1X2 + 1

4X

Also gilt

2X5 + 2X4 −X3 + 3X2 +X + 1 = (X2 + 1)(X3 + 2X2 − 2X + 1) + 4X

60

Page 62: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Ich komme nun zuruck zu der Diskussion zu Beginn des Kapitels: Ein PolynomP ∈ K[X] erzeugt naturlich eine Abbildung von K nach K:

Definition 3.14 Es sei P = a0 + a1X + · · ·+ arXr ∈ K[X] ein Polynom. Dann

definiere man die AbbildungP : K −→ K

durchP (t) = a0 + a1t+ · · ·+ art

r .

Man nennt P die zu P assoziierte Polynomabbildung.

Beispiele 3.15

(i) Es sei P = X2 +X ∈ (Z/2Z)[X]. Dann gilt:

P ([0]) = [0] + [0] = [0] und P ([1]) = [1] + [1] = [0] ,

also ist P die Nullabbildung, obwohl P nicht das Nullpolynom ist.

(ii) Es seien K = {a1, . . . , ar} ein endlicher Korper und

P = (X − a1) · · · (X − ar)

dann gilt P = 0.

Proposition 3.16 Es seien K ein Korper und P,Q ∈ K[X] sowie a ∈ K. Danngelten:

(i) P +Q = P + Q

(ii) aP = aP

(iii) PQ = P Q

Beweis Die entsprechenden Operationen fur Polynome sind gerade so angelegt,dass diese Gleichungen richtig sind. �

Definition 3.17 Es sei K ein Korper. Ein Element a ∈ K heißt Nullstelle vonP ∈ K[X], wenn gilt P (a) = 0.

Proposition 3.18 Es seien K ein Korper, P ∈ K[X], P 6= 0 und a ∈ K eineNullstelle von P . Dann gibt es ein Polynom T ∈ K[X] so dass gilt P = (X−a)T .

Beweis Division mit Rest liefert ein Polynom R ∈ K[X] so dass gilt

P = (X − a)T +R mit R = 0 oder grad(R) < grad(X − a) = 1

61

Page 63: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Also gilt R = 0 oder grad(R) = 0, d.h. R = b mit b ∈ K. Aus

P = (X − a)T + b

folgt

P = ˜(X − a)T + a

und daraus0 = P (a) = (a− a)T (a) + b = b

und daraus b = 0. �

Korollar 3.19 Es seien K ein Korper und P ∈ K[X], P 6= 0. Dann besitzt Phochstens grad(P ) Nullstellen.

Beweis Durch vollstandige Induktion nach grad(P ).

(I) grad(P ) = 0: Klar.

(II) Die Behauptung gelte fur grad(P ) = n− 1.

(III) Es sei grad(P ) = n. Falls P keine Nullstelle besitzt, folgt die Behauptung.Also sei a eine Nullstelle von P . Nach 3.18 gibt es ein Polynom T ∈ K[X] so dassgilt P = (X−a)T . Wegen grad(P ) = grad((X−a)T ) = grad(X−a)+grad(T ) =grad(T )+1 gilt grad(T ) = grad(P )−1 = n−1 und nach (II) besitzt T hochstensn− 1 Nullstellen. Schließlich sei b irgendeine Nullstelle von P , dann folgt

0 = P (b) = ˜(X − a)(b)T (b) = (b− a)T (b)

und daher gilt b = a oder b ist eine Nullstelle von T . Also besitzt P hochstens1 + (n− 1) = n Nullstellen. �

Korollar 3.20 Es seien K ein Korper mit unendlich vielen Elementen und P,Q ∈K[X] Polynome. Dann folgt aus P = Q, dass P = Q gilt.

Beweis Aus P = Q folgt P −Q = P − Q = 0 und daher ist jedes Element ausK eine Nullstelle von P −Q. Aus 3.19 folgt dann P −Q = 0, d.h. P = Q. �

Wegen 3.20 unterscheidet man in unendlichen Korpern, speziell in R und C,oft nicht zwischen einem Polynom P und der assoziierten Polynomabbildung P .Entsprechend schreibt man dann auch P (a) fur P (a).

Definition 3.21 Es seien K ein Korper und P,Q ∈ K[X]. Dann heißt P Teilervon Q, wenn es ein Polynom T ∈ K[X] so gibt, dass gilt PT = Q. Man schreibtdann P |Q.

Fur Teilbarkeit in Polynomringen die folgenden Variationen von 2.3:

62

Page 64: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Proposition 3.22 Es seien K ein Korper und P,Q,R, S, U, V ∈ K[X], danngelten:

(i) Fur alle a ∈ K∗ = K \ {0} gilt a|P und (aP )|P .

(ii) Aus P |Q und P |S folgt P |(UQ+ V S).

(iii) Aus P |Q und R|S folgt PR|QS.

(iv) Aus P |Q und Q 6= 0 folgt grad(P ) ≤ grad(Q).

(v) Aus P |Q, Q 6= 0 und gradP = gradQ folgt Q = aP fur ein a ∈ K∗.(vi) Aus P |Q und Q|P folgt Q = aP fur ein a ∈ K∗.

Beweis (i) - (iii) sind Routine.

(iv) Es gibt ein T ∈ K[X] so dass gilt PT = Q. Wegen Q 6= 0 folgt P, T 6= 0.Aus 3.11 folgt dann

gradQ = grad(PT ) = gradP + grad T ≥ gradP

(v) Es gibt ein T ∈ K[X], so dass gilt Q = TP . Aus Q 6= 0 folgt T, P 6= 0. Aus3.11 erhalt man dann

gradQ = grad(PT ) = gradP + grad T

und daraus grad T = 0. Also gibt es ein a ∈ K∗ so dass gilt T = a und manerhalt Q = aP .

(vi) Falls P = 0 gilt, folgt Q = 0 und man kann a = 1 wahlen. Das Analoge gilt,falls Q = 0 gilt. Also gelte P,Q 6= 0. Wegen P |Q und Q|P gilt gradP ≤ gradQund gradQ ≤ gradP nach (iv), also gradP = gradQ. Die Behauptung folgtdann aus (v). �

Ich komme nun zu dem zentralen Begriff, der in Polynomringen den der Primzahlersetzt. Defintionsgemaß heißt eine naturliche Zahl p Primzahl, wenn sie nur dienaturlichen Teiler 1 und p besitzt. Das ist aber aquivalent dazu, dass sie nurdie “trivialen” Teiler p,−p, 1,−1 besitzt. Die Frage ist also, was die “trivialen”Teiler eines Polynoms P sind. Das sind also die Teiler, die P in jedem Fall besitzt,also nach 3.22 alle Elemente aus K∗ und alle Teiler der Form aP mit a ∈ K∗.Die Teiler des ersten Typs sind die Teiler vom Grad 0. Die Teiler des zweitenTyps haben denselben Grad von P . Wenn aber schließlich Q ein Teiler von P mitgrad(Q) = grad(P ) ist, dann gibt es ein Polynom T so dass gilt P = TQ. AusGradgrunden folgt grad(T ) = 0 und daraus T ∈ K∗. Also sind die Teiler vonP , die denselben Grad wie P haben genau die der Form aP mit a ∈ K∗. Damithaben wir die “trivialen” Teiler von P beschrieben: Es sind die vom Grad 0 unddie vom Grad grad(P ). Also sind Polynome, die keine weiteren Teiler haben, dasAnalogon einer Primzahl.

63

Page 65: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Definition 3.23 Es sei K ein Korper. Ein Polynom P ∈ K[X], P 6= 0 heißtirreduzibel, wenn gilt grad(P ) ≥ 1 und wenn P keine Teiler Q hat mit 1 ≤grad(Q) < grad(P ).

P heißt reduzibel, wenn P nicht irreduzibel ist.

Teiler Q der Form 1 ≤ grad(Q) < grad(P ) nennt man auch echte Teiler. Alsoist ein Polynom 6= 0 genau dann irreduzibel, wenn es keine echten Teiler besitzt.

Bevor ich Beispiele rechne, beweise ich einige nutzliche Eigenschaften:

Lemma 3.24 Es sei K ein Korper. Dann gelten:

(i) Jedes Polynom aus K[X] vom Grad 1 ist irreduzibel.

(ii) Ein Polynom vom Grad ≥ 2, das eine Nullstelle besitzt, ist reduzibel, alsonicht irreduzibel.

(iii) Ein Polynom vom Grad 2 oder 3 ist genau dann irreduzibel, wenn es keineNullstelle besitzt.

Beweis

(i) ist klar.

(ii) Es sei P ∈ K[X], es gelte grad(P ) ≥ 2 und a ∈ K sei eine Nullstelle von P .Nach 3.18 gibt es ein Polynom T ∈ K[X] so dass gilt P = (X − a)T . Also istX − a ein Teiler von P und wegen

grad(X − a) = 1 < 2 = grad(P )

ist X − a ein echter Teiler von P , und P daher nicht irreduzibel.

(iii) Es gelte grad(P ) ∈ {2, 3}. Wenn P eine Nullstelle besitzt ist es nach (ii)reduzibel. Also sei P reduzibel, dann besitzt P einen echten Teiler Q und dahergibt es ein Polynom T so dass gilt P = QT . Wegen P 6= 0 gilt T 6= 0 und daher

grad(Q) + grad(T ) = grad(QT ) = grad(P ) ≤ 3

Wegen 1 ≤ grad(Q) < grad(P ) folgt grad(T ) ≥ 1 und daraus grad(Q) = 1 odergrad(T ) = 1. Da jedes Polynom vom Grad 1 eine Nullstelle hat, hat P in beidenFallen eine Nullstelle. �

Beispiele 3.25

(i) X2 + 1 ist irreduzibel in R[X], aber reduzibel in C[X] und in (Z/2Z)[X].

(ii) Die Polynome X2 + X + 1, X3 + X2 + 1 sowie X4 + X3 + X2 + X + 1 undX4 +X + 1 sind irreduzibel in (Z/2Z)[X].

(iii) Die Polynome X2 +X + 2 und X3 +X2 + 2 sind irreduzibel in (Z/3Z)[X].

(iv) Das Polynom X8 +X4 +X3 +X + 1 ist irreduzibel in (Z/2Z)[X].

64

Page 66: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Beweis

(i) Nach 3.24 is X2 + 1 genau dann irreduzibel, wenn es eine Nullstelle besitzt.Und X2 + 1 besitzt keine Nullstelle in R, aber eine Nullstelle in C bzw. Z/2Z.

(ii) Die beiden ersten Polynome haben keine Nullstelle.

Zur Vereinfachung der Notation schreibe ich bei der weiteren Rechnung 0 bzw. 1fur [0] bzw. [1].

(Das durfen Sie naturlich auch tun, aber bedenken Sie immer, dass 0 und 1 dannfur Aquivalenzklassen stehen. Und wenn Sie z.B. die Elemente in Z/3Z in derForm 0, 1, 2 schreiben, dann gilt 1+1+1 = 0, wahrend in Z/2Z gilt 1+1+1 = 1.Ich hoffe, ich habe mit dieser Bemerkung nicht mehr Verwirrung als Klarheiterreicht!)

Ich zeige zunachst, dass das Polynom P = X4 +X3 +X2 +X + 1 ∈ (Z/2Z)[X]irreduzibel ist. Offenbar besitzt P keine Nullstelle in Z/2Z. Angenommen, Pbesitzt einen echten Teiler Q. Dann gibt es ein Polynom T ∈ (Z/2Z)[X] so dassgilt P = QT . Falls grad(Q) = 1 gilt, besitzt Q und daher auch P eine Nullstelle,W! Falls grad(Q) = 3 gilt gilt grad(T ) = 1 und daher besitzt P eine Nullstellein Z/2Z. W! Also gilt grad(Q) = grad(T ) = 2.

Also gibt es α, a, b ∈ Z/2Z so dass gilt Q = αX2 + aX + b. Nun kann nichtα = 0 gelten, also muss α = 1 gelten, also folgt Q = X2 + aX + b. Analog gibtes c, d ∈ Z/2Z so dass gilt T = X2 + cX + d.

P = (X2 + aX + b)(X2 + cX + d)

es folgt

X4 +X3 +X2 +X1 + 1P = X4 + (a+ c)X3 + (b+ ac+ d)X2 + (ad+ bc)X + bd

und darausa+ c = b+ ac+ d = ad+ bc = bd = 1

Aus bd = 1 folgt b = d = 1, und daraus 1 = b+ac+d = ac und daraus a = c = 1,im Widerspruch zu a+ c = 1.

Da X4 + X + 1 keine Nullstellen besitzt, kann man es nicht als Produkt eineslinearen und eines kubischen Polynoms darstellen. Angenommen, es ware dasProdukt von zwei quadratischen Polynomen. Ebenso wie im Beispiel zuvor kannman annehmen, dass dann gilt

P = (X2 + aX + b)(X2 + cX + d)

AusP = X4 + (a+ c)X3 + (b+ ac+ d)X2 + (ad+ bc)X + bd

folgta+ c = b+ ac+ d = 0 , ad+ bc = bd = 1

65

Page 67: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Aus bd = 1 folgt b = d = 1 und daraus 0 = b+ac+d = ac, also a = 0 oder c = 0.Aus a+c = 0 folgt a = c und daher a = c = 0 im Widerspruch zu 1 = ad+bc = 0.

(iii) Beide Polynome haben keine Nullstelle in Z/3Z.

(iv) Das ist eine langere Rechnung. �

Proposition 3.26 Es seien K ein Korper, P ∈ K[X] irreduzibel und Q ∈ K[X]so gewahlt, dass P kein Teiler von Q ist. Dann gibt es Polynome S, T ∈ K[X] sodass gilt SP + TQ = 1.

Beweis Da P kein Teiler von Q ist, gilt Q 6= 0. Man wahle ein Polynom U0 ∈K[X] so dass gilt

grad(U0) = min{grad(SP + TQ) : S, T ∈ K[X], SP + TQ 6= 0}

und man wahle S0, T0 so dass gilt U0 = S0P +T0Q. Ich zeige zunachst, dass U0|Pgilt: Division mit Rest liefert Polynome V,R mit R = 0 oder grad(R) < grad(U0)so dass gilt P = U0V +R. Es folgt

R = P − U0V = P − S0PV − T0QV = (1− S0V )P − T0Q

Falls R 6= 0 gilt, folgt ein Widerspruch zur Wahl von U0. Also folgt R = 0 unddaraus U0|P . Analog zeigt man, dass U0|Q gilt.

Nun sei P irreduzibel, dann folgt grad(U0) = 0 oder grad(U0) = grad(P ). Imersten Fall folgt U0 = a fur ein a ∈ K∗ und aus

a = U0 = S0P + T0Q

folgt1 = (1/a)S0P + (1/a)T0Q

Im zweiten Fall folgt P = aU0 fur ein a ∈ K∗ und wegen U0|Q folgt P |Q imGegensatz zur Annahme. �

Man beachte, dass der Beweis der obigen Proposition analog zu dem Beweis von2.6 verlauft.

66

Page 68: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Kapitel 4

Endliche Korper

In diesem Kapitel werde ich bewiesen, dass die Anzahl der Elemente eines endli-chen Korpers eine Primzahlpotenz ist. Weiterhin werde eine Methode vorfuhren,um Korper zu konstruieren, deren Elementeanzahl eine Primzahlpotenz ist.

Definition 4.1 Es seien K ein Korper, a ∈ K und n ∈ N. Dann definiere man

n× a = a+ · · ·+ a︸ ︷︷ ︸n−mal

(Die formal bessere Definition ist naturlich die durch vollstandige Induktion: Mandefiniert 1× a = a und (n+ 1)× a = n× a+ a.) Weiterhin definiere man

(−n)× a) = −(n× a)

0× a = 0

Proposition 4.2 Es sei K ein Korper. Dann gelten fur alle k, n ∈ Z und allea, b ∈ K:

(i) (k ± n)× a = k × a± n× a

(ii) (kn)× a = k × (n× a)

(iii) (kn)× 1 = (k × 1)(n× 1)

(iv) k × (a+ b) = k × a+ k × b

(v) k × (ab) = a(k × b)

Beweis Die Beweise sind ein bißchen langlich, da man sie formal fr naturliche kinduktiv beweisen muss und anschließend den Fall, dass −k eine naturliche Zahlist, untersuchen muss. Ich veranschauliche sie im folgenden unter der Vorausset-zung, dass k und n naturliche Zahlen sind:

67

Page 69: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

(i) Ich veranschauliche die obere Gleichung:

k × a+ n× a = a+ · · ·+ a︸ ︷︷ ︸k−mal

+ a+ · · ·+ a︸ ︷︷ ︸n−mal

= a+ · · ·+ a︸ ︷︷ ︸k+n−mal

= (k + n)× a

(ii)k × (n× a) = a+ · · ·+ a︸ ︷︷ ︸

n−mal

+ · · ·+ a+ · · ·+ a︸ ︷︷ ︸n−mal︸ ︷︷ ︸

k−mal

= (kn)× a

(iv)

k × a+ k × b = a+ · · ·+ a︸ ︷︷ ︸k−mal

+ b+ · · ·+ b︸ ︷︷ ︸k−mal

= (a+ b) + · · ·+ (a+ b)︸ ︷︷ ︸k−mal

= k × (a+ b)

(v)k × (ab) = ab+ · · ·+ ab︸ ︷︷ ︸

k−mal

= a(b+ · · ·+ b︸ ︷︷ ︸k−mal

) = a(k × b)

(iii)

(k × 1)(n× 1) = (1 + · · ·+ 1)︸ ︷︷ ︸k−mal

(1 + · · ·+ 1)︸ ︷︷ ︸n−mal

= (1 + · · ·+ 1)︸ ︷︷ ︸kn−mal

= (kn)× 1

(iii) folgt auch aus (ii) und (v): Mit a = 1 folgt aus (ii):

(kn)× 1 = k × (n× 1)

Mit b = 1 und a = n× 1 folgt aus (v):

(k × 1)(n× 1) = (n× 1)(k × 1) = k × ((n× 1) · 1) = k × (n× 1)

Definition 4.3 Es sei K ein Korper. Wenn es ein n ∈ N so gibt, dass giltn× 1 = 0, dann heißt

χ(K) = min{k ∈ N : k × 1 = 0}

die Charakteristik von K. Falls es kein n mit dieser Eigenschaft gibt, setzt manχ(K) = 0.

Beispiel 4.4 Fur alle Primzahlen p gilt χ(Z/pZ) = p. Weiterhin gilt χ(Q) =χ(R) = χ(C) = 0.

Lemma 4.5 Es sei K ein Korper der Charakteristik p > 0. Dann gilt p× a = 0fur alle a ∈ K.

68

Page 70: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Beweis Nach 4.2(v) gilt fur alle a ∈ K:

p× a = p× (a · 1) = a(p× 1) = a · 0 = 0 �

Satz 4.6 Die Charakteristik eines Korpers ist 0 oder eine Primzahl.

Beweis Es sei m = χ(K) > 0. Angenommen, m = pq mit 1 < p, q < m. Danngilt nach Nach 4.2(iii)

m× 1 = (pq)× 1 = (p× 1)(q × 1)

und es folgt p× 1 = 0 oder q × 1 = 0. W. �

Proposition 4.7 Es sei K ein Korper der Charakteristik p > 0. Dann ist

L := {k × 1 : 0 ≤ k < p}

ein Unterkorper von K mit p Elementen. Es ist offenbar der kleinste Unterkorpervon K und heißt der Primkorper von K.

Beweis Der Beweis zerfallt in mehrere Teile:

Behauptung (L,+) ist eine Untergruppe von (K,+).

Beweis Fur alle 0 ≤ j ≤ k < p gilt nach 4.2(i)

k × 1− j × 1 = (k − j)× 1 ∈ L

und

j × 1− k × 1 = (j − k)× 1 = p× 1 + (j − k)× 1 = (p+ j − k)× 1 ∈ L

Behauptung Es gilt xy ∈ L fur alle x, y ∈ L.

Beweis Es gelte x = k× 1 und y = j × 1, dann wahle man q, r mit 0 ≤ r < p sodass gilt kj = pq + r = qp+ r. Es folgt

(k×1)(j×1) = (kj)×1 = (qp+r)×1 = (qp)×1+r×1 = q(p×1)+r×1 = r×1 ∈ L

Behauptung Fur alle x ∈ L \ {0} gilt x−1 ∈ L.

Beweis Es gelte x = k × 1 mit 1 ≤ k < p. Dann gilt ggT (k, p) = 1, also gibt esα, β ∈ Z so dass gilt 1 = αk + βp. Es folgt

1 = 1× 1 = (αk + βp)× 1 = (αk)× 1 + (βp)× 1

= (α× 1)(k × 1) + β × (p× 1)

= (α× 1)(k × 1)

69

Page 71: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

und daraus x−1 = α×1. Division von α durch pmit Rest liefert j, r ∈ Z, 0 ≤ r < pso dass gilt α = jp+ r. Es folgt

α× 1 = (jp)× 1 + r × 1 = r × 1 ∈ L �

Ublicherweise wird der Primkorper mit P bezeichnet. Da ich aber Poynome oftmit P bezeichne und auch die Menge der Primzahlen oft mit P oder P bezeichnetwird, habe ich diese Bezeichnung an dieser Stelle vermieden.

Korollar 4.8 Es sei K ein endlicher Korper. Dann ist |K| eine Primzahlpotenz.

Beweis Da K endlich ist, gibt es r, s ∈ N, r < s so dass gilt r × 1 = s × 1. Esfolgt (s − r) × 1 = 0 und daher χ(K) > 0. Sei L der Primkorper von K, dannist p = |L| nach 4.7 eine Primzahl. Weiterhin ist K ein Vektorraum uber L, alsogibt es ein n ∈ N so dass K isomorph ist zu Ln. Daher hat K genau pn Elemente.

Satz 4.9 Es seien K ein Korper und M ∈ K[X]. Dann ist

(M) = {QM : Q ∈ K[X]} = {P ∈ K[X] : M |P}

eine Untergruppe von K[X]. Definiert man

· : K[X]/(M)×K[X]/(M) −→ K[X]/(M)

durch[P ][Q] = [PQ]

dann ist · wohldefiniert und K[X]/(M) ein kommutativer Ring mit Eins. WennM irreduzibel ist, ist K ein Korper.

Beweis Fur alle P,Q ∈ K[X] gilt [P ] = [Q] genau dann, wenn gilt Q−P ∈ (M),d.h. es gilt [P ] = [Q] genau dann, wenn gilt M |(Q − P ). Die Untergruppenei-genschaften folgen dann direkt aus 3.22. Um zu zeigen, dass · : K[X]/(M) ×K[X]/(M) → K[X]/(M) wohldefiniert ist, betrachte man P, P ′, Q,Q′ ∈ K[X]so dass gilt [P ′] = [P ], [Q′] = [Q]. Dann folgt M |(P − P ′) und M |(Q − Q′).Weiterhin gilt

PQ− P ′Q′ = (P − P ′)Q+ (Q−Q′)P ′

Also ist M ein Teiler von PQ− P ′Q′ und es folgt [P ′Q′] = [PQ].

Das Assoziativ- und Distributivgesetz folgen auf die ubliche Weise, offenbar ist[1] ein neutrales Element bezuglich der Multiplikation.

Nun sei M irreduzibel. Dann gilt offenbar [1] 6= [0]. Es bleibt zu zeigen, dassjedes von [0] verschiedene Element ein multiplikatives Inverses besitzt. Also sei

70

Page 72: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

P ∈ K[X], [P ] 6= [0]. Dann ist M kein Teiler von P . Nach 3.26 gibt es PolynomeS, T ∈ K[X] so dass gilt 1 = SP + TM . Es folgt

[1] = [SP + TM ] = [S][P ] + [T ][M ] = [S][P ] �

Korollar 4.10 Es seien K ein Korper mit q Elementen und M ∈ K[X] einirreduzibles Polynom vom Grad n. Dann ist K[X]/(M) ein Korper mit qn Ele-menten.

Beweis Es bleibt zu zeigen, dass K[X]/(M) genau qn Elemente besitzt. Ichbehaupte nun, dass

B = {an−1Xn−1 + · · ·+ a0 : an−1, . . . , a0 ∈ K}

ein vollstandiges Representantensystem ist, d.h. es gilt [P ] 6= [Q] fur alle P,Q ∈ Bund zu jedem P ∈ K[X] gibt es ein Q ∈ B mit [P ] = [Q].

Es gelte P,Q ∈ L und [P ] = [Q]. Dann folgt [P −Q] = [0] und daher M |(P −Q).Wegen grad(P ), grad(Q) < n folgt grad(P −Q) < n und wegen M |(P −Q) folgtP = Q. Also gilt [P ] 6= [Q] fur alle P,Q ∈ L mit P 6= Q.

Es sei P ∈ K[X], dann erhalt man durch Division mit Rest Polynome S,R ∈K[X] mit R = 0 oder grad(R) < grad(Q) so dass gilt P = SQ + R. Es folgtR ∈ L und [P ] = [S][Q] + [R] = [R]. �

Beispiel 4.11 Nach 3.25(ii) ist X2 + X + 1 irreduzibel in (Z/2Z)[X], also istK = (Z/2Z)[X]/(X2 +X + 1) nach 4.10 ein Korper mit 4 Elementen. Weiterhingilt

K = {[a0 + a1X] : a0, a1 ∈ Z/2Z} = {[a0] + [a1X] : a0, a1 ∈ Z/2Z}= {[0], [1], [X], [1 +X]}

Weiterhin gilt

[X2 +X + 1] = [0]

⇒ [X]2 + [X] + [1] = [0]

⇒ [X]2 + [X] + [1] + [X] + [1] = [X] + [1]

⇒ [X]2 = [X] + [1] = [1] + [X]

Dies ergibt:

([1] + [X])[X] = [X]([1] + [X]) = [X] + [X]2 = [X] + [1] + [X] = [1]

([1] + [X])([1] + [X]) = [1] + [X] + [X] + [X]2 = [1] + [1] + [X] = [X]

71

Page 73: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Also erhalt man die folgenden Operationstafeln, wobei ich die eckigen Klammernder Ubersichtlichkeit halber weggelassen habe:

+ 0 1 X 1 +X0 0 1 X 1 +X1 1 0 1 +X XX X 1 +X 0 1

1 +X 1 +X X 1 0

· 0 1 X 1 +X0 0 0 0 01 0 1 X 1 +XX 0 X 1 +X 1

1 +X 0 1 +X 1 X

Die Frage, ob es zu jeder Primzahl p und jeder naturlichen Zahl n einen Korpermit pn Elementen gibt, ist einigermaßen kompliziert. Das Antwort dazu lautet:

Satz 4.12 Es seien p eine Primzahl und n eine naturliche Zahl. Dann gibt esbis auf Isomorphie genau einen Korper mit pn Elementen.

Dabei heißen zwei Korper K und K ′ isomorph, wenn es eine bijektive Abbildungϕ : K → K ′ so gibt, dass ϕ(x+ y) = ϕ(x) + ϕ(y) und ϕ(xy) = ϕ(x)ϕ(y) fur allex, y ∈ K gilt.

Die Existenz eines Korpers mit pn Elementen ist nach 4.10 gesichert, wenn es einirreduzibles Polynom in Z/pZ[X] mit n Elementen gibt. Interessanterweise gibtes eine Formel fur die Anzahl Nn(p) der in (Z/pZ)[X] irreduziblen, normiertenPolynome vom Grad n, namlich

Nn(p) =1

n

∑d|n

µ(d)pn/d

dabei ist µ die sogenannte Mobiusfunktion:

µ(d) =

1 d = 1

(−1)k wenn d das Produkt von genau kverschiedenen Primzahlen ist

0 sonst

Aus dieser Formel kann man ohne Muhe die Gleichung Nn(p) ≥ 1 herleiten:

Es gilt µ(1) ≥ −1 und daher

nNn(p) =∑d/n

µ(d)pn/d ≥ pn −n−1∑k=1

pk

Nun gilt

n−1∑k=1

pk = pn−1∑k=1

pk−1 = pn−2∑k=0

pk = ppn−1 − 1

p− 1<

pn

p− 1≤ pn

72

Page 74: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

und es folgt

Nn(p) =1

n(pn −

n−1∑k=1

pk) > 0

Da Nn(p) eine nicht negative ganze Zahl ist, folgt Nn(p) ≥ 1. �

Leider ist die Herleitung dieser Formel auch ein wenig muhsam. (Siehe z.B. Nor-man L. Biggs, Discrete Mathematics.)

73

Page 75: hilbert.math.uni-mannheim.dehilbert.math.uni-mannheim.de/~rhk/10_FSS_DMA/FSS10_DMA_Skript_Butzma…hilbert.math.uni-mannheim.de

Korrekturen

Seite, Zeile Fehler Korrektur Datum

5, 5 M = L = 22.02.106, -1 Gconst∩ Gconst ∩K 22.02.108, 15 bzw. 0 ∈M(A, b) bzw. 0 ∈ exM(A, b) 22.02.109, -11 (1α)zi (1− α)zi 22.02.109, -5 zulassige Bereich des MPs zulassige Bereich des LPs 22.02.1038, 10 y∗ eine Losung des primalen y∗ eine Losung des dualen 25.03.1053, 11 mi ≡ 0 mod mj m′i ≡ 0 mod mj 29.03.107, 2 Minimum Maximum 12.04.10

74