Seminar Analysis Konvexe Funktionen und einige wichtige...

13
Seminar Analysis Konvexe Funktionen und einige wichtige Ungleichungen Michael Schaeper 23.04.2013 1

Transcript of Seminar Analysis Konvexe Funktionen und einige wichtige...

Page 1: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Seminar AnalysisKonvexe Funktionen und einige wichtige Ungleichungen

Michael Schaeper

23.04.2013

1

Page 2: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Abstract

This seminar is about convex functions and several important inequalities. At the beginning theterm convexity is on focus, because with its help many important inequalities can be proofed. Af-terwards we go in detail and proof the inequalities from Hölder, Minkowski and Jensen. At the endthe Cauchy-Schwartz inequality is used in an application example, which solves the representedproblem.

Kurze Übersicht

Dieses Seminar handelt über Konvexe Funktionen und einige wichtige Ungleichungen. Zunächststeht der Begriff der Konvexität im Mittelpunkt, da mit dessen Hilfe einige wichtige Ungleichungenbewiesen werden können. Anschließend werden speziel die Höldersche, Minkowskische, sowie Jen-sensche Ungleichung bewiesen. Zum Schluss wird gezeigt, wie die Chauchy-Schwarz-Ungleichungin einem Anwendungsbeispiel zum tragen kommen kann, um das vorgestellte Problem zu lösen.

Page 3: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

1 EinleitungAbleitungen können physikalisch als Geschwindigkeiten interpretiert werden, zweite Ableitungendann entsprechend als Beschleunigungen. In diesem Seminar wird nun die geometrische Bedeu-tung der zweiten Ableitung diskutiert. Dies führt zum wichtigen Begriff der Konvexität, mit dessenHilfe sich eine Reihe interessanter Ungleichungen herleiten lassen.

Definition 1.1a) Es sei I ⊆ R ein Intervall. Eine Funktion f : I → R heißt konvex, falls für alle x, y ∈ I

und t ∈ [0, 1] gilt:

f((1− t)x+ ty) ≤ (1− t)f(x) + tf(y) (1)

b) Eine Funktion f : I → R heißt konkav, falls −f konvex ist.

Konvexität bedeutet anschaulich, dass der Graph von f immer unterhalb der Verbindungsstreckezweier seiner Punkte liegt (vgl. Abb. 1), entsprechend bedeutet Konkavität, dass er stets oberhalbdieser Strecke liegt. Natürlich ist f : I → R genau dann konkav, wenn (1) mit "≥"für f gilt.

Page 4: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Satz 1.2Eine Funktion f : I → R ist genau dann konvex, wenn für alle x < z < y ∈ I gilt:

f(z)− f(x)z − x

≤ f(y)− f(z)y − z

(2)

Beweis :

Setzt man in (1) z := (1− t)x+ ty mit t ∈ (0, 1), folgt sofort die Äquivalenz:

f(z) ≤ (1− t)f(x) + tf(y)

⇔ 0 ≤ (1− t)f(x) + tf(y)− f(z) | · (y − x)⇔ 0 ≤ (1− t)(y − x)f(x) + t(y − x)f(y)− (y − x)f(z)⇔ 0 ≤ [(1− t)y − (1− t)x]f(x) + (ty − tx)f(y)− (y − x)f(z)⇔ 0 ≤ [y − ((1− t)x+ ty︸ ︷︷ ︸

=:z

))]f(x) + [(1− t)x+ ty︸ ︷︷ ︸=:z

−x)f(y)− (y − x)f(z)

⇔ 0 ≤ (y − z)f(x) + (z − x)f(y)− (y − z + z − x)f(z)⇔ 0 ≤ [f(y)− f(z)](z − x)− [f(z)− f(x)](y − z)

⇔ f(z)− f(x)z − x

≤ f(y)− f(z)y − z

Folgerung 1.3Eine differenzierbare Funktion f ∈ F (I) ist genau dann konvex, wenn f ′ monoton wachsendist.

Beweis :

"⇒": In (2) gilt: x < z < y. Mit z → x+ folgt: limz→x+

f(z)−f(x)z−x = f ′(x) ≤ f(y)−f(z)

y−z

Mit z → y− folgt: f(z)−f(x)z−x ≤ limz→y−

f(y)−f(z)y−z = f ′(y)

Insgesamt ist f ′ monoton wachsend, denn: x < y ⇒ f ′(x) ≤ f ′(y)

"⇐": Wähle f(z)−f(x)z−x = f ′(ξ1), sowie f(y)−f(z)

y−z = f ′(ξ2) Da f ′ monoton wachsend, gilt: f ′(x) ≤ f ′(y)

Insbesondere: f ′(ξ1) ≤ f ′(ξ2)

Mit dem Mittelwertsatz der Differentialrechnung folgt: f(z)−f(x)z−x = f ′(ξ1) ≤ f ′(ξ2) = f(y)−f(z)y−z ,

was mit Satz 1.2 die Konvexitätseigenschaft beschreibt.

Page 5: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Auf dieser Seite befinden sich ein paar Aussagen im Zusammenhang mit Konvexität, die für denweiteren Verlauf des Seminars aber nicht ausschlaggebend sind. Sie sollen dem Leser dennochnicht vorenthalten werden.

Folgerung 1.4Eine zweimal differenzierbare Funktion f ∈ F (I) ist genau dann konvex, wenn f ′′(x) ≥ 0 gilt.

Eine differenzierbare Funktion f ∈ F (I) ist genau dann monoton wachsend, wenn f ′(x) ≥ 0 fürx ∈ I gilt. Da nach Folgerung 1.3 eine differenzierbare Funktion f ∈ F (I) genau dann konvexist, wenn f ′ monoton wachsend ist, oder anders formuliert f ′′(x) ≥ 0 für x ∈ I , folgt sofort dieÄquivalenz der Aussage.

f ′′(x) ≥ 0⇔ f ′ mon. wachsend 1.3⇐⇒ f konvex

Definition 1.5Eine Funktion f : I → R hat einen Wendepunkt in einem inneren Punkt a ∈ I , falls f für eingeeignetes δ > 0 auf (a− δ, a] konkav und auf [a, a+ δ) konvex ist, oder dies auf −f zutrifft.

Bemerkung 1.6Die Funktion f ∈ F (I) habe einen Wendepunkt in a ∈ I . Ist f auf I differenzierbar, so hat f ′

ein lokales Extremum in a. Ist f auf I zweimal differenzierbar, so folgt f ′′(a) = 0

Page 6: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Beispiel 1.7a) Die Exponentialfunktion f(x) = ex, f ∈ C∞(R) ist konvex wegen f(x) = ex = f ′′(x) ≥ 0∀x ∈ R.(vgl. Abb. 2)

b) Der Logarithmus g(x) = log(x), g ∈ C∞(R+) ist wegen g′′(x) = − 1x2≤ 0

konkav. (vgl. Abb. 2)

c) Für die Potenzfunktionen pα : x 7→ xα gilt auf (0,∞):p′α(x) = αxα−1 , p′′α(x) = α(α− 1)xα−2

D.h. konvex für: α ≥ 1 ∨ α ≤ 0, sowie konkav für: 0 ≤ α ≤ 1.

d) Sei nun α = 3. p3(x) = x3 ist wegen p′′3(x) = 6x auf (−∞, 0] konkavund auf [0,∞) konvex. (vlg. Abb. 3)

e) Sei nun α = 4. p4(x) = x4 ist wegen p′′4(x) = 12x2 ≥ 0 konvex für alle x ∈ R.(vlg. Abb. 3)

Page 7: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Mit Hilfe der Konvexität der Exponentialfunktion lassen sich wichtige Ungleichungen beweisen.

Lemma 1.8

Für p, q > 1 mit 1p+ 1

q= 1 und a, b ≥ 0 gilt:

a · b ≤ 1

pap +

1

qbq (3)

Beweis :

Es werden alle 4 Fälle betrachtet:

• Für a, b = 0 folgt sofort: 0 ≤ 0 X

• Für a = 0, b > 0 folgt: 0 · b ≤ 0 + 1q bq ⇔ 0 ≤ bq X

• Für a > 0, b = 0 analog X

• Für a, b > 0 folgt mit x := log(a) und y := log(b):

a · b = ex · ey = ex+y = exp(1ppx+ 1q qy)

(1)

≤ 1p exp(px) +

1q exp(qy) =

1pa

p + 1q bq X

Satz 1.9 (Höldersche Ungleichung)

Für p, q > 1 mit 1p+ 1

q= 1 und Regelfunktionen f, g ∈ R(J) gilt:

∫J

|f(x)g(x)| dx ≤

∫J

|f(x)|pdx

1p

·

∫J

|g(x)|qdx

1q

(4)

Beweis :Sei ε > 0. Definiere:

Aε :=

∫J

|f(x)|pdx

1p

+ ε, Bε :=

∫J

|g(x)|qdx

1q

+ ε

Für x ∈ J wendet man (3) auf a := |f(x)|Aε

, b := |g(x)|Bε

an und erhält:

a · b = |f(x)|Aε

· |g(x)|Bε

(3)

≤ 1

p

(|f(x)|Aε

)p+

1

q

(|g(x)|Bε

)q|Integration

⇔ 1

AεBε·∫J

|f(x)g(x)| dx ≤ 1

pApε

∫J

|f(x)|p dx+1

qBqε

∫J

|g(x)|q dx

≤ 1

p+

1

q= 1

Für ε→ 0 folgt die Behauptung (4):∫J

|f(x)g(x)| dx ≤ A ·B

Page 8: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Mit p = q = 2 hat man speziell die Cauchy-Schwarzsche Ungleichung:

∫J

|f(x)g(x)| dx ≤

∫J

|f(x)|2dx

12

·

∫J

|g(x)|2dx

12

Satz 1.10 (Minkowskische Ungleichung)Für p ≥ 1 und Regelfunktionen f, g ∈ R(J) gilt:∫

J

|f(x) + g(x)|p dx

1p

∫J

|f(x)|pdx

1p

+

∫J

|g(x)|pdx

1p

(5)

Beweis : Für p = 1 ist dies klar. (Dreiecksungleichung)∫J

|f(x) + g(x)| dx ≤∫J

|f(x)|+ |g(x)| dx =

∫J

|f(x)| dx+

∫J

|g(x)| dx

Für p > 1 und 1p +

1q = 1 berechnet man mit Hilfe der Hölderschen Ungleichung für

A :=∫J

|f(x) + g(x)|p dx :

A =

∫J

|f(x) + g(x)| · |f(x) + g(x)|p−1 dx

≤∫J

|f(x)| · |f(x) + g(x)|p−1 dx+

∫J

|g(x)| · |f(x) + g(x)|p−1 dx

∫J

|f(x)|pdx

1p

·

∫J

|f(x) + g(x)|(p−1)qdx

1q

+

∫J

|g(x)|pdx

1p

·

∫J

|f(x) + g(x)|(p−1)qdx

1q

=

∫J

|f(x)|pdx

1p

+

∫J

|g(x)|pdx

1p

·A 1q

wegen: 1p +

1q = 1 ⇔ 1

q = 1− 1p ⇔ q = p

p−1 ⇔ (p− 1)q = p

Für A = 0 ist (5) richtig, für A 6= 0 dividiert man die letzte Abschätzung durch A1q .

Page 9: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Bemerkung 1.11

Wendet man (4) und (5) auf die Treppenfunktionen f :=n∑k=1

xk · χ(k−1,k) und

g :=n∑k=1

yk · χ(k−1,k) an, so erhält man speziell die ebenfalls von Hölder und Minkowski

stammenden Ungleichungen:

n∑k=1

|xkyk| ≤

n∑k=1

|xk|p 1

p

·

n∑k=1

|yk|q 1

q

(6)

n∑k=1

|xk + yk|

1p

n∑k=1

|xk|p 1

p

+

n∑k=1

|yk|p 1

p

(7)

Im folgenden betrachten wir ein passendes Anwendungsbeispiel zur Chauchy-Schwarz-Ungleichung:

Anwendung: Beschränkung des Punkt-Linien Vorfalls

Man stelle sich vor, man hat eine große Anzahl N Punkte, sowie N gerade verlaufende Linienin dieser Umgebung. Die Menge der Punkte p wird als P , die Menge der Linien l wird als Lbezeichnet. Das Ziel ist es nun eine begründete obere Schranke für die Punkt-Linien-Vorfälle I ,welche wie folgt definiert sind, zu finden:

I =∑p,l

δpl mit δpl =

{1, wenn p ∈ l0, sonst

Mit anderen Worten, wenn n(p) die Anzahl der Linien l ∈ L ist, die durch einen Punkt p ∈ Pgehen, oder n(l) die Anzahl der Punkte p ∈ P die auf einer Linie l ∈ L liegen, dann ist

I =∑p

n(p) =∑l

n(l)

Als anschauliche Orientierung soll nun das folgende Beispiel dienen. Hier ist der SpezialfallN = 3gewählt.

Page 10: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Beispiel 1.12N = 3, I =

∑p,l

δpl = δ11 + δ12 + . . .+ δ33 = 3

Eine grobe, einfache Abschätzung ist, dass jeder Punkt p auf jeder Linie l liegt, d.h. in diesen Fallmüssten sich alle Linien in einem Punkt S schneiden, auf welchem dann alle Punkte p liegen. Alsoist die größtmögliche obere Schranke:

I ≤ N2

An dieser Stelle wird darauf hingewiesen, dass diese Schranke nicht angenommen werden kann, dadie Punkte alle unterschiedlich sind.

Diese Abschätzung können wir jedoch optimieren, indem wir Cauchy-Schwarz benutzen:Mit yk = 1 und p, q = 2 hat (6) quaddriert folgende Darstellung: N∑

k=1

xk

2

≤N∑k=1

xk2 ·

N∑k=1

12︸ ︷︷ ︸N

= N ·N∑k=1

xk2

I2 lässt sich nun wie folgt abschätzen:

I2 =

∑p,l

δpl

2

=

∑p

∑l

δpl

2

≤ N∑p

∑l

δpl

2

= N∑p

∑l,l′

δplδpl′ = N∑l,l′

∑p

δplδpl′

︸ ︷︷ ︸

(∗)

Page 11: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Die Summe über l, l′ ist die Summe über alle angeordneten Linien-Paaren (l, l′). Sei nun ein Paar(l, l′) fest gegeben, der Ausdruck

∑p

δplδpl′ beschreibt die Anzahl derer Punkte aus P , welche

gleichzeitig auf l und auf l′ liegen.

• Es sind für (*) also zwei Fälle zu betrachen, gilt l = l′, so folgt:

∑l=l′

∑p

δplδpl′

=∑l

∑p

δpl

= I

• 2. Fall, gilt nun l 6= l′:Gegeben sei also ein Linien-Paar l 6= l′. Die maximale Anzahl von Punkten p aus P , welchegleichzeitig auf l und l′ liegen ist 1, nämlich genau der Schnittpunkt der beiden Linien. Alsogilt:

∑l 6=l′

∑p

δplδpl′

=∑l 6=l′

1 ≤ N ≤ N2

• Insgesamt ergibt sich mit I ≤ N2 die viel schärfere Abschätzung:

I2 ≤ N(I +N2

)≤ N(N2 +N2) = 2N3

⇔ I ≤√2N

32

Nun kommen wir zur letzten Ungleichung dieses Seminares: Die Jensensche Ungleichung.

Für Zahlen x1, . . . , xn ∈ R werden nun gewichtete Mittel x :=n∑k=1

λkxk untersucht. Hierbei gilt

für die Gewichte λk ≥ 0 undn∑k=1

λk = 1

Satz 1.13 (Jensensche Ungleichung)

Es sei I ⊆ R ein Intervall. Für x1, . . . , xn ∈ I liegen alle gewichteten Mittel x =n∑k=1

λkxk in

I , für konvexe Funktionen ϕ : I 7→ R gilt die Jensensche Ungleichung

ϕ(x) ≤n∑k=1

λkϕ(xk) (8)

Page 12: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Beweis : per Induktion

• IA: Der Fall n = 1 ist klar, denn mit1∑

k=1

λk = λ1 = 1, sowie x =1∑

k=1

λkxk = λ1x1 = x1 gilt:

ϕ(x) ≤ λ1ϕ(x1) = ϕ(x) =1∑

k=1

λkϕ(xk) X

• Der Fall n = 2 ebenso, denn aufgrund der Konvexität von ϕ gilt:

ϕ(x) = ϕ(2∑

k=1

λkxk) = ϕ(λ1x1 + λ2x2)(1)

≤ λ1ϕ(x1) + λ2ϕ(x2) =2∑

k=1

λkϕ(xk)

• Die Behauptung sei nun für n− 1 bereits gezeigt.

IV: ϕ(x) = ϕ(n−1∑k=1

λkxk) ≤n−1∑k=1

λkϕ(xk)

• IS: (n− 1)→ n

ϕ(x) = ϕ(n∑k=1

λkxk) = ϕ(n−1∑k=1

λkxk + λnxn)IV≤

n−1∑k=1

λkϕ(xk) + λnϕ(xn) =n∑k=1

λkϕ(xk)

Folgerung 1.14

Für Zahlen x1, . . . , xn > 0 und λ1, . . . , λn ≥ 0 mitn∑k=1

λk = 1 gilt die Abschätzung

n∏k=1

xλkk ≤n∑k=1

λkxk (9)

Beweis :

Da der Logarithmus auf (0,∞) konkav ist, gilt nach (8):

log

n∑k=1

λkxk

≥ n∑k=1

λk log(xk) |Anwendung exp

⇔ exp

log n∑k=1

λkxk

≥ exp

n∑k=1

λk log(xk)

n∑k=1

λkxk ≥ exp

n∑k=1

log(xλkk )

=

n∏k=1

xλkk

Speziell erhält man mit λk = 1n

diese allgemeine Fassung der Ungleichung zwischen geometri-schem und arithmetischem Mittel:

n√x1 · x2 · · · xn ≤

1

n

n∑k=1

xk

Page 13: Seminar Analysis Konvexe Funktionen und einige wichtige ...tdohnal/TEACH/Seminar_AnaIII_SS2013/... · Abstract This seminar is about convex functions and several important inequalities.

Literatur

W. Kaballo. Einführung in die Analysis I. Spektrum Akademischer Verlag, 1996, §21