Zahlentheoretische Methoden in der Numerikjosefdick/preprints/...in der Numerik ... A. Die...

127
Zahlentheoretische Methoden in der Numerik Friedrich Pillichshammer Vorlesung im WS 2012/2013 * Universit¨ at Linz, Institut f¨ ur Finanzmathematik, Email: [email protected]

Transcript of Zahlentheoretische Methoden in der Numerikjosefdick/preprints/...in der Numerik ... A. Die...

  • Zahlentheoretische Methoden

    in der Numerik

    Friedrich Pillichshammer ∗

    Vorlesung im WS 2012/2013

    ∗Universität Linz, Institut für Finanzmathematik, Email: [email protected]

  • Inhaltsverzeichnis

    1. Einleitung 4

    1.1. Der 1-dimensionale Fall . . . . . . . . . . . . . . . . . . . . . . . . 41.2. Der allgemeine Fall . . . . . . . . . . . . . . . . . . . . . . . . . . 6Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    2. Diskrepanz 16

    2.1. Gleichverteilung modulo 1 . . . . . . . . . . . . . . . . . . . . . . 162.2. Diskrepanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242.3. Schranken für die Diskrepanz . . . . . . . . . . . . . . . . . . . . 30Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    3. QMC Integration in Hilberträumen mit reproduzierendem Kern 48

    3.1. Numerische Integration in einer Dimension . . . . . . . . . . . . . 483.2. Hilberträume mit reproduzierendem Kern . . . . . . . . . . . . . 503.3. Der worst-case error in Hilberträumen mit reproduzierendem Kern 543.4. Verbindungen zur klassischen Integrationstheorie - Die Koksma-

    Hlawka Ungleichung . . . . . . . . . . . . . . . . . . . . . . . . . 583.5. Die originale Ungleichung von Koksma . . . . . . . . . . . . . . . 60Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    4. Klassische Punktmengen 65

    4.1. Das gleichmäßige Gitter . . . . . . . . . . . . . . . . . . . . . . . 654.2. Die Halton Folge . . . . . . . . . . . . . . . . . . . . . . . . . . . 664.3. Die Hammersley Punktmenge . . . . . . . . . . . . . . . . . . . . 73Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    5. Gitterpunktmengen 77

    5.1. Definition und Diskrepanzabschätzung . . . . . . . . . . . . . . . 775.2. Numerische Integration mit guten Gitterpunkten . . . . . . . . . . 80Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    2

  • Inhaltsverzeichnis

    Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    6. (t,m, s)-Netze in Basis b 896.1. Definition und Existenzaussagen . . . . . . . . . . . . . . . . . . . 896.2. Die Stern Diskrepanz von (t,m, s)-Netzen . . . . . . . . . . . . . 966.3. Konstruktion von Netzen – digitale Netze . . . . . . . . . . . . . . 106Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

    7. Dimensionsabhängigkeit der Stern Diskrepanz 116

    7.1. Der Fluch der Dimension . . . . . . . . . . . . . . . . . . . . . . . 1167.2. Tractability der Stern Diskrepanz . . . . . . . . . . . . . . . . . . 117Litaraturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

    A. Die Totalvariation und das Riemann-Stiltjes Integral 121

    Literatur 124

    Index 126

    3

  • 1. Einleitung

    Viele Probleme in Anwendungsgebieten der Mathematik wie z.B. der Physik,der Chemie, Biologie, Statistik, Computer Graphik oder auch in der Mathe-matik selbst wie z.B. in der Finanzmathematik lassen sich auf die Berechnungeines hoch-dimensionalen Integrals zurückfüren (z.B. die Berechnung eines Er-wartungswerts). Wir betrachten hier nur folgende standardisierte Form

    [0,1]sf(x) dx.

    In den meisten Fällen ist aber so ein Integral nicht exakt berechenbar. Gründedafür sind z.B. dass

    • es keine explizite Stammfunktion zu f gibt oder dass

    • man die Funktion f nicht genau kennt (nur an endlich vielen Meßpunkten).Man benötigt also numerische Methoden um Integrale von Funktionen möglichstgenau zu approximieren.

    1.1. Der 1-dimensionale Fall

    Betrachten wir zunächst einmal den ein-dimensionalen Fall, d.h. s = 1. Sei f :[0, 1] → R eine integrierbare Funktion (im Riemannschen Sinn). Wir werden nunwie folgt vorgehen: Wir nehmen eine Stichprobe von N Punkten x0, x1, . . . , xN−1im Intervall [0, 1) und berechnen den durchschnittlichen Funktionswert auf diesenPunkten, d.h.

    1

    N

    N−1∑

    n=0

    f(xn).

    Als Näherung für das Integral∫ 10 f(x) dx nehmen wir den Wert

    “Grundfläche × durchschnittlicher Wert von f”,d.h. wir approximieren das Integral von f durch

    ∫ 1

    0

    f(x) dx ≈ 1N

    N−1∑

    n=0

    f(xn).

    4

  • 1. Einleitung

    Die Frage ist nun, wie groß ist der Fehler den man mit dieser Methode macht,d.h. wie groß ist der Wert

    ∣∣∣∣∣

    ∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn)

    ∣∣∣∣∣?

    Rein intuitiv wird der Fehler von zwei Größen abhängig sein, nämlich

    1. von der Wahl der Punkte x0, . . . , xN−1 in [0, 1) und natürlich

    2. vom Integranden f selber.

    Gehen wir kurz auf diese zwei Punkte ein:

    Zu 1. Die Punkte x0, x1, . . . , xN−1 sollen “gut” in [0, 1) verteilt sein. Angenommenunsere Integrationspunkte sind so gewählt, dass große Bereiche des Ein-heitsintervalls frei bleiben, z.B. das Intervall [1/2, 1) wie in Abbildung 1.1.Dann macht man selbst bei so “einfachen” Funktionen wie z.B. f : [0, 1] →R,

    f(x) =

    {0 falls x < 12,1 falls x ≥ 12,

    einen beträchtlichen Fehler, denn

    ∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn) =1

    2.

    1

    1

    Abbildung 1.1.: Beispiel für “schlecht” verteilte Punkte.

    5

  • 1. Einleitung

    Zu 2. Der Fehler hängt natürlich sehr stark vom Integranden ab und insbeson-dere davon, wie stark dieser schwankt. Z.B. können mit unserer Metho-de konstante Funktionen mit nur einem Punkt exakt integriert werden.Nehmen wir aber an wir sollten eine Funktion integrieren welche sehrstark “schwankt” wie z.B. die Funktion f(x) = 1 + cos(2πkx) aus Abbil-dung 1.2. Wählen wir nun Punkte x0, . . . , xN−1 die, wie man meinen könnte,

    0.2 0.4 0.6 0.8 1

    0.5

    1

    1.5

    2

    Abbildung 1.2.: Beispiel für eine “stark schwankende” Funktion, f(x) = 1 +cos(2πkx) mit k = 10.

    schön gleichmäßig in [0, 1) verteilt sind wie z.B. xn = (2n + 1)/(2N) für0 ≤ n < N . Für k = N erhalten wir aber trotzdem einen großen Integrati-onsfehler, denn ∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn) = 1.

    Bemerkung 1.1. Wir werden später sehen, dass man den Integrationsfehlerfür Funktionen aus bestimmten Funktionenklassen tatsächlich durch das Pro-dukt einer Größe welche die Güte der Verteilung der Punkte mißt und einerMaßzahl für die Schwankung des Integranden f abschätzen kann.

    1.2. Der allgemeine Fall

    Betrachten wir nun den höher-dimensionalen Fall, d.h. s ≥ 1. Sei f : [0, 1]s → Reine gegebene integrierbare Funktion. Gesucht ist das Integral dieser Funktion

    6

  • 1. Einleitung

    über das s-dimensionale Einheitsintervall [0, 1]s,

    ∫ 1

    0

    · · ·∫ 1

    0

    f(x(1), . . . , x(s)) dx(1) . . . dx(s) =:

    [0,1]sf(x) dx.

    Wir gehen dabei analog zum Fall s = 1 vor, d.h. wir wählen Punkte x0, . . . ,xN−1in [0, 1)s und approximieren das Integral durch den mittleren Funktionswert aufdiesen N Punkten, ∫

    [0,1]sf(x) dx ≈ 1

    N

    N−1∑

    n=0

    f(xn).

    Wir fragen nun wieder nach der Größe des Integrationsfehlers

    ∣∣∣∣∣

    [0,1]sf(x) dx− 1

    N

    N−1∑

    n=0

    f(xn)

    ∣∣∣∣∣ .

    Es stellt sich auch hier die Frage, nach der Wahl der Punkte x0, . . . ,xN−1. Amnaheliegendsten ist natürlich, die Punkte wie im 1-dimensionalen Fall aus einemzentrierten gleichmäßigen Gitter zu wählen. Für s = 1 waren das die Punktexn = (2n+ 1)/(2N) für 0 ≤ n < N .Allgemein ist ein zentriertes gleichmäßiges Gitter Γcm,s gegeben durch die Punk-

    te

    xk =

    (2k1 + 1

    2m, . . . ,

    2ks + 1

    2m

    )

    für k = (k1, . . . , ks) ∈ Ns0 und ‖k‖∞ = max1≤j≤s |kj| < m. Insbesondere gilt also|Γcm,s| = ms. Z.B. für s = 2 und m = 6 sieht das gleichmäßige Gitter aus wie inAbbildung 1.3.Sei nun f : [0, 1]s → R eine stetige Funktion und sei m ∈ N. Dann gilt

    ∣∣∣∣∣∣∣

    [0,1]sf(x) dx− 1

    ms

    k∈Ns0‖k‖∞

  • 1. Einleitung

    Abbildung 1.3.: Gleichmäßiges Gitter in [0, 1)2 mit m = 6.

    wobei ωf der Stetigkeitsmodul der Funktion f ist. Angenommen die Funktion fist zusätzlich Lipschitz-stetig (z.B. falls f partiell differenzierbar ist), d.h. es gibtein α ∈ R mit

    ωf(δ) ≤ αδfür alle δ > 0. Dann gilt

    ∣∣∣∣∣∣∣

    [0,1]sf(x) dx− 1

    ms

    k∈Ns0‖k‖∞

  • 1. Einleitung

    Abbildung 1.4.: Die Funktion f(x) = c(1 + cos(2πNx))/(2N) für N = 10.

    Im Fall s ≥ 2 betrachtet man analog eine Funktion

    g(x(1), . . . , x(s)) =c

    2m(1 + cos(2πmx(1))).

    Siehe Abbildung 1.5 für den Fall s = 2.

    Abbildung 1.5.: Die Funktion g(x(1), x(2)) = c2m(1 + cos(2πmx(1))) für m = 3.

    Nun gilt wieder∫

    [0,1]sg(x) dx =

    c

    2m=

    c

    2N1/sund

    1

    ms

    k∈Ns0‖k‖∞

  • 1. Einleitung

    Das Problem ist hier, dass der Integrationsfehler sehr stark von der Dimensions abhängt und N−1/s für große s nur sehr langsam gegen 0 konvergiert. DiesesPhänomen nennt man oft den Fluch der Dimension oder auf Englisch den curseof dimensionality.Es stellt sich nun die Frage, ob man unsere Methode eventuell verbessern könn-

    te um eine bessere Konvergenzordnung für den Integrationsfehler zu erreichen dienicht so stark von der Dimension s abhängt? Dazu überlegen wir uns nun wie derIntegrationsfehler durchschnittlich aussieht, wenn man anstatt eines zentriertengleichmäßigen Gitters die Punkte x0, . . . ,xN−1 zufällig aus dem Einheitsintervallwählt.Wir approximieren also das Integral einer Funktion f : [0, 1]s → R durch

    1

    N

    N−1∑

    n=0

    f(xn),

    wobei x0, . . . ,xN−1 identisch gleichverteilte unabhängige Stichproben aus [0, 1)s

    sind. Wie groß ist dann der Fehler

    e(f,P) :=∣∣∣∣∣1

    N

    N−1∑

    n=0

    f(xn)−∫

    [0,1]sf(x) dx

    ∣∣∣∣∣

    mit P = {x0, . . . ,xN−1} im Durchschnitt, d.h. wie groß ist der Erwartungswertvon e(f,P)?Sei f : [0, 1]s → R eine quadratisch integrierbare Funktion, d.h. f ∈ L2([0, 1]s).

    Wir bestimmen den Erwartungswert von e2(f,P), d.h. E[e2(f,P)].Sei g(x) := f(x)−

    ∫[0,1]s f(x) dx. Dann gilt

    [0,1]sg(x) dx = 0. (1.1)

    Nun folgt

    e2(f,P) =(

    1

    N

    N−1∑

    n=0

    g(xn)

    )2

    =1

    N2

    N−1∑

    n=0

    g(xn)2 +

    2

    N2

    0≤m

  • 1. Einleitung

    +2

    N2

    0≤m 2, d.h. für s > 2 ist es im Mittel besser wenn mandie Approximation des Integrals mit zufällig gewählten Punkten durchführt alsmit dem gleichmäßigen Gitter (f muss dabei nicht einmal stetig sein). DieseIntegrationsmethode nennt man die Monte Carlo (MC) Methode. Die Vorteileder MC Methode sind also

    • nur geringe Anforderungen an den Integranden; f ∈ L2([0, 1]s) reicht aus;

    • die Konvergenzordnung ist unabhängig von der Dimension s.

    11

  • 1. Einleitung

    Die MC Methode hat aber auch einige Nachteile aufzuweisen:

    • die Fehlerschranke ist nur probabilistisch, d.h. man hat keine Sicherheit fürden Fehler;

    • die Konvergenzordnung von N−1/2 ist für viele Anwendungen zu langsamund die Glattheit des Integranden wird nicht berücksichtigt;

    • es ist nicht klar, wie man zufällige Punktmengen erzeugt.

    Die Idee ist nun, dass man schon konkrete fixe Punktmengen (Folgen) verwen-det, von denen man zeigen kann, dass man mit ihnen zumindest gewisse Klassenvon Funktionen mindestens so gut integrieren kann wie mit der MC Methode.Diese Integrations Methode nennt man quasi-Monte Carlo (QMC) Methode. Wirbenötigen also Punktmengen die in einem gewissen Sinn gut im Einheitsintervall[0, 1)s verteilt sind.Dazu müssen wir uns zunächst einmal überlegen was es heißt, dass eine Punkt-

    menge “gut” in [0, 1)s verteilt ist. Mit diesem Thema befasst sich die Theorie der“Gleichverteilung modulo 1” womit wir uns im nächsten Kapitel beschäftigenwerden.

    Literaturhinweise

    Eine ausgezeichnete Einführung in die MC Methode bietet das Buch von Müller-Gronbach, Novak und Ritter [19]. Das augezeichnete Buch [20] von Niederreiterbeinhaltet ebenfalls eine gute Einführung in die MC und QMC Methode undbeschäftigt sich u.a. auch mit der Erzeugung von Zufalls- und Pseudozufallszah-len. Weitere empfehlenswerte Bücher zum Thema MC Methode sind jene vonLemieux [16] und von Glasserman [6], wobei sich letzteres hauptsächlich mit derAnwendung von MC auf Probleme aus der Finanzmathematik beschäftigt.

    Übungsaufgaben

    1.1 Sei f : [0, 1] → R eine Funktion mit stetiger erster Ableitung. Für m ∈ Nsei

    Tmf :=m−1∑

    n=0

    f(n/m) + f((n+ 1)/m)

    2m=

    m∑

    n=0

    wnf( nm

    )

    wobei w0 = wm = 1/(2m) und wn = 1/m falls 1 ≤ n ≤ m − 1 dieTrapezregel.

    12

  • 1. Einleitung

    Zeigen Sie, dass dann

    ∫ 1

    0

    f(x) dx− Tmf =∫ 1

    0

    K(t)f ′(t) dt (1.2)

    mit K(t) = nm +12m − t für nm < t ≤ n+1m und 0 ≤ n ≤ m − 1. Folgern Sie

    daraus, dass der Integrationsfehler von der Ornung O(m−1) ist. Hinweis:Betrachten Sie zunächst nur den Ausdruck

    ∫ (n+1)/m

    n/m

    f(x) dx− f(n/m) + f((n+ 1)/m)2m

    und verwenden Sie, dass f(x) = f(n/m) +∫ xn/m f(t) dt für n/m ≤ x ≤

    (n+ 1)/m.

    1.2 Angenommen f besitzt auch eine stetige zweite Ableitung. Zeigen Sie, dassder Integrationsfehler dann von der Ordnung O(m−2) ist. Hinweis: Verwen-den Sie (1.2) und partielle Integration.

    1.3 Sei f : [0, 1]s → R, sodass ∂2f/∂x2i stetig ist für alle 1 ≤ i ≤ s. Verwendenwir nun das Cartesische Produkt der Trapezregel, d.h.

    T (s)m f =m∑

    n1=0

    . . .m∑

    ns=0

    wn1 · · ·wnsf(n1m, . . . ,

    nsm

    ).

    Integriert man damit eine Funktion f , die nur von einer Koordinate abhängt,dann erhält man eine Fehlerordnung von O(m−2). Ist das gut, wenn manmit der Anzahl der verwendenten Stützstellen vergleicht?

    1.4 Sei f : [0, 1]2 → R, f(x1, x2) = 1 falls x21 + x22 ≤ 1 und 0 sonst. Wirwollen

    ∫ 10

    ∫ 10 f(x1, x2) dx1 dx2 näherungsweise bestimmen (der exakte Wert

    des Integrals kann natürlich sofort hingeschrieben werden). Schreiben Sieein Computer Programm (z.B. mit Mathematica) zur Monte Carlo In-tegration der Funktion f . Führen Sie verschiedene Experimente durch undvergleichen Sie den Integrationsfehler mit 1/

    √N , wobei N die Anzahl der

    Stützstellen ist.

    1.5 Sei f : [0, 1]3 → R, f(x, y, z) = x2y − exp(2y + z). Berechnen Sie∫

    [0,1]3f(x, y, z) dx dy dz

    sowie Var[f ] und E[e2(f,P)].

    13

  • 1. Einleitung

    1.6 Berechnen Sie mit der MC Methode den Wert des Integrals aus obigerAufgabe (Mathematica). Führen Sie das Experiment 100 mal durch undvergleichen Sie den MC Fehler mit dem oben berechnenten Erwartungswert.

    1.7 Sei f : [0, 1]s → R mit 0 < σ(f) 0 und N ∈ N Konfidenzintervalle der FormIN,δ = [DN − LN , DN + LN ] für welche

    P (µ ∈ IN,δ) ≥ 1− δ

    gilt.

    1.11 In der Fehlerabschätzung der MC Methode kommt die Varianz Var[f ] vor,die man i. A. jedoch nicht kennt. Als Schätzer für Var[f ] verwendet mandaher

    VN =1

    N − 1

    N∑

    i=1

    (f(Xi)−DN)2 ,

    14

  • 1. Einleitung

    wobei X1, . . .XN unabhängig und identisch gleichverteilte Zufallsvariableauf [0, 1]s sind undDN wie in obiger Aufgabe. Zeigen Sie: Für f ∈ L2([0, 1]s)gilt

    E[VN ] = Var[f ].

    Man sagt “VN ist ein erwartungstreuer Schätzer”.

    15

  • 2. Diskrepanz

    2.1. Gleichverteilung modulo 1

    Zunächst ist es nicht ganz klar, was man darunter verstehen soll wenn man meinteine Punktmenge P = {x0, . . . ,xN−1} sei “gut” im Einheitsintervall verteilt.Intuitiv meint man wohl, dass jeder “Bereich” einen angemessenen Anteil vonPunkten aus P enthält, keine Punkthaufen und auch keine zu großen Lückenzwischen den Punkten auftreten. Das könnte man so formalisieren: Unter gut imEinheitsintervall verteilten Punkten verstehen wir eine Punktmenge P mit derEigenschaft, dass für jede meßbare Teilmenge E ⊆ [0, 1)s die relative Anzahl vonPunkten aus P in E in etwa das Volumen von E ist (siehe Abbildung 2.1).

    E

    1

    00 1

    Abbildung 2.1.: Beispiel Funktion, s = 2.

    Um diese Anschauung mathematisch exakt zu fassen, betrachten wir nun un-endliche Folgen anstatt endlichen Punktmengen. Man wird dann bemerken, dassdie Forderung “für jede meßbare Teilmenge E ⊆ [0, 1)s” aus obigem Absatzetwas zu hoch gegriffen ist (siehe die später folgende Bemerkung 2.3). Darumbeschränken wir uns in folgender Definition von Gleichverteilung auf Intervalleder Form [a, b).Für eine Folge (xn)n≥0 im s-dimensionalen Einheitsintervall [0, 1)s und ein

    Intervall [a, b) ⊆ [0, 1)s sei A(J, (xn), N) (oder kurz A(J,N)) die Anzahl der

    16

  • 2. Diskrepanz

    Indizes n ∈ {0, . . . , N − 1} mit xn ∈ [a, b), also

    A([a, b), (xn), N) = #{n : 0 ≤ n ≤ N − 1 und xn ∈ [a, b)}.

    Analog verwenden wir diese Schreibweise auch für endliche Punktmengen P ={x0, . . . ,xN−1}, d.h.

    A([a, b),P , N) = #{n : 0 ≤ n ≤ N − 1 und xn ∈ [a, b)}.

    Definition 2.1. Eine Folge (xn)n≥0 im s-dimensionalen Einheitsintervall [0, 1)s

    heißt gleichverteilt modulo 1 wenn für jedes Intervall [a, b) ⊆ [0, 1)s gilt, dass

    limN→∞

    A([a, b), (xn), N)

    N= λs([a, b)), (2.1)

    wobei λs das s-dimensionale Lebesgue Mass bezeichnet.

    Sei χJ die charakteristische Funktion (oder Indikatorfunktion) einer MengeJ ⊆ Rs, also χJ(x) = 1 falls x ∈ J und 0 sonst. Dann ist

    A([a, b), (xn), N) =N−1∑

    n=0

    χ[a,b)(xn),

    und somit ist Gleichung (2.1) äquivalent zu

    limN→∞

    1

    N

    N−1∑

    n=0

    χ[a,b)(xn) =

    [0,1]sχ[a,b)(x) dx. (2.2)

    Das führt nun zu folgender Charakterisierung von Gleichverteilung:

    Satz 2.2. Eine Folge (xn)n≥0 in [0, 1)s ist genau dann gleichverteilt modulo 1,wenn für jede Riemann integrierbare Funktion f : [0, 1]s → R gilt

    limN→∞

    1

    N

    N−1∑

    n=0

    f(xn) =

    [0,1]sf(x) dx. (2.3)

    Wegen Satz 2.2 sollte man also zur numerischen Integration nur Punktmengenverwenden, deren Elemente Anfangsstücke von gleichverteilten Folgen in [0, 1)s

    bilden.

    17

  • 2. Diskrepanz

    Bemerkung 2.3. Es gibt keine Folge welche Gleichung (2.3) für alle Lebesgueintegrierbaren Funktionen erfüllt. Es ist bekannt, dass es für jede Lebesgueintegrierbare Funktion welche nicht Riemann integrierbar ist eine gleichverteilteFolge gibt, sodass (2.3) nicht gilt.

    Beweis. Wenn (2.3) für jede Riemann integrierbare Funktion f : [0, 1]s → R gilt,dann gilt trivialerweise auch (2.2) für χJ für alle Teilintervalle J ⊆ [0, 1)s undsomit ist die Folge (xn)n≥0 gleichverteilt modulo 1.Sei nun die Folge (xn)n≥0 gleichverteilt modulo 1. Wir zeigen zuerst, dass

    Gleichung (2.3) für alle Treppenfunktionen auf [0, 1]s gilt. Seien die IntervalleE1, . . . , Em eine Partition von [0, 1]

    s und

    g(x) =

    m∑

    i=1

    diχEi(x),

    mit di ∈ R für i = 1, . . . , m, eine Treppenfunktion auf [0, 1]s. Dann gilt

    limN→∞

    1

    N

    N−1∑

    n=0

    g(xn) = limN→∞

    1

    N

    N−1∑

    n=0

    m∑

    i=1

    diχEi(xn)

    =m∑

    i=1

    di limN→∞

    1

    N

    N−1∑

    n=0

    χEi(xn) =m∑

    i=1

    diλ(Ei) =

    [0,1]sg(x) dx.

    Also gilt Gleichung (2.3) für alle Treppenfunktionen auf [0, 1]s.Sei nun f : [0, 1]s → R eine beliebige Riemann integrierbare Funktion und sei

    ε > 0. Dann gibt es Treppenfunktionen g1 und g2 auf [0, 1]s mit g1 ≤ f ≤ g2 und∫

    [0,1]s g2(x)− g1(x) dx < ε. Also gilt

    [0,1]sf(x) dx− ε ≤

    [0,1]sg1(x) dx = lim

    N→∞1

    N

    N−1∑

    n=0

    g1(xn)

    ≤ lim infN→∞

    1

    N

    N−1∑

    n=0

    f(xn) ≤ lim supN→∞

    1

    N

    N−1∑

    n=0

    f(xn)

    ≤ limN→∞

    1

    N

    N−1∑

    n=0

    g2(xn) =

    [0,1]sg2(x) dx ≤

    [0,1]sf(x) dx+ ε.

    Da ε > 0 beliebig war, folgt die Behauptung. �

    Ganz analog zum Beweis von Satz 2.2 kann man folgenden Satz beweisen:

    18

  • 2. Diskrepanz

    Satz 2.4. Eine Folge (xn)n≥0 in [0, 1)s ist genau dann gleichverteilt modulo 1,wenn für jede stetige, periodische Funktion f : [0, 1]s → C mit Periode 1 gilt

    limN→∞

    1

    N

    N−1∑

    n=0

    f(xn) =

    [0,1]sf(x) dx . (2.4)

    Eine viel einfachere Version von Satz 2.4 ist das berühmte Weylsche Kriteri-um. H. Weyl fand 1916 heraus, dass es ausreicht Gleichung (2.4) nur für trigo-nometrische Polynome zu überprüfen. Diese Arbeit von Weyl markiert auch denAnfangspunkt der Theorie der Gleichverteilung modulo 1.

    Satz 2.5 (Weylsches Kriterium). Eine Folge (xn)n≥0 in [0, 1)s ist genaudann gleichverteilt modulo 1, wenn

    limN→∞

    1

    N

    N−1∑

    n=0

    exp(2πih · xn) = 0 (2.5)

    für alle Vektoren h ∈ Zs \ {0}. Hier bezeichnet x · y das gewöhnliche innereProdukt von x,y ∈ Rs.

    Beweis. Falls die Folge (xn)n≥0 gleichverteilt modulo 1 ist, dann folgt Glei-chung (2.5) sofort aus Satz 2.4 mit der speziellen Wahl f(x) = exp(2πih · x).Die andere Richtung der Behauptung beweisen wir hier nur für den Fall s = 1.

    Der Fall s > 1 geht analog. Sei f : [0, 1] → C eine stetige, periodische Funktionmit Periode 1. Nach dem Satz von Weierstraß (trigonometrische Version) gibt esfür alle ε > 0 ein trigonometrisches Polynom

    P (x) =

    R∑

    r=−Rar exp(2πirx)

    sodasssupx∈[0,1]

    |f(x)− P (x)| < ε/3.

    Dann gilt∣∣∣∣∣

    ∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn)

    ∣∣∣∣∣ ≤∣∣∣∣∫ 1

    0

    f(x) dx−∫ 1

    0

    P (x) dx

    ∣∣∣∣+

    19

  • 2. Diskrepanz

    +

    ∣∣∣∣∣

    ∫ 1

    0

    P (x) dx− 1N

    N−1∑

    n=0

    P (xn)

    ∣∣∣∣∣+

    +

    ∣∣∣∣∣1

    N

    N−1∑

    n=0

    P (xn)−1

    N

    N−1∑

    n=0

    f(xn)

    ∣∣∣∣∣ .

    Nun ist ∣∣∣∣∫ 1

    0

    f(x) dx−∫ 1

    0

    P (x) dx

    ∣∣∣∣ ≤ supx∈[0,1]

    |f(x)− P (x)| < ε/3

    und ∣∣∣∣∣1

    N

    N−1∑

    n=0

    P (xn)−1

    N

    N−1∑

    n=0

    f(xn)

    ∣∣∣∣∣ ≤ supx∈[0,1]|f(x)− P (x)| < ε/3.

    Weiters gilt wegen (2.5), dass

    limN→∞

    1

    N

    N−1∑

    n=0

    P (xn) =R∑

    r=−Rar lim

    N→∞1

    N

    N−1∑

    n=0

    exp(2πirxn) = a0

    und ∫ 1

    0

    P (x) dx =R∑

    r=−Rar

    ∫ 1

    0

    exp(2πirx) dx = a0.

    Also gilt für N groß genug, dass∣∣∣∣∣

    ∫ 1

    0

    P (x) dx− 1N

    N−1∑

    n=0

    P (xn)

    ∣∣∣∣∣ < ε/3.

    Zusammen folgt ∣∣∣∣∣

    ∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn)

    ∣∣∣∣∣ < ε

    für N groß genug, woraus die Behauptung folgt. �

    Mit Hilfe des Weylschen Kriteriums können wir nun ein erstes Beispiel für einegleichverteilte Folge angeben. Für x ∈ R sei {x} der Bruchteil von x, also {x} =x− ⌊x⌋. Für x = (x(1), . . . , x(s)) ∈ Rs sei {x} = ({x(1)}, . . . , {x(s)}) ∈ [0, 1)s.

    Proposition 2.6. Sei α = (α1, . . . , αs) ∈ Rs. Dann ist die Folge ({nα})n≥0genau dann gleichverteilt modulo 1, wenn die Zahlen 1, α1, . . . , αs linear un-abhängig über Q sind. Die Folge ({nα})n≥0 heißt Kronecker Folge.

    20

  • 2. Diskrepanz

    Beweis. Sei h ∈ Zs \ {0}. Da die Funktion x 7→ exp(2πih · x) periodisch mitPeriode 1 ist gilt

    1

    N

    N−1∑

    n=0

    exp(2πih · {nα}) = 1N

    N−1∑

    n=0

    exp(2πih ·α)n.

    Falls die Zahlen 1, α1, . . . , αs linear unabhängig über Q sind, dann ist h ·α 6∈ Qund damit ist exp(2πih · α) 6= 1. Also folgt aus der Formel für geometrischeSummen, dass

    ∣∣∣∣∣1

    N

    N−1∑

    n=0

    exp(πih ·α)n∣∣∣∣∣ =

    1

    N

    ∣∣∣∣exp(2πiNh ·α)− 1exp(2πih ·α)− 1

    ∣∣∣∣

    ≤ 1N

    2

    | exp(2πih ·α)− 1| .

    Eine Anwendung des Weylschen Kriteriums zeigt nun, dass die Folge gleichver-teilt ist. Die Umkehrung ist, wie man einfach sehen kann, auch richtig. �

    Bemerkung 2.7. Im Spezialfall s = 1 ist also die Folge ({nα})n≥0 genau danngleichverteilt modulo 1, wenn α ∈ R \Q, also wenn α irrational ist.

    Wir geben ein weiteres Beispiel einer gleichverteilten Folge. Dazu benötigenwir noch folgende Definition:

    Definition 2.8. Sei b ∈ N, b ≥ 2.• Die radikal inverse Funktion in Basis b ist definiert als φb : N0 → [0, 1),

    φb(n) =n0b+n1b2

    + · · · , falls n = n0 + n1b+ · · · .

    • Die van der Corput Folge in Basis b ist definiert als xn = φb(n) für n ∈ N0.

    Proposition 2.9. Die van der Corput Folge in Basis b ist gleichverteilt modulo1.

    Beweis. Sei m ∈ N und sei a = a0bm−1 + a1bm−2 + · · ·+ am−2b+ am−1. Betrachteein Intervall der Form Ja =

    [abm ,

    a+1bm

    ). Dann ist xn genau dann in Ja, wenn

    a0b+ · · ·+ am−1

    bm≤ n0

    b+n1b2

    + · · · < a0b+ · · ·+ am−1

    bm+

    1

    bm.

    21

  • 2. Diskrepanz

    Das ist genau dann der Fall, wenn

    a0bm−1+ · · ·+am−1 ≤ n0bm−1+ · · ·+nm−1+

    nm−2b

    + · · · < a0bm−1+ · · ·+am−1+1

    bzw.n0 = a0, . . . , nm−1 = am−1

    was wiederum genau dann gilt, wenn

    n ≡ a (mod bm) wobei a = a0 + a1b+ · · ·+ am−1bm−1.

    Die Kongruenz x ≡ a (mod bm) ist modulo bm eindeutig lösbar.Zu N ∈ N wähle man nun jenes k = k(N) ∈ N0 für welches kbm ≤ N <

    (k + 1)bm. Dann gilt

    k ≤ # {n < N : xn ∈ Ja} ≤ k + 1.

    Wegen 1bm − 1N ≤ kN ≤ 1bm gilt limN→∞ kN = 1bm . Damit folgt nun

    limN→∞

    # {n < N : xn ∈ Ja}N

    =1

    bm.

    Sei nun J = [α, β) ⊆ [0, 1). Für m ∈ N sei

    J =⋃

    a: Ja⊆JJa und J =

    a: Ja∩J 6=∅Ja.

    Dann gilt J ⊆ J ⊆ J und λ1(J)− λ1(J) ≤ 2/bm und

    A(J,N)

    N− λ1(J) ≤

    A(J,N)

    N− λ1(J) ≤

    A(J,N)

    N− λ1(J).

    Da aus β − δ ≤ x ≤ α + δ mit δ > 0 folgt, dass |x| ≤ δ +max(α, β) so gilt nun∣∣∣∣A(J,N)

    N− λ1(J)

    ∣∣∣∣

    ≤ λ1(J)− λ1(J) + max(∣∣∣∣A(J,N)

    N− λ1(J)

    ∣∣∣∣ ,∣∣∣∣A(J,N)

    N− λ1(J)

    ∣∣∣∣)

    ≤ 2bm

    +max

    (∣∣∣∣A(J,N)

    N− λ1(J)

    ∣∣∣∣ ,∣∣∣∣A(J,N)

    N− λ1(J)

    ∣∣∣∣).

    Da

    limN→∞

    ∣∣∣∣A(J,N)

    N− λ1(J)

    ∣∣∣∣ ≤∑

    a: Ja⊆JlimN→∞

    ∣∣∣∣A(Ja, N)

    N− λ1(Ja)

    ∣∣∣∣ = 0

    22

  • 2. Diskrepanz

    und analog für J , so folgt nun

    limN→∞

    ∣∣∣∣A(J,N)

    N− λ1(J)

    ∣∣∣∣ ≤2

    bm.

    Diese Abschätzung gilt für beliebiges m ∈ N und somit folgt

    limN→∞

    ∣∣∣∣A(J,N)

    N− λ1(J)

    ∣∣∣∣ = 0.

    Damit ist die van der Corput Folge in Basis b gleichverteilt modulo 1. �

    Als nächstes zeigen wir, dass jede gleichverteilte Folge dicht in [0, 1]s liegt.

    Proposition 2.10. Jede gleichverteilte Folge (xn)n≥0 in [0, 1)s liegt dicht in[0, 1]s.

    Beweis. Sei x ∈ [0, 1]s. Wir müssen zeigen, dass in jeder Umgebung von x Punkteder Folge liegen. Wir beschränken uns hier auf Intervalle. Angenommen es gibtein Intervall J ⊆ [0, 1]s mit λs(J) > 0, x ∈ J und xn 6∈ J für alle n ≥ 0. Dadie Folge (xn)n≥0 gleichverteilt ist modulo 1 gibt es zu ε := λs(J)/2 > 0 einM =M(ε) sodass

    −ε < A(J,N)N

    − λs(J) < εgilt für alle N ≥M . Speziell gilt also

    0 <λs(J)

    2<A(J,N)

    N= 0

    für alle N ≥M , was offensichtlich einen Widerspruch darstellt. �

    Aus Proposition 2.6 und Proposition 2.10 folgt nun ein bekanntes Resultat ausder Zahlentheorie.

    Korollar 2.11 (Kronecker). Sei α = (α1, . . . , αs) ∈ Rs sodass 1, α1, . . . , αslinear unabhängig über Q sind. Dann ist die Folge ({nα})n≥0 dicht in [0, 1]s.

    Die Umkehrung in Proposition 2.10 ist im Allgemeinen nicht richtig. Sei z.B.α irrational und

    xn :=

    {{kα} falls n = 2k,0 falls n = 2k + 1.

    23

  • 2. Diskrepanz

    Dann ist die Folge (xn)n≥0 dicht in [0, 1] aber nicht gleichverteilt modulo 1, daz.B. A([0, 1/8), N) ≥ N/2 für alle N ∈ N, also

    A([0, 1/8), N)

    N≥ 1

    2.

    Wäre die Folge gleichverteilt, müßte aber die linke Seite obiger Ungleichung gegen1/8 konvergieren.

    2.2. Diskrepanz

    Wir führen nun eine Größe ein, welche die Ordnung der Konvergenz in Gleichung(2.1) bzw. Gleichung (2.2) angibt, d.h. ein quantitatives Maß für die Abweichungeiner endlichen Punktmenge von der Gleichverteilung. Für a, b ∈ [0, 1]s mit a =(a1, . . . , as) und analog für b bedeutet a ≤ b, dass aj ≤ bj für alle j = 1, . . . , s.

    Definition 2.12. Sei P eine N -elementige Punktmenge in [0, 1)s. Die Diskre-panz DN dieser Punktmenge ist definiert als

    DN(P) = supa,b∈[0,1]s

    a≤b

    ∣∣∣∣A([a, b),P , N)

    N− λs([a, b))

    ∣∣∣∣ .

    Für eine unendliche Folge S = (x0,x1, . . .) versteht man unter der DiskrepanzDN(S) die Diskrepanz der ersten N Folgenelemente.

    Oft betrachtet man folgende, etwas vereinfachte Definition:

    Definition 2.13. Sei P eine N -elementige Punktmenge in [0, 1)s. Die Stern Dis-krepanz D∗N dieser Punktmenge ist definiert als

    D∗N(P) = supa∈[0,1]s

    ∣∣∣∣A([0,a),P , N)

    N− λs([0,a))

    ∣∣∣∣ .

    Für unendliche Folgen S = (x0,x1, . . .) versteht man unter der Stern DiskrepanzD∗N(S) die Stern Diskrepanz der ersten N Folgenelemente.

    Es gilt folgender Zusammenhang zwischen DN und D∗N :

    Proposition 2.14. Für jede N-elementige Punktmenge P in [0, 1)s gilt

    D∗N(P) ≤ DN(P) ≤ 2sD∗N(P).

    24

  • 2. Diskrepanz

    Beweis. Die linke Ungleichung folgt unmittelbar aus den Definitionen 2.12 und2.13. Wir beweisen die rechte Ungleichung für s = 1 und s = 2. Der Beweis fürs ≥ 3 geht ganz analog. Sei also s = 1 und [α, β) ⊆ [0, 1). Dann ist [α, β) =[0, β) \ [0, α),

    A([α, β), N) = A([0, β), N)− A([0, α), N)und

    λ1([α, β)) = λ1([0, β))− λ1([0, α)).Also folgt

    A([α, β), N)

    N− λ1([α, β)) =

    A([0, β), N)

    N− λ1([0, β))−

    −(A([0, α), N)

    N− λ1([0, α))

    ).

    Damit ist nun ∣∣∣∣A([α, β), N)

    N− λ1([α, β))

    ∣∣∣∣ ≤ 2D∗N(P)

    und somit giltDN(P) ≤ 2D∗N(P).

    Betrachten wir noch kurz den Fall s = 2. Sei

    J = [α1, β1)× [α2, β2).

    Dann gilt

    A(J,N) = A([0, β1)× [0, β2), N)−A([0, α1)× [0, β2), N)− A([0, β1)× [0, α2), N)+A([0, α1)× [0, α2), N).

    Eine analoge Gleichung ergibt sich für λ2. Wie im Fall s = 1 folgt die Behauptung.�

    Mit Hilfe der Diskrepanz können wir nun folgendes Kriterium für Gleichver-teilung modulo 1 angeben:

    Satz 2.15. Sei S eine Folge in [0, 1)s. Dann sind folgende Aussagen äquivalent:

    (a) S ist gleichverteilt modulo 1.

    (b) Es gilt limN→∞D∗N(S) = 0.

    (c) Es gilt limN→∞DN(S) = 0.

    25

  • 2. Diskrepanz

    Zum Beweis dieses Satzes benötigen wir das folgende Hilfsresultat:

    Lemma 2.16. Für i = 1, . . . , s seien ui, vi ∈ [0, 1] mit |ui − vi| ≤ δ. Dann gilt∣∣∣∣∣

    s∏

    i=1

    ui −s∏

    i=1

    vi

    ∣∣∣∣∣ ≤ 1− (1− δ)s ≤ s δ.

    Beweis. Wir führen den Beweis mit Hilfe vollständiger Induktion nach s. Für s =1 ist die Aussage trivialerweise richtig. Wir müssen also nur den Induktionsschritts → s + 1 machen. Dabei können wir ohne Beschränkung der Allgemeinheitannehmen, dass us+1 ≥ vs+1. Dann gilt

    ∣∣∣∣∣s+1∏

    i=1

    ui −s+1∏

    i=1

    vi

    ∣∣∣∣∣ =∣∣∣∣∣(us+1 − vs+1)

    s∏

    i=1

    ui + vs+1

    (s∏

    i=1

    ui −s∏

    i=1

    vi

    )∣∣∣∣∣≤ |us+1 − vs+1| · 1 + vs+1(1− (1− δ)s)= us+1 − vs+1(1− δ)s= us+1(1− (1− δ)s) + (us+1 − vs+1)(1− δ)s≤ 1− (1− δ)s + δ(1− δ)s= 1− (1− δ)s+1.

    Damit ist die linke Ungleichung bewiesen. Für die Funktion x 7→ xs auf R giltnach dem Mittelwertsatz der Differentialrechnung für alle y, z ∈ R mit z ≤ y

    ys − zs = sξs−1(y − z)

    für ein ξ ∈ [z, y]. Setzen wir nun speziell y = 1 und z = 1 − δ ein, so folgt auchdie rechte Ungleichung. �

    Beweis von Satz 2.15. Die Äquivalenz von (b) und (c) folgt aus Proposition 2.14.(c) ⇒ (a): Sei limN→∞DN(S) = 0, also

    limN→∞

    supa,b∈[0,1]s

    a≤b

    ∣∣∣∣A([a, b),S, N)

    N− λs([a, b))

    ∣∣∣∣ = 0.

    Dann gilt natürlich auch

    limN→∞

    A([a, b),S, N)N

    = λs([a, b))

    für alle Intervalle der Form [a, b) ⊆ [0, 1)s und somit ist die Folge (xn)n≥0 gleich-verteilt modulo 1.

    26

  • 2. Diskrepanz

    (a) ⇒ (b): Sei die Folge (xn)n≥0 gleichverteilt modulo 1. Sei J ein beliebigesTeilintervall von [0, 1)s der Form [0,a). Wähle m ∈ N, m ≥ 2, und betrachte den1/m-Raster

    Γm,s :=

    {0,

    1

    m, . . . ,

    m− 1m

    }s⊆ [0, 1)s.

    Für p = (p1, . . . , ps) ∈ Γm,s sei Ip :=∏s

    i=1 [pi, pi + 1/m), siehe Abbildung 2.2.

    1

    m

    1

    m

    Ip

    Abbildung 2.2.: Der Raster Γm,s für s = 2 und m = 6.

    Nun seienJ :=

    p:Ip⊆JIp und J :=

    p:Ip∩J 6=∅Ip.

    Dann sind J und J Intervalle (J kann eventuell auch leer sein) mit

    J ⊆ J ⊆ J.

    Entsprechende Seitenlängen von J und J unterscheiden sich maximal um 1/m.Also folgt aus Lemma 2.16, dass

    λs(J)− λs(J) ≤s

    m.

    Nun gilt

    A(J,N)

    N− λs(J) ≤

    A(J,N)

    N− λs(J) ≤

    A(J,N)

    N− λs(J)

    bzw.

    A(J,N)

    N− λs(J)

    ≥ A(J,N)N − λs(J)− (λs(J)− λs(J)),

    ≤ A(J,N)N − λs(J) + (λs(J)− λs(J)).

    27

  • 2. Diskrepanz

    Da aus β − δ ≤ x ≤ α + δ mit δ > 0 folgt, dass |x| ≤ δ +max(α, β) so gilt nun∣∣∣∣A(J,N)

    N− λs(J)

    ∣∣∣∣ ≤ λs(J)− λs(J) +

    +max

    {∣∣∣∣A(J,N)

    N− λs(J)

    ∣∣∣∣ ,∣∣∣∣A(J,N)

    N− λs(J)

    ∣∣∣∣}

    ≤ sm

    + maxp∈Γm,s

    ∣∣∣∣A([0,p), N)

    N− λs([0,p))

    ∣∣∣∣ .

    Sei nun ε > 0 beliebig. Da die Folge S gleichverteilt modulo 1 ist, gibt es einN0 = N0(ε,m), sodass für alle N ≥ N0 gilt

    maxp∈Γm,s

    ∣∣∣∣A([0,p), N)

    N− λs([0,p))

    ∣∣∣∣ ≤ ε.

    D.h. aber, dass

    limN→∞

    maxp∈Γm,s

    ∣∣∣∣A([0,p), N)

    N− λs([0,p))

    ∣∣∣∣ = 0

    und somit gilt

    0 ≤ lim supN→∞

    D∗N(S) ≤s

    m.

    Da m ≥ 2 beliebig groß gewählt werden kann folgt nun die Behauptung. �

    Bemerkung 2.17. Wir haben im Beweis folgende Abschätzung für die SternDiskrepanz D∗N einer endlichen Punktmenge P gezeigt: Für alle m ∈ N, m ≥ 2gilt

    D∗N(P) ≤s

    m+ max

    p∈Γm,s

    ∣∣∣∣A([0,p), N)

    N− λs([0,p))

    ∣∣∣∣ .

    D.h. man kann das Supremum in der Definition der Stern Diskrepanz durch einMaximum über ms Punkte ersetzen und macht dabei einen Fehler von maximals/m.

    Wir wissen nun, dass eine Folge genau dann gleichverteilt ist, wenn ihre Diskre-panz gegen Null konvergiert fallsN gegen unendlich geht. Wir werden nun zeigen,dass dies aber nicht beliebig schnell gehen kann. Es gilt

    28

  • 2. Diskrepanz

    Proposition 2.18. Für jede N-elementige Punktmenge P in [0, 1)s gilt

    (a) 1N ≤ DN(P) ≤ 1.

    (b) 12sN

    ≤ D∗N(P) ≤ 1.

    Beweis.

    (a) Die UngleichungDN(P) ≤ 1 ist trivialerweise richtig. Sei nun 0 < ε ≤ 1/N ,sei x = (x(1), . . . , x(s)) ∈ P und sei

    J =([x(1), x(1) + ε1/s)× . . .× [x(s), x(s) + ε1/s)

    )∩ [0, 1]s.

    Da x ∈ J giltDN(P) ≥

    A(J,N)

    N− λs(J) ≥

    1

    N− ε.

    Da man ε > 0 beliebig klein wählen kann folgt die Behauptung.

    (b) Folgt unmittelbar aus (a) und Proposition 2.14. �

    Die Stern Diskrepanz einer Punktmenge P kann man auch als Supremum Normder Funktion ∆P : [0, 1]s → R,

    ∆P(y) =A([0,y),P , N)

    N− λs([0,y))

    betrachten. Die Funktion ∆P nennt man oft Diskrepanzfunktion der PunktmengeP . Es ist somit naheliegend auch andere Normen der Diskrepanzfunktion zubetrachten. Z.B. kann man für p > 0 die Lp-Norm von ∆P betrachten. Dazufolgende Definition:

    Definition 2.19. Sei P eine N -elementige Punktmenge in [0, 1)s und sei 1 ≤p < ∞. Die Lp Diskrepanz (manchmal auch Lp Stern Diskrepanz) von P istdefiniert als

    Lp,N(P) = ‖∆P‖Lp =(∫

    [0,1]s

    ∣∣∣∣A([0,y),P , N)

    N− λs([0,y))

    ∣∣∣∣p

    dy

    )1/p.

    Für Folgen S versteht man unter der Lp Diskrepanz Lp,N(S) die Lp Diskrepanzder ersten N Folgenelemente.

    Auch hier gibt es einen engen Zusammenhang zwischen D∗N und Lp,N . Es gilt

    29

  • 2. Diskrepanz

    Proposition 2.20. Für jede N-elementige Punktmenge P in [0, 1)s gilt

    Lp,N(P) ≤ D∗N(P) ≤ c(s, p)Lp

    p+s

    p,N(P).

    Dabei hängt c(s, p) > 0 nur von der Dimension s und von p ab (aber nicht vonN).

    Beweis. Die linke Ungleichung ist unmittelbar klar. Für einen Beweis der rechtenUngleichung siehe z.B. [5]. �

    Also kann man auch die Lp Diskrepanz als Kriterium für Gleichverteilungmodulo 1 verwenden. Aus Proposition 2.20 und Satz 2.15 folgt:

    Korollar 2.21. Eine Folge S in [0, 1)s ist genau dann gleichverteilt modulo 1,wenn limN→∞ Lp,N(S) = 0.

    2.3. Schranken für die Diskrepanz

    Die untere Schranke für die Stern Diskrepanz aus Proposition 2.18 ist für großes sehr schwach. Nur für s = 1 werden wir zeigen, dass diese Schranke auchangenommen wird. Allgemein gilt folgender Satz von K. F. Roth aus dem Jahr1954:

    Satz 2.22 (Roth). Für jede N-elementige Punktmenge P in [0, 1)s gilt

    DN(P) ≥ D∗N(P) ≥ L2,N(P) ≥ cs(logN)

    s−12

    N,

    wobei cs > 0 eine Konstante ist, die nur von s abhängt.

    Beweis für s = 2. Für x ∈ [0, 1]2 seiD(x) = Nλ2([0,x))−A([0,x),P , N).

    Wir zeigen nun die Schranke

    NL2,N(P) =(∫

    [0,1]2D2(x) dx

    )1/2≥

    √logN

    29√log 2

    .

    30

  • 2. Diskrepanz

    Daraus folgt dann sofort die Behauptung.Wir wählen dazu eine Hilfsfunktion F : [0, 1]2 → R und verwenden die Cauchy-

    Schwarz-Ungleichung

    [0,1]2F (x)D(x) dx ≤

    (∫

    [0,1]2F 2(x) dx

    )1/2(∫

    [0,1]2D2(x) dx

    )1/2

    und somit

    NL2,N(P) =(∫

    [0,1]2D2(x) dx

    )1/2≥∫[0,1]2 F (x)D(x) dx(∫[0,1]2 F

    2(x) dx)1/2 .

    Ziel ist es nun, die Funktion F so zu wählen, dass F im quadratischen Mittel kleinist, d.h. von der Ordnung

    ∫[0,1]2 F

    2(x) dx = O(logN), aber∫[0,1]2 F (x)D(x) dx

    groß ist, genauer von der Ordnung logN . Natürlich wird die Funktion von dergegebenen Punktmenge abhängen.Für x ∈ R definieren wir

    ψ(x) =

    {1 falls x ∈ [k, k + 1/2) für ein k ∈ Z,

    −1 falls x ∈ [k + 1/2, k + 1) für ein k ∈ Z.

    Wir bemerken hier, dass für i ∈ N0 und a ∈ {0, . . . , 2i − 1} gilt∫ (a+1)/2i

    a/2iψ(2iy) dy =

    1

    2i

    ∫ a+1

    a

    ψ(y) dy = 0.

    Wähle m ∈ N so, dass 2N ≤ 2m < 4N und definiere M = 2m. Für j ∈{0, 1, . . . , m} definieren wir Funktionen

    fj : [0, 1]2 → {−1, 0, 1}

    auf folgende Weise: Sei

    R(j)a,b =

    [a

    2m−j,a+ 1

    2m−j

    )×[b

    2j,b+ 1

    2j

    ),

    wobei a ∈ {0, 1, . . . , 2m−j − 1} und b ∈ {0, 1, . . . , 2j − 1}. Dann definieren wir füry = (y1, y2) ∈ R(j)a,b,

    fj(y) =

    {0 falls R

    (j)a,b ∩ P 6= ∅,

    ψ(2m−jy1)ψ(2jy2) falls R(j)a,b ∩ P = ∅.

    (2.6)

    Siehe Abbildung 2.3 für ein Beispiel.

    31

  • 2. Diskrepanz

    Abbildung 2.3.: Die Funktion f1 für N = 4 (also m = 3). Weiss entspricht demFunktionswert 0, Hellgrau dem Wert +1 und Dunkelgrau demWert −1.

    Wir zeigen nun, dass die so definierten Funktionen fj paarweise orthogonalsind, d.h. für i < j gilt ∫

    [0,1]2fi(x)fj(x) dx = 0. (2.7)

    Zunächst ist

    [a

    2j,a+ 1

    2j

    )⊆

    [b2i ,

    b2i +

    12i+1

    )für ein b ∈ {0, . . . , 2i − 1}, oder

    [b2i +

    12i+1 ,

    b+12i

    )für ein b ∈ {0, . . . , 2i − 1}.

    Also ist ψ(2iy) = c ∈ {−1, 0, 1} konstant auf[a/2j, (a+ 1)/2j

    )und somit gilt

    ∫ (a+1)/2j

    a/2jψ(2jy)ψ(2iy) dy = c

    ∫ (a+1)/2j

    a/2jψ(2jy) dy = 0.

    Für a ∈ {0, . . . , 2m−i − 1} und b ∈ {0, . . . , 2j − 1} sei

    R(i,j)a,b =

    [a

    2m−i,a+ 1

    2m−i

    )×[b

    2j,b+ 1

    2j

    ).

    Nun gilt

    [0,1]2fi(y)fj(y) dy =

    2m−i−1∑

    a=0

    2j−1∑

    b=0

    R(i,j)a,b

    fi(y)fj(y) dy

    =2m−i−1∑

    a=0

    2j−1∑

    b=0︸ ︷︷ ︸R

    (i,j)a,b =∅

    R(i,j)a,b

    ψ(2m−iy1)ψ(2jy2)ψ(2

    m−iy1)ψ(2jy2) dy1 dy2

    32

  • 2. Diskrepanz

    =

    2m−i−1∑

    a=0

    2j−1∑

    b=0︸ ︷︷ ︸R

    (i,j)a,b =∅

    ∫ (a+1)/2m−i

    a/2m−iψ(2m−iy1)ψ(2

    m−jy1) dy1

    ×∫ (b+1)/2j

    b/2jψ(2iy2)ψ(2

    jy2) dy2

    = 0.

    Sei nunF (x) = f0(x) + f1(x) + · · ·+ fm(x). (2.8)

    Dann gilt wegen 2m < 4N , dass

    [0,1]2F 2(x) dx =

    m∑

    i,j=0

    [0,1]2fi(x)fj(x) dx =

    m∑

    i=0

    [0,1]2f 2i (x) dx

    ≤m∑

    i=0

    1 = m+ 1

    < log2(4N) + 1 = log2N + 3.

    Wir zeigen nun, dass∫

    [0,1]2fj(x)D(x) dx ≥ 2−8 (2.9)

    für alle j ∈ {0, 1, . . . , m} ist.Dazu betrachten wir fjD auf einem Rechteck R

    (j)a,b aus der Definition von fj.

    Dabei interessieren wir uns nur für leere R(j)a,b, da andernfalls fj(x) = 0 ist für

    x ∈ R(j)a,b.Insgesamt gibt es 2m =M ≥ 2N Rechtecke R(j)a,b von denen höchstens N einen

    Punkt aus P enthalten können. Also gibt es mindestens N leere Rechtecke R(j)a,b.Also genügt es zu zeigen, dass für jedes leere Rechteck R

    (j)a,b gilt

    R(j)a,b

    fj(x)D(x) dx ≥ 2−8N−1. (2.10)

    Sei also R(j)a,b ein leeres Rechteck und sei Rlu der linke untere Teilquadrant und

    entsprechend Rru, Rlo, Rro (siehe Abbildung 2.4).Seien a, b wie in Abbildung 2.4 eingezeichnet. Dann folgt

    R(j)a,b

    fj(x)D(x) dx

    33

  • 2. Diskrepanz

    Rlo

    Rlu

    Rro

    Rru

    x x+ a

    x+ a + bx+ b

    R

    b

    a

    Abbildung 2.4.: Ein leeres Rechteck mit den Quadranten Rlu, Rru, Rlo, Rro.

    =

    Rlu

    D(x) dx−∫

    Rru

    D(x) dx−∫

    Rlo

    D(x) dx+

    Rro

    D(x) dx

    =

    Rlu

    [D(x)−D(x+ a)−D(x+ b) +D(x+ a+ b)] dx.

    Wegen

    λ2(Rlu) = λ2([x,x+ a+ b))

    = λ2([0,x))− λ2([0,x+ a))− λ2([0,x+ b)) + λ2([0,x+ a + b))

    und

    0 = A([x,x+ a+ b),P , N)= A([0,x),P , N)−A([0,x+ a),P , N)

    −A([0,x+ b),P , N) + A([0,x+ a+ b),P , N)

    gilt, dass

    D(x)−D(x+ a)−D(x+ b) +D(x+ a+ b) = Nλ2(Rlu).

    Damit folgt∫

    R(j)a,b

    fj(x)D(x) dx =

    Rlu

    Nλ2(Rlu) dx = Nλ2(Rlu)2

    34

  • 2. Diskrepanz

    =N

    22m+4>

    1

    2m+6>

    1

    28N.

    Somit ist (2.10) und damit auch (2.9) gezeigt.Aus (2.9) folgt nun

    [0,1]2F (x)D(x) dx ≥ m+ 1

    28≥ log2N

    28.

    Zusammen folgt nun

    NL2,N(P) ≥log2N

    28√

    log2N + 3≥

    √logN

    29√log 2

    .

    Es ist bekannt, dass die untere Schranke aus Satz 2.22 best möglich ist für dieL2 Diskrepanz, d.h. für jedes s,N ∈ N,N ≥ 2 gibt esN -elementige PunktmengenP in [0, 1)s mit

    L2,N(P) ≤ c̃s(logN)

    s−12

    N.

    Die erste Konstruktion solcher Punktmengen in beliebiger Dimension stammtvon W.W.L. Chen und M.M. Skriganov aus dem Jahr 2002. Eine weitere wurde2012 von J. Dick und F. Pillichshammer präsentiert.Andererseits ist diese Schranke nicht best möglich für die Stern Diskrepanz.

    Bilyk, Lacey und Vagharshakyan konnten 2008 in einer gemeinsamen Arbeitzeigen, dass für jede Dimension s ∈ N, s ≥ 2 Zahlen cs > 0 und 0 < ηs < 12existieren mit der Eigenschaft, dass für jede N -elementige Punktmenge P in[0, 1)s gilt

    D∗N(P) ≥ cs(logN)(s−1)/2+ηs

    N.

    Dieses Resultat ist momentan die beste untere Abschätzung für die Stern Dis-krepanz von s-dimensionalen Punktmengen für s ≥ 3.Eine berühmte Vermutung in der Theorie der Gleichverteilung modulo 1 lautet:

    Vermutung I: Für jede Dimension s ∈ N existiert eine Zahl cs > 0 mit derEigenschaft, dass für jede N -elementige Punktmenge P in [0, 1)s gilt

    D∗N(P) ≥ cs(logN)s−1

    N.

    Diese Aussage ist natürlich für s = 1 richtig (siehe Proposition 2.18). Für s = 2wurde sie vonW. M. Schmidt bewiesen (siehe Satz 2.30 in Aufgabe 2.12). Für s ≥

    35

  • 2. Diskrepanz

    3 ist aber ein Beweis dieser Aussage bis heute ausständig. Diese untere Schrankefür D∗N wäre aber best möglich. Wir werden noch Punktmengen kennenlernen,deren Diskrepanz von genau dieser Größenordnung in N ist.Was bedeutet das ganze nun für Folgen?

    Satz 2.23. Für alle s ∈ N gibt es eine Zahl c′s > 0 mit der Eigenschaft, dassfür jede unendliche Folge S in [0, 1)s gilt

    D∗N(S) ≥ c′s(logN)s/2

    N

    für unendlich viele Werte von N ∈ N.

    Beweis. Sei S = (xn)n≥0 und sei xn = (x(1)n , . . . , x(s)n ). Für ein festes N ∈ Nbetrachten wir die endliche Punktmenge P = {y0, . . . ,yN−1} in [0, 1)s+1 gegebendurch

    yn := (x(1)n , . . . , x

    (s)n , n/N), für n = 0, . . . , N − 1.

    Nach Satz 2.22 gibt es a1, . . . , as+1 ∈ [0, 1] sodass∣∣∣∣∣A(∏s+1

    i=1 [0, ai),P , N)N

    −s+1∏

    i=1

    ai

    ∣∣∣∣∣ ≥ cs+1(logN)s/2

    N

    gilt. Sei nun m ∈ N mit m−1N

    < as+1 ≤ mN bzw. −1 < Nas+1 −m ≤ 0.A(∏s+1

    i=1 [0, ai),P , N) ist die Anzahl aller n ∈ {0, . . . , N−1} für die x(j)n ∈ [0, aj)

    für alle j = 1, . . . , s und nN ∈ [0, as+1) sind. Die letzte Bedingung ist dabeiäquivalent zu n ∈ {0, . . . , m− 1}. Also gilt

    A

    (s+1∏

    i=1

    [0, ai),P , N)

    = A

    (s∏

    i=1

    [0, ai),S, m).

    Sei c′s < cs+1. Dann folgt∣∣∣∣∣A(

    s∏

    i=1

    [0, ai),S, m)

    −ma1 · · · as∣∣∣∣∣

    ≥∣∣∣∣∣A(

    s+1∏

    i=1

    [0, ai),P , N)

    −N a1 · · · as+1∣∣∣∣∣− |Na1 · · · as+1 −ma1 · · · as|

    ≥ cs+1 (logN)s/2 − a1 · · · as |Nas+1 −m|≥ cs+1 (logN)s/2 − 1

    36

  • 2. Diskrepanz

    ≥ c′s (logN)s/2,

    für N groß genugWir haben also folgendes gezeigt: Für jedes hinreichend große N gibt es ein

    m ∈ {1, . . . , N}, sodass

    mD∗m(S) > c′s(logN)s/2 ≥ c′s(logm)s/2.

    Angenommen die Ungleichung

    mD∗m(S) > c′s(logm)s/2

    gilt nur für endlich viele m ∈ N. Sei m∗ das maximale m mit dieser Eigenschaft.Wähle nun N ∈ N, sodass

    c′s(logN)s/2 > max

    1≤k≤m∗kD∗k(S).

    Zu diesem N kann man nun wie oben beschrieben ein m ∈ {1, . . . , N} finden,mit der Eigenschaft

    mD∗m(S) > c′s(logN)s/2 ≥ c′s(logm)s/2.

    Angenommen m ≤ m∗, dann ergäbe aber

    mD∗m(S) > c′s(logN)s/2 > max1≤k≤m∗

    kD∗k(S)

    einen Widerspruch. Also ist m > m∗ was aber wegen

    mD∗m(S) ≥ c′s(logm)s/2

    einen Widerspruch zur Maximalität von m∗ ergibt. �

    Es gibt nun folgende Vermutung bezüglich der Stern Diskrepanz von unendli-chen Folgen:

    Vermutung II: Für jede Dimension s ∈ N gibt es eine Zahl c′s > 0 mit derEigenschaft, dass für jede Folge S in [0, 1)s gilt

    D∗N (S) ≥ c′s(logN)s

    N

    für unendlich viele Werte von N ∈ N.

    Für s = 1 wurde diese Vermutung von W.M. Schmidt 1972 und von R. Béjian1982 bewiesen.

    37

  • 2. Diskrepanz

    Definition 2.24. 1. Punktmengen P in [0, 1)s mit

    D∗N (P) ≤ c(logN)s−1

    N

    werden oft als niedrigdiskrepante Punktmengen (low discrepancy pointsets) bezeichnet.

    2. Folgen S in [0, 1)s mit

    D∗N(S) ≤ c(logN)s

    Nfür alle N ≥ 2

    werden oft als niedrigdiskrepante Folgen (low discrepancy sequences) be-zeichnet.

    Natürlich ist die obere Schranke für die Diskrepanz aus Proposition 2.18 abso-lut nicht aussagekräftig. Wir werden nun eine Abschätzung der Diskrepanz nachoben angeben, die sogenannte Erdős-Turán-Koksma Ungleichung. Diese Unglei-chung gibt eine obere Schranke für die Diskrepanz von Punktmengen mit derHilfe von Exponentialsummen. Wir wissen ja bereits aus dem Weylschen Krite-rium Satz 2.4, dass das Verhalten von Exponentialsummen eng verwandt ist mitdem Begriff der Gleichverteilung modulo 1.

    Satz 2.25 (Erdős-Turán-Koksma Ungleichung). Für jede N-elementigePunktmenge P = {x0, . . . ,xN−1} in [0, 1)s gilt

    DN(P) ≤(3

    2

    )s 2m+ 1

    +∑

    0

  • 2. Diskrepanz

    und somit ist DN(P) ≤ 3/N.

    Oft hat man Punktmengen deren Komponenten rationale Tahlen sind. Für sol-che Punktmengen wurde von H. Niederreiter 1977 eine Diskrepanz Abschätzunggezeigt die ähnlich aussieht wie Satz 2.25. Dazu benötigen wir noch einige Nota-tionen:Für M ∈ N, M ≥ 2, sei C(M) = (−M/2,M/2] ∩ Z und Cs(M) = C(M)s das

    s-fache Kartesische Produkt der C(M). Weiters, sei C∗s (M) = Cs(M) \ {0}. Fürh ∈ C(M) setzen wir

    r(h,M) =

    {M sin(π|h|/M) falls h 6= 0,1 falls h = 0.

    Für h = (h1, . . . , hs) ∈ Cs(M), setzen wir r(h,M) =∏s

    j=1 r(hj,M).

    Satz 2.27. Sei P = {x0, . . . ,xN−1} eine Punktmenge in [0, 1)s wobei xn vonder Form xn = {yn/M} mit yn ∈ Zs ist für alle n ∈ {0, . . . , N − 1}. Für jedesM ∈ N, M ≥ 2, gilt dann

    DN(P) ≤ 1−(1− 1

    M

    )s+

    h∈C∗s (M)

    1

    r(h,M)

    ∣∣∣∣∣1

    N

    N−1∑

    n=0

    exp(2πih · yn/M)∣∣∣∣∣ .

    Beweis. Für k = (k1, . . . , ks) ∈ Zs seiA(k) := #{n ∈ N0 : 0 ≤ n < N und yn ≡ k (mod M)}.

    Es ist1

    M

    h∈C(M)exp(2πiha/M) =

    {1 falls a ≡ 0 (mod M),0 falls a 6≡ 0 (mod M).

    Also gilt

    N−1∑

    n=0

    1

    M s

    h∈Cs(M)exp(2πih · (yn − k)/M)

    =N−1∑

    n=0

    s∏

    j=1

    1

    M

    hj∈C(M)exp(2πihj(y

    (j)n − kj)/M)

    ︸ ︷︷ ︸=

    1 falls y

    (j)n ≡ kj (mod M),

    0 sonst.

    = A(k).

    39

  • 2. Diskrepanz

    Also gilt

    A(k)− NM s

    =1

    M s

    h∈C∗s (M)exp(−2πih · k/M)

    N−1∑

    n=0

    exp(2πih · yn/M).

    Sei nun J =∏s

    j=1[uj, vj) ⊆ [0, 1)s. Für j = 1, . . . , s sei aj ∈ Z minimal,sodass uj ≤ aj/M und bj ∈ Z maximal, sodass bj/M < vj. Insbesondere ist[aj/M, bj/M ] ⊆ [uj, vj).Falls [aj/M, bj/M ] = ∅ für ein j ∈ {1, . . . , s}, dann ist A(J,P , N) = 0 und

    vj − uj < 1/M . Somit ist∣∣∣∣A(J,P , N)

    N− λs(J)

    ∣∣∣∣ = λs(J) <1

    M≤ 1−

    (1− 1

    M

    )s.

    Seien nun [aj/M, bj/M ] 6= ∅ für alle j ∈ {1, . . . , s}. Dann gilt

    A(J,P , N)N

    − λs(J) =∑

    k : aj≤kj≤bj∀ 1≤j≤s

    (A(k)

    N− 1M s

    )+

    1

    M s

    s∏

    j=1

    (bj − aj + 1)− λs(J)

    =1

    M s

    h∈C∗s (M)

    k : aj≤kj≤bj∀ 1≤j≤s

    exp(−2πih · k/M)

    1N

    N−1∑

    n=0

    exp(2πih · yn/M)

    +

    s∏

    j=1

    bj − aj + 1M

    −s∏

    j=1

    (vj − uj).

    Da ∣∣∣∣bj − aj + 1

    M− (vj − uj)

    ∣∣∣∣ <1

    M

    für alle j ∈ {1, . . . , s} folgt aus Lemma 2.16, dass∣∣∣∣∣

    s∏

    j=1

    bj − aj + 1M

    −s∏

    j=1

    (vj − uj)∣∣∣∣∣ ≤ 1−

    (1− 1

    M

    )s.

    Somit folgt∣∣∣∣A(J,P , N)

    N− λs(J)

    ∣∣∣∣ ≤ 1−(1− 1

    M

    )s

    +1

    M s

    h∈C∗s (M)

    ∣∣∣∣∣∣∣

    k : aj≤kj≤bj∀ 1≤j≤s

    exp(−2πih · k/M)

    ∣∣∣∣∣∣∣︸ ︷︷ ︸

    =:r∗(h,M)

    ·∣∣∣∣∣1

    N

    N−1∑

    n=0

    exp(2πih · yn/M)∣∣∣∣∣ .

    40

  • 2. Diskrepanz

    Nun gilt

    r∗(h,M) =s∏

    j=1

    ∣∣∣∣∣∣

    bj∑

    kj=aj

    exp(2πihjkj/M)

    ∣∣∣∣∣∣

    =s∏

    j=1

    ∣∣∣∣∣∣

    bj−aj∑

    kj=0

    exp(2πihjkj/M) exp(2πihjaj/M)

    ∣∣∣∣∣∣

    =s∏

    j=1

    ∣∣∣∣∣∣

    bj−aj∑

    kj=0

    exp(2πihjkj/M)

    ∣∣∣∣∣∣.

    Ist hj = 0, dann gilt∣∣∣∣∣∣

    bj−aj∑

    kj=0

    exp(2πihjkj/M)

    ∣∣∣∣∣∣= bj − aj + 1 ≤M =

    M

    r(hj,M).

    Ist hj ∈ C∗(M), dann gilt∣∣∣∣∣∣

    bj−aj∑

    kj=0

    exp(2πihjkj/M)

    ∣∣∣∣∣∣=

    ∣∣∣∣exp(2πihj(bj − aj + 1)/M)− 1

    exp(2πihj/M)− 1

    ∣∣∣∣

    =

    ∣∣∣∣sin(πhj(bj − aj + 1)/M)

    sin(πhj/M)

    ∣∣∣∣

    ≤ 1sin(π|hj|/M)

    =M

    r(hj,M).

    Also gilt stets

    r∗(h,M) ≤s∏

    j=1

    M

    r(hj,M)=

    M s

    r(h,M).

    Somit folgt∣∣∣∣A(J,P , N)

    N− λs(J)

    ∣∣∣∣ ≤ 1−(1− 1

    M

    )s

    +∑

    h∈C∗s (M)

    1

    r(h,M)

    ∣∣∣∣∣1

    N

    N−1∑

    n=0

    exp(2πih · yn/M)∣∣∣∣∣ .

    Das Resultat folgt. �

    41

  • 2. Diskrepanz

    Wir zeigen noch eine Formel von H. Niederreiter aus dem Jahr 1972 für dieStern Diskrepanz von ein-dimensionalen Punktmengen.

    Proposition 2.28. Sei P = {x1, . . . , xN} ⊆ [0, 1), wobei x1 ≤ x2 ≤ . . . ≤ xN .Dann gilt

    D∗N(P) =1

    2N+ max

    n=1,...,N

    ∣∣∣∣xn −2n− 12N

    ∣∣∣∣ .

    Bemerkung 2.29. Also gilt für jede N -elementige Punktmenge P in [0, 1),dass

    D∗N(P) ≥1

    2N

    mit Gleichheit genau dann, wenn xn =2n−12N für n ∈ {1, . . . , N}, d.h. für das

    zentrierte, gleichmäßige Gitter in [0, 1) mit N Punkten.

    Beweis. Seien x0 := 0 und xN+1 := 1. Es gilt

    D∗N (P) = sup0

  • 2. Diskrepanz

    mit 1 ≤ j ≤ r − 1 immer kleiner sind als eine Zahl die im ersten Maximum von(2.12) vorkommt. Sei 1 ≤ j ≤ r − 1. Dann gilt∣∣∣∣n+ j

    N− xn+j

    ∣∣∣∣ =∣∣∣∣n+ j

    N− xn+1

    ∣∣∣∣ ≤ max{∣∣∣ nN

    − xn+1∣∣∣ ,∣∣∣∣n+ r

    N− xn+1

    ∣∣∣∣}

    = max

    {∣∣∣ nN

    − xn+1∣∣∣ ,∣∣∣∣n+ r

    N− xn+r

    ∣∣∣∣}.

    Die beiden Ausdrücke im letzten Maximum kommen aber im ersten Maximumvon (2.12) vor. Für

    ∣∣n+jN − xn+j+1

    ∣∣ geht man analog vor. Somit gilt

    D∗N(P) = maxn=0,...,N

    max{∣∣∣ nN

    − xn∣∣∣ ,∣∣∣ nN

    − xn+1∣∣∣}

    = maxn=1,...,N

    max

    {∣∣∣ nN

    − xn∣∣∣ ,∣∣∣∣n− 1N

    − xn∣∣∣∣}

    = maxn=1,...,N

    max

    {∣∣∣∣2n− 12N

    − xn +1

    2N

    ∣∣∣∣ ,∣∣∣∣2n− 12N

    − xn −1

    2N

    ∣∣∣∣}

    =1

    2N+ max

    n=1,...,N

    ∣∣∣∣2n− 12N

    − xn∣∣∣∣ ,

    da max{|a− b|, |a+ b|} = |a| + |b| ist. �

    Literaturhinweise

    Standardwerk über die qualitative und quantitative Theorie der Gleichverteilungmodulo 1 ist das Buch von Kuipers und Niederreiter [14]. Weiters bietet dasBuch von Matoušek [17] eine gut lesbare Einführung in die Diskrepanz-Theorie.Erwähnenswert sind auch noch die Bücher von Beck und Chen [3], von Dick undPillichshammer [4], von Drmota und Tichy [5] und von Hlawka [11].

    Übungsaufgaben

    2.1 Sei S eine Folge in [0, 1)s. Geben Sie eine Lebesgue integrierbare Funktionf : [0, 1] → R an, für welche (2.3) nicht gilt.

    2.2 Eine Menge J ⊆ [0, 1] heißt Jordan-messbar, wenn die charakteristischeFunktion χJ Riemann-integrierbar ist. In diesem Fall nennt man m(J) :=∫ 10 χJ(x) dx das Jordan Maß von J .

    43

  • 2. Diskrepanz

    Zeigen Sie: Eine Folge (xn)n≥0 ist genau dann gleichverteilt, wenn für jedeJordan-messbare Menge J gilt

    limN→∞

    #{n < N : xn ∈ J}N

    = m(J).

    2.3 Sei die Folge ({αn})n≥0 mit α = (α1, . . . , αs) ∈ Rs gleichverteilt. ZeigenSie, dass dann 1, α1, . . . , αs linear unabhängig über Q sein müssen.

    2.4 Seien b1, b2 ≥ 2 ganze Zahlen mit ggT(b1, b2) = 1. Zeigen Sie, dass diezwei-dimensionale Folge xn = (φb1(n), φb2(n)) für n ∈ N0, gleichverteilt ist.Hier ist φb die radikal inverse Funktion in Basis b. So eine Folge nenntman Halton Folge. Hinweis: Betrachten Sie zunächst nur Intervalle derForm [a1/b

    m11 , (a1 + 1)/b

    m11 )× [a2/bm22 , (a2 + 1)/bm22 ) mit mi ∈ N0 und ai ∈

    {0, . . . , bmii − 1} für i ∈ {1, 2}.Bemerkung: Allgemeiner gilt, falls b1, . . . , bs ≥ 2 paarweise relativ primeganze Zahlen sind, dann ist die s-dimensionale Folge xn = (φb1(n), . . . , φbs(n))für n ∈ N0, gleichverteilt.

    2.5 Berechnen Sie die L1- und die Stern-Diskrepanz der Punktmengen

    a) P = {n/N : n = 0, . . . , N − 1}.b) P = {(2n+ 1)/(2N) : n = 0, . . . , N − 1}.c) P = {n/(2N) : n = 0, . . . , N − 1}.

    2.6 Sei L2,N(P) die L2-Diskrepanz einer Punktmenge P = {x0, . . . ,xN−1} ⊆[0, 1)s. Zeigen Sie die Formel

    (L2,N(P))2 =1

    3s− 2N

    N−1∑

    n=0

    s∏

    i=1

    1− x2n,i2

    +1

    N2

    N−1∑

    n,m=0

    s∏

    i=1

    min(1− xm,i, 1− xn,i),

    wobei xn,i die ite Koordinate des Punkts xn ist. Hinweis: Schreiben Sie dieL2-Diskrepanz in folgender Form an:

    (L2,N(P))2 =∫ 1

    0

    . . .

    ∫ 1

    0

    (1

    N

    N−1∑

    n=0

    s∏

    i=1

    χ[0,ti)(xn,i)− t1 · · · ts)2

    dt1 . . . dts.

    2.7 Berechnen Sie die L2-Diskrepanz der Punktmengen aus Aufgabe 2.5.

    2.8 Berechnen Sie ∫

    [0,1]sN(L2,N({t1, . . . , tN}))2 dt1 . . . dtN

    und interpretieren Sie das Ergebnis?

    44

  • 2. Diskrepanz

    2.9 Sei Ts,N(α) die Menge aller Tupel (t1, . . . , tN) ∈ [0, 1)sN für die gilt

    L2,N({t1, . . . , tN}) ≤α√N

    (1

    2s− 1

    3s

    )1/2.

    Zeigen Sie, dass für alle α ≥ 1 giltλsN(Ts,N(α)) > 1− α−2.

    2.10 Für s,m ∈ N, m ≥ 2, sei

    Γm,s ={(n1

    m, . . . ,

    nsm

    ): n1, . . . , ns ∈ {0, . . . , m− 1}

    }.

    Berechnen Sie L2,N(Γm,s) und folgern Sie daraus L2,N(Γm,s) ≍s N−1/s.

    2.11 Für i = 1, . . . , k seien Pi Punktmengen bestehend aus Ni Elementen mitDiskrepanz DNi(Pi). Sei P die Vereinigung aller Pi, i = 1, . . . , k, wobeiElemente die mehrfach vorkommen auch mehrfach gezählt werden. Sei N =N1 + · · ·+Nk. Zeigen Sie, dass

    DN(P) ≤k∑

    i=1

    NiNDNi(Pi).

    2.12 Wir beweisen folgenden Satz:

    Satz 2.30 (Schmidt). Es gibt eine Konstante c > 0, sodass für jedeN-elementige Punktmenge P in [0, 1)2 gilt

    D∗N(P) ≥ clogN

    N.

    Beweis. Basis des Beweises ist der Beweis von Satz 2.22 von Roth. Wählen ∈ N so, dass 2n−1 < 2N ≤ 2n. Für i = 0, . . . ,≤ n definieren wir dieFunktionen fj : [0, 1)

    s → {−1, 0, 1} wie in (2.6). Weiters definieren wir dieFunktion H : [0, 1)2 → R durch

    H(x) =

    n∏

    i=0

    (1 + αfi(x))− 1,

    wobei 0 < α < 1/2 später genauer festgelegt wird. Sei weiters D(x) :=A([0,x), N,P)−Nx1x2, wobei x = (x1, x2).a) Zeigen Sie folgendes Lemma:

    45

  • 2. Diskrepanz

    Lemma 2.31. Seien 0 ≤ i1 < . . . < ik ≤ n ganze Zahlen. Dann gilt∫

    [0,1]2fi1(x) · · · fik(x) dx = 0.

    Hinweis: Teilen Sie [0, 1)2 in 2n−i1+ik Rechtecke auf, wobei [0, 1) aufder x-Achse in 2ik und auf der y-Achse in 2n−i1 gleich lange Intervallezerlegt wird. Argumentieren Sie dann wie im Fall k = 2 in (2.7).

    b) Zeigen Sie, dass

    n∏

    i=0

    (1 + αfi(x)) = 1 + αF (x) +n+1∑

    k=2

    αkFk(x),

    wobei die Funktion F wie in (2.8) definiert ist und für k = 2, . . . , n+1setzt man

    Fk(x) =∑

    0≤i1

  • 2. Diskrepanz

    Hinweis:Verwenden Sie Lemma 2.32 und setzen Sie i1 = i ∈ {0, . . . , n−k + 1} und ik = i+ h mit h ∈ {1, . . . , n− i}.

    f) Zeigen Sie, dass

    ∣∣∣∣∣n+1∑

    k=2

    αk∫

    [0,1]2Fk(x)D(x) dx

    ∣∣∣∣∣ ≤ α2N

    n

    2n+2.

    g) Zeigen Sie, dass es für hinreichend kleine 0 < α < 1/2 eine KonstanteC > 0 gibt, sodass

    ∣∣∣∣∫

    [0,1]2H(x)D(x) dx

    ∣∣∣∣ ≥ C logN.

    Hinweis: Aus der Dreiecksungleichung folgt∣∣∫ HD

    ∣∣ ≥ α∣∣∫ FD

    ∣∣ −∣∣∣∑n+1

    k=2 αk∫FkD

    ∣∣∣.h) Folgern Sie nun aus Aufgabe 2.12c und 2.12g, dass

    supx∈[0,1]2

    |D(x)| > c logN,

    wobei c > 0 eine Konstante ist. Damit ist Satz 2.30 dann vollständigbewiesen.

    47

  • 3. QMC Integration in Hilberträumen mit

    reproduzierendem Kern

    Wir approximieren das Integral einer Funktion f : [0, 1]s → R durch einen quasi-Monte Carlo (QMC) Algorithmus. Dieser bildet das arithmetische Mittel vonFunktionswerten an fest vorgegebenen Stellen. Seien also x0, . . . ,xN−1 ∈ [0, 1)s,dann verwenden wir die Näherung

    [0,1]sf(x) dx ≈ 1

    N

    N−1∑

    n=0

    f(xn).

    Dabei stellen sich folgende Fragen:

    • Wovon hängt der Fehler eines QMC Algorithmus ab?

    • Wie kann man gute QMC Punkte x0, . . . ,xN−1 ∈ [0, 1)s finden?

    Um diese Fragen zu beantworten, muss man festlegen, welche Integranden f :[0, 1]s → R man betrachtet. Natürlich soll ein QMC Algorithmus nicht nur für ei-ne spezielle Funktion funktionieren, sondern für eine ganze Klasse von Funktionen(mit bestimmten Eigenschaften). In diesem Zusammenhang spielt die Glattheitder Integranden eine wichtige Rolle.Wir wollen also QMC Punktmengen finden, welche Funktionen aus einer be-

    stimmten Funktionenklasse (mit bestimmter Glattheit) gut integrieren. Die In-tegrationspunkte werden also a priori gewählt und diese sollen dann für alleIntegranden aus der Funktionenklassen gute Ergebnisse liefern.

    3.1. Numerische Integration in einer Dimension

    Zum Einstieg betrachten wir QMC Integration von univariaten Funktionen f :[0, 1] → R mit stetiger erster Ableitung auf [0, 1]. Für diese Funktionen gilt

    f(x) = f(1)−∫ 1

    x

    f ′(y) dy.

    48

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    Wir betrachten den Fehler eines QMC Algorithmus mit P = {x0, . . . , xN−1} ⊆[0, 1) und erhalten

    ∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn)

    =1

    N

    N−1∑

    n=0

    ∫ 1

    xn

    f ′(y) dy −∫ 1

    0

    ∫ 1

    x

    f ′(y) dy dx

    =

    ∫ 1

    0

    1

    N

    N−1∑

    n=0

    χ(xn,1](y)f′(y) dy −

    ∫ 1

    0

    ∫ y

    0

    f ′(y) dx dy

    =

    ∫ 1

    0

    f ′(y)

    [1

    N

    N−1∑

    n=0

    χ(xn,1](y)− y]dy.

    DaN−1∑

    n=0

    χ(xn,1](y) =N−1∑

    n=0

    χ[0,y)(xn) =: A([0, y),P , N),

    die Anzahl der Punkte aus P welche im Intervall [0, y) liegen, ist

    1

    N

    N−1∑

    n=0

    χ(xn,1](y)− y = ∆P(y),

    die Diskrepanzfunktion von P an der Stelle y. Somit gilt∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn) =

    ∫ 1

    0

    f ′(y)∆P(y) dy. (3.1)

    Wenden wir nun auf beiden Seiten der Gleichung den Absolutbetrag an undverwenden wir die Dreiecksungleichung für Integrale und dann die Hölder’scheUngleichung für p, q ≥ 1 und 1/p+ 1/q = 1, dann folgt

    ∣∣∣∣∣

    ∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn)

    ∣∣∣∣∣ ≤∫ 1

    0

    |f ′(y)||∆P(y)| dy

    ≤(∫ 1

    0

    |f ′(y)|q dy)1/q(∫ 1

    0

    |∆P(y)|p dy)1/p

    . (3.2)

    Ungleichung (3.2) separiert nun den Einfluss des Integranden f und der Punkt-

    menge P auf den Integrationsfehler. Man beachte, dass(∫ 1

    0 |f ′(y)|q dy)1/q

    nur

    eine Semi-Norm ist, jedoch ‖f‖1,q :=(|f(1)|q +

    ∫ 10 |f ′(y)|q dy

    )1/qeine Norm.

    49

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    Zwei Wahlen für p finden besondere Beachtung, nämlich p = ∞ und p = 2.Ungleichung (3.2) kann in diesen Fällen geschrieben werden als

    ∣∣∣∣∣

    ∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn)

    ∣∣∣∣∣ ≤ ‖f‖1,1D∗N(P) (3.3)

    für p = ∞ und q = 1 und für p = q = 2 als∣∣∣∣∣

    ∫ 1

    0

    f(x) dx− 1N

    N−1∑

    n=0

    f(xn)

    ∣∣∣∣∣ ≤ ‖f‖1,2L2,N(P). (3.4)

    Ungleichung (3.3) ist eine vereinfachte Version der Ungleichung von Koksma.Wir wollen nun eine ähnliche Theorie für beliebige Dimensionen s ∈ N ent-

    wickeln. Diese Verallgemeinerung kann man besonders schön für Hilberträumemit reproduzierendem Kern machen, welche wir nun einführen.

    3.2. Hilberträume mit reproduzierendem Kern

    Sei H ein Hilbertraum bestehend aus Lebesgue integrierbaren Funktionen auf[0, 1]s für welche Funktionswerte wohldefiniert sind. Das innere Produkt in Hbezeichnen wir mit 〈·, ·〉 und die dazugehörige Norm mit ‖ · ‖ = 〈·, ·〉1/2. Seiweiters P = {x0, . . . ,xN−1} eine Menge von Punkten in [0, 1)s. Wir führen nunein Kriterium für die Güte eines QMC Algorithmus

    QN(f) =1

    N

    N−1∑

    n=0

    f(xn)

    für f ∈ H ein.Definition 3.1. Der worst-case error für QMC Integration im Hilbertraum Hunter Verwendung von P ist definiert als

    e(H,P) = supf∈H,‖f‖≤1

    ∣∣∣∣∫

    [0,1]sf(x) dx−QN(f)

    ∣∣∣∣ .

    Man kann nun eine schöne Theorie entwickeln, wenn es eine Funktion K(x,y)gibt mit K(·,y) ∈ H für alle y ∈ [0, 1]s, sodass f(y) = 〈f,K(·,y)〉 für alley ∈ [0, 1]s.Definition 3.2. Ein HilbertraumH von Funktionen f : [0, 1]s → C mit inneremProdukt 〈·, ·〉 heißt Hilbertraum mit reproduzierendem Kern, wenn eine FunktionK : [0, 1]s × [0, 1]s → C existiert, sodass

    50

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    P1: K(·,y) ∈ H für alle y ∈ [0, 1]s und

    P2: 〈f,K(·,y)〉 = f(y) für alle y ∈ [0, 1]s und für alle f ∈ H.Die Funktion K nennt man den reproduzierenden Kern von H.

    Man beachte, dass wir inP1 undP2 den reproduzierenden KernK als eine Funk-tion in der ersten Variablen, bezeichnet durch ·, betrachten und in 〈f,K(·,y)〉 dasinnere Produkt bezüglich der ersten Variablen von K angewendet wird. Manch-mal werden wir darauf hinweisen, indem wir 〈f(x), K(x,y)〉x schreiben. Diezweite Eigenschaft P2 ist die reproduzierende Eigenschaft, d.h. der Funktions-wert von f kann durch den Kern und das innere Produkt erzeugt werden.Eine Funktion mit den Eigenschaften P1 und P2 muss auch symmetrisch,

    eindeutig bestimmt und positiv semidefinit sein:

    P3 (Symmetrie): gilt, da

    K(x,y) = 〈K(·,y), K(·,x)〉 = 〈K(·,x), K(·,y)〉 = K(y,x),

    P4 (Eindeutigkeit): gilt, da für alle Funktionen K̃ welche P1 und P2erfüllen gilt

    K̃(x,y) = 〈K̃(·,y), K(·,x)〉 = 〈K(·,x), K̃(·,y)〉 = K(y,x) = K(x,y),

    P5 (positiv Semidefinitheit): gilt, da für jede Wahl von a0, . . . , aN−1 ∈C und x0, . . . ,xN−1 ∈ [0, 1]s gilt

    N−1∑

    m,n=0

    amanK(xm,xn) =N−1∑

    m,n=0

    aman〈K(·,xn), K(·,xm)〉

    =

    〈N−1∑

    n=0

    anK(xn, ·),N−1∑

    m=0

    amK(xm, ·)〉

    =

    ∥∥∥∥∥N−1∑

    m=0

    amK(xm, ·)∥∥∥∥∥

    2

    ≥ 0.

    Man kann zeigen, dass eine Funktion K welche P3 und P5 erfüllt auch ineindeutiger Weise einen Hilbertraum von Funktionen erzeugt, zusammen mit ei-nem inneren Produkt welches P1 und P2 (und damit auch P4) erfüllt. Es machtalso Sinn, wenn man von einem reproduzierendem Kern spricht ohne explizit dendazugehörigen Hilbertraum von Funktionen zu spezifizieren.Wir können nun nochmals den ein-dimensionalen Fall aus Abschnitt 3.1 be-

    trachten.

    51

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    Seien f, g : [0, 1] → R mit jeweils stetiger erster Ableitung auf [0, 1]. Danndefinieren wir ein inneres Produkt durch

    〈f, g〉1 := f(1)g(1) +∫ 1

    0

    f ′(x)g′(x) dx. (3.5)

    Die dazugehörige Norm ‖f‖1,2 :=√

    〈f, f〉 ist genau die Norm aus (3.4). Es ist‖f‖1,2 < ∞ falls die erste Ableitung f ′ quadratisch integrierbar ist. Mit Hilfedieser Norm definieren wir einen Hilbertraum durch

    H1 = {f : [0, 1] → R : f absolut stetig und ‖f‖1,2 0 ein δ > 0 exi-stiert, sodass für alle n ∈ N und jede Wahl von paarweise disjunkten Intervallen(xk, yk), k = 1, . . . , n, mit

    ∑nk=1(yk −xk) < δ gilt, dass

    ∑nk=1 |f(xk)− f(yk)| < ε.

    Z.B. ist jede Lipschitz stetige Funktion absolut stetig. Insbesondere gilt, fallsf : [0, 1] → R differenzierbar ist auf [0, 1] mit beschränkter erster Ableitung f ′,dann ist f absolut stetig. Man kann zeigen, dass eine Funktion f : [0, 1] → Rgenau dann absolut stetig ist, wenn es eine Lebesgue integrierbare Funktiong : [0, 1] → R gibt, sodass f für alle x ∈ [0, 1] in der Form

    f(x) = f(0) +

    ∫ x

    0

    g(t) dt = f(1)−∫ 1

    x

    g(t) dt

    dargestellt werden kann. In diesem Fall gilt dann g = f ′ fast überall.

    Die FunktionK1(x, y) = 1 + min(1− x, 1− y) (3.6)

    ist der reproduzierende Kern von H1, denn: Es ist

    K1(x, y) =

    {2− x falls x > y,2− y falls x ≤ y,

    und∂K1(x, y)

    ∂x=

    {−1 falls x > y,0 falls x ≤ y.

    Für g : [0, 1] → R,g(x) =

    {−1 falls x > y,0 falls x ≤ y,

    ist

    K1(1, y)−∫ 1

    x

    g(t) dt = 1 +

    ∫ 1

    max(x,y)

    dt = 1 +min(1− x, 1− y) = K1(x, y).

    52

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    Damit ist K1(·, y) absolut stetig. Weiters

    〈K1(·, y), K1(·, y)〉1 = K1(1, y)2 +∫ 1

    0

    (∂K1(x, y)

    ∂x

    )2dx

    = 1 +

    ∫ 1

    y

    dx = 2− y

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    aufgrund der Linearität des inneren Produkts. Hier gilt Gleichheit falls f = h.Also ist

    e(H1,P) =e(h,P)‖h‖1,2

    =〈h, h〉1‖h‖1,2

    = ‖h‖1,2.

    Man beachte, dass

    ∆P(x) =d

    dx

    (∫ 1

    0

    K1(x, y) dy −1

    N

    N−1∑

    n=0

    K1(x, xn)

    )= h′(x)

    (der Beweis dafür wird als Übung überlassen) und somit gilt

    L2,N(P) = ‖h‖1,2 .

    Also gilte(H1,P) = L2,N(P),

    d.h. der worst-case error ist gleich der L2 Diskrepanz der verwendeten Punkt-menge. Weiters ist unter allen Funktionen in H1 die Funktion h am schwierigstenzu integrieren (mit der Punktmenge P), da für die Funktion h Gleichheit in (3.7)gilt.

    3.3. Der worst-case error in Hilberträumen mit

    reproduzierendem Kern

    Wir betrachten nun den allgemeinen Fall. Sei H ein Hilbertraum von Funktionenf : [0, 1]s → R mit innerem Produkt 〈·, ·〉 und Norm ‖ · ‖ = 〈·, ·〉1/2.Wir betrachten das lineare Funktional Ty welches f ∈ H an der Stelle y ∈

    [0, 1]s auswertet, d.h.Ty(f) = f(y) ∀f ∈ H.

    Da wir das Integral∫[0,1]s f(y) dy durch einen QMC Algorithmus

    1N

    ∑N−1n=0 f(xn)

    approximieren und dieser auf Funktionsauswertungen basiert ist es natürlich zuverlangen, dass |f(xn)| < ∞. Diese Bedingung ist garantiert, wenn man verlangt,dass das Funktional Ty beschränkt bzw. äquivalent dazu, stetig ist, d.h. es gibtein M

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    Satz 3.3 (Darstellungssatz von Fréchet-Riesz). Sei X ein Hilbertraummit innerem Produkt 〈·, ·〉 und sei T : X → C ein beschränktes (bzw. äqui-valent dazu stetiges) lineares Funktional. Dann gibt es genau ein z ∈ X , sodassgilt

    T (x) = 〈x, z〉 für alle x ∈ X .

    Wenn also die Punktauswertung in H, d.h. das lineare Funktional Ty stetigist, dann garantiert der Darstellungssatz von Fréchet-Riesz die Existenz einereindeutig bestimmten Funktion K(·,y) ∈ H, sodass

    Ty(f) = 〈f,K(·,y)〉 ∀ f ∈ H.

    Die Eigenschaften P1 und P2 zeigen nun, dass K der reproduzierende Kern vonH ist (und damit ist H ein Hilbertraum mit reproduzierendem Kern).Eine wichtige Eigenschaft die wir im Beispiel im letzten Abschnitt verwendet

    haben war, dass

    ∫ 1

    0

    〈f,K1(·, y)〉1 dy =〈f,

    ∫ 1

    0

    K1(·, y) dy〉

    1

    für den reproduzierenden Kern K1(x, y) = 1 + min(1− x, 1− y). In diesem Fallhaben wir nur die Reihenfolge der Integration vertauscht. Diese Eigenschaft istauch im allgemeinen Fall wichtig, muss hier aber erst gezeigt werden.

    Lemma 3.4. Sei T ein beschränktes, lineares Funktional auf einem Hilbert-raum H mit reproduzierendem Kern K und mit innerem Produkt 〈·, ·〉. Danngilt

    T (〈f(x), K(x,y)〉x) = 〈f, T (K(y,x))〉x.

    Beweis.Da T beschränkt ist, gibt es nach dem Darstellungssatz von Fréchet-Rieszeine eindeutig bestimmte Funktion R ∈ H, sodass

    T (f(y)) = 〈f(y), R(y)〉y ∀ f ∈ H.

    Da R ∈ H gilt aber auch

    R(x) = 〈R(y), K(y,x)〉y = 〈K(y,x), R(y)〉y = T (K(y,x)).

    Also gilt

    T (〈f(x), K(x,y)〉x) = T (f(y)) = 〈f(x), R(x)〉x = 〈f(x), T (K(y,x))〉x.

    55

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    Beispiel 3.5. Angenommen das Integrationsfunktional

    I(f) =

    [0,1]sf(y) dy für f ∈ H

    ist beschränkt. Dann gilt∫

    [0,1]s〈f,K(·,y)〉 dy =

    [0,1]sf(y) dy

    = I(f)

    = I(〈f,K(·,y)〉)= 〈f, I(K(y, ·))〉

    =

    〈f,

    [0,1]sK(y, ·) dy

    =

    〈f,

    [0,1]sK(·,y) dy

    〉. (3.8)

    Also dürfen in einem Hilbertraum mit reproduzierendem Kern Integration undinneres Produkt vertauscht werden solange das Funktional I beschränkt ist.

    Für unsere Zwecke sind wir natürlich an den folgenden Funktionalen interes-siert:

    • das Integrationsfunktional I(f) :=∫[0,1]s f(x) dx und

    • den QMC Algorithmus QN(f) := 1N∑N−1

    n=0 f(xn) basierend auf den Punk-ten x0, . . . ,xN−1 ∈ [0, 1)s.

    Für f ∈ H mit ‖f‖ 6= 0 gilt unter Verwendung der Cauchy-Schwarz Unglei-chung

    |f(y)|‖f‖ = |〈f/‖f‖, K(·,y)〉| ≤ ‖K(·,y)‖ =

    √〈K(·,y), K(·,y)〉 =

    √K(y,y).

    Also ist|f(y)|‖f‖ =

    |Ty(f)|‖f‖ ≤

    √K(y,y)

    56

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    und|I(f)|‖f‖ ≤

    1

    ‖f‖

    [0,1]s|f(y)| dy ≤

    [0,1]s

    √K(y,y) dy

    für alle f ∈ H mit ‖f‖ 6= 0.Man beachte, dass Hilberträume mit reproduzierendem Kern als Hilberträume

    von Funktionen definiert sind für welche die Punktauswertungen stetige, lineareFunktionale und somit beschränkt sind. Da K(·,y) ∈ H gilt

    √K(y,y) = 〈K(·,y), K(·,y)〉1/2 = ‖K(·,y)‖ < ∞ ∀ y ∈ [0, 1]s.

    Also gilt|f(y)| = |Ty(f)| ≤ ‖f‖

    √K(y,y)

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    Für den quadratischen worst-case error e2(H,P) = 〈h, h〉 gilt nun folgende For-mel.

    Satz 3.6. Sei H ein Hilbertraum mit reproduzierendem Kern K welcher dieEigenschaft C besitzt. Für P = {x0, . . . ,xN−1} gilt dann

    e2(H,P) =∫

    [0,1]2sK(x,y) dx dy − 2

    N

    N−1∑

    n=0

    [0,1]sK(xn,y) dy

    +1

    N2

    N−1∑

    n,m=0

    K(xn,xm).

    Diese Formel ist sehr praktisch zur Berechnung des worst-case errors in Hilbert-räumen mit reproduzierendem Kern. Im nächsten Abschnitt verwenden wir diehier entwickelte Theorie um Resultate aus der klassischen Integrationstheorie zuzeigen.

    3.4. Verbindungen zur klassischen

    Integrationstheorie - Die Koksma-Hlawka

    Ungleichung

    Wir betrachten nun den reproduzierenden Kern

    Ks(x,y) =s∏

    j=1

    K1(xj, yj) =s∏

    j=1

    (1 + min(1− xj, 1− yj)),

    wobei x = (x1, . . . , xs) ∈ [0, 1]s und analog für y und wobei K1 wie in (3.6)definiert ist. Das zugehörige innere Produkt ist gegeben durch

    〈f, g〉s =∑

    u⊆[s]

    [0,1]|u|

    ∂ |u|f

    ∂xu(xu, 1)

    ∂ |u|g

    xu(xu, 1) dxu,

    wobei [s] = {1, . . . , s} und für u ⊆ [s] und x = (x1, . . . , xs) ∈ [0, 1]s ist (xu, 1) =(z1, . . . , zs) wobei

    zj =

    {xj falls j ∈ u,1 falls j 6∈ u.

    Sei Hs der von Ks erzeugte Hilbertraum mit Norm ‖ · ‖s,2 = 〈·, ·〉1/2s .

    58

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    Im bereits behandelten Fall s = 1 enthält der Hilbertraum H1 alle absolut ste-tigen Funktionen f : [0, 1] → R mit quadratisch integrierbarer erster Ableitung.Für s > 1 kann man zeigen, dass Hs das s-fache Tensorprodukt der Räume

    H1 ist, alsoHs = H1 ⊗ . . .⊗H1 (s-fach)

    bzw.

    Hs ={

    n∑

    i=1

    fi,1 . . . fi,s : fi,j ∈ H1 und n ∈ N}

    wobei der Abschluss bezüglich der Norm ‖ · ‖s,2 betrachtet wird. Eine Funktionf : [0, 1]s → R ist in Hs, falls alle gemischten partiellen Ableitungen von f biszur ersten Ordnung in jeder Variablen quadratisch integrierbar sind.Wegen

    [0,1]s

    √Ks(y,y) dy =

    (∫ 1

    0

    √2− y dy

    )s=

    (2(√8− 1)3

    )s

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    = (−1)|u|+1∆P(xu, 1),

    wobei xn = (xn,1, . . . , xn,s). Es ist ∆P(x∅, 1) = ∆P(1) = 0Wir erhalten nun folgende Formel für den Integrationsfehler welche oft Hlaw-

    ka’s Identität oder auch Zaremba’s Identität genannt wird.

    Satz 3.7 (Hlawka, Zaremba). Für f ∈ Hs und P ⊆ [0, 1)s gilt

    QN(f)− I(f) =∑

    u⊆[s]u6=∅

    (−1)|u|∫

    [0,1]|u|

    ∂ |u|f

    ∂xu(xu, 1)∆P(xu, 1) dxu.

    Wenden wir nun in Satz 3.7 den Absolutbetrag an und verwenden die Abschätzung

    |∆P(xu, 1)| ≤ supx∈[0,1]s

    |∆P(x)| = D∗N(P),

    dann folgt die klassische Koksma-Hlawka Ungleichung.

    Satz 3.8 (Koksma-Hlawka Ungleichung). Sei P eine N-elementigePunktmenge in [0, 1)s und sei QN der auf P basierende QMC Algorithmus. Füreine Funktion f : [0, 1]s → R mit stetigen gemischten partiellen Ableitungenerster Ordnung sei ‖f‖s,1 =

    ∑u⊆[s]

    ∫[0,1]|u|

    ∣∣∣∂|u|f∂xu (xu, 1)∣∣∣ dxu. Für alle Funktionen

    f mit ‖f‖s,1

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    hier einen Beweis für den Fall s = 1, in welchem die Variation von Hardy undKrause gleich der Totalvariation ist. Hier spricht man oft nur von der Ungleichungvon Koksma. Die Definition der Totalvariation ist in Appendix A wiederholt.

    Satz 3.9 (Ungleichung von Koksma). Für alle Funktionen f : [0, 1] →R mit beschränkter Totalvariation V (f) und für alle Punktmengen P ={x0, . . . , xN−1} in [0, 1) gilt

    ∣∣∣∣∣1

    N

    N−1∑

    n=0

    f(xn)−∫ 1

    0

    f(x) dx

    ∣∣∣∣∣ ≤ V (f)D∗N(P).

    Folgendes Lemma ist der Grundstein zum Beweis von Satz 3.9:

    Lemma 3.10. Seien x1 ≤ x2 ≤ . . . ≤ xN Punkte in [0, 1) und sei f eineFunktion mit beschränkter Variation V (f) auf [0, 1]. Seien x0 := 0 und xN+1 :=1. Dann gilt

    1

    N

    N∑

    n=1

    f(xn)−∫ 1

    0

    f(x) dx =N∑

    n=0

    ∫ xn+1xn

    (x− n

    N

    )df(x).

    Beweis. Es gilt

    N∑

    n=0

    ∫ xn+1xn

    (x− n

    N

    )df(x) =

    ∫ 1

    0

    x df(x)−N∑

    n=0

    n

    N(f(xn+1)− f(xn))

    = xf(x)∣∣∣1

    0−∫ 1

    0

    f(x) dx+1

    N

    N∑

    n=1

    f(xn)− f(xN+1)

    =1

    N

    N∑

    n=1

    f(xn)−∫ 1

    0

    f(x) dx,

    da xN+1 = 1. �

    Beweis von Satz 3.9. Wir nehmen an, dass x1 ≤ x2 ≤ . . . ≤ xN . Seien weitersx0 := 0 und xN+1 := 1. Aus Lemma 3.10 und Lemma A.4 in Appendix A folgt

    ∣∣∣∣∣

    ∫ 1

    0

    f(x) dx− 1N

    N∑

    n=1

    f(xn)

    ∣∣∣∣∣ ≤N∑

    n=0

    ∣∣∣∣∫ xn+1xn

    (x− n

    N

    )df(x)

    ∣∣∣∣

    61

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    ≤N∑

    n=0

    supxn≤x≤xn+1

    ∣∣∣x− nN

    ∣∣∣ V xn+1xn (f).

    Wegen (2.11) gilt für 0 ≤ n ≤ N und xn ≤ x ≤ xn+1,∣∣∣x− n

    N

    ∣∣∣ ≤ D∗N (P).

    Also folgt mit Hilfe von Lemma A.1 in Appendix A

    ∣∣∣∣∣

    ∫ 1

    0

    f(x) dx− 1N

    N∑

    n=1

    f(xn)

    ∣∣∣∣∣ ≤ D∗N(P)

    N∑

    n=0

    V xn+1xn (f) = V (f)D∗N(P).

    Literaturhinweise

    Eine Einführung in die Theorie der QMC Integration in Hilberträumen mit re-produzierendem Kern findet man in [4]. Standardreferenz für die Theorie der Hil-berträume mit reproduzierendem Kern ist die Arbeit von Aronszajn [1]. EinenBeweis der Koksma-Hlawka Ungleichung enthält das Buch von Kuipers und Nie-derreiter [14].

    Übungsaufgaben

    3.1 Sei

    Hr = {p(x) = a0 + a1x+ · · ·+ arxr : a0, . . . , ar ∈ R, x ∈ [0, 1]}

    der Raum aller Polynome mit Grad höchstens r ∈ N0 auf [0, 1]. Wir defi-nieren ein inneres Produkt in Hr: Für p(x) = a0 + a1x + · · · + arxr undq(x) = b0 + b1x+ · · ·+ brxr sei

    〈p, q〉 = a0b0 + · · ·+ arbr.

    Bestimmen Sie den reproduzierenden Kern K(x, y) für diesen Raum undzeigen Sie direkt, dass K symmetrisch, eindeutig bestimmt und positivsemidefinit ist.

    3.2 Sei

    Hr = {p(x) = a0 + a1e2πix + · · ·+ are2πirx : a0, . . . , ar ∈ C, x ∈ [0, 1]}

    62

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    der Raum aller trigonometrischen Polynome mit Grad höchstens r ∈ N0 auf[0, 1]. Wir definieren ein inneres Produkt in Hr: Für f(x) = a0 + a1e2πix +· · ·+ are2πirx und g(x) = b0 + b1e2πix + · · ·+ Bre2πirx sei

    〈f, g〉 = a0b0 + · · ·+ arbr.Bestimmen Sie den reproduzierenden Kern K(x, y) für diesen Raum undzeigen Sie direkt, dass K symmetrisch, eindeutig bestimmt und positivsemidefinit ist.

    3.3 Zeigen Sie, dass die Funktion K(x, y) = min(1 − x, 1 − y) ein reproduzie-render Kern für den Raum

    H = {f : [0, 1] → R : f absolut stetig, ‖f‖ r eine Primzahl und P gegeben durch xn = n/N für n =0, . . . , N − 1. Zeigen Sie, dass dann e(Hr,P) = 0.

    3.6 Sei K(x; y) = 1+min(1−x, 1−y). Zeigen Sie, dass die Diskrepanzfunktioneiner Punktmenge P = {x0, . . . , xN−1} gegeben ist durch

    ∆P(y) =d

    dy

    (∫ 1

    0

    K(x, y) dx− 1N

    N−1∑

    n=0

    K(xn, y)

    ).

    63

  • 3. QMC Integration in Hilberträumen mit reproduzierendem Kern

    3.7 Für x = (x1, . . . , xs) und y = (y1, . . . , ys) in [0, 1]s sei

    K(x,y) =s∏

    j=1

    min(1− xj, 1− yj).

    Definiere

    〈f, g〉 =∫

    [0,1]s

    ∂sf

    ∂x(x)

    ∂sg

    ∂x(x) dx.

    SeiH der vonK erzeugte Hilbertraum. Zeigen Sie, dass für jedeN -elementigePunktmenge P in [0, 1)s gilt

    e(H,P) = L2,N(P).

    3.8 Berechnen Sie nun e(H,P) aus Aufgabe 3.7 mit Hilfe von Satz 3.6 undzeigen Sie damit die Formel aus Aufgabe 2.6.

    3.9 SeiH ein Hilbertraum von Funktionen f : [0, 1] → C mit reproduzierendemKern K, innerem Produkt 〈·, ·〉 und Norm ‖ · ‖ = 〈·, ·〉1/2.Für i = 1, . . . , k seien Pi Punktmengen bestehend aus Ni Elementen in[0, 1)s. Sei P die Vereinigung aller Pi für i = 1, . . . , k, wobei Elemente diemehrfach vorkommen auch mehrfach gezählt werden. Sei N = N1+· · ·+Nk.Zeigen Sie, dass

    e(H,P) ≤k∑

    i=1

    NiNe(H,Pi).

    3.10 Sei H ein Hilbertraum von Funktionen f : [0, 1] → R mit reproduzie-rendem Kern K, innerem Produkt 〈·, ·〉 und Norm ‖ · ‖ = 〈·, ·〉1/2. Fürw = (w0, . . . , wN−1) ∈ RN und P = {x0, . . . ,xN−1} sei

    e(H,P ,w) = supf∈H‖f‖≤1

    ∣∣∣∣∣

    [0,1]sf(x) dx−

    N−1∑

    n