Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in...

55
Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) Das vorliegende Skript pr¨ asentiert einen recht modernen Zugang zu den Konzepten, die die Quan- tenmechanik heute so pr¨ azie und umfassend wie m¨ oglich definieren, tragen und ausmachen, und der Ph¨ anomenologie, die sich zum einen aus diesen Konzepten ergibt und zum anderen in der Natur beobachtbar realisert ist. Bei aller Sorgfalt und uhe vermag dieses Skript keinesfalls den bekannten Kanon von Lehrb¨ uchern zu diesem Thema zu ersetzen. Ein hinreichend tiefes Verst¨ andnis dieser fundamen- talsten Naturbschreibung ist nur m¨ oglich, wenn der gesamte Kanon genutzt wird, und nicht nur eines seiner Werke. PACS numbers: I. EINE INFORMELLE EINLADUNG Statt den hoffnungslosen Versuch zu unternehmen, be- reits an dieser Stelle—ohne weitere begriffliche geschwei- ge denn konzeptioneller Vorbereitung und Vorbildung— den Anwendungsbereich der Quantenmechanik konstruk- tiv zu definieren oder zumindestens zu charakterisieren, beginnen wir statt dessen mit einer Einladung. Ein wenig Ideengeschichte vorweg: O. Stern hat sich den weiter unten grob beschriebenen Versuchsaufbau 1921 ausgedacht und zusammen mit W. Gerlach 1922 in Frankfurt durchgef¨ uhrt. Das sogenannte Stern– Gerlach–Experiment (SGE) illustriert eindrucksvoll den radikalen Bruch mit den Konzepten der klassi- schen Mechanik und dem klasischen Naturverst¨ andnis ¨ uberhaupt. Das betrachtete System kann als das am we- nigsten klassische und als das quantenmechanische Sy- stem schlechthin betrachtet werden. Das SGE kann daher mit Fug und Recht als paradigmatisches Experiment bezeichnet werden. Das Studienobjekt, hier Silberatome und eine gewis- se Eigenschaft, die diese tragen, sowie eine Messme- thode basierend auf einer sogenannten Stern–Gerlach– Apparatur (SGA), darf Ihnen vollkommen unbekannt sein. Unser Ziel ist im Moment nicht ein pr¨ azises Verst¨ andnis des SGE mit all seinen relevanten und auch interessanten Komponenten. Vielmehr konzentrieren wir uns auf nicht–klassische Eigenschaften dieses Systems, die weniger mit dem hier betrachteten speziellen Ver- suchsaufbau zusammenh¨ angen, als vielmehr von quan- tenmechanischen Eigent¨ umlickeiten her¨ uhren, die wir ex- trahieren m¨ ochten. In einem Ofen werden Silberatome erhitzt, die durch eine kleine ¨ Offnung im Ofen diesen verlassen k¨ onnen, und dann auf einen Spalt treffen, der die Silberatome passiv fokusiert. Diesen Teil des Versuchaufbaus bezeichnen wir mit Q. Hinter Q befinde sich ein inhomogenes Magne- feld, das von einem speziell geformten Magneten erzeugt wird. Schliesslich wird ein weiterer Spalt in den Strahl- gang gebracht, wiederum zur passiven Fokussierung. Die- sen zweiten Teil des Aufbaus bezeichnen wir mit M. Der dritte und letzte Teil dieses ersten Aufbaus bildet ein Detektor D, also eine Anordnung, die das Aufprallen von Silberatomen auf eine Oberfl¨ ache nachhaltig anzeigt. Die Prozessf¨ uhrung sieht also schematisch folgenderma- ßen aus: SGE≡Q-→M-→D. Ein Silberatom stellen wir uns ganz primitiv als eine Ansammlung von 47 Elektronen und einem Kern vor. Dabei sind die Elektronen derart angeordnet, daß 46 von ihnen eine kugelsymmetrische Elektronenwolke um den Kern bilden, die keinen Gesamtdrehimpuls tr¨ agt. Der Kern spielt in unseren Betrachtungen keine Rolle, da das Experiment nur auf die Elektronenh¨ ulle, genauer auf das ¨ ausserste Elektron (in der 5s–Schale) sensitiv ist. Dieses tr¨ agt eine Eigenschaft (Observable), die wir Spin nen- nen, oder auch intrinsischen Drehimpuls, um sie vom Bahndrehimpuls (extrinsischer Drehimpuls) deutlich zu unterscheiden. Auch der Kern tr¨ agt diese Eigenschaft, al- lerdings ist er 10 5 mal schwerer als die Elektronenh¨ ulle und tr¨ agt daher nicht wesentlich zum magnetischen Moment μ des Silberatoms bei. Dieses ist praktisch al- leine durch den Spin S des 5s–Elektrons gegeben: μ (e/m e ) S , (1) wobei e< 0 und die Lichtgeschwindigkeit c = 1 gesetzt wurde. Das magnetische Moment koppelt an das inhomogene Magnetfeld B und die Wechselwirkungsenergie (potenti- elle Energie) dieser Konfiguration ist V = -hμ, Bi. Mit anderen Worten, das inhomogene Magnetfeld ¨ ubt eine Kraft auf das Silberatom aus: F = -∇V = (hμ, Bi). Ohne Beschr¨ ankung der Allgemeinheit nehmen wir an, daß B = B z e z , schliesslich k¨ onnen wir unser Koordina- tensystem immer so ausrichten. Bei geeigneter Magnet- feldkonfiguration und Orientierung haben wir dann fol- gende Situation: Atome mit μ z > 0 erfahren eine nach unten gerichtete Kraft, w¨ ahrend Atome mit μ z < 0 eine Beschleunigung noch oben erfahren 1 . SGE erlaubt somit, μ z S z zu messen. Da die Ausrichtung des inhomoge- nen Magnetfeldes wichtig ist, notieren wir die Vorzugs- richtung immer mit, also SGE z . Die nahe liegende Frage ist, welche Verteilung von Sil- beratomen auf D wir erwarten? Zun¨ achst die klassische 1 Auch wenn wir es hier mit Atomen zu tun haben, gilt diese klas- sische Betrachtungsweise. Der Spin ist hier die relevante nicht– klassische Eigenschaft, w¨ ahrend das Atom aufgrund seiner gros- sen Masse einer klassischen Trajektorie folgt, wie wir sp¨ ater sehen werden.

Transcript of Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in...

Page 1: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

Die Quantentheorie eines Teilchens(Dated: 6. Dezember 2012)

Das vorliegende Skript prasentiert einen recht modernen Zugang zu den Konzepten, die die Quan-tenmechanik heute so prazie und umfassend wie moglich definieren, tragen und ausmachen, und derPhanomenologie, die sich zum einen aus diesen Konzepten ergibt und zum anderen in der Naturbeobachtbar realisert ist.

Bei aller Sorgfalt und Muhe vermag dieses Skript keinesfalls den bekannten Kanon vonLehrbuchern zu diesem Thema zu ersetzen. Ein hinreichend tiefes Verstandnis dieser fundamen-talsten Naturbschreibung ist nur moglich, wenn der gesamte Kanon genutzt wird, und nicht nureines seiner Werke.

PACS numbers:

I. EINE INFORMELLE EINLADUNG

Statt den hoffnungslosen Versuch zu unternehmen, be-reits an dieser Stelle—ohne weitere begriffliche geschwei-ge denn konzeptioneller Vorbereitung und Vorbildung—den Anwendungsbereich der Quantenmechanik konstruk-tiv zu definieren oder zumindestens zu charakterisieren,beginnen wir statt dessen mit einer Einladung.

Ein wenig Ideengeschichte vorweg: O. Stern hat sichden weiter unten grob beschriebenen Versuchsaufbau1921 ausgedacht und zusammen mit W. Gerlach 1922in Frankfurt durchgefuhrt. Das sogenannte Stern–Gerlach–Experiment (SGE) illustriert eindrucksvollden radikalen Bruch mit den Konzepten der klassi-schen Mechanik und dem klasischen Naturverstandnisuberhaupt. Das betrachtete System kann als das am we-nigsten klassische und als das quantenmechanische Sy-stem schlechthin betrachtet werden. Das SGE kann dahermit Fug und Recht als paradigmatisches Experimentbezeichnet werden.

Das Studienobjekt, hier Silberatome und eine gewis-se Eigenschaft, die diese tragen, sowie eine Messme-thode basierend auf einer sogenannten Stern–Gerlach–Apparatur (SGA), darf Ihnen vollkommen unbekanntsein. Unser Ziel ist im Moment nicht ein prazisesVerstandnis des SGE mit all seinen relevanten und auchinteressanten Komponenten. Vielmehr konzentrieren wiruns auf nicht–klassische Eigenschaften dieses Systems,die weniger mit dem hier betrachteten speziellen Ver-suchsaufbau zusammenhangen, als vielmehr von quan-tenmechanischen Eigentumlickeiten heruhren, die wir ex-trahieren mochten.

In einem Ofen werden Silberatome erhitzt, die durcheine kleine Offnung im Ofen diesen verlassen konnen, unddann auf einen Spalt treffen, der die Silberatome passivfokusiert. Diesen Teil des Versuchaufbaus bezeichnen wirmit Q. Hinter Q befinde sich ein inhomogenes Magne-feld, das von einem speziell geformten Magneten erzeugtwird. Schliesslich wird ein weiterer Spalt in den Strahl-gang gebracht, wiederum zur passiven Fokussierung. Die-sen zweiten Teil des Aufbaus bezeichnen wir mit M.Der dritte und letzte Teil dieses ersten Aufbaus bildetein Detektor D, also eine Anordnung, die das Aufprallenvon Silberatomen auf eine Oberflache nachhaltig anzeigt.Die Prozessfuhrung sieht also schematisch folgenderma-

ßen aus: SGE≡ Q −→M −→ D.Ein Silberatom stellen wir uns ganz primitiv als eine

Ansammlung von 47 Elektronen und einem Kern vor.Dabei sind die Elektronen derart angeordnet, daß 46 vonihnen eine kugelsymmetrische Elektronenwolke um denKern bilden, die keinen Gesamtdrehimpuls tragt. DerKern spielt in unseren Betrachtungen keine Rolle, da dasExperiment nur auf die Elektronenhulle, genauer auf dasausserste Elektron (in der 5s–Schale) sensitiv ist. Diesestragt eine Eigenschaft (Observable), die wir Spin nen-nen, oder auch intrinsischen Drehimpuls, um sie vomBahndrehimpuls (extrinsischer Drehimpuls) deutlich zuunterscheiden. Auch der Kern tragt diese Eigenschaft, al-lerdings ist er ∼ 105 mal schwerer als die Elektronenhulleund tragt daher nicht wesentlich zum magnetischenMoment µ des Silberatoms bei. Dieses ist praktisch al-leine durch den Spin S des 5s–Elektrons gegeben:

µ ≈ (e/me) S , (1)

wobei e < 0 und die Lichtgeschwindigkeit c = 1 gesetztwurde.

Das magnetische Moment koppelt an das inhomogeneMagnetfeld B und die Wechselwirkungsenergie (potenti-elle Energie) dieser Konfiguration ist V = −〈µ,B〉. Mitanderen Worten, das inhomogene Magnetfeld ubt eineKraft auf das Silberatom aus: F = −∇V = ∇ (〈µ,B〉).Ohne Beschrankung der Allgemeinheit nehmen wir an,daß B = Bzez, schliesslich konnen wir unser Koordina-tensystem immer so ausrichten. Bei geeigneter Magnet-feldkonfiguration und Orientierung haben wir dann fol-gende Situation: Atome mit µz > 0 erfahren eine nachunten gerichtete Kraft, wahrend Atome mit µz < 0 eineBeschleunigung noch oben erfahren1. SGE erlaubt somit,µz ∝ Sz zu messen. Da die Ausrichtung des inhomoge-nen Magnetfeldes wichtig ist, notieren wir die Vorzugs-richtung immer mit, also SGEz.

Die nahe liegende Frage ist, welche Verteilung von Sil-beratomen auf D wir erwarten? Zunachst die klassische

1 Auch wenn wir es hier mit Atomen zu tun haben, gilt diese klas-sische Betrachtungsweise. Der Spin ist hier die relevante nicht–klassische Eigenschaft, wahrend das Atom aufgrund seiner gros-sen Masse einer klassischen Trajektorie folgt, wie wir spater sehenwerden.

Page 2: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

2

Erwartung: Die Silberatome sind im Ofen beliebig aus-gerichtet (es gibt ja keine Vorzugsrichtung) und jedermogliche Wert µz ∈ I ≡ [−|µ|, |µ|] sollte demokratischangenommen werden. Wir erwarten eine ensprechendeVerteilung von Detektorregistrierungen uber I, also etwaeine gleiche Anzahl von Treffern fur jedes µz ∈ I nachhinreichend langer Experimentierdauer.

Die klassische Erwartung halt der Konfrontati-on mit dem Experiment nicht stand: Tatsachlichspaltet sich der Strahl von Silberatomen in nur zweidisjunkte Strahlen auf, die nur zwei moglichen WertenSz ∈ Sz(+), Sz(−) entsprechen. Naturlich kommt derz–Richtung dabei keine Sonderrolle zu.

Damit sind wir noch lange nicht am Ende. Wir be-trachten als nachstes Ketten von Stern–Gerlach Experi-menten. Mit obigen Erlauterungen definieren wir:

Def. I.1 Eine Stern–Gerlach Apparatur SGa(α) , (a ∈x, y, z , α ∈ ±,+,−) besteht aus einem inhomoge-nen Magnetfeld in a–Richtung, und einer nachgeschal-teten Selektionsvorrichtung, die ausschliesslich die Spin-komponente(n) Sa(α) passieren lasst.

Def. I.2 Eine Kette von Stern–Gerlach ExperimentenK (SGa(α)) besteht aus einer Quelle Q, ei-ner Sequenz von Stern–Gerlach ApparaturenSGa(α) , (a ∈ x, y, z , α ∈ ±,+,−) und einemDetektor D.

Wir betrachten zunachst einmal die folgende Ket-te: K(SGz(±), SGz(+)), also eine Komposition vonzwei SGz–Apparaturen, wobei die erste Sz(−) aus-sortiert2. Daher erwarten wir ausschliesslich Sz(+)auf D. Als nachstes betrachten wir die SGE–Kette K(SGx(±), SGz(+)). Im Detektor werden Sx±–Anteile gleich haufig ausfallen. Bedeutet dies, daß50 Prozent der Atome im Sz(+)–Strahl als Sx(+)–Komponente vorliegen? Im dritten Anlauf betrachten wirK(SGz(±), SGx(+), SGz(+)). Der Detektor registriertbeide Spinkomponenten Sz(+) und Sz(−). Aber wiekann dies sein, SGz(+) hat doch als erstes Glied in derSequenz alle Atome mit Sz(−) aussortiert? Es scheint,als ob das Glied SGx(+) die Wirkung von SGz(+) auf-hebt bezuglich der auf D beobachteten Verteilung. Unse-re zwar durch gesunden Menschenverstand aber dennochoffenbar falsche Intuition versagt bei der Interpretationvon K(SGx(±), SGz(+)).

Es ist klug, nun nach guten Analogien in anderen Be-reichen der Physik zu suchen. Wir werden fundig in derelementaren Wellenoptik: Wir betrachten eine mono-chromatische Welle mit Wellenzahlvektor k = kez. Dabeikann es sich um x–polarisiertes Licht E = E(ωt− kz)exhandeln, oder auch um y–polarisiertes E = E(ωt−kz)ey,wobei in beiden Fallen E(ωt−kz) = E0 cos (ωt− kz) gilt,

2 Die Reihenfolge ist relativ zu einem von rechts einfallenden Strahlgewahlt.

und ω die Kreisfrequenz (∝ Energie) des elektrischen Fel-des bezeichne. Nun brauchen wir eine schone Analogie zuden SGa(α). Hier kommt sie:

Def. I.3 Ein variabler Filter F ist eine Abbildung

F : R3 × R3 −→ R3 ,

(A,B) −→ FA(B) ≡ 〈A,B〉A .

Hierbei heisst A die Polarisationsrichtung und die lineareAbbildung

FA : R3 −→ R3 ,Blin.−→ FA(B)

heisst A–Filter.

Sei nun E eine monochromatische Welle, die sich in z–Richtung ausbreitet. Nun nehmen wir einen ex–Filter zuHand und gucken durch: Fex(E) = 〈ex,E〉ex. Naturlichist Fex Fex = Fex . Setzen wir nun stattdessen einen ey–Filter auf den ex–Filter, bilden wir also die KompositionFey Fex , so wird es dunkel hinter dieser Filterkompo-sition: Fey (Fex(E)) = 0. Damit handelt es sich bei denFiltern Fex ,Fey um Projektoren in der Ebene senkrechtzu k ∝ ez.

Aber auch schon elementare Wellenoptik hat mehr zubieten:

Def. I.4 Unter einer Filtersequenz FAA∈M⊂R3 verste-hen wir die Komposition von A–Filtern, wobei A uber diegeordnete Menge M lauft.

Hier kommt es offenbar auf die Reihenfolge an. Betrach-ten wir einmal die Filtersequenz Fex Fe Fey , wobeie ⊥ k and e 6= ex,y. Nun sind wir geschult in elementa-rer Wellenoptik, trotzdem ist es gut sich uber folgendeszu wundern: Obwohl der erste Filter in obiger Sequenzalle x–polarisierten Anteile aus einer monochromatischenWelle filtert, besitzt die Welle nach dem Einsatz des e–Filters wieder x–polarisierte Anteile. Offenbar hebt diePolariation mittels des e–Filters die Wirkung des ey–Filters auf. Damit haben wir eine sehr passende Analo-gie zu den oben diskutierten SGE–Ketten. Nur hier ken-nen wir die mathematische Beschreibung: Zunachst ein-mal rotieren wir das Koordinatensystem, so daß k q ez.Nun, Fey (E) = Eyey, und Fe(Fey (E)) = EyFe(ey) =Ey〈ey, e〉e. Per Konstruktion ist 〈eb, e〉 6= 0 , b ∈ x, y.Somit gilt:

Fex(Fe(Fey (E))) = Ey 〈ey, e〉 Fex(e)

= Ey 〈ey, e〉〈e, ex〉 ex . (2)

Unser mathematisches Modell liefert hier in der Tat dasgewunschte Resultat, namlich, daß die Wirkung des ey–Filters (partiell) aufgehoben wird durch den anschlies-senden Einschub des e–Filters. Wir erhalten nachweisbarwieder x–polarisierte Komponenten. Der Grund hierfurist folgender: Die Wahl der z–Achse verlegt alle Polarisa-tionseffekte in die Ebene, die k als Normale hat. Der erste

Page 3: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

3

Polarisationsfilter fuhrt in dieser Ebene eine Basis ein, dieden Teilraum beschreibt, der durch den Polarisationsvek-tor gegeben ist, und auch den Teilraum senkrecht hierzu.Der Filter liefert also eine Basis. Bezuglich dieser Basishat die Polarisationsrichtung des zweiten Filters aussch-liesslich nicht–verschwindende Projektionen. Der dritteFilter konstituiert nun wieder die ursprungliche Basis.

Wir betrachten ein konkretes Beispiel: ^(ex, e) =

π/4, also 〈e, ex〉 = 〈ey, e〉 = 1/√

2. Nun spannt jader zweite Polarisationsfilter auch eine Basis auf, diewir jetzt mit e ≡ e1, e2 bezeichnen. Wir haben dannFe1

(E) = 〈E, e1〉e1 = 〈E, e1〉(〈e1, ex〉ex + 〈e1, ey〉ey) =

〈E, e1〉(ex + ey)/√

2, und Fe2(E) = 〈E, e1〉(−ex +

ey)/√

2. Wir fassen unsere elementaren Rechnungen zu-sammen:

Fe1(E) = 〈E, e1〉e1 = 〈E, e1〉(ey + ex)/

√2 ,

Fe2(E) = 〈E, e2〉e2 = 〈E, e1〉(ey − ex)/

√2 . (3)

Es ist an der Zeit, die Analogie dingfest zu ma-chen: wir ubertragen unsere Erkenntnisse aus der Wel-lenoptik auf das SGE. Dazu brauchen wir lediglichfolgende Ersetzung zu machen: Sz(±)–Atome ←→x, y–polarisiertes Licht, und Sx(±)–Atome ←→ 1, 2–polarisiertes Licht. Das entspricht naturlich noch keinerlexikografischen Ersetzung in der mathematischen Be-schreibung. Das kommt jetzt: Gegeben sei die SGE–KetteK(SGz(±), SGx(+), SGz(+)). Wie modellieren wir dieseund welche mathematischen Objekte brauchen wir da-zu? Die Lichtwelle wurde durch einen Vektor beschrie-ben, bezuglich der Polarisationen hatten wir es mit einemzwei–dimensionalen Vektorraum zu tun (senkrecht zurAusbreitungsrichtung der Welle). Dieser Polarisations-vektor beschrieb den Zustand des E–Feldes hinsichtlichder Frage, die uns interessierte. Der zwei–dimensionaleVektorraum ist also ein Zustandsraum und die Vek-toren darin nennen wir Zustandsvektor. Wir bezeich-nen den Vektor, der den Spinzustand eines Silberatoms(genauer seines 5s–Elektrons) bezogen auf ein inhomoge-nen Magnetfeldes in z–Richtung angibt mit |Sz±〉 ∈ H,wobei wir den zwei–dimensionalen Zustandsraum H ge-nannt haben. Kennen wir den Spinzustand a priori nicht,so schreiben wir kurz |in〉 ∈ H.

Als nachstes benotigen wir eine operationelle Vor-schrift, die ein SGE mit inhomogenen Magnetfeld in z–Richtung (aquivalent K(SGz(±))) erklart. In der Wellen-optik war fur die analoge Fragestellung eine mathemati-sche Struktur wesentlich, namlich ein Skalarprodukt,〈|〉, wobei ein Platzhalter ist. Dieses induziert einegeometrische Struktur auf H und erlaubt uns

|in〉 = 〈Sz − |in〉|Sz−〉+ 〈Sz + |in〉|Sz+〉 , (4)

wie ublich zu interpretieren: die Zahlen (den Korper las-sen wir noch unspezifiziert) 〈Sz ± |in〉 interpretieren wirals Projektionen des unbekannten Spinzustandes |in〉 aufdas betreffende Basiselement von H. daß wir diese Ba-sis gewahlt haben liegt einzig und alleine daran, daß wir

zunachst mit einer SGz(+)–Apparatur auf den einlau-fenden Spinzustand |in〉 operieren wollen. Schematischnotiert soll gelten: SGz(+)|in〉 = 〈Sz + |in〉|Sz+〉. DieSGz(+)–Apparatur konnen wir also folgendermaßen mo-dellieren: Ihre Wirkung ist die einer Projektion auf |Sz+〉entlang desselben Basiselementes. Formal3 konnen wirdie Wirkung der SGz(+)–Apparatur so beschreiben:

Pz(a) ≡ |Sza〉〈Sza| : Hlin.−→ H , a ∈ ± ,

Pz(a) (|V 〉) df= 〈Sza|V 〉|Sza〉 . (5)

Offenbar handelt es sich bei den Pz(a) um Projektoren,wie Sie leicht uberprufen konnen.

Kommen wir zur betrachteten SGE–Kette zuruck, de-ren interessanter Bestandteil nun folgendermaßen ange-geben werden kann: (Pz(−)Px(+)Pz(+))(|in〉). Es isteinmal ganz ausfuhrlich:

Pz(+) (|in〉) =

= Pz(+) (〈Sz + |in〉 |Sz+〉+ 〈Sz − |in〉 |Sz−〉) =

= 〈Sz + |in〉Pz(+) (|Sz+〉) + 〈Sz − |in〉Pz(+) (|Sz−〉) =

= 〈Sz + |in〉 |Sz+〉 .

Und genauso weiter:

Px(+) (Pz(+) (|in〉)) =

= 〈Sz + |in〉 Px(+) (|Sz+〉) =

= 〈Sz + |in〉Px(+) (〈Sx + |Sz+〉 |Sx+〉) =

= 〈Sz + |in〉〈Sx + |Sz+〉 |Sx+〉 .

Endlich,

Pz(−)

(Px(+)

(Pz(+) (|in〉)

))=

= 〈Sz + |in〉〈Sx + |Sz+〉 Pz(−) (|Sx+〉) =

= 〈Sz + |in〉〈Sx + |Sz+〉 Pz(−) (〈Sz − |Sx+〉|Sz−〉) =

= 〈Sz + |in〉〈Sx + |Sz+〉〈Sz − |Sx+〉|Sz−〉 . (6)

Diese Rechnung verlief tatsachlich vollkommen analog zu(2). Unser mathematisches Modell kann den beobachte-ten Sachverhalt erfassen und der Wissenstransfer aus derelementaren Wellenoptik hat sich gelohnt. Fur das Re-sultat (6) war ebenfalls wichtig, daß der einlaufende Zu-stand nicht mit einem Koordinatensystem ausgestattetwar, dieses wird vielmehr durch die erste SG–Apparaturbereit gestellt und in dessen Basis entwickeln wir den ein-laufenden Zustand, und so weiter. Analog zu (3) habenwir

|Sx+〉 = 〈Sz − |Sx+〉|Sz−〉+ 〈Sz + |Sx+〉|Sz+〉 ,|Sx−〉 = 〈Sz − |Sx−〉|Sz−〉+ 〈Sz + |Sx−〉|Sz+〉 . (7)

3 Keine Sorge, die benotigten mathematischen Objekte werden als-bald eingefuhrt. Hier begnugen wir uns lediglich darauf zu zeigen,warum diese Objekte in der Naturbeschreibung auftauchen, undunterdrucken die Lust auf mehr Formalitat noch.

Page 4: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

4

Wenn wir fordern, daß 〈Sx ± |Sx±〉 = 1 gilt (Normie-rungsbedingung), so durfen wir es wagen (in Anleh-nung an das optische Analogon), folgendes anzunehmen:

〈Sz±|Sx+〉 = 1/√

2, und 〈Sz−|Sx−〉 = −〈Sz + |Sx−〉 =

1/√

2.Die nachste Frage, die sich uns stellt und die wir ja

verschoben hatten, ist die Frage nach einem geeignetenKorper K, uber dem H liegt. Wir beginnen mit einerbanalen Beobachtung in Anlehnung an (7):

|Sy+〉 = 〈Sz − |Sy+〉|Sz−〉+ 〈Sz + |Sy+〉|Sz+〉 ,|Sy−〉 = 〈Sz − |Sy−〉|Sz−〉+ 〈Sz + |Sy−〉|Sz+〉 . (8)

Nun besitzt eine SGz–Apparatur eine Vorzugsrichtung,die durch das inhomogene Magnetfeld in ez–Richtung ge-geben ist. Um diese Richtung besitzt das Experiment ei-ne Rotationssymmetrie. Daher liegt es nahe, folgendesanzunehmen: 〈Sz ± |Sy+〉 = 1/

√2, und 〈Sz − |Sy−〉 =

−〈Sz + |Sx−〉 = 1/√

2. Diese Werte sind allerdings schonvergeben, siehe (7). Damit stellt sich die Frage, wie |Sy±〉dargestellt werden kann. Eine rasche Feststellung ist, daßK 6= R.

Wieder hilft eine Analogie aus der elementaren Wel-lenoptik, wenn auch eine gewagterer— es steht ja aberauch einiges auf dem Spiel. Dieses Mal interessierenwir uns fur zirkular polarisiertes Licht, das sich wie-der in ez–Richtung ausbreiten soll. Ohne Beschrankungder Allgemeinheit betrachten wir folgende zirkular po-larisierte Lichtwelle: E = E(ωt − kz)ex/

√2 + E(ωt −

kz − π/2)ey/√

2. In komplexer Schreibweise: E =

exp (ωt− kz)(ex + iey)/√

2, wobei Re(E) = E/E0. Kla-rerweise ist zirkular polarisiertes Licht leicht zu unter-scheiden von linear polarisiertem Licht. In unsere Uber-setzungsliste nehmen wir folgendes auf: (Sy+)–Atome←→ rechts zirkular polarisiertes Licht, und (Sy−)–Atome←→ links zirkular polarisiertes Licht. Dann bereiten dieZustande |Sy±〉 uberhaupt keine Probleme:

|Sy±〉 = |Sz+〉/√

2± i|Sz−〉/√

2 . (9)

Wir sehen also, daß K = C unser Problem lost. Da-mit wird H also ein Vektorraum uber dem komplexenZahlenkorper. Nun ist es wichtig daran zu erinnern,daß die komplexe Schreibweise in der Elektrodynamiknur rechentechnisch von Bedeutung ist, die Zustandeder Elektrodynamik aber immer reelle Vektorfelder sind.Tatsachlich konnen wir die zur zirkularen Polarisationnotwendige Phasenverschiebung komplett reell erfassen,es ist halt nur bequemer mit komplexen Grossen zu rech-nen. Dies ist im Falle der Spinzustande offenbar nicht derFall: hier ist der komplexe Zahlenkorper essentiell, undkein Luxus. Wir benotigen fur die betrachteten Projek-tionen einfach einen grosseren Wertevorrat, als der reel-le Zahlenkorper zu bieten hat. Damit stossen wir aberauf komplexe Zustandsvektoren. Mit anderen Worten:die hier betrachteten Spinzustande sind komplexe Linear-kombinationen. Folglich konnen die zur Beschreibung vonSGE notwendigen Zustande keine Beobachtungsgrossen

sein. Somit wird die zu studierende Theorie essentiellnicht–observabel zu formulieren sein. Eine grasse Ab-kehr von der klassischen Naturbeschreibung.

II. PRALIMINARIEN (FUNDAMENTE)

In diesem Kapitel wird eine hoffentlich angemesseneWurdigung der mathematischen Konzepte dargelegt, wiesie zur Formulierung von physikalischen Sachverhalten inder Quantenmechanik zum Einsatz kommen. Allerdingsliegt hier die Betonung auf den mathematischen Struktu-ren, weniger auf den praktischen Einsatz derselben. Auchnicht auf der durch Erfahrung gschulten Verwasserungdieser Konzepte, die eine bequeme Intuition ermoglichen.Die passiert in Kapitel III. Fur das erste durchdenken-de Lesen kann das vorliegende Kapitel bis zu den Weih-nachtsferien aufgehoben werden, sollte dann aber in dereinen oder anderen ruhigen Stunde tiefsinnig durchdachtwerden.

Wir brauchen also einen komplexen Vektorraum, derals Zustandsraum fungiert, und ein Skalarprodukt, dasdie relevante geometrische Struktur induziert. Diesen Lu-xus haben wir in der Quantenmechanik immer. UnsereNotation folgt P.A.M. Dirac, da diese viele Einsichten er-leichtert (und sich gut memorieren lasst), und ungemeinpraktisch furs bequeme Rechnen (allerdings auch etwasholprig bei formalen Manipulationen) ist.

A. Die Geometrie von Hilbert–Raumen

Def. II.1 Ein komplexer Vektorraum V heisst einPra–Hilbert–Raum, wenn es eine komplexwertige Funkti-on 〈|〉 : V × V −→ C gibt, die fur alle |x〉 , |y〉 , |z〉 ∈ Vund α ∈ C folgende Bedingungen erfullt:

(1) 〈x|x〉 ≥ 0 und 〈x|x〉 = 0 genau dann, wenn |x〉 = 0

(2) 〈x|y + z〉 = 〈x|y〉+ 〈x|z〉

(3) 〈x|αy〉 = α〈x|y〉

(4) 〈x|y〉 = 〈y|x〉∗

Die Funktion 〈|〉 heisst Skalarprodukt.

Wir bringen zwei Beipiele:

Bsp. II.1 Sei Cn , n ∈ N die Menge aller n–Tupelsvon komplexen Zahlen. Fur x = (x1, . . . , xn) und y =(y1, . . . , yn) in Cn definiere wir

〈x|y〉 df=

n∑j=1

x∗j yj . (10)

Bsp. II.2 Sei C[a, b] die Menge (wir brauchen es nichtgenauer) der stetigen komplexwertigen Funktionen auf

Page 5: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

5

dem abgeschlossenen Intervall [a, b] ⊂ R. Fur f, g ∈C[a, b] definieren wir

〈f |g〉 df=

∫ b

a

dx f∗(x) g(x) . (11)

Wir kommen nun zu den nutzlichen geometrischenAspekten, die ein Pra–Hilbert–Raum ganz allgemein zubieten hat.

Def. II.2 Sei V ein Pra–Hilbert–Raum. Zwei Vektoren|x〉 , |y〉 ∈ V heißen orthogonal (zueinander), wenn〈x|y〉 = 0. Sei I ⊂ N eine Indexmenge. Eine Men-ge |xj〉j∈I von Vektoren in V heißt eine orthonormal

Menge, wenn 〈xj |xj〉 = 1 ∀j ∈ I, und 〈xi|xj〉 =0 ,∀i, j ∈ I , i 6= j gilt.

Wir schreiben kurzerhand ‖|x〉‖ df=√〈x|x〉. Weiter un-

ten zeigen wir, daß ‖ ‖ tatsachlich eine Norm ist.

Satz II.1 (Satz von Pythagoras) Sei |xa〉a∈I , I ⊂N eine orthonormale Menge in einem Pra–Hilbert–RaumV. Dann gilt fur alle |x〉 ∈ V

‖|x〉‖2 =∑a∈I|〈x|xa〉|2 +

∥∥∥∥∥|x〉 −∑a∈I|xa〉〈xa|x〉

∥∥∥∥∥2

(12)

Beweis II.1 Wir stellen |x〉 folgendermaßen dar:

|x〉 =∑a∈I|xa〉〈xa|x〉+

(|x〉 −

∑a∈I|xa〉〈xa|x〉

).

Eine kurze Rechnung zeigt, daß∑a∈I|xa〉〈xa|x〉 ⊥ |x〉 −

∑a∈I|xa〉〈xa|x〉 .

Folglich gilt

‖|x〉‖2 =

=

∥∥∥∥∥∑a∈I|xa〉〈xa|x〉

∥∥∥∥∥2

+

∥∥∥∥∥|x〉 −∑a∈I|xa〉〈xa|x〉

∥∥∥∥∥2

=

=∑a∈I|〈xa|x〉|2 +

∥∥∥∥∥|x〉 −∑a∈I|xa〉〈xa|x〉

∥∥∥∥∥2

.

Damit ist der Satz bewiesen. ∗–< [; 0)

Lemma II.1 (Besselsche Ungleichung) Sei|xa〉a∈I , I ⊂ N eine orthonormale Menge ineinem Pra–Hilbert–Raum V. Dann gilt fur alle |x〉 ∈ V:

‖|x〉‖2 ≥∑a∈I|〈x|xa〉|2 . (13)

Beweis II.2 Als Ubung. ∗–< [; 0)

Lemma II.2 (Schwarzsche Ungleichung) Sei V einPra–Hilbert–Raum und |x〉, |y〉 ∈ V. Dann gilt:

‖〈x|y〉‖ ≤ ‖|x〉‖ ‖|y〉‖ . (14)

Beweis II.3 Der Fall |y〉 = |0〉 ist trivial. Sei also |y〉 6=|0〉. Der Vektor |y〉/‖|y〉‖ bildet selbst eine orthonorma-le Menge. Mit Hilfe der Besselschen Ungleichung (II.1)folgt daher fur jedes |x〉 ∈ V:

‖|x〉‖2 ≥ |〈x|y/‖|y〉‖〉|2 y ‖|x〉‖2‖|y〉‖2 ≥ |〈x|y〉|2 ,

woraus sich unmittelbar die Behauptung ergibt. ∗–< [; 0)

Aus der Linearen Algebra ist bekannt, daß jeder nor-mierte Vektorraum ein metrischer Raum ist. Der folgendeSatz besagt nun, daß jeder Pra–Hilbert–Raum ein nor-mierter Vektorraum ist.

Satz II.2 Jeder Pra–Hilbert–Raum V ist ein normierterVektorraum bezuglich der Norm

‖x‖ df=√〈x|x〉 ,∀x ∈ V . (15)

Beweis II.4 Als Ubung.

Eine unmittelbare Einsicht, die sich aus Satz II.2 ergibtist, daß wir auf V eine naturliche Metrik d haben: Fur|x〉 , |y〉 ∈ V definieren wir

d(|x〉, |y〉) df=√〈x− y|x− y〉 . (16)

Damit stehen uns Konzepte wie Konvergenz,Vollstandigkeit und Dichte zu Verfugung. Insbeson-dere konnen wir V immer vervollstandigen zu einem nor-mierten Raum V ′, in dem V isometrisch als dichte Unter-menge eingebettet ist. Tatsachlich ist V ′ selbst ein Pra–Hilbert–Raum, da das Skalarprodukt von V auf V ′ wegenStetigkeit erweitert werden kann.

Def. II.3 Ein vollstandiger Pra–Hilbert–Raum heisstHilbert–Raum.

Def. II.4 Zwei Hilbert–Raume H1 und H2 heißen iso-morph (zueinander), wenn es eine lineare AbbildungU : H1 −→ H2 gibt, sodaß

〈U(x)|U(y)〉H2= 〈x|y〉H1

,∀|x〉, |y〉 ∈ H1 (17)

gilt. Eine solche Abbildung heisst unitarer Operator.

Wir vertiefen diese Konzepte anhand einiger wichtigeBeispiele, die Sie mit Hilvertraumen vertraut machen, diefur die Quantenmechanik relevant sind.

Bsp. II.3 Sei L2([a, b]) die Menge von komplexwertigenFunktionen auf I ≡ [a, b] ⊂ R, fur die gilt:∫

Idx |f(x)|2 <∞ . (18)

Page 6: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

6

Wir definieren ein Skalarprodukt durch: Fur alle f, g ∈L2(I)

〈f |g〉 =

∫I

dx f∗(x)g(x) . (19)

Dies ist sinnvoll, da 2 |f∗(x)g(x)| ≤ |f(x)|2+|g(x)|2, alsof∗(x)g(x) ∈ L1(I). In Ihrer einfuhrenden Vorlesung zurFunktionalanalysis beweisen Sie, daß L2(I) vollstandigund daher ein Hilbert–Raum ist. Ausserdem lasst sichzeigen, daß bezuglich der Norm

‖f‖ df=

√∫I

dx |f(x)|2 , (20)

L2(I) gerade die Vervollstandigung von C(I) ist.

Bsp. II.4 Sei `2 die Menge der komplexen Zahlenfolgenznn∈N, fur die gilt:

∞∑n=0

|zn|2 <∞ . (21)

Wir definieren ein Skalarprodukt durch:

〈ynn∈N|znn∈N〉df=

∞∑n=0

(yn)∗zn . (22)

Bei `2 handelt es sich um einen archetypischen Hil-bertraum in folgendem Sinn: Jeder nicht endlich–dimensionale Hilbert–Raum mit einer abzahlbar dichtenUntermenge ist isomorph zu `2. Damit ist `2 ein kanoni-sches Beispiel fur einen Hilbert–Raum.

Bsp. II.5 Sei µ ein Borel–Maß auf Rn. Dann bezeich-ne L2(Rn,dµ) die Menge aller komplexwertigen Funktio-nen auf Rn, fur die gilt:∫

Rndµ |f(x)|2 <∞ . (23)

Bezuglich des Skalarproduktes

〈f |g〉 df=

∫Rn

dµ f∗(x)g(x) (24)

wird L2(Rn,dµ) zu einem Hilbert–Raum.

B. Der Satz von Riesz

Eine fur uns wichtige Methode zur Konstruktion vonneuen Hilbert–Raumen aus alten besteht darin, einen ab-geschlossenen Unterraum M eines gegebenen Hilbert–Raumes H zu betrachten. Dabei erbt M das auf H er-klarte Skalarprodukt und wird so selbst zu einem Hilber-traum. Dies erlaubt vertiefende geometrische Einsichten,die uns dann auch mit einer geometrischen Vorstellungvon dualen Zustanden ausstattet.

Wir definieren das orthogonale Komplement M⊥von M:

M⊥ df= |y〉 ∈ H | 〈y|x〉 = 0 ,∀|x〉 ∈ M . (25)

Aus der Linearitat des Skalarprodukts folgt, daß M⊥ein linearer Unterraum von H. Ausserdem ist M⊥ ab-geschlossen. Also ist auch M⊥ ein Hilbert–Raum. DieHilbert–RaumeM undM⊥ haben lediglich den Nullvek-tor gemein. Zentral wird folgende Aussage sein: Zu jedemabgeschlossenen Unterraum gibt es senkrechte Vektoren,und zwar ausreichend viele, so daß

H =M+M⊥ =|x〉+ |y〉 | |x〉 ∈ M , |y〉 ∈ M⊥

.

(26)

Lemma II.3 Sei H ein Hilbert–Raum,M⊂ H ein abge-schlossener Unterraum, und |x〉 ∈ H. Dann gibt es eineneindeutig bestimmten Vektor |z〉 ∈ M, der zu |x〉 denkurzesten Abstand hat.

Beweis II.5 Sei d := inf |y〉∈M‖|x〉 − |y〉‖. Wir wahleneine Folge |yn〉 , |yn〉 ∈ M mit ‖|x〉 − |yn〉‖ −→ d.Dann gilt

‖|yn〉 − |ym〉‖2 = ‖|yn〉 − |x〉 − (|ym〉 − |x〉) ‖2

= 2‖|yn〉 − |x〉‖2 + 2‖|ym〉 − |x〉‖2 +

−‖ − 2|x〉+ |yn〉+ |yn〉‖2

= 2‖|yn〉 − |x〉‖2 + 2‖|ym〉 − |x〉‖2 +

−4‖|x〉 − (|yn〉+ |yn〉) /2‖2

≤ 2‖|yn〉 − |x〉‖2 + 2‖|ym〉 − |x〉‖2 − 4d2

−→ 2d2 + 2d2 − 4d2 = 0 .

Die zweite Gleichung folgt aus der Parallelogramm–Identitat, die Ungleichung resultiert aus(|yn〉+ |yn〉) /2 ∈ M. Also ist |yn〉 eine Cauchy–Folge. Da M abgeschlossen ist, konvergiert |yn〉gegen ein |z〉 ∈ M. Es folgt, daß ‖|x〉 − |z〉‖ = d. DieEindeutigkeit uberlassen wir einer Ubung. ∗–< [; 0)

Nun kommt die zentrale geometrische Aussage, dasProjektionstheorem:

Satz II.3 Sei H ein Hilbert–Raum und M⊂ H ein abe-schlossener Unterraum. Dann kann jeder Vektor |x〉 ∈ Hfolgendermaßen eindeutig dargestellt werden: |x〉 = |z〉+|w〉 , |z〉 ∈ M , |w〉 ∈ M⊥.

Beweis II.6 Sei |x〉 ∈ H. Nach dem Lemma II.3 gibtes ein eindeutig bestimmtes Element |z〉 ∈ M, daß |x〉am nahesten ist. Wir setzen |w〉 = |x〉 − |z〉. Klarerweiseist dann |x〉 = |w〉 + |z〉. Sei |y〉 ∈ M und t ∈ R. Furd = ‖|x〉 − |z〉‖ gilt:

d2 ≤ ‖|x〉 − (|z〉+ t|y〉) ‖2 = ‖|w〉 − t|y〉‖2

= d2 − 2tRe (〈w|y〉) + t2‖|y〉‖2 .

Folglich ist fur alle t ∈ R: −2tRe (〈w|y〉) + t2‖|y〉‖2 ≥ 0.Daher muß Re (〈w|y〉) = 0. Benutzen wir it statt t, soliefert ein ahnliches Argument, daß auch Im (〈w|y〉) = 0gilt. Als Resultat haben wir somit: |w〉 ∈ M⊥. Eindeutig-keit bleibt einer Ubung vorbehalten. ∗–< [; 0)

Page 7: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

7

Das Projektionstheorem liefert einen naturlichen Iso-morphismus zwischen H und M⊕M⊥. Fur uns ist esvollkommen in Ordnung, den Isomorphismus zu unter-drucken und einfach H =M⊕M⊥ zu notieren.

Wir wenden uns nun beschrankten linearen Abbildun-gen von einem Hilbert–Raum H in einen anderen H′ zu.Sei B (H,H′) die Menge der beschrankten linearen Ab-bildungen von H nach H′. Offenbar ist B (H,H′) ein Vek-torraum. Wir definieren auf B (H,H′) die folgende Norm:Fur T ∈ B (H,H′) setzen wir

‖T‖ df= sup‖|x〉‖H=1

‖T (|x〉) ‖H′ . (27)

Fur Interessierte: Bezuglich dieser Norm wird B (H,H′)ein Banach–Raum. Uns interessiert insbesondere derFall H′ = C:

Def. II.5 Der Vektorraum B (H,C) heißt der zu Hduale Raum und wird mit H∗ bezeichnet. Die Elementevon H∗ heissen stetige lineare Funktionale.

Eine anschauliche Charakterisierung von H∗ verdan-ken wir F. Riesz und M. Frechet. Diese macht naturlichvon der geometrischen Struktur auf H guten Gebrauch.

Satz II.4 Zu jedem T ∈ H∗ existiert genau ein |yT 〉 ∈H mit T (|x〉) = 〈yT |x〉 ,∀|x〉 ∈ H. Weiterhin gilt:‖|yT 〉‖H = ‖T‖H∗ .

Beweis II.7 Sei N := |x〉 ∈ H | T (|x〉) = 0. We-gen der Stetigkeit von T folgt, daß N ⊂ H ein ab-geschlossener Unterraum ist. Falls N = H, dann istT (|x〉) = 0 = 〈0|x〉 ,∀|x〉 ∈ H und wir sind fertig.Wir nehmen im weiteren an, daß N 6= H. Der Projek-tionssatz II.3 garantiert dann, daß es einen vom Null-vektor verschiedenen Vektor |x0〉 ∈ N⊥ gibt. Wir setzen|yT 〉 := (T (|x0〉))∗‖|x0〉‖−2|x0〉. Es bleibt zu zeigen, daß|yT 〉 die richtigen Eigenschaften hat. Falls |x〉 ∈ N , danngilt T (|x〉) = 0 = 〈yT |x〉 (da |yT 〉 ∝ |x0〉 ∈ N⊥). Weiter-hin, fur |x〉 = α|x0〉 , α ∈ C, haben wir

T (|x〉) = T (α|x0〉) = αT (|x0〉) =

= 〈(T (|x0〉))∗ ‖|x0〉‖−2x0|αx0〉 = 〈yT |αx0〉 .

Da die Funktionen T () und 〈yT |〉 linear sind und auf Nund |x0〉 ubereinstimmen, stimmen sie auch uberein aufdem Raum, der von N und |x0〉 aufgespannt wird. DieserRaum ist aber gerade H, denn jedes Element |y〉 ∈ Hkann folgendermassen dargestellt werden:

|y〉 =

(|y〉 − T (|y〉)

T (|x0〉)|x0〉

)+

T (|y〉)T (|x0〉)

|x0〉 . (28)

Offenbar ist |y〉 − T (|y〉) |x0〉/T (|x0〉) ∈ N und der letz-te Term ist ∝ |x0〉. Also ist T (|x〉) = 〈yT |x〉 ,∀|x〉 ∈H. Nun zur Eindeutigkeit: Sei |y′〉 ∈ H und außer-dem T (x) = 〈y′|x〉. Insbesondere gilt dann einerseitsT (|y′〉 − |yT 〉) = 〈y′|y′〉 − 〈y′|yT 〉, und andererseitsT (|y′〉 − |yT 〉) = 〈yT |y′〉 − 〈yT |yT 〉. Daraus folgt nun,

‖|y′〉‖2 + ‖|yT 〉‖2 − 〈y′|yT 〉 − 〈yT |y′〉 = 0, also ‖|y′〉 −|yT 〉‖2 = 0 y |y′〉 = |yT 〉, womit Eindeutigkeit gezeigtist.

Es bleibt zu zeigen, daß ‖|yT 〉‖H = ‖T‖H∗ . Wir bemer-ken (C als normierter Raum (C, | |)):

‖T‖H∗ = sup‖|x〉‖H=1

|T (x)| = sup‖|x〉‖H=1

|〈yT |x〉|Schwarz

=

≤ sup‖|x〉‖H=1

‖|yT 〉‖H ‖|x〉‖H

‖T‖H∗ = sup‖|x〉‖H=1

|T (x)| ≥ |T (|yT 〉/‖|yT 〉‖H)|

= 〈yT ||yT 〉/‖|yT 〉‖H = ‖|yT 〉‖H .

Damit ist auch die letzte Behauptung des Satzes bewiesen.∗–< [; 0)

Die Umkehrung von Satz II.4 gilt auch: jedes |y〉 ∈ Hdefiniert ein stetiges lineares Funktional Ty ∈ H∗ durchTy(|x〉) = 〈y|x〉 ,∀|x〉 ∈ H. Daher schreiben wir in derPhysik statt Ty in der Regel 〈y|.

C. Othonormale Basen

In diesem Abschnitt ubertragen wir das Konzeptder Basis von endlich–dimensionalen Vektorraumen aufvollstandige Vektorraume, die mit einem Skalarproduktversehen sind, also auf Hilbert–Raume. Sei S ⊂ H ei-ne Menge orthonormaler Vektoren im Hilbert–Raum H,die in keiner anderen Menge orthonormaler Vektoren inH enthalten ist. Dann heißt S eine vollstandige or-thonormale Basis von H, kurz vONB(H), oder einfachvONB.

Satz II.5 Jeder Hilbertraum H hat eine vONB.

Beweis II.8 Bezeichne F ⊂ H die Familie von ortho-normalen Mengen in H. Wir versehen diese Familie miteiner partiellen Ordnung: S1 ≺ S2 wenn S1 ⊂ S2 fur be-liebige S1,2 ∈ F . Die Familie F ist nicht–leer, denn mit|v〉 ∈ H ist |v〉/‖|v〉‖ eine orthonormale Menge. Seiennun Saa∈A eine linear geordnete Untermenge von F .Dann ist die Vereinigung aller Sa , a ∈ A eine orthonor-male Menge, die jedes Sa enthalt und daher eine obereSchranke fur Saa∈A darstellt. Da jede linear geordneteUntermenge von F eine obere Schranke hat, konnen wirdas Lemma von Zorn anwenden. Aus diesem folgt, daßF ein maximales Element besitzt. Also ein orthonorma-les System, das in keinem anderen orthonormalen Systemecht enthalten ist. ∗–< [; 0)

Der folgende Satz zeigt, daß, wie schon im endlich–dimensionalen Fall, jeder Vektor in einem Hilbert–Raumals Linearkombination von Basisvektoren dargestellt wer-den kann.

Page 8: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

8

Satz II.6 Sei H ein Hilbert–Raum und S = |ea〉a∈Aeine ONB. Dann gilt fur jedes |y〉 ∈ H:

|y〉 =∑a∈A

|ea〉〈ea|y〉 , (29)

‖|y〉‖ =

√∑a∈A

|〈ea|y〉|2 . (30)

Die Gleichung (29) ist folgendermaßen gemeint: DieSumme auf der rhs(29) konvergiert gegen |y〉 ∈H (unabhangig von der Reihenfolge). Umgekehrt, ist∑a∈A |ca|2 < ∞ , ca ∈ C, so konvergiert die Linear-

kombination∑a∈A ca|ea〉 gegen ein Element aus H.

Beweis II.9 Aus der Besselschen Ungleichung (LemmaII.1) folgt, daß fur jede endliche Untermenge A′ ⊂ A gilt:∑

a∈A′|〈ea|y〉|2 ≤ ‖|y〉‖2 . (31)

Somit ist 〈ea|y〉 6= 0 fur hochstens eine abzahlbare An-zahl von a’s in A, die wir nach Belieben anordnen:

a1, a2, a3, . . . , aN . Da die Summe∑Nj=1

∣∣〈eaj |y〉∣∣2 mono-ton anwachst und gleichzeitig beschrankt ist, konvergiertsie im Limes N −→ ∞. Sei |yn〉 :=

∑nj=1 |eaj 〉〈eaj |y〉.

Dann gilt fur n > m,

‖|yn〉 − |ym〉‖2 =

∥∥∥∥∥∥n∑

j=m+1

|eaj 〉〈eaj |y〉

∥∥∥∥∥∥2

=

n∑j=m+1

∣∣〈eaj |y〉∣∣2 .

Also ist |yn〉 eine Cauchy–Folge. Sei |z〉 ∈ H derGrenzwert dieser Cauchy–Folge. Wir notieren:

〈y − z|eak〉 =

= limn→∞

〈y|eak〉 −⟨

n∑j=1

eaj 〈eaj |y〉

∣∣∣∣∣eak⟩ =

= 〈y|eak〉 − 〈y|eak〉 = 0 . (32)

Und fur a 6= ak , k ∈ 1, 2, . . . , N folgt 〈y − z|ea〉 = 0.Somit ist |y − z〉 orthogonal zu allen |ea〉 ∈ S , a ∈ A.Da nach Voraussetzung S eine vONB ist, muß |y〉 = |z〉gelten. Damit ist

|y〉 = limn→∞

n∑j=1

|eaj 〉〈eaj |y〉 . (33)

Also gilt (29). Weiterhin folgt

0 = limn→∞

∥∥∥∥∥∥|y〉 −n∑j=1

|eaj 〉〈eaj |y〉

∥∥∥∥∥∥2

=

= limn→∞

‖|y〉‖2 − n∑j=1

∣∣〈eaj |y〉∣∣2 =

= ‖|y〉‖2 −∑a∈A

∣∣〈eaj |y〉∣∣2 , (34)

woraus sich (30) ergibt. Die umgekehrte Schlussrichtunguberlassen wir einer Ubung. ∗–< [; 0)

Die Gleichung (30) heißt Parzevalsche Gleichung. DieKoeffizienten 〈ea|y〉 werden oft Fourier–Koeffizientenvon |y〉 bezuglich der Basis |ea〉a∈A genannt. DerGrund fur diese Namensgebung wird erst weiter untenklar.

Dies ist eine gute Stelle, um an das Gram–Schmidt–Verfahren zur Konstruktion einer orthonormalen Men-ge zu erinnern. Gegeben seien linear unabhangige Vekto-ren |u1〉, |u2〉, . . . . Wir definieren

|w1〉 = |u1〉 |v1〉 = |w1〉/‖|w1〉‖|w2〉 = |u2〉 − |v1〉〈v1|u1〉 |v2〉 = |w2〉/‖|w2〉‖

......

|wn〉 = |un〉 −∑n−1j=1 |vj〉〈vj |un〉 |vn〉 = |wn〉/‖|wn〉‖

......

Die Menge |vj〉 ist eine orthonormale Mengeund hat folgende nutzliche Eigenschaft: Sei Im :=1, . . . ,m ,m ∈ N. Fur jedes m ∈ N spannen die Vekto-ren |uj〉Im und |vj〉Im den gleichen Vektorraum auf.

Def. II.6 A metrischer Raum M heißt separabel, wennes eine abzahlbare Untermenge U gibt, die dicht in Mliegt.

Viele fur die Praxis relevante Hilbert–Raume sind sepa-rabel. Diese konnen bis auf einen Isomorphismus wie folgtcharakterisiert werden (ohne Beweis):

Satz II.7 Ein Hilbert–Raum H ist genau dann separa-bel, wenn er eine abzahlbare ONB S besitzt. Sind N <∞Vektoren in S, dann ist H isomorph zu CN . Gibt esabzahlbar viele Elemente in S, so ist H isomorph zu `2.

D. Beschrankte Operatoren

1. Adjungierte

Es bezeichne L(X ,Y) den Banach–Raum von Operato-

ren O : X lin.−→ Y, wobei X ,Y selbst Banach–Raume sei-en. Uns interessiert am meisten der Fall L(H,H) ≡ L(H),mit H ein separabler Hilbert–Raum. Wir konnen hiernicht auf topologische Untersuchungen eingehen, aller-dings sei erwahnt, daß L(X ,Y) mit der Norm

‖T‖ = sup|x〉6=|0〉

‖T |x〉‖Y‖x〉‖X

, T ∈ L(X ,Y) , |x〉 ∈ X ,(35)

ausgestattet ist, die auf L(X ,Y) eine Topologie in-duziert, die sogenannte Norm–Topologie. In dieserNorm ist die Komposition L(X ,Y) × L(Y,Z) −→L(X ,Z) , (A,B) −→ A B stuckweise stetig.

Page 9: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

9

Sei T ∈ L(X ,Y). Die Menge von Vektoren |x〉 ∈ X mitder Eigenschaft T |x〉 = |0〉 ∈ Y heißt der Kern von Tund wird folgendermaßen notiert: Kern(T ). Die Mengeder Vektoren |y〉 ∈ Y mit |y〉 = T |x〉 , |x〉 ∈ X heißtdas Bild von T und wird mit Bild(T ) notiert. Offenbarist Kern(T ) ⊂ X und Bild(T ) ⊂ Y. Der Kern(T ) ist einabgeschlossener Unterraum, wahrend das Bild(T ) nichtabgeschlossen zu sein braucht.

Im Folgenden fuhren wir den zu einem beschrank-ten Operator adjungierten Operator ein. Mit obigenBezeichnungen wird dabei zunachst (ein wenig spitzfin-dig) unterschieden zwischen Operatoren aus L(X ,Y) undL(H).

Def. II.7 Seien X ,Y Banach–Raume und T ∈ L(X ,Y)beschrankt. Der beschrankte Operator T ′ ∈ L(Y∗,X ∗)(wobei X ∗,Y∗ die zu X ,Y dualen Raume bezeichnen) seifolgendermaßen definiert:

(T ′〈y|) (|x〉) df= 〈y|Tx〉 ,∀〈y| ∈ Y∗ , |x〉 ∈ X . (36)

Der so definierte Operator T ′ heißt Banach–adjungiertzu T .

Die Konstruktion ist sehr naturlich, bitte machen Sie sichdas klar.

Bemerken Sie folgende Schreibweise: |Tx〉 ≡ T |x〉 ∈ Y.Ein bisschen klarer hatte man die Definition so notie-ren konnen: Sei Y 3 |z〉 := T |x〉. Dann soll gelten:(T ′〈y|) (|x〉) := 〈y|z〉. In der Physik sind wir oft intui-tiver was die Schreibweise betrifft: 〈yT ′|x〉 := 〈y|Tx〉,wobei der duale Vektor (stetiges lineares Funktional)〈yT ′| := T ′〈y|. In der Physik wird formal nicht unter-schieden zwischen der Operation von Elementen des dua-len Vektorraumes und dem Skalarprodukt als lineare Ab-bildung, weil wir immer Hilbert–Raume zu Verfugung ha-ben und uns daher zweckmaßig der Charakterisiung vonFrechet und Riesz bedienen.

Satz II.8 Seien X ,Y Banach–Raume. Die AbbildungL(X ,Y) −→ L(Y∗,X ∗) , T −→ T ′ ist ein isometrischerIsomorphismus.

Beweis II.10 Die Abbildung L(X ,Y) 3 T −→ T ′ ∈L(Y∗,X ∗) ist linear. Die Aussagen, daß T ′ beschranktund obige Abbildung eine Isometrie ist folgen aus derRechnung:

‖T‖L(X ,Y) = sup‖|x〉‖X=1

‖T |x〉‖Y =

= sup‖|x〉‖X=1

(sup

‖〈y||Y∗=1

|〈y|Tx〉|

)=

= sup‖〈y|‖Y∗=1

(sup

‖|x〉‖X=1

|(T ′〈y|) (|x〉)|

)=

= sup‖〈y|‖Y∗=1

‖T ′〈y|‖X∗ =

= ‖T ′|‖L(Y∗,X∗) .

Die zweite Gleichung benutzt ein Korrolar des Hahn–Banach Theorems.∗–< [; 0)

Wie weiter oben schon bemerkt, interessieren wiruns hauptsachlich fur beschrankte lineare Transforma-tionen O ∈ L(H) von Hilbert–Raumen H. Der Banch–adjungierte Operator zum beschrankten Operator T ∈L(H,H) ist dann eine lineare Abbildung von H∗ nachH∗. Sei C : H −→ H∗ , |y〉 −→ C(|y〉) := 〈y|〉.

Wir definieren eine lineare Abbildung T † : H −→ Hals folgende Komposition

T †df= C−1 T ′ C .

Dann gilt fur alle |x〉, |y〉 ∈ H:

〈x|Ty〉 = (C|x〉) (T |y〉) =

= (T ′C|x〉) (|y〉) = 〈C−1T ′Cx|y〉 =

= 〈T †x|y〉 .

T † heißt der Hilbert–adjungierte Operator zu T ∈L(H,H). Es hat sich eingeburgert, einfach vom adjun-gierten Operator zu sprechen. Wir listen einige Eigen-schaften der Abbildung T −→ T †.

Satz II.9 Es gilt mit offensichtlichen Notationen:

(1) T → T † ist ein linearer isometrischer isomorphismusvon L(H) auf L(H).

(2) (TS)†

= S†T †.

(3)(T †)†

= T .

(4) Hat T ein beschranktes Inverses, T−1, so hat auch

T † ein beschranktes Inverses, und es gilt(T †)−1

=(T−1

)†.

(5)∥∥T †T∥∥ = ‖T‖2.

Beweis II.11 Als Ubung. ∗–< [; 0)

Die folgende Definition ist zentral fur die Quantenme-chanik, insbesondere fur die funktionalanalytische Cha-rakterisierung von Observablen.

Def. II.8 Ein beschrankter Operator T ∈ L(H) auf ei-nem Hilbert–Raum H heißt selbstadjungiert, wenn T =

T † gilt.

Wir erinnern daran, daß auf Cn , n ∈ N, eine lineareTransformation genau dann selbstadjungiert ist, wenn ineiner orthonormalen Basis die zugeordnete Matrix inva-riant ist unter der Komposition von Spiegelung an derDiagonalen und komplexer Konjugation.

Eine wichtige Klasse von Operatoren auf einemHilbert–Raum bilden die sogenannten Projektoren.

Def. II.9 Sei P ∈ L(H). Gilt P 2 := P P = P , so heißtP eine Projektion. Gilt zusatzlich P = P †, so heißt Peine orthogonale Projektion.

Page 10: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

10

Bild(P ) ist ein abgeschlossener Unterraum, auf dem Pwie die Identitat operiert. Ist P sogar orthogonal, dann

gilt:P (Bild(P ))⊥

= 0. Sei H 3 |x〉 = |y〉 + |z〉 , |y〉 ∈Bild(P ) , |z〉 ∈ (Bild(P ))

⊥, die vom Projektionssatz II.3

garantierte Zerlegung, dann gilt P |x〉 = |y〉. P heißt dieorthogonale Projektion auf Bild(P). Mit anderenWorten: der Projektionssatz II.3 konstituiert eine bijek-tive Korrespondenz zwischen orthogonalen Projektionenund abgeschlossenen Unterraumen. Wir sind ausschließ-lich an orthogonalen Projektionen interessiert und unter-drucken daher die Qualifikation orthogonal im weiteren.

2. Das Spektrum

Sei nun T ∈ L(Cn,Cn) , n ∈ N. Die Eigenwerte von Tsind dann die λ ∈ C mit T − λI = 0. Die Menge dieser λheißt das Spektrum von T . Das Spektrum von T kannhochstens aus n Punkten bestehen, da det(T − λI) einPolynom vom Grade n ist. Ist λ kein Eigenwert von T , sokann T −λI invertiert werden, da dann det(T −λI) 6= 0.

Die Spektraltheorie von Operatoren auf unendlich–dimensionalen Vektorraumen ist wesentlich interessanterund extrem relevant fur die Charakterisierung der Ope-ratoren selbst (und damit der Observablen, wie wir sehenwerden). Wir werden praziser:

Def. II.10 Sei T ∈ L(X ). Die Resolventenmenge ρ(T )von T ist die Menge aller λ ∈ C, fur die T − λI bijektivist und ein beschranktes Inverses besitzt. Rλ(T ) = (T −λI)−1 heißt die Resolvente von T bei λ. Das Spektrumσ(T ) von T besteht aus allen C 3 λ 3 ρ(T ).

Wir merken noch an, daß T − λI automatisch ein be-schranktes Inverses besitzt, wenn es bijektiv ist. Wir un-terscheiden zwei Teilmengen des Spektrums:

Def. II.11 Sei T ∈ L(X ).

(1) Ein Vektor |x〉 6= 0 mit T |x〉 = λ|x〉 , λ ∈ Cheißt Eigenvektor von T , und λ heißt der zugehori-ge Eigenwert. Ist λ ein Eigenwert, dann ist T − λInicht injektiv, also ist λ ∈ σ(T ). Die Menge allerEigenwerte heißt das Punktspektrum von T .

(2) Ist λ kein Eigenwert und ist Bild(T − λI) nirgendsdicht in X , so gehort λ zum Residualspektrum.

Der Grund warum hier diese Unterscheidung ein-gefuhrt wird ist, daß selbstadjungierte Operatoren keinResidualspektrum besitzen.

Satz II.10 Sei T ∈ L(H) ein selbstadjungierter Opera-tor auf einem Hilbert–Raum H. Dann gilt:

(1) T besitzt kein Residualspektrum.

(2) σ(T ) ⊂ R.

(3) Eigenvektoren zu unterschiedlichen Eigenwerten vonT sind orthogonal zueinander.

Beweis II.12 Wir beginnen mit dem Beweis von (2).Zunachst eine kurze Rechnung: Seien λ ∈ C , |x〉 ∈ H.Dann ist

‖[T − (Re(λ) + i Im(λ))] |x〉‖2 =

= ‖[T − Re(λ)] |x〉‖2 + (Im(λ))2 ‖|x〉‖2 .

Also, ‖[T − (Re(λ) + i Im(λ))] |x〉‖2 ≥ (Im(λ))2 ‖|x〉‖2.

Fur Im(λ) 6= 0 ist daher die Abbildung T − (Re(λ) +i Im(λ)) injektiv und hat ein beschranktes Inverses auf ih-rem Wertebereich, der abgeschlossen ist. Ist nun Bild(T−(Re(λ) + i Im(λ))) 6= H, so ware (Re(λ) + i Im(λ)) ∈σ(T ), im Widerspruch zu obiger Ungleichung. Also ist(Re(λ) + i Im(λ)) ∈ ρ(T ) fur Im(λ) 6= 0. Damit ist (2)gezeigt. Sei nun Im(λ) = 0 und λ ∈ ρ(T ). Dann wareλ∗ = λ ∈ σ(T †) = σ(T ), im Widerspruch zur Definitionvon Punkt– und Residualspektrum, die ja disjunkt sind.Damit ist (1) gezeigt. (3) uberlassen wir einer Ubung.∗–< [; 0)

Wir charakterisieren nun einige Klassen von relevantenbeschrankten Operatoren.

3. Positive Operatoren

Wir wollen im Folgenden zeigen, daß eine spezielle Dar-stellung von Operatoren auf Hilbert–Raumen existiert,die ahnlich der Polardarstellung von komplexen ZahlenC 3 z = |z| exp (i arg(z)) ist. Dazu benotigen wir einAnalogon zu den positiven reellen Zahlen.

Def. II.12 Sei H ein Hilbert–Raum. Ein Operator B ∈L(H) heißt positiv, wenn 〈Bx|x〉 ≥ 0 ,∀|x〉 ∈ H. Wirschreiben B ≥ 0, wenn B positiv ist und B ≤ A (A ∈ H)wenn A−B ≥ 0.

Jeder beschrankte positive Operator auf einem kom-plexen Hilbert–Raum ist selbstadjungiert. Das sehen wirfolgendermaßen ein: Ist A ein positiver Operator, so ist〈Az|z〉 = 〈Az|z〉∗ = 〈z|Az〉 ,∀|z〉 ∈ H, d.h. 〈z|Az〉 ∈ R.Wir betrachten den Fall |z〉 = |x〉+ |y〉 , |x〉, |y〉 ∈ H. DaA positiv ist, folgt aus obiger Gleichung Im (〈Ax|y〉) =Im (〈x|Ay〉) ,∀|x〉, |y〉 ∈ H. Das kann nur der Fall sein,wenn Im (〈Ax|y〉) = 0, also 〈Ax|y〉 = 〈x|Ay〉 ,∀|x〉, |y〉 ∈H. Dies bedeutet aber gerade, daß A selbstadjungiert ist.Beachten Sie, daß es essentiell war, einen Hilbert–Raumuber dem komplexen Zahlenkorper zu betrachten.

Fur jeden Operator A ∈ L(H) gilt: A†A ≥ 0, denn〈A†Ax|x〉 = ‖A|x〉‖2 ≥ 0 ,∀|x〉 ∈ H. In Anlehnung an

|z| =√z∗z , ∀z ∈ C lage es nun nahe |A| :=

√A†A zu

definieren. Dafur mussen wir uns aber versichern, daß wirWurzeln aus positiven Operatoren ziehen konnen. Wirbeginnen mit einem Lemma:

Lemma II.4 Die Taylor–Reihenentwicklung von√

1− zan der Stelle z = 0 konvergiert absolut fur z ∈ C mit|z| ≤ 1.

Page 11: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

11

Beweis II.13 Sei√

1− z = c0 + c1z + c2z2 + . . . die

Taylor–Reihenentwicklung von√

1− z am Ursprung. Da√1− z analytisch ist fur |z| < 1, konvergiert die Reihe

fur |z| < 1 absolut. Die Ableitungen von√

1− z am Ur-sprung sind alle negativ, also cj < 0 ,N 3 j ≥ 1. Somitgilt fur ein beliebiges N ∈ N

N∑j=0

|cj | = 2−n∑j=0

cj =

= 2− limx→1−

n∑j=0

cjxj =

≤ 2− limx→1−

√1− x =

= 2 y

y∞∑j=0

|cj | ≤ 2 .

Daraus folgt unmittelbar, daß die Reihenentwicklung fur|z| = 1 absolut konvergiert. ∗–< [; 0)

Satz II.11 Sei A ∈ L(H) und A ≥ 0. Dann gibt es eineneindeutig bestimmten Operator B ∈ L(H) mit B ≥ 0 undB2 = A.

Beweis II.14 Es genugt den Fall ‖A‖ ≤ 1 zu betrachten.Da ‖I − a‖ ≤ 1 ist, folgt auf dem Lemma II.4, daß dieReihe c0+c1(I−A)+c2(I−A)2+. . . bezuglich der Norm–Topologie absolut gegen ein B ∈ L(H) konvergiert. Daherkonnen wir die Reihe quadrieren und die Terme geeignetumsortieren und so zeigen, daß B2 = A. Da weiterhin0 ≤ I − A ≤ I ist, folgt 0 ≤ 〈x|(I − A)nx〉 ≤ 1 ,∀n ∈N, |x〉 ∈ H : ‖|x〉‖ = 1. Daher,

〈x|Bx〉 = 1 +

∞∑j=1

cj〈x|(I −A)nx〉 =

≥ 1 +

∞∑j=1

cj = 0 ,∀|x〉 ∈ H ,

wobei wir cj < 0 ,N 3 j ≥ 1 und die Abschatzung ausdem Lemma II.4 benutzt haben. Folglich gilt: B ≥ 0. Ein-deutigkeit zeigen wir hier nicht. ∗–< [; 0)

So, jetzt haben wir alles beisammen:

Def. II.13 Sei A ∈ L(H). Dann |A| :=√A†A.

Bitte die Bezeichnung mit Vorsicht genießen: Fur A,B ∈L(H) gilt weder |AB| = |A||B|, noch |A| = |A†|, imallgemeinen!

Das Analogon zu den komplexen Zahlen auf dem Ein-heitskreis stellt sich nicht so direkt ein.

Def. II.14 Ein Operator U ∈ L(H) heißt eine Isometrie,wenn gilt: ‖|Ux〉‖ = ‖|x〉‖ ,∀|x〉 ∈ H. U heißt einepartielle Isometrie, wenn U eingeschrankt auf den abge-

schlossenen Unterraum (Kern(U))⊥ eine Isometrie ist.

Wenn U eine partielle Isometrie ist, dann kannder Hilbert–Raum H folgendermaßen dargestellt wer-den: H = Kern(U) ⊕ (Kern(U))⊥ und auch H =Bild(U) ⊕ (Bild(U))⊥. U ist ein unitarer Operator U :(Kern(U))⊥ −→ Bild(U). Und U† ist gerade die Um-kehrabbildung, also U† : Bild(U) −→ (Kern(U))⊥.

Lemma II.5 Sei U ∈ L(H) eine partielle Isometrie desHilbert–Raumes H. Dann ist Pin := U†U die Projektionauf (Kern(U))⊥, und Pfi := UU† ist die Projektion aufBild(U). Umgekehrt, ist U ∈ L(H) und sind U†U undUU† Projektoren, so ist U eine partielle Isometrie

Beweis II.15 Als Ubung.∗–< [; 0)

Wir sind jetzt am Ziel:

Satz II.12 Polarzerlegung Sei H ein Hilbert–Raumund A ∈ L(H) beschrankt. Dann gibt es eine partielle Iso-metrie U mit der Eigenschaft: A = U |A|. Dabei ist U ein-deutig bestimmt aus der Forderung Kern(U) = Kern(A).

Außerdem ist Bild(U) = Bild(A).

Beweis II.16 Wir definieren U : Bild(|A|) −→Bild(A) , U(|A||x〉) := A|x〉 , |x〉 ∈ H. Da

‖|A| |x〉‖2 = 〈x||A|2|x〉 = 〈x|A†A|x〉= ‖A|x〉‖2 ,

ist U wohl definiert, d.h. wenn |A||x〉 = |A||y〉, dann gilt

A|x〉 = A|y〉. U is eine Isometrie auf Bild(|A|), und in-

duziert auch eine Isometrie auf auf Bild(A). U kann be-quem auf ganz H erweitert werden, dazu brauchen wirlediglich U |n〉 := 0 , |n〉 ∈ (Bild(|A|))⊥ ⊂ H. Da |A|selbstadjungiert ist, ist (Bild(|A|))⊥ = Kern(|A|). Außer-dem ist |A||n〉 = 0 genau dann, wenn A|n〉 = 0, so daßKern(|A|) = Kern(A). Damit gilt: Kern(U) = Kern(A).Eindeutigkeit uberlassen wir einer Ubung. ∗–< [; 0)

4. Kompakte Operatoren

Viele Fragestellungen in der Physik sind naturlicherWeise als Probleme von Differentialgleichungen formu-liert. Eine Umformulierung dieser Fragestellungen alsIntegralgleichungen erlaubt oft neue Einsichten undauch deren Beantwortung. Das wohl bekannteste Bei-spiel in dieser Kategorie ist das weiter unten diskutierteDirichlet–Problem. Vorbereitend betrachten wir einenOperator K ∈ L(C[0, 1]), definiert durch

(KΦ) (x)df=

∫ 1

0

dy G(x, y)Φ(y) ,

wobei die Funktion G(x, y) stetig auf x, y ∈ I := [0, 1] ⊂R sei. G(x, y) heißt der Integralkern zum Integralope-rator K. Es gilt (beachten Sie, daß y ∈ [0, 1])

|(KΦ) (x)| ≤(

supx,y∈I

|G(x, y)|)(

supy∈I|Φ(y)|

)y

y ‖KΦ‖∞ ≤(

supy∈I|Φ(y)|

)‖Φ‖∞ .

Page 12: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

12

Somit ist K ein beschrankter Operator auf C[0, 1]. DerIntegraloperator K hat eine weitere sehr wichtige Ei-genschaft: Bezeichne BM := Φ ∈ C[0, 1] : ‖Φ‖∞ ≤M ,M ∈ R. Da G(x, y) stetig ist fur x, y ∈ I, und wei-terhin der I×I kompakt ist, istG(x, y) sogar gleichmaßigstetig auf I ×I. Also zu einem gegebenen R 3 ε > 0 gibtes ein R 3 δ > 0, so daß |x − x′| < δ bereits impliziert|G(x, y)−G(x′, y)| < ε ,∀y ∈ I. Ist nun Φ ∈ BM , so folgt

|(KΦ) (x)− (KΦ) (x′)| ≤≤ sup

y∈I|G(x, y)−G(x′, y)| ‖Φ‖∞

≤ εM .

Somit sind die Funktionen K[BM ] gleichgradig stetig.Da sie auch gleichmaßig beschrankt sind durch ‖K‖M ,kann mit dem Satz von Ascoli gefolgert werden, daß zujede Folge Φn ∈ BM , die Folge KΦn eine konvergenteTeilfolge besitzt, wobei der Grenzwert nicht in der Men-ge K[BM ] liegen muß. Mit anderen Worten: Die MengeK[BM ] ist prakompakt, d.h. die abgeschlossene Hulle vonK[BM ] ist kompakt in C[0, 1]. Dabei spielt die konkreteWahl von M ∈ R keine Rolle, und wir haben gezeigt, daßder Integraloperator K beschrankte Mengen in prakom-pakte Mengen abbildet.

Def. II.15 Seien X ,Y Banach–Raume. Ein OperatorT ∈ L(X ,Y) heißt kompakt, wenn T beschrankte Mengen

in X auf prakompakte Mengen in Y abbildet. Aquivalent,T heißt kompakt genau dann, wenn fur jede beschrank-te Folge xn ⊂ X , die Folge Txn eine konvergenteTeilfolge in Y besitzt.

Bsp. II.6 Neben der oben betrachteten Klasse von In-tegraloperator spielt die folgende Klasse von Operatoreneine wichtige Rolle. Sei dim(Bild(T )) < ∞. Also besitzt|y〉 ∈ Bild(T ) die folgende Darstellung:

|y〉 = T |x〉 =

N∑j=1

αj |ej〉 ,

wobei N ∈ N, und |ej〉j=1,...,N ∈ Y eine vorgegebe-ne Familie von Vektoren ist. Ist |xn〉 eine beschrankteFolge von Vektoren in X , so sind die Koeffizienten αnj be-schrankt, weil T beschrankt ist. Wir konnen (wie ublich)eine konvergente Teilfolge von T |xn〉 isolieren, womit ge-zeigt ist, daß T kompakt ist.

Satz II.13 Seien X ,Y Banach–Raume und T ∈L(X ,Y).

(1) Ist die Folge Tn , Tn ∈ L(X ,Y) kompakt und kon-vergiert gegen T bezuglich der Norm–Topologie, soist auch T kompakt.

(2) T ist genau dann kompakt, wenn T ′ kompakt ist.

(3) Sei Z ein Banach–Raum und S ∈ L(Y,Z) und Toder S kompakt, dann ist auch die KompositionST ∈ L(X ,Z) kompakt.

Satz II.13 zeigt, daß der Grenzwert einer Folge vonOperatoren mit den Spezifikationen von Beispiel II.6 einkompakter Operator ist. Gonnen wir uns einen Hilbert–Raum, so ist auch die Umkehrung war, wie der folgendeSatz besagt.

Satz II.14 Sei H ein separabler Hilbert–Raum.Bezuglich der Norm–Topologie, ist jeder kompakteOperator T ∈ L(H) der Limes einer Folge Tn vonOperatoren mit dim(Bild(Tn)) <∞ , n ∈ N.

Beweis II.17 Der Beweis setzt ein paar mehr topologi-sche Betrachtungen voraus, als wir hier disktutiert ha-ben. Allerdings konnen wir die essentielle Schlussfolge-rung trotzdem wurdigen, zumindestens moralisch.

Sei also T ∈ L(H) gegeben. Der konstruktive Teil desBeweises ist dann lediglich eine kleine Rechnung: Sei|ej〉j∈N eine orthonormale Menge in H. Wir betrachtendie Folge

Tndf=

n∑j=1

T |ej〉〈ej |〉 .

Offenbar gilt Tn −→ T in der Norm–Topologie. ∗–< [; 0)

Bisher haben wir noch keine wirklich uberzeugendeMotivation fur das Studium von kompakten Operatorengeliefert. Grundsatzlich sind kompakte Operatoren we-gen der sogenannten Fredholmschen Alternative vonso großer Bedeutung. Worum geht es dabei? Sei H einHilbert–Raum und A ∈ L(H) kompakt. Dann gilt entwe-der A|x〉 = |x〉 , |x〉 ∈ H, oder aber (A − I)−1 existiert.Machen Sie sich klar, daß diese Eigenschaft keineswegsvon allen beschrankten Operatoren geteilt wird.

Satz II.15 (Fredholm) Sei D ⊂ C offen und zusam-menhangend, und f : D −→ L(H) eine analytische opera-torwertige Funktion mit: f(z) ist kompakt fur alle z ∈ D.Dann gilt genau eine der folgenden Aussagen:

(1) (f(z)− I)−1 ist nicht definiert fur z ∈ D.

(2) (f(z)−I)−1 exisitert fur alle z ∈ D\S, wobei S ⊂ Ddiskret ist (d.h. S hat keine Haufungspunkte in D).(f(z)− I)−1 ist dann meromorph in D, analytischin D \ S, und fur die Residuen an den isoliertenPolstellen zp ∈ S gilt: dim(Bild(f(zp))) < ∞. Istz ∈ S, so besitzt f(z)|x〉 = |x〉 eine von Null ver-schiedene Losung in H.

Beweis II.18 Wir zeigen, daß in einer Umgebung vonz0 ∈ D entweder (1) oder (2) gilt. Wegen der gefordertenZusammenhangseigenschaft von D kann diese Aussagedann auf ganz D ausgeweitet werden. Sei also z0 ∈ D ge-geben. Wir wahlen ein r ∈ R so, daß aus |z−z0| < r folgt:‖f(z) − f(z0)‖ < 1/2, und einen Operator F ∈ L(H)mit dim(Bild)(F ) < ∞, so daß ‖f(z0) − F‖ < 1/2. Furz ∈ Dr := z ∈ D : |z−z0| < r gilt dann ‖f(z)−F‖ < 1.Wir entwickeln nun (f(z) − F − I)−1 in eine geometri-sche Reihe und sehen, daß (f(z)−F − I)−1 existiert undanalytisch ist.

Page 13: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

13

Da nach Wahl dim(Bild)(F ) < ∞, gibt es Vekto-ren |x1〉, . . . , |xn〉 ,N 3 n := dim(Bild)(F ), so daß je-des |y〉 ∈ H folgendermaßen dargestellt werden kann:F (|y〉) =

∑nj=1 αj(|y〉)|xj〉. Hierbei sind αj() beschrank-

te lineare Funktionale auf H. Daher folgt mit dem Satzvon Riesz II.4, daß es Vektoren |y1〉, . . . , |yn〉 ∈ H gibtmit F (|y〉) =

∑nj=1 |xj〉〈yj |y〉 ,∀|y〉 ∈ H. Wir definieren

den φj(z) := ((f(z) − F − I))∗|yj〉 ,N 3 j ∈ 1, . . . , nund

g(z)df= F (f(z)− F − I)

−1=∑nj=1 |xj〉〈φj(z)|〉 .

Nun schreiben wir umstandlich

(f(z)− I) = F (g(z)− I) (f(z)− F − I) .

Also ist f(z)− I , z ∈ Dr genau dann invertierbar, wenng(z)−I , z ∈ Dr invertierbar ist. Die Gleichung f(z)|x〉 =|x〉 besitzt somit genau dann eine von Null verschiedeneLosung, wenn g(z)|y〉 = |y〉 eine nicht–triviale Losungbesitzt.

Gilt nun g(z)|y〉 = |y〉, dann ist |y〉 =∑nj=1 βj |yj〉 und

die Koeffizienten βj ∈ C erfullen folgende Bestimmungs-gleichung:

βn =

n∑j=1

〈φn(z)|xj〉βj . (37)

Umgekehrt, hat (37) eine Losung (β1, . . . , βn), so ist|y〉 =

∑nj=1 βj |xj〉 eine Losung von g(z)|y〉 = |y〉. Folg-

lich hat g(z)|y〉 = |y〉 genau dann eine nicht–trivialeLosung, wenn

d(z)df= det [δab − 〈φa(z)|xb〉] = 0 .

Mit 〈φa(z)|xb〉 ist auch d(z) analytisch in Dr. Damitist klar, daß entweder Sr := z ∈ Dr : d(z) = 0 ei-ne diskrete Menge ist, oder Sr = Dr. Sei d(z) 6= 0 und|x〉 ∈ H gegeben. Wir suchen eine Losung der Gleichung(g(z) − I)|y〉 = |x〉. Der Ansatz |y〉 = |x〉 +

∑nj=1 βj |xj〉

ist erfolgreich, vorausgesetzt, die Koeffizienten losen

βa = 〈φa(z)|x〉+

n∑j=1

〈φa(z)|xj〉βj . (38)

Da d(z) 6= 0 angenommen wurde, hat (38) eine Losung.Also existiert (g(z)−I)−1. Die Aussage, daß die Residuenvon endlichem Rang sind, folgt aus (38). ∗–< [; 0)

Der Satz von Fredholm hat vier wichtige Konsequen-zen:

Lemma II.6 (Die Fredholmsche Alternative) SeiA ∈ L(H) kompakt. Dann gilt: Entweder (A − I)−1 exi-stiert, oder A|x〉 = |x〉 , |x〉 ∈ H hat eine von Null ver-schiedene Losung.

Beweis II.19 Wir benutzen den Satz von Fredholm furf(z) := zA an der Stelle z = 1. ∗–< [; 0)

Satz II.16 (Satz von Riesz & Schauder) Sein A ∈L(H) kompakt. Dann ist das Spektrum σ(A) eine diskreteMenge mit hochstens einem Haufungspunkt bei λ = 0.Jeder von Null verschiedene Eigenwert λ ∈ σ(A) gehortzu endlich vielen Eigenvektoren.

Satz II.17 (Hilbert–Schmidt Theorem) Sei A ∈L(H) selbstadjungiert und kompakt. Dann gibt es ei-ne vONB |ej〉j∈N fur den Hilbert–Raum H, so daßA|ej〉 = λj |ej〉 und λj −→ 0 fur j −→∞.

Beweis II.20 Fur jeden Eigenwert von A ∈ L(H)wahlen wir eine ONB fur die zugehorigen Eigenvekto-ren. Die Familie aller dieser Vektoren, |ejj∈N ist eineorthonormale Menge, da Eigenvektoren zu unterschiedli-chen Eigenwerten orthogonal zueinander sind. Sei M :=Spann(|ej〉). Da A nach Voraussetzung selbstadjun-giert ist und A ∈ L(M), ist auch A ∈ L(M⊥). Es be-zeichne B die Restriktion von A aufM⊥. Als Restriktionist B selbstadjungiert und kompakt. Nach dem Satz vonRiesz und Schauder gilt: ist λ 6= 0 in σ(B), so ist λ einEigenwert von B und damit auch von A. Der Spektralra-dius von B, r(B) := supλ∈σ(B) |λ|, ist daher Null, denn

jeder Eigenvektor von A (dies schliesst die Eigenvektorenvon B ein) ist in M. Daher korrespondiert B zur Null–Abbildung (Null–Operator) auf M⊥. Also ist M⊥ = ∅,denn |x〉 ∈ M⊥ bedeutet A|x〉 = 0, und daraus folgt|x〉 ∈ M. Damit gilt M = H.

Die Aussage λj −→ 0 ist eine Folge des Satzes vonRiesz und Schauder. Der erste Teil dieses Satzes besagtja, daß jeder von Null verschiedene Eigenwert nur zuendlich vielen Eigenvektoren gehort und der einzig mogli-che Haufungspunkt von λj die Null ist. ∗–< [; 0)

Satz II.18 (Kanonische Form kompakter Opera-toren) Sei A ∈ L(H) kompakt. Dann gibt es (nichtnotwendigerweise vollstandige) orthonormale Mengen|ej〉j∈I , |fj〉j∈I , I ⊂ N, und λjj∈I , λj ∈ R+∀j ∈I mit λj −→ 0, so daß

A =∑j∈I

λj〈ej |〉|fj〉 . (39)

Die Summe (39) konvergiert bezuglich der Norm–Topologie.

Beweis II.21 Mit A ist nach Satz II.13 auch A†A kom-pakt. Außerdem ist A†A selbstadjungiert. Der Satz vonHilbert und Schmidt garantiert dann die Existenz einerorthonormalen Menge |ej〉j∈I mit der hubschen Ei-genschaft: A†A|ej〉 = µj |ej〉 , µj ∈ R , j ∈ I, undA†A ist der Null–Operator auf dem Unterraum ortho-gonal zu Spann(|ej〉j∈I). Da A†A > 0, ist µj > 0. Seiλj := +

√µj und |fj〉 := A|ej〉/λj. Eine kurze Rechnung

ergibt:

A|x〉 =∑j∈I

λj〈ej |x〉|fj〉 .

Der Beweis zeigt, daß die Koeffizienten λj gerade die Ei-genwerte von |A| sind. ∗–< [; 0)

Page 14: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

14

Bsp. II.7 (Dirichlet–Problem) Im nachsten Seme-ster werden Sie sich ausfuhrlich mit dem Dirichlet–Problem in der Elektrostatik auseinandersetzen. Es stellteine gute Motivation fur das Studium von kompaktenOperatoren dar. Kompakte Operatoren treten auf dieBuhne, wenn klassische Randwertprobleme durch Inte-gralgleichungen gelost werden wollen. Sei D ⊂ R3 offenund beschrankt mit einem glatten Rand ∂D (Oberflache).Das Dirichlet–Problem fur die Lalace–Gleichung istwie folgt gegeben: gegeben sei eine stetige Funktion f :∂D −→ R. Wir suchen eine zweimal stetig differenzier-bare Funktion u : D −→ R, die auch stetig auf D seinsoll, so daß

∆u(x) = 0 , x ∈ D , u(x) = f(x) , x ∈ ∂D . (40)

Es bezeichne n(y) die nach außen weisende Norma-le zu ∂D am Punkt y ∈ ∂D. Sei G(x, y) := 〈x −y, n(y)〉/8π|x − y|3. Als Funktion von x lost G(x, y) dieLaplace–Gleichung ∆(x)G(x, y) = 0 , x ∈ D. Da dieLaplace–Gleichung linear ist, schreiben wir ihre Losungformal als Superposition

u(x) =

∫∂D

d2S(y) G(x, y)Q(y) ,

wobei Q ∈ C(∂D) Quellen auf dem Rand beschreibt(z.B. elektrische Ladungen), und dS(y) das ubliche Ober-flachenmaß bezeichne. Mit Sicherheit macht das Integralin (41) Sinn fur x ∈ D, tatsachlich gilt ∆u(x) = 0 , x ∈D. Aber wie schaut die Situation auf dem Rand aus? Seix0 ∈ ∂D und wir lassen x −→ x0 , x ∈ D. Es kann gezeigtwerden, daß

u(x) −→ −Q(x0) +

∫∂D

d2S(y) G(x0, y)Q(y) . (41)

Fur x −→ x0 , x ∈ R3 \ D erhalten wir

u(x) −→ +Q(x0) +

∫∂D

d2S(y) G(x0, y)Q(y) . (42)

Da Q ∈ C(∂D), ist auch das Integral als Funktion vonx vom Typ C(∂D). Dies folge im wesentlichen aus derVoraussetzung, daß der Rand glatt sein soll. Daher gilt:Fur x, y ∈ ∂D ist 〈x − y, n(y)〉 ∝ |x − y|2 im Limesx −→ y.

Die entscheidende Frage ist, ob wir Quellen Q findenkonnen, so daß u(x) = f(x) , x ∈ ∂D, also

f(x) = −Q(x) +

∫∂D

d2S(y) G(x, y)Q(y) , x ∈ ∂D .

Dazu definieren wir T : C(∂D) −→ C(∂D) durch

(TQ) (x)df=

∫∂D

d2S(y) G(x, y)Q(y) .

T ist beschrankt und kompakt (zeigen wir hier nicht).Nun hilft uns die Fredholmsche Alternative, die ja garan-tiert, daß entweder λ = 1 im Punktspektrum σ(T ) liegt,

wobei dann ein h ∈ C(∂D) existiert mit (T − I)h = 0,oder aber (T − I)Q = f hat eine eindeutige Losungfur jedes f ∈ C(∂D). Ist u definiert wie in (41), wo-bei jetzt Q durch h ersetzt wird, so ist u ≡ 0 ,∀x ∈ D.Da weitherin ∇nu stetig ist bei Randdurchquerung, giltauch ∇nu ≡ 0 ,∀x ∈ ∂D. Partielle Integration zeigt, daßu ≡ 0 außerhalb ∂D. Daher liefern (41) und (42) dieBedingung: 2h(x) ≡ 0 ,∀x ∈ ∂D. Damit ist die erste Al-ternative obsolet, und wir finden tatsachlich Quellen, diemit den moglichen Randbedingungen vertraglich sind.

5. Spurklasse–Operatoren

Wir haben im letzten Abschnitt gelernt, daß kompakteOperatoren schone Eigenschaften haben, die sie auch sehrnutzlich in Anwendungen machen. Ein naheliegende Mo-tivation ist somit, effiziente Kriterien zu finden, die es unspraktisch und einfach erlauben, Operatoren dieser Klassezu identifizieren. Das Ergebnis konnen wir bereits vor-weg nehmen, weil es sich an unsere Betrachtungen schonanschließt: Wir werden zeigen, daß ein IntegraloperatorT ∈ L(L2(M,dµ)), definiert durch

(TQ) (x) =

∫M

dµ(y) G(x, y)Q(y) ,

kompakt ist, wenn K(, ) ∈ L2(M×M,dµ⊗ dµ).Dazu bedarf es einiger Vorbereitung, die auch recht

instruktiv ist. Insbesondere wollen wir das Konzept derSpur aus der gewohnlichen Linearen Algebra auf L(H)ubertragen. Offenbar involviert dies aber unendliche Rei-hen, weshalb sich die Spur nicht fur alle Operatoren de-finieren laßt.

Satz II.19 Sein H ein separabler Hilbert–Raum und|ej〉j∈N eine vONB. Fur jeden Operator L(H) 3 A ≥ 0definieren wir

Sp (A)df=

∞∑j=1

〈ej |Aej〉 .

Die Zahl Sp(A) heißt die Spur von A und ihr Wert istunabhangig von der gewahlten vONB. Die Spur hat fol-gende Eigenschaften: Fur alle L(H) 3 A,B ≥ 0 , λ ∈ R+

gelten

(1) Sp(A+B) = Sp(A) + Sp(B).

(2) Sp(λA) = λSp(A).

(3) Sp(UAU−1) = Sp(A) ,∀U ∈ L(H) : U† = U−1.

(4) Fur 0 ≤ A ≤ B ist Sp(A) ≤ Sp(B).

Beweis II.22 Wir zeigen zuerst, daß die Definitionnicht von der gewahlten vONB abhangt. Seien |ej〉j∈N

Page 15: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

15

und |fj〉j∈N zwei vONB. Mit offensichtlichen Bezeich-nungen rechnen wir nach:

Sp|e〉(A) =

∞∑j=1

〈ej |Aej〉 =

∞∑j=1

∥∥∥∣∣∣√Aej⟩∥∥∥2

=

=

∞∑j=1

∥∥∥∥∥∞∑i=1

∣∣∣fi⟩⟨fi∣∣∣√Aej⟩∥∥∥∥∥

2

=

=

∞∑j=1

( ∞∑i=1

∣∣∣⟨fi∣∣∣√Aej⟩∣∣∣2) =

=

∞∑j=1

( ∞∑i=1

∣∣∣⟨√Afi∣∣∣ej⟩∣∣∣2) =

=

∞∑i=1

∥∥∥∥∥∥∞∑j=1

∣∣∣ej⟩⟨ej∣∣∣√Afi⟩∥∥∥∥∥∥

2

=

=

∞∑i=1

∥∥∥∣∣∣√Afi⟩∥∥∥2

=

∞∑i=1

〈fi|Afi〉 =

= Sp|f〉(A) .

Die Summen durften vertauscht werden, da alle Sum-manden positiv sind.

Die Eigenschaften (1), (2) und (4) uberlassen wir ei-ner Ubung. Es bleibt der Beweis von (3). Dazu bemerkenwir, daß mit |ej〉j∈N auch |Uej〉j∈N eine vONB ist.Daher gilt

Sp(UAU−1

)= Sp|Ue〉

(UAU−1

)= Sp|e〉 (A) = Sp(A) .

Das war es auch schon. ∗–< [; 0)

Def. II.16 A ∈ L(H) heißt Spurklasse–Operator genaudann, wenn Sp(|A|) < ∞. Die Familie von Spurklasse–Operatoren wird mit F1 bezeichnet.

Die Definition laßt eine strukturelle Relevanz dieserOperatorklasse vermuten, weshalb wir die wichtigen Ei-genschaften von F1 darlegen wollen:

Satz II.20 F1 ist ein †–Ideal in L(H), d.h.

(1) F1 ist ein Vektorraum.

(2) Ist A ∈ F1 und B ∈ L(H), so ist auch AB,BA ∈ F1.

(3) Ist A ∈ F1, so ist auch A† ∈ F1.

Beweis II.23 Wir beginnen mit dem Beweis von (1).Fur λ ∈ C gilt |λA| = |λ||A|, also ist F1 abegeschlossenunter Multiplikation mit Skalaren. Seien A,B ∈ F1. DerBeweis, daß dann auch A + B ∈ F1 ist langwieriger.Es seien U, V,W die partiellen Isometrien zu folgendenPolarzerlegungen: A + B = U |A + B| , A = V |A| , B =W |B|. Dann ist (zunachst fur endliche Reihen)

N∑j=1

〈ej | |A+B|ej〉 =

N∑j=1

〈ej |U†(A+B)ej〉 =

≤N∑j=1

∣∣〈ej | U†V |A|ej〉∣∣+

N∑j=1

∣∣〈ej | U†W |B|ej〉∣∣ .

Wir schatzen die erste Summe auf der rechten Seite derUngleichung ab (mit der zweiten verfahren wir genauso):

N∑j=1

∣∣〈ej |U†V |A|ej〉∣∣ =

N∑j=1

〈|A|1/2V †Uej | |A|1/2ej〉 =

≤N∑j=1

∥∥∥|A|1/2V †U |ej〉∥∥∥ · ∥∥∥|A|1/2|ej〉∥∥∥ =

N∑j=1

∥∥∥|A|1/2V †U |ej〉∥∥∥2

1/2 N∑j=1

∥∥∥|A|1/2|ej〉∥∥∥2

1/2

=

N∑j=1

∥∥∥|A|1/2V †U |ej〉∥∥∥2

1/2

· (Sp(|A|))1/2. (43)

Wir mussen uns um den ersten Faktor in der letzten Zeilekummern, was wir sogleich tun: Zunachst erinnern dar-an, daß U eine partielle Isometrie ist, d.h. U ist ei-ne Isometrie auf (Kern(U))⊥. Jeder Vektor der vONB|ej〉j∈N ist entweder in Kern(U) oder im orthogonalenKomplement (Kern(U))⊥. Also

N∑j=1

∥∥∥|A|1/2V †U |ej〉∥∥∥2

≤ Sp|e〉(U†V |A|V †U

)=

≤ SpU |e〉(V |A|V †

).

Wir iterieren unser letztes Argument ein weiteres Mal:Jeder Vektor U |ej〉 ∈ (Kern(U))⊥ ist entweder inKern(V †) oder in (Kern(V †))⊥. Daher gilt weiter:

N∑j=1

∥∥∥|A|1/2V †U |ej〉∥∥∥2

≤ SpV †U |e〉 (|A|) ≤ Sp(|A|) <∞ .

Einsetzen in (80) liefert

N∑j=1

∣∣〈ej |U†V |A|ej〉∣∣ ≤ Sp(|A|) <∞ .

Insgesamt ergibt sich so endlich

N∑j=1

〈ej | |A+B|ej〉 ≤ Sp(|A|) + Sp(|B|) <∞ .

Damit haben wir gezeigt, daß mit A,B ∈ F1 auch A+B ∈F1, und (1) is bewiesen.

Wir kommen nun zum Beweis von (2). Zunachst ein-mal zeigen wir, daß jeder Operator B ∈ L(H) als Line-arkombination von vier unitaren Operatoren geschriebenwerden kann. Es gilt: B = (B+B†)/2− i(B−B†)/2, al-so B kann als Linearkombination zweier selbstadjungier-ter Operatoren geschrieben werden. Sei nun C ∈ L(H)selbstadjungiert, und ohne Einschranung der Allgemein-heit ‖C‖ ≤ 1. Dann sind C ± i

√I − C2 unitare Operato-

ren und es gilt: C = (C+i√I − C2)/2+C− i

√I − C2/2.

Page 16: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

16

Nach dieser Vorarbeit genugt es zu zeigen: Mit A ∈ F1

ist auch UA,AU ∈ F1 , U ∈ L(H) : U† = U−1. Es ist

|UA| =√A†U†UA = |A|, also UA ∈ F1. Zeigen Sie, daß

|AU | = U−1|A|U . Mit (II.19) folgt nun |AU | ∈ F1.Es bleibt (3) zu beweisen. Seien A = U |A| und A† =

V |A†| die Polarzerlegungen von A und A†. Dann gilt:|A†| = V †A† = V †|A|U†. Ist A ∈ F1, so ist auch |A| ∈F1. Wegen (2) ist dann auch |A†| ∈ F1. Und damit auchA† = V |A†| ∈ F1. ∗–< [; 0)

Satz II.21 Sei ‖‖1 definiert durch: ‖A‖1 := Sp|A| , A ∈F1. Damit wird F1 zu einem Banach–Raum mit Norm‖ ‖1. Es gilt ‖A‖ ≤ ‖A‖1.

Der Zusammenhang zwischen den Spurklasse–Operatoren und den kompakten Operatoren ist folgen-der:

Satz II.22 Jeder Operator A ∈ F1 ist kompakt. Einkompakter Operator A ist in F1 genau dann, wenn∑∞j=1 λj < ∞, wobei λj die Eigenwerte von |A| bezeich-

ne.

Beweis II.24 Sei A ∈ F1. Dann ist auch |A|2 ∈ F1.Daher gilt bzgl. einer beliebigen vONB |ej〉j∈N:

Sp(|A|2

)=

∞∑j=1

‖A|ej〉‖2 <∞ .

Sei nun |f〉 ∈ |e1〉, . . . , |en〉⊥ , n ∈ N und ‖|f〉‖ = 1.Dann ist

‖A|f〉‖2 ≤ Sp(|A|2

)−

n∑j=1

‖A|ej〉‖2 ,

da |e1〉, . . . , |en〉, |f〉 immer zu einer ONB ver-vollstandigt werden kann. Also,

sup(‖A|f〉‖ : |f〉 ∈ |e1〉, . . . , |en〉⊥ , ‖|f〉‖ = 1

)n→∞−→ 0 .

Damit konvergiert∑nj=1A|ej〉〈ej |〉 gegen A bezuglich

der durch die Norm induzierten Topologie. Somit ist Akompakt. Der zweite Teil des Satzes folgt aus der kanoni-schen Form kompakter Operatoren und der Beweis bleibtIhnen uberlassen. ∗–< [; 0)

Satz II.23 T ∈ L(H) mit dim(Bild)(T )∞ liegen dichtin F1 bzgl. der Norm ‖ ‖1.

Def. II.17 T ∈ L(H) heißt Hilbert–Schmidt Operator

genau dann, wenn Sp(T †T ) < ∞. Die Familie vonHilbert–Schmidt Operatoren notieren wir mit F2.

Ganz ahnliche Argumente wie wir sie zur Charakteri-sierung von F1 herangezogen haben, fuhren auf

Satz II.24 Seien A,B ∈ F2 und C ∈ L(H) kompakt,außerdem sei T ∈ L(H) mit dim(Bild)(T ) < ∞, und|ej〉j∈N eine beliebige vONB. Wir definieren

(A,B)2df=

∞∑j=1

〈ej |A†Bej〉 .

Dies ist sinnvoll, da die Definition nicht von der gewahl-ten vONB abhangt. Weiterhin sei ‖A‖2 :=

√(A,A)2 =√

Sp(A†A). Schließlich bezeichnen wir die Eigenwertevon |A| mit λj. Dann gilt:

(1) F2 ist ein †–Ideal.

(2) Die Reihe (A,B)2 ist absolut summierbar.

(3) Mit (, )2 wird F2 zu einem Hilbert–Raum.

(4) ‖A‖ ≤ ‖A‖2‖A‖1 und ‖A‖2 = ‖A†‖2.

(5) Jeder A ∈ F2 ist kompakt.

(6) C ∈ F2 genau dann, wenn∑∞j=1 λ

2j <∞.

(7) T liegt dicht in F2 bzgl. der Norm ‖ ‖2.

(8) A ∈ F2 genau dann, wenn A|ej〉j∈N ∈ `2.

(9) Z ∈ F1 genau dann, wenn Z = AB.

Eine wichtige Tatsache uber F2 ist, daß im Falle H =L2(M,dµ) sich der Hilbert–Raum F2 konkret realisierenlaßt.

Satz II.25 Sei (M, µ) ein Maßraum und H =L2(M,dµ). Dann ist A ∈ L(H) genau dann ein Hilbert–Schmidt Operator, wenn es eine Funktion G ∈ L2(M×M,dµ⊗ dµ) gibt mit der Eigenschaft

(AQ) (x) =

∫M

dµ(y) G(x, y)Q(y) ,

‖A‖ 22 =

∫M×M

dµ(x)dµ(y) |G(x, y)|2 .

Beweis II.25 Sei G ∈ L2(M×M,dµ⊗dµ) und AG derassoziierte Integraloperator. Uberzeugen Sie sich, daß AGwohldefiniert ist und ‖AG‖ ≤ ‖G‖L2 .

Sei ej(x)j∈N eine vONB von L2(M,dµ). Dann istei(x)e∗j (y)i,j∈N eine vONB fur L2(M×M,dµ ⊗ dµ).Daher,

G(x, y) =

∞∑i,j=1

αijei(x)e∗j (y) .

Wir definieren

Gn(x, y) =

n∑i,j=1

αijei(x)e∗j (y) .

Page 17: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

17

Per Konstruktion ist Gn , n ∈ N ein Integralkern zu ei-nem Operator AGn mit dim(Bild(AGn)) < ∞. In derTat,

AGn =

n∑i,j=1

αijei(x)(ej(y), ) .

Aus ‖Gn−G‖L2 −→ 0 folgt ‖AGn−AG‖ −→ 0 im Limesn −→ ∞. Somit ist AG kompakt, was wir auch folgen-dermaßen einsehen:

Sp(A †GAG

)=

∞∑j=1

‖AGej‖2 =

=

∞∑i,j=1

|αij |2 = ‖G‖L2 .

Also ist AG ∈ F2 (und daher kompakt) und ‖AG‖2 =‖G‖L2 .

Wir haben gezeigt, daß die Abbildung G −→ AG eineisometrische Einbettung von L2(M×M,dµ⊗ dµ) in F2

ist. Zeigen Sie, daß das Bild von G −→ AG sogar F2 ist.∗–< [; 0)

Bitte beachten Sie, daß obiger Satz eine hinreichendeBedingung fur die Eigenschaft Kompaktheit eines Opera-tors liefert, die sehr nutzlich, allerdings nicht notwendigist. Ebenfalls haben wir eine hinreichende Bedingung furdie Qualifikation, daß ein Operator ein Integraloperatorist, aber auch diese ist nicht hinreichend.

Satz II.26 Sei A ∈ F1 und |ej〉j∈N eine beliebigevONB. Dann konvergiert

∑∞j=1〈ej |Aej〉 absolut und der

Grenzwert ist unabhangig von der vONB–Wahl.

Beweis II.26 Als Ubung. ∗–< [; 0)

Def. II.18 Die Abbildung Sp : F1 −→ C, definiert durchSp(A) =

∑∞j=1〈ej |Aej〉, wobei |ej〉j∈N eine beliebige

vONB sei, heißt die Spur.

Wir listen die relevanten Eigenschaften:

Satz II.27 Fur A ∈ F1, B ∈ L(H) gilt:

(1) Sp() ist linear.

(2) Sp(A†) = (Sp(A))∗.

(3) Sp(AB) = Sp(BA).

Beweis II.27 Die Aussagen (1) und (2) folgen unmit-telbar aus der Spur–Definition und aus der Definition desHilbert–adjungierten Operators. Den Beweis der Aussage(3) uberlassen wir einer Ubung. ∗–< [; 0)

E. Der Spektralsatz fur beschrankte Operatoren

Der Spektralsatz ist eine konkrete Beschreibung derstrukturellen Eigenschaften aller selbstadjungierter Ope-ratoren. Diese strukturelle Aufklarung existiert in ver-schiedenen Formulierungen, die aus zunachst ganz un-terschiedlichen Standpunkten resultieren, aber in derCharakterisierung der maßgeblichen Struktur aquivalentsind.

Wir schranken uns zunachst auf beschrankte selbst-adjungierte Operatoren ein, um dann im nachstenUnterkapitel von der Qualifikation beschrankt hin zuunbeschrankt zu relaxieren. Der fur uns vielleichtzweckmassigste Standpunkt ist folgender: Sei A ∈L(H) , A† = A beschrankt auf dem Hilbert–Raum H.Dann gibt es immer ein Maß µ auf einem Maßraum Mund ein U ∈ L(H) , U† = U−1, erklart durch

U : H −→ L2(M,dµ) ,(UAU−1f

)(x) = F (x)f(x) ,

wobei F eine beschrankte reellwertige meßbare Funktionauf M ist.

Dieser Standpunkt ist so attraktiv, weil er eine Ver-allgemeinerung des entsprechenden Sachverhaltes liefert,der uns aus der Linearen Algebra bekannt ist fur endlich-dimensionale Vektorraume: Jede selbstadjungierte n ×n(n ∈ N) Matrix ist diagonalisierbar. Genauer: Sei Vein Vektorraum uber C und A : V −→ V eine selbstad-jungierte lineare Abbildung. Dann gibt es eine unitarelineare Abbildung U : V −→ Cn und reelle Zahlenλ1, . . . , λn ∈ R, so daß(

UAU−1v)j

= λjvj , j ∈ 1, . . . , n ,

fur jeden Vektor Cn 3 v = (v1, . . . , vn).In der Physik wird M in aller Regel eine Vereini-

gung von Kopien von R sein und F ≡ x. Das Haupt-augenmerk liegt daher auf der Konstruktion geeigne-ter Maße. Bevor wir diesen Weg gedanklich beschreiten,beschaftigen wir uns im folgenden Abschnitt damit, wiewir h : L(H) −→ L(H) sinnvoll erklaren fur stetige Funk-tionen h angewandt auf selbstadjungierte beschrankteOperatoren.

1. Stetiges Funktionalkalkul

Die dringlichste Frage ist wohl: gegeben ein beschrank-ter Operator A ∈ L(H) ohne weitere Qualifikation. Furwelche Funktionen f : L(H) −→ L(H) konnen wir f(A)uberhaupt definieren? Zunachst einmal naiv, lassen Sieuns eine Wunschliste aufstellen. Bestimmt hatten wir ausBequemlichkeit gerne Folgendes: Sei f(x) =

∑Nj=1 ajx

j

ein Polynom, dann soll f(A) =∑Nj=1 ajA

j sein. Nehmen

wir einmal an, daß f(x) =∑∞j=0 cjx

j eine Potenzrei-

he mit Konvergenzradius R ist. Falls ‖A‖ < R, dannkonvergiert

∑∞j=0 cjA

j in L(H), also ist es nur naturlich

Page 18: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

18

f(A) =∑∞j=0 cjA

j zu setzen. Beachten Sie, daß in die-sem Fall f analytisch auf einem Definitionsbereich ist,der ganz σ(A) beinhaltet.

Welche strukturelle Unterstutzung kommt nun von derQualifikation selbstadjungiert? Sei P ein Polynom undA ∈ L(H) , A† = A beschrankt. Dann ist ‖P (A)‖ =supλ∈σ(A) |P (λ)|. Dann erlaubt der zentrale Satz uber be-

schrankte lineare Transformationen4 , das oben skizzierteFunktionalkalkul auf stetige Funktionen auszuweiten.

Wir beginnen mit einem Lemma, das wieder fur be-schranke aber sonst beliebe Operatoren A gilt:

Lemma II.7 Sei P (x) =∑Nj=0 ajx

j, und P (A) =∑Nj=0 ajA

j. Dann gilt σ(P (A)) = P (λ) : λ ∈ σ(A).

Beweis II.28 Sei λ ∈ σ(A). Da x = λ eine Nullstellevon P (x) − P (λ) ist, folgt P (x) − P (λ) = (x − λ)Q(x),und damit P (A) − P (λ) = (A − λ)Q(A). Da (A − λ)nicht invertiert werden kann, besitzt auch P (A) − P (λ)kein Inverses. Damit ist aber P (λ) ∈ σ(P (A)).

Umgekehrt, sei µ ∈ σ(P (A)) und λ1, . . . , λN die Null-stellen von P (x) − µ. Dann gilt P (x) − µ = a(x −λ1) · · · (x − λN ). Ware nun λ1, . . . , λN 3 σ(A), so exi-stierte

(P (A)− µ)−1

= a−1 (A− λ1)−1 · · · (A− λN )

−1.

Dies kann aber nicht sein, da nach Voraussetzung µ ∈σ(P (A)). Also gibt es wenigstens ein i ∈ 1, . . . , N mitλi ∈ σ(A), also µ = P (λ) fur ein λ ∈ σ(A). ∗–< [; 0)

Wir brauchen noch ein weiteres Lemma. Hier wird ganzwesentlich benutzt, daß fur selbstadjungierte OperatorenA der Spektralradius, r(A) := supλ∈σ(A) |λ|, gleich der

Norm von A ist, also r(A) = ‖A‖, was wir nicht zeigen,aber zum Beweis des folgenen Lemmas benutzen werden.

Lemma II.8 Sei A ein beschrankter selbstadjungierterOperator, und P ein Polynom. Dann gilt: ‖P (A)‖ =supλ∈σ(A) |P (λ)|.

Beweis II.29 Wir rechnen:

‖P (A)‖2 =∥∥P (A)†P (A)

∥∥ = ‖(P ∗P ) (A)‖ !=

= supλ∈σ(P∗P (A))

|λ| II.7=

= supλ∈σ(A)

|P ∗P (λ)| =

=

(sup

λ∈σ(A)

|P (λ)|

)2

.

Daraus folgt unmittelbar die Behauptung. ∗–< [; 0)

4 Zur Erinnerung: Sei T eine beschrankte lineare Transformationvon einem normierten Vektorraum (V1, ‖‖1) in einen vollstandi-gen normierten Raum (V2, ‖‖2). Dann kann T eindeutig erwei-

tert werden zu einer beschrankten linearen Transformation, T ,die die Vervolstandigung von V1 auf (V2, ‖ ‖2) abbildet.

Jetzt sind wir endlich in der Lage, obige Frage zu be-antworten.

Satz II.28 (Stetiges Funktionalkalkul) Sei H einHilbert–Raum und A ∈ L(H) selbstadjungiert. Dann gibtes genau eine Abbildung Φ : C(σ(A)) −→ L(H) mit denfolgenden Eigenschaften:

(1) Φ ist ein algebraischer †–Homomorphismus, d.h.

Φ(fg) = Φ(f)Φ(g) ,

Φ(λf) = λΦ(f) (λ ∈ C) ,

Φ(1) = I ,

Φ(f∗) = Φ(f)† .

(2) Φ ist stetig, d.h. ‖Φ(f)‖L(H) ≤ C‖f‖∞ , C ∈ R.

(3) Sei f die Funktion f(x) = x, dann ist Φ(f) = A.

(4) Gilt A|ψ〉 = λ|ψ〉, so ist Φ(f)|ψ〉 = f(λ)|ψ〉.

(5) σ[Φ(f)] = f(λ) : λ ∈ σ(A).

(6) Ist f ≥ 0, so ist Φ(f) ≥ 0.

(7) ‖Φ(f)‖ = ‖f‖∞.

Die Idee fur den Beweis von Satz II.28 ist ganz ein-fach. Zunachst einmal ist Φ(P ) fur jedes Polynom P (x)wegen (1) und (3) eindeutig bestimmt. Lemma II.7 istbereits ein Spezialfall der zentralen Gleichung (5). DerSatz von Weierstrass liefert uns sofort folgenden Befund:Die Menge der Polynome ist dicht in C(σ(A)). Im Zen-trum des Beweises steht daher die Aussage von LemmaII.8. Denn mit der Fußnote 4 folgt dann bequem die Exi-stenz und Eindeutigkeit der Abbildung Φ.

Beweis II.30 Sei P ein Polynom und Φ(P ) = P (A).Dann ist ‖Φ(P )‖L(H) = ‖P‖C(σ(A)). Somit hat Φ genaueine lineare Erweiterung auf die abgeschlossene Hulle derPolynome in C(σ(A)). Die Polynome bilden eine Algebra,die die 1 enthalt, abgeschlossen unter komplexer Konju-gation ist, und die die Punkte von σ(A) separiert. Damitist die abgeschlossene Hulle der Polynome ganz C(σ(A)).Die Aussagen (1), (2), (3), (7) folgen direkt. Fur (4) be-merken wir: Φ(P )|ψ〉 = P (A)|ψ〉 = P (λ)|ψ〉. Diese Tat-sache laßt sich wegen der Stetigkeit auf ganz C(σ(A)) aus-dehnen. Fur (6) bemerken wir: Sei f ≥ 0yf = g2 , g ∈C(σ(A)) reell. Folglich ist Φ(f) = Φ(g2) = Φ(g)Φ(g) und,da Φ(g) selbstadjungiert ist, weiter Φ(f) = Φ(g)†Φ(g) ≥0. Die Aussage (5) uberlassen wir einer Ubung (einenSpezialfall haben wir ja in II.7 betrachtet). ∗–< [; 0)

2. Die Spektralmaße

Sei H ein Hilbert–Raum und A ∈ L(H) , A† = A be-schrankt. Sei |ψ〉 ∈ H. Dann ist die Abbildung C(σ(A)) 3f −→ 〈ψ|f(A)ψ〉 ein semi–positiv definites Funktio-nal auf C(σ(A)). Das Riesz–Markov Theorem garantiert

Page 19: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

19

dann die Existenz eines eindeutig bestimmten Maßes µψauf der kompakten Menge σ(A), so daß

〈ψ|f(A)ψ〉 =

∫σ(A)

dµψ f(λ) .

Def. II.19 Das Maß µψ heißt dasmit dem Vektor ψ assoziierte Spekralmaß.

Die einfachste Sache, die wir ausgestattet mit demMaß µψ anstellen konnen, ist das Funktionalkalkul aufdie Menge der beschrankten Borel–Funktionen auf R, be-zeichnet mit B(R), auszuweiten.

Satz II.29 (Spektralsatz, Standpunkt: Funktio-nalkalkul) Sei H ein Hilbert–Raum und A,B ∈L(H) , A† = A beschrankt. Es gibt genau eine Abbildung

Φ : B(R) −→ L(H) mit folgenden Eigenschaften:

(1) Φ ist ein algebraischer †–Homomorphismus.

(2) Φ ist stetig bzgl. der Norm: ‖Φ(f)‖L(H) ≤ ‖f‖∞.

(3) Sei f die Funktion f(x) = x. Dann gilt Φ(f) = A.

(4) Fur fn(x) −→ f(x) punktweise und ‖fn‖∞ be-

schrankt, gilt: Φ(fn) −→ Φ(f) bzgl. der starkenTopologie.

(5) Sei A|ψ〉 = λ|ψ〉. Dann ist Φ(f)|ψ〉 = f(λ)|ψ〉.

(6) Fur f ≥ 0 gilt auch Φ(f) ≥ 0.

(7) Falls AB = BA, dann gilt Φ(f)B = BΦ(f).

Beweis II.31 Im wesentlichen wie Satz II.28, ist abernicht vollkommen trivial, da wir intelligent den Ubergangvom stetigen Funktionalkalkul zum meßbaren Funktional-kalkul vollziehen mussen. ∗–< [; 0)

Def. II.20 Ein Vektor |ψ〉 ∈ H heißt zyklischer Vektorvon A ∈ L(H), wenn endliche Linearkombinationen vonElementen aus An|ψ〉n∈N dicht in H liegen.

Diese Eigenschaft wird leider nicht von allen Opera-toren geteilt, aber wenn ein Operator einen zyklischenVektor besitzt, so ist das ungemein nutzlich:

Lemma II.9 Sei A ∈ L(H) , A† = A beschrankt, und|ψ〉 ∈ H ein zyklischer Vektor von A. Dann gibt es einenunitaren Operator U : H −→ L2(σ(A),dµψ) mit der Ei-genschaft:(UAU−1f

)(λ) = λf(λ) , f ∈ L2(σ(A),dµψ) , λ ∈ R.

Die Gleichheit bezieht sich hier auf die Gleichheit vonElementen aus L2(σ(A),dµψ).

Beweis II.32 Wir definieren U durch UΦ(f)|ψ〉 = f ,wobei f ∈ C(σ(A)). Wir zeigen zuerst, daß U wohldefi-niert ist. Dazu rechnen wir:

‖Φ(f)|ψ〉‖2 = 〈ψ|Φ†(f)Φ(f)ψ〉 II.28:(1)= 〈ψ|Φ(f∗f)ψ〉 R−M

=

=

∫σ(Φ(f∗f))

dµψ |f(λ)|2 .

Also, ist f = g bzgl. µψ fast uberall, dann gilt auchΦ(f)|ψ〉 = Φ(g)|ψ〉. Damit ist U wohldefiniert aufΦ(f)|ψ〉 : f ∈ C(σ(A)) und U erhalt die Norm. Danach Voraussetzung |ψ〉 ein zyklischer Vektor ist folgt

weiterhin Φ(f)|ψ〉 : f ∈ C(σ(A)) = H. Wir konnenwieder die Fußnote 4 heranziehen und notieren: U kannerweitert werden zu einer isometrischen Abbildung vonH nach L2(σ(A),dµψ). Da C(σ(A)) dicht liegt in L2,folgt Bild(U) = L2(σ(A),dµψ). Es bleibt: Sei f ∈C(σ(A)) , λ ∈ σ(A). Dann gilt,(

UAU−1f)

(λ)Df= (UAΦ(f)) (λ)

II.28:(3)=

= (UΦ(xf)) (λ)Df=

= λf(λ) .

Dieses Argument kann von f ∈ C(σ(A)) auf f ∈ L2 er-weitert werden. ∗–< [; 0)

Lemma II.10 Sei H ein separabler Hilbert–Raum undA ∈ L(H) selbstadjungiert. Dann gibt eine Zerlegung vonH in eine direkte Summe: H = ⊕Nj=1Hj, wobei N ∈ Noder N =∞, so daß gilt:

(1) Aus |ψ〉 ∈ Hj folgt A|ψ〉 ∈ Hj fur jedes j.

(2) ∀j ∃ |φj〉 ∈ Hj : Hj = f(A)|φj〉 : f ∈ C(σ(A)).

Beweis II.33 Als Ubung mit Zorn. ∗–< [; 0)

Die letzten beiden Lemmata lassen sich machtig kom-binieren zu der Version des Spektralsatzes, die fur unsam transparentesten und praktischtesten ist:

Satz II.30 (Spektralsatz, Standpunkt: Lieblings-version von Physikerinnen und Physikern oderMultiplikationsoperator–Form) Sei H ein separablerHilbert–Raum, A ∈ L(H) beschrankt und selbstadjun-giert. Dann gibt es Maße µjNj=1 , (N = 1, 2, . . . oder∞) auf σ(A) und einen unitaren Operator mit

U : H −→N⊕j=1

L2(R,dµj) ,

(UAU−1Ψ

)j

(λ) = λΨj ,Ψj ∈ L2(R,dµj) , λ ∈ σ(A) .

Hierbei gilt folgende Notation: Ψ ∈ ⊕Nj=1L2(R,dµj) ist

das N–Tupel (Ψ1(λ), . . . ,ΨN (λ)). Diese Realisierung vonA heißt Spektraldarstellung.

Page 20: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

20

Beweis II.34 Die Idee ist: Sie benutzen Lemma II.10zur Zerlegung von H und wenden Lemma II.9 auf jedenTeilraum an. Bitte fullen Sie die Lucken. ∗–< [; 0)

Die Formulierung des Spektralsatzes besagt einfach,daß jeder beschrankte selbstadjungierte Operator alsMultiplikationsoperator auf einem geeigneten Maßraumdargestellt werden kann.

Def. II.21 Die Maße dµj heißen Spektralmaße. Sie sindgerade die dµψ fur geeignete ψ.

Diese Maße sind nicht eindeutig bestimmt, was unsnoch beschaftigen wird. Zunachst ein paar Beispiele:

Bsp. II.8 Sei A eine selbstadjungierte (n × n)–Matrix(n ∈ N). Das Spektraltheorem fur endlichdimensionaleVektorraume ist Ihnen ja aus der Linearen Algebra be-kannt. Zur formlosen Erinnerung: Es besagt, daß es zu Aeinen orthonormalen Satz von Eigenvektoren ψ1, . . . , ψnmit Aψj = λjψj , j ∈ 1, . . . , n gibt.

Wir nehmen an, daß alle Eigenwerte λ1, . . . , λn dis-junkt sind. Die Frage, die uns in diesem Beispiel inter-essiert ist, welcher Maßraum den Satz II.30 auf das ent-sprechende Resultat aus der Linearen Algebra reduziert?Wir probieren folgendes: Sei µ :=

∑nj=1 δ(x− λj), wobei

δ(x) ein Dirac–Maß bezeichne. L2(R,dµ) ist dann ein-fach Cn: f ∈ L2 ist durch f = (f(λ1), . . . , f(λn)) gege-ben. Probieren Sie es aus! Der Funktion λf entsprichtdas n–Tupel (λ1f(λ1), . . . , λnf(λn)).

Dieses Beispiel eignet sich auch dafur, die Beliebig-keit des Maßes explizit aufzuzeigen: Sei namlich µ :=∑nj=1 ajδ(x − λj) mit aj > 0 , j ∈ 1, . . . , n. A kann

dann auch als Multiplikationsoperator auf L2(R,dµ) dar-gestellt werden.

Weiterhin sehen wir an diesem Beispiel, wann mehrals ein Maß benotigt wird: Ein selbstadjungierter Opera-tor A auf einem Hilbert–Raum H mit dim(H) <∞ kanngenau dann als Multiplikationsoperator auf L2(R,dµ)dargestellt werden, wenn A ausschließlich disjunkte Ei-genwerte besitzt.

Bsp. II.9 Wir wissen bereits, daß kompakte Operatorenviele Eigenschaften mit ihren Verwandten aus der Linea-ren Algebra teilen. Obiges Beispiel sollte also fur kompak-te Operatoren eine muhelose Verallgemeinerung besitzen.Dem ist auch so: Sei A kompakt und selbstadjungiert.Das Hilbert–Schmidt Theorem (Satz II.17) garantiert dieExistenz eines vONS von Eigenvektoren ψjnj=1 , n ∈ N,mit der Eigenschaft: Aψj = λjψj. Sind alle Eigenwer-te disjunkt, so eignet sich µ :=

∑∞j=1 δ(x − λj)/2

n alsSpektralmaß.

Bsp. II.10 Wir betrachten den Differentialoperator−id/dx auf L2(R,dx). Um ganz ehrlich zu sein, dabeihandelt es um einen unbeschrankten Operator und als sol-cher gehort er nicht in diesen Abschnitt. Allerdins werdenwir spater sehen, daß auch fur unbeschrankte Operato-ren eine Aussage ganz analog zu Satz II.30 gilt. Wir er-lauben uns daher eine gesunde Portion an Naivitat und

konzentrieren uns auf die unitare Transformation: Ge-sucht wird also ein unitaren Operator U und ein Maß dµ(es stellt sich an anderer Stelle heraus, daß lediglich einµ gebraucht wird) mit U : L2(R,dx) −→ L2(R,dµ(k)).Sei f(x) := (U−1g(k))(x) , g ∈ L2(R,dµ(k)). Dieentscheidende Gleichung des Spektralsatzes II.30 lau-tet dann: (U(−id/dx)f(x))(k) = k(Uf(x))(k) , k ∈σ(−id/dx). Die gesuchte Transformation ist die Fourier–Transformation:

(Uf(x))(k) = (2π)−1/2

∫R

dx exp (ixk)g(k) .

Die Fourier–Transformation ist also ein Beispiel fur eineSpektraldarstellung.

Wir kommen nun zu der bereits angesprochenen Fra-ge, wann A unitar aquivalent zu einem Multiplikationso-pearator auf L2(R,dµ) ist, also wann wir mit nur einemSpektralmaß auskommen. Beispiel II.8 hat uns gelehrt,daß im Falle endlich–dimensionaler Vektorraume dies derFall ist, wenn alle Eigenwerte von A verschieden sind.

Def. II.22 Ein beschrankter selbstadjungierter OperatorA heißt nicht–entartet genau dann, wenn A unitar aqui-valent zur Multiplikation mit λ auf L2(R,dµ) fur ein Maßµ ist.

Intrinsische Charakterisierungen sind:

Satz II.31 Die folgenden Aussagen sind aquivalent:

(1) A ist nicht–entartet.

(2) A hat einen zyklichen Vektor.

(3) B : AB −BA = 0 ist eine Abelsche Algebra.

Als nachstes wenden wir uns der Nichteindeutigkeitdes Spektralmaßes fur nicht–entartete Operatoren zu.In Beipiel II.8 haben wir gesehen, daß akzeptable Ma-ße (Anschluß an die Lineare Algebra) von der Form

µ =∑Nj=1 αjδ(x − λj) , αj > 0 , j ∈ 1, . . . , n sind.

Diese Einsicht hat eine naturliche Verallgemeinerung aufden Fall unendlich–dimensionaler Vektorraume. Wir neh-men an, daß dµ auf R gegeben ist. Sei F eine meßbareFunktion, die positiv und fast uberall von Null verschie-den ist bzgl. des Maßes µ, außerdem soll sie lokal vomTyp L1(R,dµ) sein, d.h.

∫K dµ |F | < ∞ ,K ⊂ R kom-

pakt. Dann ist auch dν = Fdµ ein Borel Maß, und dieAbbildung

U : L2(R,dµ) −→ L2(R,dν) ,

(Uf) (λ) =√F (λ)f(λ) (44)

ist unitar (F 6= 0 fast uberall) und λU(f) = U(λf).Folglich kann ein Operator A mit einer Spekraldarstel-lung bzgl. µ genau so gut bzgl. ν dargestellt werden. Derentscheidende Fortschritt gelingt nun dank eines Satzesvon Radon–Nikodym, der besagt, daß dν = Fdµ mitF 6= 0 fast uberall gilt genau dann, wenn µ und ν diegleichen Nullmengen haben (also gleiche Teilmengen vomMaß Null). Dies motiviert folgende Definition:

Page 21: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

21

Def. II.23 Zwei Borel–Maße µ, ν sind genau dannaquivalent, wenn sie die gleichen Nullmengen haben. Ei-

ne Aquivalenzklasse [µ] heißt Maßklasse.

Die Nichteindeutigkeit von Spekralmaßen erfahrt nunfolgende Aufklarung:

Satz II.32 Seien µ, ν Borel–Maße auf R mit beschrank-tem Trager. Sei Aµ auf L2(R,dµ) gegeben durch(Aµf)(λ) = λf(λ), und Aν entsprechend auf L2(R,dν).Dann sind Aµ und Aν genau dann unitar aquivalent,wenn µ und ν aquivalente Maße sind.

Die Verallgemeinerung auf den Fall mit Entartung spa-ren wir uns hier, auch wenn diese in der Physik durchauswichtig ist, nimmt es hier zuviel Platz weg.

3. Spektralprojektoren

Im letzten Abschnitt haben wir das Funktionalkalkulf −→ f(A) fur jede Borel–Funktion f und jeden be-schrankten selbstadjungierten Operator A angesprochen.Die wichtigsten Funktionen, die wir beim Ubergang vomstetigen zum meßbaren Funktionalkalkul gewonnen ha-ben, sind die charakteristischen Funktionen auf Mengen.

Def. II.24 Sei A ein beschrankter selbstadjungierterOperator und Ω eine Borel–Menge in R. Wir definiereneinen Spektralprojektor von A durch PΩ := χΩ(A).

Wie die Definition suggeriert: PΩ ist eine orthogonaleProjektion, da χ2

Ω = χΩ gilt. Die wichtigen Eigenschaftender Familie PΩ := PΩ : Ω ist eine Borel–Menge sinddie Folgenden:

Lemma II.11 Die Familie PΩ von Spektralprojekto-ren eines beschrankten selbstadjungierten Operators Ahat die folgenden Eigenschaften:

(1) Jedes PΩ ist eine orthogonale Projektion.

(2) P∅ = 0.

(3) Sei Ω = ∪∞j=1Ωj mit Ωi ∩ Ωj = ∅ ,∀i 6= j. Dann

PΩ = limN→∞

∞∑j=1

PΩj .

(4) PΩiPΩj = PΩi∩Ωj ,∀i, j .

Dies erinnert schon sehr an die ein Maß definierendenEigenschaften. Kein Zufall, denn

Def. II.25 Eine Familie von Projektoren, die(1)–(3) von Lemma II.11 erfullt, heißt einprojektiorwertiges Maß.

Naturlich konnen wir bzgl. eines projektorwertigenMaßes auch integieren. Sei PΩ ein projektorwertiges Maß,dann ist 〈φ|PΩφ〉 das gewohnliches Maß fur jedes φ. Insuggestiver Manier werden wir in den Praliminarien dieIntegration bzgl. dieses Maßes ganz barock mit d〈φ|PΩφ〉bezeichnen.

Satz II.33 Sei PΩ ein projektorwertiges Maß und f einebeschrankte Borel–Funktion auf Trager(PΩ). Dann gibtes einen eindeutig bestimmten Operator B, den wir mit∫

dPλ f(λ) bezeichnen, so daß

〈Φ|BΦ〉 =

∫d〈φ|Pλφ〉 f(λ) ,∀|Φ〉 ∈ H . (45)

Bsp. II.11 Ist A ein selbstadjungiertert Operator, undPΩ das zugehorige projektorwertige Maß, so gilt:

A =

∫λ∈σ(A)

dPλ λ ,

wie wir recht schnell einsehen konnen in einer ruhigenMinute.

Satz II.34 (Spektralsatz, Standpunkt: Auch eineLieblingsversion von Physikerinnen und Physi-kern, oder kurz: der maßtheoretische Blickwin-kel) Zwischen (beschrankten) selbstadjungierten Opera-toren A und beschrankten projektorwertigen Maßen PΩgibt es folgende eineindeutige Beziehung:

A −→ PΩ = χΩ(A) , PΩ −→ A =

∫dPλ λ .

Dieser Satz ist nicht nur machtig, sondern auch ro-bust gegen eine wichtige Verallgemeinerung, die fur denAufbau der Quantenmechanik essentiell ist: Die Verall-gemeinerung auf unbeschrankte Operatoren.

Spektralprojektoren sind nutzlich zur Untersuchungdes Spektrums eines selbstadjungierten Operators:

Satz II.35 λ ∈ σ(A) genau dann, wenn fur jedes ε > 0folgendes gilt:

P(λ−ε,λ+ε) 6= 0 .

Beweis II.35 Die wesentliche Idee des Beweises beruhtauf folgender Feststellung:∥∥∥(A− λI)

−1∥∥∥ = [d(λ, σ(A))]

−1.

Die Ausarbeitung uberlassen wir einer Ubung. ∗–< [; 0)

Satz II.35 motiviert folgende Klassifikation des Spek-trums:

Def. II.26 Wir nennen

σkont(A)df=λ ∈ σ(A)

∣∣∣dim(Bild(P(λ−ε,λ+ε))) =∞ ,∀ε > 0

das kontinuierliche Spektrum, und

σdisk(A)df= σ(A) \ σkont(A)

das diskrete Spektrum von A.

Page 22: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

22

Damit ist σ(A) zerlegt in zwei notwendigerweise dis-junkte Untermengen. Dabei ist σdisk nicht unbedingt ab-geschlossen, aber:

Satz II.36 σkont ist abgeschlossen.

Beweis II.36 Sei σkont(A) 3 λn −→ λ, und Iδ := (λ −δ, λ + δ). Nach Voraussetzung gibt es immer n ∈ N undε > 0, so daß Iε := (λn − ε, λn + ε) ⊂ Iδ. Damit istdim(Bild(PIδ(A))) =∞, also λ ∈ σkont(A). ∗–< [; 0)

Es folgenden zwei Satze geben alternative Charakte-risierungen von σdisk und σkont. Die Beweise uberlassenwir den Ubungen.

Satz II.37 λ ∈ σdisk genau dann, wenn die folgendenbeiden Kriterien gleichzeitig erfullt sind:

(1) ∃ε > 0, so daß (λ− ε, λ+ ε) ∩ σ(A) = λ.

(2) dim(|ψ〉 ∈ H : A|ψ〉 = λ|ψ〉) <∞.

Satz II.38 (Weyls Kriterium) Sei A ein beschrankterselbstadjungierter Operator. Dann ist λ ∈ σ(A) genaudann, wenn es eine Folge |ψj〉j∈N gibt mit ‖|ψj〉‖ = 1und limj→∞ ‖(A − λI)|ψj〉‖ = 0. λ ∈ σkont genau dann,wenn die Folgenglieder |ψj〉j∈N alle orthogonal gewahltwerden konnen.

F. Unbeschrankte Operatoren

Wir werden schon recht fruh sehen, daß wichtige Ob-servablen in der Quantenmechanik durch unbeschrank-te Operatoren beschrieben werden. Nach einem Satzvon Hellinger–Toeplitz gilt fur einen auf dem gesamtenHilbert–Raum H definierten Operator A mit der Eigen-schaft 〈φ|Aψ〉 = 〈Aφ|ψ〉 , |φ〉, |ψ〉 ∈ H, daß dieser be-schrankt ist. Daher wird ein unbeschrankter Operatornur auf einer Untermenge von H definiert sein.

1. Grundbegriffe

Praziser, ein Operator5T auf einem Hilbert–Raum Hist eine Abbildung von D(T ) ⊂ H −→ H, wobei der Un-terraum D(T ) der Definitionsbereich des Operators Theißt. Wir nehmen immer an, daß der Definitionsbereichdicht in H liegt, D(T ) = H. Damit ist der Definitions-bereich eines (unbeschrankten) Operators ein wichtigesCharakteristikum desselben und gehort eigentlich in dieDefinition des Operators, neben dessen expliziten Wir-kung auf Vektoren im Definitionsbereich. Diese buchhal-terische Muhe wird in der Physik nicht gepflegt.

5 Wir weisen lediglich auf die Qualifikation ’beschrankt’ explizithin, ansonsten handelt es sich um einen unbeschrankten Opera-tor.

Bsp. II.12 Der Ortsoperator Sei H = L2(R) und

D(T )df=

f ∈ L2(R) :

∫R

dx x2|f(x)|2 <∞.

Fur f ∈ D(T ) definieren wir:(Tf)(x) := xf(x).Naturlich ist T unbeschrankt, wir brauchen ja lediglichFunktionen in D(T ) zu wahlen, deren Trager sich bisnach ±∞ erstreckt. Wir konnen also ‖Tf‖ so groß ma-chen, wie wir wollen und gleichzeitig ‖f‖ = 1 haben.

Nun macht xf(x) auch Sinn, wenn f /∈ D(T ), aberliegt dann halt nicht in L2(R). Wollen wir aus bestimm-ten Grunden, oder mussen gar, auf den Hilbert–RaumL2(R) einschranken, so erfordert dies, den Definitionsbe-reich von T zweckmaßig einzuschranken. Der hier ange-gebene Definitionsbereich ist tatsachlich der großt mogli-che, fur den das Bild(T ) noch in L2(R) liegt.

Von von Neumann stammt folgender nutzliche Begriffzum Studium von linearen Abbildungen, der sich als be-sonders nutzlich zur Charakterisierung von unbeschrank-ten Operatoren erweist.

Def. II.27 Unter dem Graph Γ(T ) einer linearen Abbil-dung T verstehen wir folgende Menge: (f, Tf) : f ∈D(T ) ⊂ H × H. T heißt ein abgeschlossener Operator,wenn Γ(T ) eine abgeschlossene Untermenge von H ×Hist.

Def. II.28 Seien T1 und T Operatoren auf H. GiltΓ(T1) ⊃ Γ(T ), dann heißt T1 eine Erweiterung von T ,kurz: T1 ⊃ T .

Dies ist offenbar aquivalent zu: T1 ⊃ T genau dann, wennD(T1) ⊃ D(T ) und T1f = Tf , ∀f ∈ D(T ).

Def. II.29 Ein Operator T heißt abschließbar, wenn Teine abgeschlossene Erweiterung hat. Jeder abschließbareOperator T hat eine kleinste abgeschlossene Erweiterung,die wir den Abschluß von T nennen und mit T bezeich-nen.

Es ist verfuhrerisch, eine abgeschlossene Erweiterungvon T zu finden, im dem wir den Abschluß des entspre-chenden Graphen in H × H suchen. Im allgemeinen istdies keine gute Strategie, da Γ(T ) nicht der Graph ei-nes Operators zu sein braucht. Wir werden weiter unteneinsehen, daß dies aber kein Drama fur uns darstellt.

Lemma II.12 Sei T ein abschließbarer Operator. Danngilt: Γ(T ) = Γ(T ).

Beweis II.37 Sei S eine beliebige abgeschlossene Er-weiterung von T , nicht notwendigerweise die kleinste.Dann gilt Γ(T ) ⊂ Γ(S). Wir definieren einen Opera-tor R durch (1) den Definitionsbereich D(R) = H 3|ψ〉 : (|ψ〉, |φ〉) ∈ Γ(T ) (|φ〉 = T |ψ〉), und (2) durch dieVorschrift: R|ψ〉 = |φ〉, wobei |φ〉 ∈ H durch die Forde-

rung (|ψ〉, |φ〉) ∈ Γ(T ) eindeutig bestimmt ist. Offenbar

Page 23: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

23

ist Γ(R) = Γ(T ), also ist R eine abgeschlossene Erwei-terng von T . Folglich gilt auch R ⊂ S. Nun ist S abereine beliebige abgeschlossene Erweiterung. Mit anderenWorten R ⊂ S gilt fur alle abgeschlossenen Erweiterun-gen. Das ist aber nur moglich, wenn R = T . ∗–< [; 0)

Und gleich noch ein Beispiel zu den eben eingefuhrtenKonzepten:

Bsp. II.13 Sei H = L2(R) ,D(T ) = C∞0 (R), die be-liebig oft stetig differenzierbaren Funktionen mit kom-pakten Trager, und D(T1) = C1

0(R), die einmal ste-tig differenzierbaren Funktionen mit kompakten Trager.Sei (Tf)(x) = if ′(x) ,∀f ∈ D(T ) und (T1f)(x) =if ′(x) ,∀f ∈ D(T1). T1 ist eine Erweiterung von T , hierbeschranken wir uns aber bescheiden auf die Aussage, daßΓ(T ) ⊃ Γ(T1). Weiter unten zeigen wir, daß T ein sym-metrischer Operator und daher abschließbar ist, worausfolgt T ⊃ T1. Sei jε(x) eine Approximation der Eins,konkret: jε(x) := j(x/ε)/ε, wobei j(x) eine positive, belie-big oft differenzierbare Funktion auf dem Trager (−1, 1)bezeichne, mit der weiteren Eigenschaft:

∫R dx j(x) = 1.

Fur φ ∈ D(T1) setzen wir

φε(x)df=

∫R

dt jε(x− t)φ(t) .

Da jε(x) einen kompakten Trager hat und beliebig oft dif-ferenzierbar ist, gilt: φε ∈ C∞0 (R), also φε ∈ D(T ) ∀ε ∈R+. Es ist

|φε(x)− φ(x)| ≤∫R

dt jε(x− t) |φ(t)− φ(x)|

(sup

t:|x−t|≤ε|φ(t)− φ(x)|

)∫R

dt jε(x− t)

= supt:|x−t|≤ε

|φ(t)− φ(x)| .

Da φ einen kompakten Trager hat, ist φ gleichmaßigstetig. Daher konvergiert φε ∈ D(T ) gleichmaßig gegenφ ∈ D(T1) in L2(R). Und ahnlich,

(Tφε)(x) =

∫R

dt (Tjε)(x− t)φ(t)

=

∫R

dt (−i)

(d

dtjε(x− t)

)φ(t)

=

∫R

dt jε(x− t)(T1φ)(t)

L2(R)−→ (Tφ)(x) .

Insgesamt haben wir also gezeigt, daß φεL2(R)−→ φ und

TφεL2(R)−→ Tφ fur jedes φ ∈ D(T1). Daraus folgt Γ(T ) ⊃

Γ(T1). ∗–< [; 0)

Das Konzept des adjungierten Operators kann direktauf unbeschrankte Operatoren ubertragen werden:

Def. II.30 Sei T ein linearer Operator auf dem Hilbert–Raum H, dessen Definitionsbereich D(T ) dicht in H ist.Sei D(T †) die Menge der |φ〉 ∈ H fur die es ein |η〉 ∈ Hgibt, so daß

〈Tψ|φ〉 = 〈ψ|η〉 ∀|ψ〉 ∈ D(T ) . (46)

Fur jedes |φ〉 ∈ D(T †) definieren wir: T †|φ〉 = |η〉. T †heißt der adjungierte Opertator zu T .

Nach dem Satz II.4 von Riesz ist |φ〉 ∈ D(T †) genau dann,wenn |〈Tψ|φ〉| ≤ C‖|ψ〉‖ ∀|ψ〉 ∈ D(T ). Wir bemerkennoch: S ⊂ T y T † ⊂ S†. Die Forderung, daß D(T ) dichtin H sein soll, war hier wichtig, damit |η〉 eindeutig durch(46) bestimmt ist. Machen Sie sich klar, daß es prinzipiellmoglich ist, folgende Situation vorzufinden: D(T †) = ∅.

Satz II.39 Sei T ein auf H dicht definierter Operator.Dann gelten:

(1) T † ist abgeschlossen.

(2) T ist abschließbar genau dann, wenn D(T †) = H.

(3) Ist T abschließbar, so gilt: (T )† = T †.

Def. II.31 Sei T ein abgeschlossener Operator auf demHilbert–Raum H. Die Resolventenmenge ρ(T ) ist folgen-dermaßen definiert:

ρ(T )df=λ ∈ C : T − λI : D(T )

bijektiv−→ H

und (T − λI)−1 ist beschrankt.

Ist λ ∈ ρ(T ), so heißt Rλ(T ) := (T−λI)−1 die Resolventevon T an der Stelle λ.

Das Spektrum, Punktspektrum und residualeSpektrum werden genau so definiert wie im Falle vonbeschrankten Operatoren.

Oft kann sich die Physik–Gemeinschaft nichtdes Eindruckes erwehren, daß Fragestellungenbezuglich des Definitionsbereiches oder des Ab-schlusses eines Operators lediglich eine buchhal-terische Pflicht darstellen, die allenfalls eine tech-nische Unannehmlichkeit von peripharem Inter-esse bedeutet. Dieser Eindruck kommt in etwavon folgender Idee: es ist doch lediglich notwen-dig, den Definitionsbereich ausreichend klein zuwahlen, so daß mit dem unbeschrankte Operatorsinnvoll gerechnet werden kann und mehr stehtda nicht dahinter. Na ja, den Meinungsbildungs-prozeß auf Ihrer Seite will ich nicht beeinflus-sen, allerdings ist es fair zu erwidern, daß einsinnvoller Definitionsbereich oft mit der konkre-ten physikalischen Fragestellung zusammenhangt.Außerdem hangen viele wichtige Eigenschaftenvon Operatoren sensibel von der Wahl des De-finitionsbereichs ab, insbesondere naturlich dasSpektrum.

Page 24: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

24

2. Symmetrische und selbst-adjungierte Operatoren

Wir beginnen zugig mit zwei ganz zentralen Begriffen:

Def. II.32 Ein auf einem Hilbert–Raum H dicht defi-nierter Operator T heißt symmetrischer Operator (oder

auch hermitescher Operator), wenn T ⊂ T †, also wenn

D(T ) ⊂ D(T †) und T |ψ〉 = T †|ψ〉 ,∀|ψ〉 ∈ H. Aquiva-lent: T ist symmetrisch genau dann, wenn

〈Tφ|ψ〉 = 〈φ|Tψ〉 ∀|φ〉, |ψ〉 ∈ H .

Def. II.33 T heißt selbstadjungiert, wenn T = T †, also

genau dann, wenn T symmetrisch ist und D(T ) = D(T †).

Ein symmetrischer Operator kann immer abgeschlos-sen werden, da D(T †) ⊃ D(T ) dicht in H ist. Ist Tsymmetrisch, so ist T † ein Abschluß von T . Praziser,fur symmetrische Operatoren gilt: T ⊂ (T †)† ⊂ T †.Fur einen abgeschlossenen symmetrischen Operator gilt:T = (T †)† ⊂ T †, und fur selbstadjungierte Operatorengilt sogar: T = (T †)† = T †. Dies impliziert, daß einabgeschlossener symmetrischer Operator T genau dannselbstadjungiert ist, wenn T † symmetrisch ist.

Die Unterscheidung zwischen abgeschlossenen symme-trischen Operatoren und selbstadjungierten Operatorenist ungemein wichtig. Nur fur selbstadjungierte Opera-toren gilt der Spektralsatz. Außerdem konnen auch le-diglich selbstadjungierte Operatoren exponiert werden,um so unitare 1–Parametergruppen zu liefern, die un-ter anderem fur die Dynamik in der Quantenmechanikzustandig sind. Daher benotigen wir ein Kriterium furSelbsradjungiertheit.

Def. II.34 Ein symmetrischer Operator T heißtessentiell selbstadjungiert, wenn T selbstadjungiert ist.Ist T abgeschlossen, so heißt eine Untermenge D ⊂ D(T )

Kern von T , wenn gilt: T |D = T .

Ein essentiell selbstadjungierter Operator T hat genaueine selbstadjungierte Erweiterung.

III. PRALIMINARIEN (PRAXIS)

Dieser Praxisteil ist gut zum Rechnen und zur Erorte-rung der physikalischen Grundlagen der Quantenmecha-nik, hilft Ihnen aber nicht bei der Fundierung der ma-thematischen Konzepte, die zur Formulierung der Quan-tenmechanik eingesetzt werden. Eine klare Trennungzwischen mathematischen und physikalischen Konzep-ten ist nur schwer moglich und vielleicht auch gar nichtwunschenswert.

Trotzdem hilft Ihnen dieses Kapitel, in die faszinieren-de Physik der Quantenmechanik alsbald einzutauchen,ohne die mathematische Finesse und das Eigenleben dermathematischen Sprache gebuhrend zu bewundern. Ei-ne zwar skizzenhafte, aber dennoch angemessene Wurdi-gung des mathematischen Intellekts finden Sie im vorhe-rigen Kapitel II.

Auch um den Unterschied zwischen Kapitel II und demvorliegenden zu betonen, folgen wir hier der angelsachsi-schen Schule der informativen Wissensvermittlung ohneaxiomatischen Herangehensweise, sondern behalten einenlockeren und hoffentlich flussigen Erzahlstil.

Bitte behalten Sie immer das einleitende einladendeKapitel I im Blick.

A. Der Zustandsraum

Gegeben sei ein quantenmechanisches System S, des-sen physikalischen Zustand wir mit lediglich einer Ob-servablen notwendigerweise unvollstandig charakterisie-ren wollen. Sei O diese Observable und M(O) ⊂ R dieMenge von moglichen Werten dieser Observablen, die beieinem entsprechenden Experiment am betrachteten Sy-stem S gemessen werden konnten. Ubrigens ist M(O) apriori nicht bekannt6. Den Zustandsvektor (oder kurz:Zustand) bezeichnen wir mit |m〉 (m ∈M(O)), genanntket (nach Dirac). Fur den Moment beschranken wir unsals Zustandsraum Z auf einen komplexen Vektorraum(spater erweitern wir auf Hilbert–Raume).

Sei c ∈ C, c 6= 0, und |m′〉 := c|m〉 ∈ Z. Die nahelie-gende Frage ist, ob |m〉 und |m′〉 wirklich unterschiedli-che Charakterisierungen von S liefern konnen sollen? DieAntwort ist nein, denn das System S soll ja hinsichtlicheiner Messung von O durch M(O) charakterisiert wer-den7. Daher fuhren wir folgende Aquivalenzrelation ein:|m〉 ∼ |m′〉, wenn |m′〉 = c|m〉 (c 6= 0). Der komplexe Zu-standsraum zerfallt dann durch Quotientenbildung Z/ ∼in Aquivalenzklassen:

[|m〉] df= |m′〉 : ∃ c ∈ C , c 6= 0, mit |m′〉 = c|m〉 .

Solche Aquivalenklassen heißen Strahlen. Wir verzich-ten auf die umstandliche Schreibweise und arbeiten im-mer mit Reprasentanten, sind uns aber der Quotienten-bildung stets bewußt.

Wie lesen wir denn nun die Information uber O aus ei-nem Zustandsvektor von S aus? Dies ist eine erste naiveFrage nach der mathematischen Beschreibung des Meß-prozesses. Physikalisch ware folgendes wunschenswert:Das System S wird mit einem Meßapparat in Kontaktgebracht, welche in der Lage ist, O zu messen, also ent-sprechend m ∈ M(O) aus dem Zustand |m〉 auszulesen.Das Resultat der Messung besteht in der Kenntnis desMeßwertes m ∈ R und des Zustandes |m〉, der das Sy-stem S direkt nach seinem Kontakt mit dem Meßapparatcharakterisiert. Wir operieren also mit der Meßapparatur

6 Es handelt sich bei der Menge M(O) um das Spektrum der Ob-servablen O, siehe Kapitel II.

7 Tatsachlich renormiert der komplexe Skalar c ja lediglich denVektor, der als Informationstrager fur die moglichen Meßwertefungiert, allerdings haben wir den Begriff der Norm noch nichtbereitgestellt in diesem Kapitel.

Page 25: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

25

auf den Zustand |m〉 und das Resultat der Messung ist,daß unsere Apparatur m mißt und das detektierte Systemnach der Messung (falls keine weitere Wechselwirkungfolgt) im Zustand |m〉 ist. Dies konnen wir mathematischdurch eine Eigenwertgleichung modellieren, wobei wirdie Apparatur durch die Observable, die sie messen soll,ersetzen:

O : Z linear−→ Z , O|m〉 = m|m〉 .

Hierbei wird die Observable O als linearer Operator rea-lisiert, und der angesprochene Meßprozeß als Eigenwert-gleichung, wobei die Eigenwerte m ∈ M(O) ⊂ R diemoglichen Meßwerte bei einer Messung von O am Sy-stem S im Zustand |m〉 ,m ∈M(O) sind.

Nun braucht ein System S aber nicht derart prapa-riert zu sein. Die verwendete Mathematik kommt unsjetzt zur Hilfe und erklart auch c1|m1〉+ c2|m2〉 , c1, c2 ∈C ,m1,m2 ∈ M(O) als legitimen Zustand, schließlichist der Zustandsraum ja ein Vektorraum. Dies bedarfnaturlich einer physikalischen Interpretation, die weiterunten auch kommen wird. Im Moment halten wir fest: SeiM(O) = m1, . . . ,mn ⊂ R. Dann muß sich ein beliebigerZustand von S hinsichtlich O als komplexe Linearkombi-nation der |mj〉 , j ∈ 1, . . . , n darstellen lassen:

| z 〉 =

n∑j=1

cj |mj〉 , cj ∈ C .

Naturlich fehlt uns im Moment vollkommen die physi-kalische Interpretation einer solchen Linearkombination(modulo unserer Einsichten aus Kapitel I)

B. Der duale Zustandsraum

Sicherlich wollen wir die Moglichkeit haben, Zustands-vektoren linear auf komplexe Zahlen abzubilden. Dieserlaubt die Identifikation der relevanten geometrischenStruktur und stellt somit auch eine Intuitionsstutze dar.Duale Vektoren, bezeichnet mit 〈n| (nach Dirac bra ge-nannt), tun genau diesen Job fur uns:

〈n| : Z linear−→ C , |m〉 −→ 〈n|(|m〉) df= 〈n|m〉 ,

wobei n ∈ M(O′) und zur Observablen O′ auch der Zu-standsraum Z gehort.

Die komplexe Zahl 〈n|m〉 (nach Dirac bracket gen-nant) haben wir nicht von ungefahr so notiert: Die Vek-toren des Dualraums Z∗ operieren als lineare Funktiona-le auf Z. Ist nun der komplexe Vektorraum Z mit einemSkalarprodukt

〈|〉 : Z × Z bilin.−→ C , |m1〉 , |m2〉 −→ 〈m1|m2〉

ausgestattet, so erlaubt der Satz II.4 von Riesz folgendesalopp notierte Interpretation von dualen Vektoren: Zujedem 〈m| ∈ Z∗ exisitiert ein |m〉 ∈ Z mit 〈m| = 〈m|〉.

Das Skalarprodukt hat folgende Eigenschaften:

(1) 〈n|m〉 = 〈m|n〉∗ ∀|m〉, |n〉 ∈ Z.

(2) 〈m|m〉 ≥ 0 ∀|m〉 ∈ Z,

wobei 〈m|m〉 = 0 genau dann gilt, wenn |m〉 = 0|m′〉 fur|m′〉 ∈ Z, und |m〉 in diesem Fall Null–ket genannt wird.Das Skalarprodukt erlaubt es, Geometrie auf dem Zu-standsraum Z zu betreiben, und auch eine geometrischeVorstellung und Intuition zu entwickeln. Zum Beispielheißen zwei Zustande |m〉, |n〉 ∈ Z orthogonal zueinan-der, wenn 〈n|m〉 = 0. Dann gilt offenbar auch 〈m|n〉 = 0.Oder ebenfalls ein wichtiges Beispiel: Fur |m〉 6= Null–ketbetrachten wir normierte Zustandsvektoren,

|m〉 = |m〉/√〈m|m〉 , 〈m|m〉 = 1 , (47)

wobei 〈m|m〉 die Norm des Zustandes |m〉 bezeichnet.Wir wahlen immer normierte Zustandsvektoren als Re-prasentanten der entsprechenden Strahlen, diese sind da-mit ausgezeichnet und diese Auszeichnung wird spaterbegrundet werden.

C. Beschrankte Observablen

Operatoren O : Z linear−→ Z sind ein wichtiger Bestand-teil zur mathematischen Modellierung von Messungen aneinem quantenmechanischen System S. Sie sind gewis-sermaßen die Auslesewerkzeuge, mit denen wir Informa-tionen (Werte von Observablen) aus den Zustandsvekto-ren (kets) extrahieren, die S hinsichtlich der ObservablenO charakterisieren. Eine Besonderheit ist dabei, daß derAuslesevorgang (die Messung) im wesentlichen durch ei-ne Eigenwertgleichung des Operators beschrieben wird,der der Observablen zugeordnet wird:

O|m〉 = m|m〉 ,

wobei der Bezeichner (moglicher Meßwert) reell sein muß,m ∈ R. Diese Beschreibung wird uns aufgezwungen, weil|m〉 ∈ Z und Z ein komplexer Vektorraum ist, und derZustand |m〉 selbst damit nicht observable sein kann.

Erinnern wir uns an die Klassische Mechaniknach Hamilton: Hier war der Zustand eines Hamilton–Systems (P, H) durch einen Vektor in einem reellen Vek-torraum (Phasenraum) P = T ∗M ∼= Rn × Rn (n ∈ N)gegeben. Denken wir uns den Phasenraum P global durch(q, p) ∈ Rn×Rn koordinatisiert, so sind Klassische Ob-servablen (bzw. deren Komponenten) Funktionen

B : P −→ R , (q, p) −→ B(q, p) .

Wichtige Spezialfalle sind die klassische Ortsvariable:BjOrt := Pj Pr1 , j ∈ 1, 2, 3, wobei Pra , a ∈ 1, 2 dieProjektion auf den a-ten Faktor im kartesischen Produkt(q, p) bezeichne, und Pj(q) = qj die kanonische Projek-tion, zum Beispiel durch P j := 〈ej , 〉 uber das Eukli-dische Skalarprodukt 〈, 〉 realisiert. Also ausfuhrlich,

BjOrt(q, p) = Pj(Pr1(q)) = Pj(q) = qj . Und die klassi-sche Impulsvariable: BImp j := Pj Pr2 , j ∈ 1, 2, 3,

Page 26: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

26

ganz entsprechend. Es hat sich eingeburgert, diese grund-legenden klassischen Observablen mit den entsprechen-den Komponenten des Phasenraumvektors gleichzuset-zen: BjOrt = qj , BImp j = pj .

Wir konnen folgendermaßen eine engere Beziehung zurklassischen Formulierung herstellen: Sei P := Z×Z∗ und

BO : P −→ R ,

(|m〉, 〈n|) −→ BO(m, n)df=〈n|O|m〉〈n|m〉

,

where Z 3 |m〉 , |n〉 6= 0. Mit anderen Worten:BO(|m〉, 〈n|) = m ∈ M(O) ⊂ R. Die Notation ist so ge-meint: Z 3 |Om〉 := O|m〉 und 〈n|O|m〉 := 〈n|Om〉.

Es bietet sich nun an zu fragen, welche Eigenschaft vonO verantwortlich ist fur M(O) ⊂ R. Zunachst fuhren wirden zu O adjungierten Operator O† ein:

O† : Z∗ linear−→ Z∗ , 〈n| −→ 〈n|O† .

Dank Riesz konnen wir dies salopp so interpretieren: esgibt einen Zustand |On〉 := O|n〉 mit der Eigenschaft〈n|O† = 〈On|〉. Also, 〈n|O†|m〉 = 〈On|m〉 = 〈m|On〉∗ =〈m|O|n〉∗ ∀|m〉, |n〉 ∈ Z.

Operatoren mit 〈n|O|m〉 = 〈n|O†|m〉 heißen selbst-adjungiert, also 〈n|O|m〉 = 〈m|O|n〉∗, was auch kurzfolgendermaßen notiert wird: O† = O. SelbstadjungierteOperatoren eignen sich wunderbar als Observablen, dennBO(m, n) = BO†(m, n) y 〈n|m〉(BO(m, n) − B ∗O(n,m)) =0 y (m − n∗)〈n|m〉 = 0. Ist n = m, so folgt m = m∗,also m ∈ R. Gilt m 6= n, so folgt (wegen M(O) ⊂ R)(m − n)〈n|m〉 = 0, weshalb außerdem 〈n|m〉 = 0 ∀m, n ∈M(O) ,m 6= n folgt. Das bedeutet, daß die Eigenvektoren(Eigenzustande) von O zu unterschiedlichen Eigenwer-ten orthogonal sind (setzen wir normierte Eigenzustandevoraus, so sind Eigenzustande zu unterschiedlichen Ei-genwerten sogar orthonormiert).

Bezuglich einer Observablen O muß ein beliebiger Zu-stand | z 〉 als Linearkombination

| z 〉 =∑

m∈M(O)

c(m)|m〉 , c(m) ∈ C ∀ m ∈M(O) .

geschrieben werden konnen, d.h. |m〉m∈M(O) ist ei-ne vONB von Z. Dies ist physikalisch absolut sinn-voll, allerdings wollen wir diese folkloristische Aussa-ge ein bisschen genauer beleuchten. Der Zustand | z 〉kann prinizpiell namlich noch Information uber andereObservablen O(1),O(2), . . . tragen, zum Beispiel | z 〉 =|m(1),m(2), . . . 〉 ,m(1) ∈ M(O(1)),m(2) ∈ M(O(2)), . . . .Obige Linearkombination ist daher praziser folgenderma-ßen zu verstehen: Bezuglich der Observablen O(j) , j ∈1, 2, . . . ⊂ N gilt,

| z 〉 ≡ |z(1), . . . , z(j), . . . 〉

=∑

m(j)∈M(O(j))

c(z(1), . . . ,m(j), . . .

)|z(1), . . . ,m(j), . . . 〉 .

Es hat sich aber eingeburgert, lediglich den Bezeichner zuverwenden, der zu der Observablen gehort, die wir kon-kret zur Charakterisierung des physikalischen Zustandeseines quantenmechanischen Systems heranziehen wollen.

Es drangt sich die Frage auf, ob wir ohne Sorge Infor-mationen zu jeder beliebigen Observablen-Kombinationoder gar aller Observablen in einen Zustand | z 〉 ablegenkonnen?

Dies ist in der Klassischen Mechanik der Fall, was wirsogleich als Eigenschaft der Observablen-Konstruktioneinsehen: Zum Beispiel gilt offenbar B i

Ort BImp j =BImp j B i

Ort. Genau diese Eigenschaft charakterisiert dieAlgebra der klassischen Observablen als Abelsch, d.h. eskommt nicht auf die Reihenfolge der Messungen an, es istegal, ob zuerst die j–Komponente des Impulses und danndie i–Komponente des Ortes gemessen wird, oder umge-kehrt. Diese algebraische Eigenschaft von klassischen Ob-servablen ermoglicht es, den Phasenraum eines Hamilton-Systems als Informationsspeicher fur die gesamte Infor-mation uber ein gegebenes mechanisches System anzuse-hen.

Im Falle der Quantenmechanik fragen wir zunachst,

welche Eigenschaft die Observablen O(j) : Z linear−→Z , O(j)|m(1)m(2)〉 = m(j)|m(1)m(2)〉 , j ∈ 1, 2 erfullenmussen, damit die Reihenfolge, in der diese gemessenwerden, keine Rolle spielt. Die Antwort ist schnell ge-funden und fur auf eine neue mathematische Struktur:0 = BO(1)O(2) − BO(2)O(1) = B[O(1),O(2)], wobei wir den

Kommutator [O(1),O(2)] := O(1) O(2) − O(2) O(1)

von O(1) und O(2) eingefuhrt haben. Offenbar spieltdie Reihenfolge der Komposition (Hintereinanderschal-tung) von O(1) und O(2) genau dann keine Rolle, wenn[O(1),O(2)] = 0, wenn alsoO(1) undO(2) kommutieren.Noch ein kleiner Vermerk zur Notation: [O(1),O(2)] = 0meint [O(1),O(2)]|Z〉 = 0 ∀ | z 〉 ∈ Z. Kommutie-rende Observablen heißen auch miteinander vertragli-che Observablen. Es macht sicherlich Sinn, quanten-mechanische Zustande mit miteinander vertraglichen Ob-servablen zu kennzeichnen. Aber macht es auch keinenSinn, quantenmechanische Zustande mit unvertraglichen(nicht vertraglichen) Observablen zu bezeichnen? Sei al-so [O(1),O(2)] = R 6= 0. Dann kann |m(1),m(2)〉 nichtgleichzeitig Eigenzustand von O(1) und O(2) sein. So-mit eignen sich nur miteinander vertragliche Observa-blen als gemeinsame Bezeichner von quantenmechani-schen Zustanden.

Wir haben oben physiaklisch motiviert, daß|m〉m∈M(O) eine vONB von Z hinsichtlich derObservablen O bildet,

| z 〉 =∑

m∈M(O)

c(m)|m〉 , c(m) ∈ C ∀ m ∈M(O) .

Daher sind die c(m) ∈ C durch c(m) = 〈m | z 〉 gegeben.Einsetzen in die Linearkombination liefert

| z 〉 =∑

m∈M(O)

〈m | z 〉|m〉 ≡∑

m∈M(O)

|m〉〈m | z 〉 .

Page 27: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

27

Dies legt dem Objekt |m〉〈m| eine strukturelle Bedeutung

nahe. Abbildungstechnisch haben wir |m〉〈m| : Z linear−→Z , | z 〉 −→ c(m)|m〉. Mit c(m) = 〈m | z 〉 handelt es bei|m〉〈m| im geometrischen Sinne um eine Projektion von| z 〉 auf |m〉 entlang des Eigenzustandes |m〉 der Observa-blen O. Tatsachlich gilt (|m〉〈m| |m〉〈m|) | z 〉 = |m〉〈m | z 〉und (|m′〉〈m′| |m〉〈m|) | z 〉 = 0 fur m 6= m′. Da die|m〉m∈M(O) eine vONB bilden, gilt auch∑

m∈M(O)

|m〉〈m| = id ,

wobei id : Z −→ Z , id | z 〉 =| z 〉 den Identitatsoperator(die identische Abbildung) bezeichne.

Sei | z 〉 ∈ Z normiert. Dann gilt

1 = 〈z | z 〉=

∑m′∈M(O)

∑m∈M(O)

〈z|m′ 〉〈m′|m〉〈︸ ︷︷ ︸δm,m′

m | z 〉

=∑

m∈M(O)

|c(m)|2 .

Wir erhalten also ohne jede Muhe eine Einschrankungder Koeffizienten in der Linearkombination, die ganz dengeometrischen Charakter der Projektion widerspiegelt.

Die gewonnene geometrische Einsicht konnen wir nunnutzen, um eine bessere Vorstellung von Operatoren aufZustandsraumen Z mit dim(Z) <∞ zu erhalten. Im we-sentlichen haben wir es ja mit Endomorphismen zu tunund konnen daher nach einer Matrixdarstellung solcherOperatoren fragen:

Y =∑

m′∈M(O)

∑m∈M(O)

|m′〉〈m′|Y|m〉〈m|

≡∑

m′∈M(O)

∑m∈M(O)

|m′〉Ym′m〈m| ,

wobei die Komponenten Ym′m der zu Y zugeordneten Ma-trix folgendermaßen angeordnet seien:

〈m1|Y|m1〉 〈m1|Y|m2〉 . . .

〈m2|Y|m1〉 〈m2|Y|m2〉 . . .

......

...

.

Diese Darstellung ist sinnvoll: Sei Y := O(1) O(2) dieKomposition zweier Operatoren O(j) , j ∈ 1, 2 in Z.Dann gilt fur m,m′ ∈M(O):

Ym′m =∑

m′′∈M(O)

O(1)m′m′′O

(1)m′′m .

Die Matrixdarstellung eines Operators O wird besonderseinfach, wenn wir id =

∑m∈M(O) |m〉〈m| benutzen, denn

dann gilt

O =∑

m′∈M(O)

∑m∈M(O)

|m′〉〈m′|O|m〉〈m|

=∑

m∈M(O)

m|m〉〈m| . (48)

Ebenso konnen wir Zustande | z 〉 als Komponenten(〈m1 | z 〉, 〈m2 | z 〉, . . . ) von Vektoren bezuglich der Basis|mj〉mj∈M(O) auffassen.

Wir beschließen diesen Abschnitt uber beschrankteObservablen mit einem Beispiel:

Bsp. III.1 Gegeben sei eine SGz(±)–Apparatur. EinSilberatom, welches diese Apparatur durchlauft, hat dieObservable Spin Sz in z–Richtung mit den moglichenMeßwerten: M(Sz) = Sz(+), Sz(−), der zugehori-ge Vektorraum ist also 2–dimensional und wird von|Sz(−)〉, |Sz(+)〉 aufgespannt. Der Identitatsoperatorist explizit durch id = |Sz(−)〉〈Sz(−)| + |Sz(+)〉〈Sz(+)|gegeben. Nach (48) gibt es dann folgende nutzliche Dar-stellung von Sz:

Sz = Sz(+) |Sz(+)〉〈Sz(+)|+ Sz(−) |Sz(−)〉〈Sz(−)| .

Da |Sz(−)〉, |Sz(+)〉 eine vONB ist, finden wir ohneMuhe

Sz |Sz(±)〉 = Sz(±) |Sz(±)〉 .

Ein beliebiger Zustand ist durch | z 〉 = c(+)|Sz(+)〉 +c(−)|Sz(−)〉 gegeben, wobei c(±) = 〈Sz(±) | z 〉und wegen |c(+)|2 + |c(−)|2 = 1 aus Symmetrie-

grunden c(±) = 1/√

2 gilt. Bezuglich der vONB|Sz(−)〉, |Sz(+)〉 konnen wir die Eigenzustande vonSz folgendermaßen darstellen: |Sz(+)〉 = (1, 0) und|Sz(−)〉 = (0, 1). Wenn Sie es nicht gleich sehen,dann schreiben Sie fur den allgemeinen Zustand | z 〉 =|Sz(+)〉〈Sz(+) | z 〉 + |Sz(−)〉〈Sz(−) | z 〉, dies entsprichtin der vONB dem Vektor (〈Sz(+) | z 〉, 〈Sz(−) | z 〉). Jetztbrauchen Sie lediglich auf | z 〉 = |Sz(±)〉 zu spezialisierenund die Normierung der Basis–Eigenzustande zu beruck-sichtigen. Die Matrixdarstellung von Sz ist somit:

Sz =

(Sz(+) 0

0 Sz(−)

). (49)

IV. MESSPROZESS & INTERPRETATION

Die Tatsache, daß Zustandsraume in der Quanten-mechanik notwendig Vektorraume uber dem komplexenZahlenkorper sind, zwingt uns so ausfuhrlich uber Obser-vablen und den Meßprozeß nachzudenken, insbesondereauch was die Interpretation von Zustanden als Linear-kombination der Basis–Eigenzustande einer Observablenbetrifft.

Statt eine Reihe von an dieser Stelle mehr oder wenigermotivierten Postulaten zu verdauen, wollen wir den Meß-prozeß in der Quantenmechanik ein wenig naiv aber in-struktiv modellieren. Das Ziel ist, eine sich beinahe schon

Page 28: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

28

aufzwingende, wenn vielleicht auch nicht zwingende Klar-heit zu gewinnen, die diese Postulate nachhaltig inspiriertund motiviert.

Der Einfachheit halber betrachten wir den Zustands-raum Z = ZO ⊗ ZA ,dim(Z) < ∞ eines Systems S,welches sich aus einem Studienobjekt O und einer Meß-apparatur A zusammensetzt. Konzeptionell ist hier zubetonen, daß wir auch A in die quantenmechanischeBeschreibung miteinbeziehen, nicht nur das eigentlichequantenmechanische Objekt O unserer Forscherbegierde.Dies hat folgende Konsequenz: Sei O(1) eine Observa-ble, die wir zur Beschreibung von O heranziehen wol-len, und |o(1)〉o(1)∈M(O(1)) die zugehorige vONB aus

Eigenzustanden von O(1). Sei weiterhin |aj〉j∈J⊂N einevONB von ZA, die wir nicht weiter spezifizieren, weil wirja an einer Messung von O(1) am Subsystem O interes-siert sind. Dann ist ein allgemeiner Zustand | z 〉 durcheine Linearkombination der Form

| z 〉 =∑

o(1)∈M(O(1)),j∈J

c(o(1), aj) |o(1)〉 ⊗ |aj〉 , (50)

mit c(o(1), aj) ∈ C ∀ o(1) ∈M(O(1)) , j ∈ J gegeben. Of-fenbar ist z ein legitimer Zustand in Z, allerdings konnenaus (50) den Zustandsraumen ZO und ZA nicht vonein-ander unabhangige Zustande zugeordnet werden, außerc(o(1), aj) = 0 ∀ o(1) ∈M(O(1)) , j ∈ J .

Nehmen wir einmal an, das Subsystem O lage im Zu-stand o ∈ M(O(1)) vor. Dann ist der Zustand von Arelativ zu dem von O und kompatibel mit | z 〉 folgen-der:

|A ` O . o〉 = N (o)∑j∈J

c (o, aj) |aj〉 , (51)

wobei N (o) eine Normierungskonstante bezeichne. DasKonzept des relativen Zustandes |A a O . o〉 ist offen-bar sinnvoll, da |A a O. o〉 eindeutig durch |o〉 bestimmtist, und insbesondere nicht von |o(1)〉o(1)∈M(O(1)),o(1) 6=o

abhangt. Es gilt dann

| z 〉 =∑

o(1)∈M(O(1))

N−1(o(1))|o(1)〉 ⊗ |A a O . o(1)〉 .

Der Begriff des relativen Zustandes (auch relationa-ler Zustand) ist nicht nur sinnvoll, sondern auch zentralinsofern, als es ausschließlich sinnvoll ist, nach relativenZustanden von Subsystemen zu fragen. Wir vereinfachenjetzt die Notation: |[o(1)]〉 := N−1

(o(1))|A a O . o(1)〉,

| z 〉 =∑

o(1)∈M(O(1))

| o(1) 〉 ⊗ | [o(1)] 〉 . (52)

Die Interpretation ist: Liegt O im Zustand |o(1)〉 , o(1) ∈M(O(1)) vor, so registriert A dies nachdem beide Sub-systeme in Kontakt gebracht wurden, und zeichnet diesentsprechend auf, in dem der zu |o(1)〉 gehorende Meßwertin den Speicher von A eingetragen wird. Dies verallgemei-nern wir sogleich: Der Zustand von O braucht ja nicht in

einem Eigenzustand vorliegen, sondern kann als Linear-kombination

∑o(1)∈M(O(1)) d(o(1))|o(1)〉 gegeben sein. In

diesem Fall ist der Zustand des Gesamtsystems somit:

| z 〉 =∑

o(1)∈M(O(1))

d(o(1)) | o(1) 〉 ⊗ | [o(1)] 〉 . (53)

Damit nicht genug: Der Zustand von O kann durcheine nicht–leere Menge von vertraglichen Observa-blen beschrieben werden, sagen wir O(1), . . . ,O(n) :[O(i),O(j)] = 0 ,∀ i, j ∈ 1, . . . , n ⊂ N, die unsalle interessieren. Hinsichtlich dieser Beschreibung istZO = ⊗ni=1Z i

O. Sind wir zunachst wieder lediglich an

einer Beschreibung mittels O(1) interessiert und liegt derZustand von O wieder in einer Uberlagerung von Eigen-zustanden bzgl. O(1) vor, so gilt fur den Zustand desGesamtsystems unmittelbar nach der Messung:

| z 〉 =∑

o(1)∈M(O(1))

f1(o(1)) | o(1) 〉 ⊗n⊗j=2

|zj〉 ⊗ | [o(1)] 〉 ,

|zj〉 =∑

o(j)∈M(O(j))

fj(o(j))|o(j)〉 , j ∈ 1, . . . , n ⊂ N .

(54)

Interessiert uns anschließend die Observable O(2) furO im Zustand (54), so erhalten wir unmittelbar nach derMessung den Zustand

| z 〉 =∑

o(1)∈M(O(1))

∑o(2)∈M(O(2))

f1(o(1))f2(o(2)) | o(1) 〉 ⊗ | o(2) 〉 ⊗

⊗n⊗j=3

|zj〉 ⊗ | [o(1), o(2)] 〉 , (55)

wobei fj = 〈o(j)|zj〉 , j ∈ 1, 2, und die Definition von|z1〉 ist klar. Die Meßaparatur (Beobachter) hat jetzt[o(1), o(2)] in den Speicher geladen.

Eine wichtige Annahme bei unserer Modellierung ist,daß auch der uns als klassisch erscheinenden Meßapara-tur ein quantenmechanischer Zustand zugeordnet wird,also die quantenmechanische Beschreibung als fundamen-taler angesehen wird, die sich tatsachlich auf alle Objek-te erstreckt. Tatsachlich halten viele diese Sichtweise inEhren und betrachten die klassischen Systeme als emer-gente Objekte, die auf bestimmten Skalen den Gesetzender Klassischen Mechanik approximativ gehorchen, aberfundamental eine quantenmechanische Natur haben, undexakt eben quantenmechanisch zu beschreiben sind.

Dies hat nun eine interessante Konsequenz fur eine er-ste vorsichtige Interpretation von (55). Relativ zu denunterschiedlichen Zustanden, die O bezuglich den Ob-servablen O(j) einnehmen kann, gibt es eben auch un-terschiedliche Zustande fur die Meßapparatur, die ja diemoglichen Meßwerte speichert. Dies bedeuter aber, daßes zu jeder moglichen Kombination von Meßwerten auch

Page 29: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

29

entsprechende unterschiedliche Zustande des Meßappara-tes gibt, obwohl wir diesen zumindestens naherungswei-se sicherlich als klassisches Objekt ansehen. Der Meßap-part ist aber ein Synonym fur eine Beobachterin/einenBeobachter. Da die Beobachter als Subsytem Teil desGesamtsystems sind, gibt es keine externen Beobachter.Damit scheint es entsprechend der Anzahl der Kombi-nationen von moglichen Meßwerten genauso viele Beob-achterzustande zu geben. Dieser rohen Gedankengangefuhrt mehr oder weniger unmittelbar zur Vielwelten–Interpretation der Quantenmechanik, die zumindestendsvom Sci-Fi–Standpunkt her beurteilt eine fulminante In-terpretation darstellt.

Fallen wir fur den Moment auf den einfacheren Fall(53) zuruck. Nach der Messung von O(1) und derentsprechenden Speicherung der moglichen Meßwerteo(1) ∈ M(O(1)) in den zugehorigen moglichen relativenZustanden des Meßapparates gibt es keine unabhangigenZustande mehr, die die Subsysteme O und A unabhangigvoneinander beschreiben. Allerdings ist in jedem Sum-manden |o(1)〉⊗ |[o1]〉 der Linearkombination (53) der re-lative Objektzustand durch einen Eigenzustand von O(1)

gegeben und der Zustand der entsprechende relative Zu-stand der Meßapparatur beschreibt stellt exakt den Sach-verhalt dar, daß der Meßapparat diesen Objektzustandtatsachlich registriert hat.

Lassen wir das Objektsystem nun ein weiteres Malmit der Meßapparatur in Kontakt treten und fragen, wiedas Gesamtsystem, welches ursprunglich im Zustand (53)vorliegt, nun zu beschreiben ist. Die Antwort kennen wir:

| z 〉 =∑

o(1)∈M(O(1))

d(o(1)) | o(1) 〉 ⊗ | [o(1), o(1)] 〉 . (56)

Wieder beschreibt |o(1)〉 ⊗ |[o(1), o(1)]〉 den relativen Ob-jektzustand in einem Eigenzustand von O(1), aber jetztbeschreibt der relative Beobachterzustand den Sachver-halt, daß der entsprechende Meßwert zweimal registriertwurde. Somit ist die Messung reproduzierbar, was eine di-rekte Konsequenz davon ist, daß nach einer Beobachtungder Objektzustand relativ zu einem bestimmten Beob-achterzustand eben der entsprechende Eigenzustand vonO(1) ist.

Wir betrachten jetzt eine ganz andere Situation: DasObjekt O sei N 3 n-mal identisch kopiert worden, die Ko-pien sollen in keiner direkten Wechselwirkung miteinan-der stehen, konnen aber jeweils mit der Meßapparatur inKontakt gebracht werden. Was konnen wir mit so einemAufbau zustande bringen? Wir konnen die Observable Oan einer Untermenge der Kopien messen, sagen wir anN 3 r ≤ n Kopien. Offenbar gilt dann fur den Zustanddes Gesamtsystems (jede Kopie wird als Subsystem auf-gefaßt),

|z(r)〉 =∑

o1∈M(O)

· · ·∑

or∈M(O)

f(o1) . . . f(or)|o1〉 ⊗ · · · ⊗ |or〉 ⊗

⊗n⊗

j=r+1

|zj〉 ⊗ |[o1, . . . , or]〉 . (57)

Die Interpretation von (57) ist jetzt klar: jeder Term

|o1〉⊗· · ·⊗|or〉⊗|zj〉⊗rj=1⊗|[o1, . . . , or]〉 in der Linearkom-

bination (57) beschreibt eine Beobachterin/einen Beob-achter mit einem bestimmten Speicherinhalt [o1, . . . , or].Bezuglich dieser so charakterisierten Beobachter sind diebeobachteten Kopien von O relativ zum Speicherinhaltin Zustanden |oj〉 , j ∈ 1, . . . , r ⊂ N, die allesamt Ei-genzustande von O sind, wahren die restlichen Kopienunberuhrt in ihren ursprunglichen Zustanden |zk〉 , k ∈r + 1, . . . , n ⊂ N bleiben.

Betrachten wir nun die Situation, in der eine Beob-achterin/ein Beobachter die folgende Konfiguration vonMeßdaten im Speicher hat: [o1, . . . , or], wobei die oj , j ∈1, . . . , r jetzt fest sind. Wir nehmen an, daß jetzt einerder Meßwerte reproduziert wird, die Konfiguration vonMeßdaten im Speicher sieht dann so aus:[o1, . . . , or, ok] :k ∈ 1, . . . , r. Jeder Term der Linearkombination (57)beschreibt dann eine Beobachterin/einen Beobachter miteinem Speicherinhalt, bei dem an der k-te und (r + 1)-te Position der gleiche Meßwert eingetragen ist. Fur dieBeobachterin/den Beobachter, selbst ein Subsystem undeben nicht losgelost vom Objektsystem, erscheint die Se-quenz von Messungen derart, daß jede Messung das Ob-jektsystem in den entsprechenden Objektzustand (Eigen-zustand der Observablen) springen laßt, in dem es dannwahrend der Meßreihe verbleibt.

Dies bedeutet: Obwohl wahrend der gesamten Meßrei-he nur ein physikalisches System die Beobachterin/denBeobachter reprasentiert, gibt es dennoch keinen einzigenZustand, der die Beobachterin/den Beobachter eindeutigbeschreibt. Vielmehr ist der Zustand des Gesamtsystemsals Linearkombination gegeben, in der jeder Term einenbestimmten Beobachterzustand relativ zum zugehorigenObjektzustand ausweist. Jede Beobachtung fuhrt dazu,daß jeder ursprungliche Beobachterzustand in weitereverschiedene Beobachterzustande aufspaltet. Jedem die-ser Zustande entspricht ein unterschiedliches Meßergeb-nis und der zugehorige Objektzustand. Alle Moglichkei-ten nach einer Meßreihe sind dabei simultan realisiert inder Linearkombination.

Im Gegensatz zur Klassischen Mechanik (Trajektorieim Phasenraum) existiert in der Quantenmechanik fureine Meßreihe also nicht nur eine Speicherkonfigurati-on, sondern ein ganzer Graph von Speicherkonfiguratio-nen derart, daß samtliche nach einer Meßreihe mogli-chen Speicherkonfigurationen Teil der Linearkombinati-on sind, die den Zustand des Gesamtsystems beschreibt,wobei die moglichen Konfigurationen mit unterschiedli-chen Koeffizienten in der Linearkombination auftretenkonnen.

Nun ist Physik aber eine quantitative Naturbeschrei-bung und es stellt sich die Frage, was es in dieser Situa-tion uberhaupt quantitativ auszusagen gibt? Eine quan-titative Aussage, die wir gerne machen mochten, betrifft

Page 30: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

30

die Frequenz, mit der bestimmte Meßwerte in einer Meß-reihe auftauchen. Es genugt, Linearkombinationen derfolgenden Form zu betrachten:

Z 3| z 〉 =∑

o∈M(O)

f(o)|o〉 . (58)

Wir suchen ein Vorschrift, jedem Element der Linear-kombination ein Maß µ : Z −→ R+ so zuzuordnen, diekompatibel ist mit der Haufigkeit, mit der der betreffen-de Meßwert von einem gegebenen Beobachter gemessenwird.

Da die |o〉o∈M(O) eine vONB bilden, konnen wir | z 〉auch als den Vektor (f(o1), . . . , f(odim(Z)))

T ∈ Cdim(Z)

auffassen, wobei oj ∈ M(O) , j ∈ 1, . . . ,dim(Z).Jede Komponente zerlegen wir nun so: C 3 f(oj) =|f(oj)| exp (iϕ(oj)). Die Phasen exp (iϕ(oj)) fassen wir alsElemente von U(1) auf, die als Abbildung R −→ C ein-betten. Sie konnen damit nicht als Bewegungen auf R immaßtheoretischen Sinn erklart werden. Nach Vorausset-zung sind die Eigenzustande |o〉o∈M(O) normiert. DieNormierungsvorschrift legt den Zustand aber ebenfallsnur bis auf eine Phase fest, die aber prinzipiell willkurlichist: [|o〉] := |o′〉 ∈ Z : |o′〉 = exp (iψ)|o〉 , ψ ∈ [0, 2π] ⊂R. Insgesamt ergibt sich also fur einen Term in der Li-nearkombination (58) wieder eine Aquivalenzklasse, diewir kurz mittels der Aquivalenzrelation charakterisieren:f(oj)|oj〉 ∼ exp (iγj)|f(oj)||oj〉 , γj ∈ [0, 2π] ⊂ R. In obi-ger Notation, γj = ϕ(oj) + ψj , da aber ψj prinizpiell be-liebig ist, ist auch γj beliebig. Es bietet sich nun an, die-sen Phasenfaktor ganz im Eigenzustand zu absorbieren.Dann gilt | z 〉 = (|f(o1)|, . . . , |f(odim(Z))|)T . So gesehen

ist das gesuchte Maß eine Funktion µ : Rdim(Z) −→ R derKomponenten |f(oj)|. Da Maße extensive Großen sind,gilt

µ(|f(o1)| , . . . ,

∣∣f(odim(Z))∣∣) =

∑o∈M(O)

µ (|f(o)|) .

(59)

Wir haben immer die Freiheit, das Maß aufEins zu normieren. Dann haben wir einerseitsµ(|f(o1)|, . . . , |f(odim(Z))|) = 1, da alle moglichenMeßwerte im Spektrum M(O) berucksichtigt wurden.Andererseits liefert die Normierung des Zustandes

1!= 〈z | z 〉 =

∑o∈M(O)

|f(o)|2 . (60)

Gleichsetzen von (59) und (60) liefert µ(|f(o)|) = |f(o)|2,o ∈ M(O), da dies fur alle Linearkombinationen geltenmuß.

Wenden wir sogleich unsere Vorschrift auf (57) an,so wird jedem Element der Linearkombination |o1〉 ⊗· · · ⊗ |or〉 ⊗

⊗nj=r+1 |zj〉 ⊗ |[o1, . . . , or]〉 das Maß (Ge-

wicht) µ(f(o1), . . . , f(or)) = |f(o1)|2 · · · |f(or)|2 zugeord-net. Das Gewicht, welches einer bestimmten Speicherkon-figuration [o1, . . . or] zugeordnet wird, ist also das Pro-dukt der Gewichte fur die einzelnen Speicherinhalte.

Es gibt einen direkten Zusammenhang zwischen Maß-theorie, wie sie hier ganz simpel zum Einsatz kommt, undWahrscheinlichkeitstheorie. Dieser erlaubt uns, Gewich-te der Form µ(f(o1), . . . , f(or)) gleichzusetzen mit derWahrscheinlichkeit, eine Meßreihe (Speicherkonfigurati-on) [o1, . . . or] vorzufinden, vorausgezetzt die Meßreiheist ausreichend lang, so daß sie als zufallig generierteFolge von Messungen angesehen werden kann. Dies kannsofort verallgemeinert werden auf Meßreihen verschiede-ner Observablen.

V. UNBESCHRANKTE OBSERVABLEN

Wir lassen jetzt die Einschrankung dim(Z) < ∞ fal-len, betrachten also zum Beispiel Observablen O mitM(O) = R. Die Theorie dieser Observablen (unbe-schrankte Operatoren) ist recht vielseitig und auch subtil.Eine prazise Skizze finden Sie in Abschnitt II F, hier ge-hen wir heuristischer vor mit einem strengen Augenmerkauf die Aspekte, die tatsachlich relevant sind fur die Be-schreibung quantenmechanischer Systeme und nicht aus-schließlich der logischen Konsistenz geschuldet sind.

Zunachst fallt auf, daß es wohl wenig sinnvoll scheintvon der Wahrscheinlichkeit zu sprechen, einen Meßwerto ∈ M(O) bei einer entsprechenden Messung von O aneinem Zustand aus Z vorzufinden. Auch klassisch konnenwir Meßwerte nur mit endlicher Genauigkeit bestimmen,in diesem Sinne sind reelle Zahlen in der Natur nicht ob-servabel realisiert. Es mach vielmehr Sinn, in beiden Na-turbeschreibungen, einen Meßwert in einem bestimmtenIntervall anzusiedeln.

In der Theorie Linearer Operatoren ist diese Einsichteng mit der mathematischen Tatsache verknupft, daßdie zugehorigen Eigenzustande gar nicht normierbar sindund daher nicht bona fide Zustande eines quantenme-chanischen Systems darstellen konnen. Insbesondere istes unmoglich, ein System so zu praparieren, daß es durcheinen nicht normierbaren Zustand reprasentiert werdenkann.

Eine Beschreibung solcher Observablen verdanken wirvon Neumann. Seine Charakterisierung basiert auf derExistenz von 1–Parameter Familien von ProjektorenEoo∈R, mit der Eigenschaft: Fur beliebige Zustande|φ〉|, |ψ〉 ∈ Z gilt

〈φ|O|ψ〉 =

∫R

d〈φ|Eo|ψ〉 o . (61)

Hierbei ist f(o) := 〈φ|Eo|ψ〉 als differenzierbare Funkti-on zu verstehen, und df(o) = do f ′(o), wobei f ′(o) :=df/do. Das Integral ist dann das gewohnliche Riemann–Integral. Es soll nicht verschwiegen werden, daß die Ma-thematik diese Charakterisierung von O auch dann nochhoch halt, wenn die Funktion f nicht differentierbar ist.Allerdings erfordert dies eine Verallgemeinerung des Inte-gralbegriffs hin zum sogenannten Riemann–Stieltjes–Integral.

Page 31: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

31

Fur jedes Intervall I := [b, c] ⊂ R , b < c definieren wir

EIdf=

∫I

dEo . (62)

EI projiziert auf den Unterraum von Z, in dem dieZustande liegen, die zu Eigenwerten o ∈ I ⊂ M(O) derObservablen O gehoren. Die Wahrscheinlichkeit W(o ∈I ⊂M(O) , |ψ〉 ∈ Z), daß eine Messung von O am phy-sikalischen System im Zustand |ψ〉 ∈ Z einen Meßwerto ∈ I ⊂M(O) im Intervall I liefert ist

W (o ∈ I ⊂M(O) , |ψ〉 ∈ Z) = 〈ψ|EI |ψ〉 . (63)

Fur diese Konstruktion ist essentiell, daß I 3 b, c : b <c, da keine Projektoren auf einzelne Zustande |o〉 , o ∈M(O) existieren, noch schlimmer: @|o〉 ∈ Z : O|o〉 = o|o〉.

Eine kreativere Charakterisierung unbeschrankter Ob-servablen verdanken wir Dirac. Dirac hat hemmungslosangenommen, daß Eigenzustande |o〉 in irgend einem Sin-ne existieren mussen. Diese mutige Annahme konnte imRahmen von sogenannten Gel′fand−Tripeln mathe-matisch konsistent realisiert werden, aber das ist Themaeiner anderen Vorlesung. Wir lassen uns von Dirac’s er-fahrener Leichtigkeit anstecken und postulieren folgendeempirische Regeln:

(1) Gibt es Zustande |o〉o∈M(O) mit O|o〉 = o|o〉 furo ∈M(O), wobei M(O) = R moglich ist, so konnendiese in folgendem verallgemeinerten Sinne ortho-normiert werden:

〈o′|o〉 = δ (o′ − o) , o, o′ ∈M(O) . (64)

(2) Jeder Zustand | z 〉 ∈ Z kann nach den verallgemei-nersten Eigenzustanden entwickelt werden:

| z 〉 =

∫M(O)

do |o〉〈o | z 〉 . (65)

(3) Folgende Rechnung macht Sinn: Seien |ψ〉, |φ〉 ∈ Z.Dann ist

〈ψ|φ〉 =

∫M(O)

do

∫M(O)

do′

〈ψ|o〉〈o|o′〉〈o′|φ〉

=

∫M(O)

do 〈ψ|o〉〈o|φ〉

≡∫M(O)

do ψ∗(o)φ(o) . (66)

Insbesondere gilt:

‖|ψ〉‖2 ≡ 〈ψ|ψ〉 =

∫M(O)

do |〈ψ|o〉|2

≡∫M(O)

do |ψ(o)|2 . (67)

(4) Sei M(O) nicht entartet. Dann ist mit obiger Nota-tion

W (o ∈ I ⊂M(O) , |ψ〉 ∈ Z)

=

∫I⊂M(O)

do |〈ψ|o〉|2 (68)

die Wahrscheinlichkeit dafur, bei einer Messung derObservablen O an einem physikalischen System imZustand |ψ〉 einen Meßwert im Intervall I zu beob-achten.

Diese empirischen Regeln konnen als kontinuierliche Ver-allgemeinerung der diskreten Beschreibung aus AbschnittIII C angesehen werden. Regel (1) ist naturlich mit Vor-sicht zu genießen, da im Falle o′ 6= o dem Zustand |o〉ja keine vernunftige Norm zugeordnet werden kann. VonNeumanns Konstruktion erlaubt folgende Meinung: imPrinzip sollten wir mit einer kontinuierlichen Uberlage-rung von Zustanden arbeiten, deren zugehorigen Eigen-werte in einem abgeschlossenen Intervall liegen. Aber dasist muhsam.

Der heuristische Anschluß an von Neumanns Beschrei-bung unbeschrankter Observablen ist folgendermaßengut einpragsam:

dEo = do |o〉〈o| . (69)

VI. KONSTRUKTION VON OBSERVABLEN I— ELEMENTARE OBSERVABLEN

Elementare Observablen heißen die Observablen,die in einem bestimmten Sinne zu den klassischen Obser-vablen korrespondieren, die den Phasenraum eines me-chanischen Systems bilden, also Ort und Impuls. In derKlassischen Mechanik lassen sich aus diesen dann alleanderen Observablen in bekannter Weise konstruieren.

A. Ort als quantenmechanische Observable

Gegeben sei ein quantenmechanisches System im Zu-stand | z 〉 ∈ Z. Zum Beispiel kann | z 〉 den Zustandeines freien Teilchens beschreiben, welches sich irgendwoauf dem reellen Zahlenstrahl R1 befinde. Sicherlich ist eslegitim zu fragen, und diese Frage stellen wir uns klas-sisch gewohnheitsmaßig, wo sich das Teilchen im Zustand| z 〉 zum Zeitpunkt der Ortsmessung befindet?

Diese Frage ist der Anker unserer Konstruktion vonObservablen. In diesem Stadium brauchen wir empiri-sche Erfahrungen, die wir klug in unsere mathemati-sche Modellbildung einbeziehen. Da es sich um ein freiesTeilchen handelt, kann es a priori jeden Punkt im R1

als Ort einnehmen. Bezeichnen wir die Ortsobserva-ble mit Oq, so gilt sicherlich M(Oq) = R1. Es handeltsich also um eine unbeschrankte Observable. Es gibt nun

Page 32: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

32

Zustande |x〉 , x ∈M(Oq), in denen Orte gespeichert wer-den konnen, und aus denen diese folgendermaßen ausge-lesen werden konnen Oq|x〉 = x|x〉 , x ∈ M(Oq). Die-se Ortsspeicher sind verallgemeinerte Eigenzustande vonOq, und wir erinnern uns, daß |x〉 /∈ Z.

Der Ausleseprozeß (die Ortsmessung) setzt voraus, daßunser Meßgerat (Detektor) irgendwo auf R1 stationiertwird. Sagen wir, der Detektor nehme das abgeschlosseneIntervall I ⊂ R1 ein. Ausschließlich im Detektorintervallkann das Teilchen nachgewiesen werden, d.h. wenn gilt∫I⊂M(Oq)

dx |x〉〈x | z 〉 = | z 〉 −∫M(Oq)/I

dx |x〉〈x | z 〉

6= 0 . (70)

Das Teilchen muß sich offenbar entweder im Detektorin-tervall befinden oder außerhalb davon:

| z 〉 =

∫I∪(M(Oq)/I)

dx |x〉〈x | z 〉

=

∫R

dx |x〉〈x | z 〉 . (71)

Daraus folgt, daß die Wahrscheinlickeit dafur, das Teil-chen im Detektor vorzufinden (also dafur, daß der De-tektor das Teilchen nachweist) folgendermaßen gegebenist:

W (x ∈ I, | z 〉 ∈ Z) =

∫I

dx |Z(x)|2

= 1−W (x ∈M(Oq)/I, | z 〉 ∈ Z) . (72)

wobei wir Z(x) := 〈x | z 〉 gesetzt haben. In der Litera-tur wird W (x ∈ I, | z 〉 ∈ Z) oft die Aufenthaltswahr-scheinlichkeit des Teilchens im Detektor genannt, oderauch

Der Erwartungswert E(Oq, | z 〉) := 〈z|Oq | z 〉 furden Ort des Teilchens im Zustand | z 〉 ∈ Z ist

E(Oq, | z 〉) ≡ 〈z|Oq | z 〉 =

∫R

dx |Z(x)|2x . (73)

Die Interpretation dieses Ausdrucks ist klar: |Z(x)|2 istdas Gewicht (die Wahrscheinlichkeit) dafur, das Teilchenam Ort x ∈ R vorzufinden, und das Integral summiertalle moglichen Aufenthaltsorte mit ihrer entsprechendenGewichtung auf. Die Gewichte sind wie ublich normiert:E(id, | z 〉) = 〈z | z 〉 = 1, wobei id | z 〉 =| z 〉 , | z 〉 ∈Z. Nun muß auch |z′〉 := Oq | z 〉 normierbar sein, alsoE(id, |z′〉) <∞. Dies fuhrt auf∫

Rdx |Z(x)|2x2 <∞ . (74)

Dies ist der Ausgangspunkt fur eine anstandige Definitionder Ortsobservablen:

Def. VI.1 (Ortsoperator) Sei Z = L2(R) und D(Oq)der Definitionsbereich von Oq,

D(Oq) =

Z ∈ L2(R) :

∫R

dx |Z(x)|2x2 <∞.(75)

Fur Z ∈ D(Oq) setzen wir (OqZ)(x) = xZ(x).

Offenbar ist Oq unbeschrankt, wir brauchen lediglichZ ∈ L2(R) mit Trager nahe bei ±∞ zu wahlen. Sokonnen wir ‖OqZ‖ beliebig groß werden lassen, undgleichzeitig ‖Z‖ = 1 haben. Naturlich macht der Aus-druck xZ(x) auch dann noch Sinn, wenn Z /∈ D(Oq),aber es ist dann halt xZ(x) /∈ L2(R). Wir sehen jedoch,daß es aus physikalischen Grunden unerlaßlich ist, nurZ ∈ D(Oq) ⊂ L2(R) zu erlauben, weswegen obige Ein-schrankung des Definitionsbereiches vorgenommen wer-den muß. Dabei ist D(Oq) der großte Definitionsbereich,fur den OqZ ∈ L2(R) gilt.

Die Verallgemeinerung auf R3 als Ortsraum macht kei-ne große Muhe. Allerdings lohnt es sich, auf eine konzep-tionelle Uberlegung hinzuweisen. Bezeichnen wir mit Oq1die Ortsobservable, mit deren Hilfe die Ortsinformationentlang der q1–Richtung ausgelesen werden kann, und en-sprechend mit Oq2 die Ortsinformation entlang der q2–Richtung. Das quantenmechanische System liege im Zu-stand | z 〉 ∈ Z vor. Eine interessante Frage ist nun, obdie Reihenfolge der Ortsmessungen eine Rolle spielt? Esist eine Erfahrungstatsache, daß auf den Langenskalen,die uns in dieser Vorlesung interessieren, Ortsmessungenkommutieren: [Oq1 ,Oq2 ] | z 〉 = 0 ∀ | z 〉 ∈ Z, d.h. dieReihenfolge der Ortsmessungen ist unerheblich, Ortsope-ratoren kommutieren. Wir ahnen bereits, daß dies keineSelbstverstandlichkeit ist. Andererseits betrachten wir imMoment nur quantenmechanische Systeme im Euklidi-schen Vektorraum, der mit einer klassischen Geometrieausgestattet ist. Die Fragestellung, ob diese Geometriequantisiert werden kann, liegt außerhalb dieses Vorle-sungsrahmens.

B. Impuls als quantenmechanische Observable

Gegeben sei eine klassische Observable B : P −→ Rauf dem Phasenraum P ∼= T ∗M∼= R3×R3 eines mecha-nischen Systems, und (q, p) ∈ P. Wir vergleichen jetztB(q + a, p) , a ∈ R3 mit B(q, p). Ohne große Bedenkengilt formal: B(q + a, p) = (1 + ∇a + . . . )B(q, p), wobei∇a ≡ a · ∇ die Richtungsableitung in Richtung a be-zeichne. Also konnen wir in der Klassischen Mechanikeinen Translationsoperator einfuhren. Bezeichne O(P)die Menge der Observablen auf P, so ist eine endlicheTranslation in Richtung a ∈ R3 folgendermaßen gege-ben: Ta : O(P) −→ O(P), definiert als B −→ Ta(B) :=B Ta, wobei

(Ta(B))(q, p)df= B(q + a, p)

= exp (∇a)B(q, p) . (76)

Nun ist es oft zweckmaßiger direkt mit dem GeneratorGa fur Translationen in Richtung a ≡ a/‖a‖

Gadf= lim‖a‖→0

dTa/d‖a‖ (77)

Page 33: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

33

zu arbeiten, wobei die Abbildungsvorschrift klar sein soll-te. Somit ist Ga = ∇a der (infinitesimale) Generator furTranslationen in Richtung a. Offenbar handelt es sich beiTranslationen um eine Abelsche Gruppe, d.h. die Gene-ratoren fur Translationen kommutieren. Ist ein mecha-nisches System invariant unter raumlichen Translationen(Homogenitat des Raumes), so impliziert diese Symme-trie mittels eines Satzes von Noether die Erhaltung deslinearen Impulses.

Es ist instruktiv, eine algebraische Vorschrift fur Trans-lationen zu finden. Dazu betrachten wir die Fourier–Transformierte von B(q, p), die wir folgendermaßen no-

tieren: B(q, p) = FT [B(k, p)](q, p). Damit wird aus (76):(Ta

(FT [B(k, p)]

))(q, p) =

FT[exp (i〈a, k〉)B(k, p)

](q, p) (78)

Der Generator fur Translationen in Richtung a imFourier–Raum ist also gerade 〈a, ik〉. Fur den Spezialfall,daß a mit einem Einheitsvektor unseres Koordinatensy-stems zusammenfallt, finden wir somit, daß der zugehori-ge Generator im Fourier–Raum gerade die entsprechendeKomponente des zu q Fourier–konjugierten Impulses ist.Wir merken uns als wichtiges Resultat folgende Fourier–Korrespondenz: ∇ = ik.

Noch ein Wort zu den Maßeinheiten: Eigentlich hat kdie Maßeinheit einer inversen Lange L, [k] = 1/L. Diesgarantiert, daß 〈a, k〉 frei von Maßeinheiten ist. Damittragt k aber nicht die Maßeinheit, die zu einem Impulsgehort: [Impuls] = ML/T , wobei M fur die Maßeinheitvon Masse steht, und T fur die Maßeinheit in der Zeitgemessen wird. Wir werden weiter unten sehen, daß kmittels einer dimensionsbehafteten Konstante so reska-liert werden kann, daß k ∝ Impuls gilt.

Unsere Sichtweise ist jetzt folgende: In der KlassischenMechanik ist der Impuls definiert als der Generatorvon raumlichen Translationen, wenn diese im Fourier–Raum ausgewertet werden. Diese operationelle Sichtwei-se ubertragen wir nun in die Quantenmechanik. Zunachsteinmal mussen wir das Konzept von Translationen in dieQuantenmechanik ubertragen. Das prinzipiell (also nichtnur fur diesen Fall) geeignte Mittel zum Ubertragen vonklassischen Konzepten ist Darstellungstheorie.

Def. VI.2 Sei G eine (Matrix–) Gruppe, Z ein komple-xer Hilbert–Raum und U(Z) die unitare Gruppe von Z.Eine unitare Darstellung von G in Z ist ein Gruppenho-momorphismus

U : G −→ U(Z) , (79)

der in folgendem Sinn stetig ist: Fur alle konvergen-ten Folgen (gν) in G und alle |ψ〉 ∈ Z gilt: Die Folge(U(gν)|ψ〉) konvergiert bezuglich der Norm in Z und esgilt limU(gν)|ψ〉 = U(lim gν)|ψ〉.

Die Darstellung heißt treu, wenn U injektiv ist, alsowenn G isomorph zur Untergruppe U(G) ⊂ U(Z) ist.

Die Qualifikation unitar spielt eine wichtige Rolle, weilsie grantiert, daß die Darstellung auf Z normerhaltendoperiert.

Betrachten wir einmal etwas umstandlich fur | z 〉 ∈ Z,Z ∈ D(Oq), x, x′ ∈M(Oq) und a ∈ R3:

(U(Ta)Z)(x) ≡ 〈x|U(Ta) | z 〉 =

∫R3

d3x′ 〈x|U(Ta)|x′〉〈x′ | z 〉

df=

∫R3

d3x′ 〈x|x′ + a〉〈x′ | z 〉

= Z(x− a)

= (exp (−∇a)Z) (x) . (80)

Es fallt auf, daß U(Ta) nicht manifest unitar ist. Dasbedeutet nicht, daß die Darstellung nicht unitar ist, son-dern zunachst einmal lediglich, daß die Unitaritat derDarstellung nicht offenkundig ist. Aber dies bedeutetauch, daß wir noch nicht davon ausgehen konnen, daßU(Ta)|x〉 = |x+ a〉 eine sinnvolle Vorschrift ist.

Wir beginnen ganz heuristisch ohne allzu große Be-denken technischer Natur. In Anlehnung an den klas-

sischen Fall betrachten wir Z(x) = FT [Z(k)](x)

und rechnen (U(Ta)Z)(x) = (U(Ta)FT [Z(k)])(x) =

FT [exp (i〈a, k〉)Z(k)](x). Dabei haben wir benutzt, daß

∇ exp (i〈k, x〉) = ik exp (i〈k, x〉) . (81)

Dies suggeriert, daß ∇/i ein unbeschrankter Operator istmit ebenen Wellen als Eigenfunktionen zu Eigenwertenk ∈ R3, M(∇/i) = R3. Damit ist ∇/i ein guter Kandidatfur eine Observable. Außerdem ist seine Interpretationevident: Modulo dem oben angesprochenen Problem mitden Maßeinheiten ist∇/i ∝ Op, dem Impulsoperator (derObservable Impuls in der Quantenmechanik).

Lassen Sie uns das Problem mit den Maßeinheiten einfur alle Mal aus der Welt schaffen, bevor wir mit derKonstruktion fortfahren. De Broglie hatte 1924 eine un-gemein revolutionare Idee. Er fand es angebracht (wirfolgen hier nicht der historischen Entwicklung und hal-ten uns eher bedeckt, was wellenmechanische Ideenge-schichte betrifft, da dies aus heutiger Sicht nicht mehrso relevant zu sein scheint), Teilchen Welleneigenschaf-ten zuzusprechen. Fur ein Teilchen der Masse m miteiner Geschwindigkeit v c soll nach de Broglie fol-gende Beziehung zwischen dem Impuls p dieses Teil-chens im Laborsystem und der diesem Teilchen uber seineWelleneigenschaft zugeordnete Wellenlange λ bestehen:λ = h/p, dabei ist h eine dimensionsbehaftete Konstan-te mit [h] = [Wirkung] = MT . Es stellte sich heraus,daß h gerade die Planck–Konstante (auch PlanckschesWirkungsquantum). Nach de Broglie vermittelt das Wir-kungsquantum gerade die Konversion zwischen Teilchen–und Welleneigenschaften der Materie. Fur uns ist wich-tig, daß Op = ~∇/i, wobei ~ := h/2π.

Bei unserer heuristischen Untersuchung haben wir al-so folgendes gefunden: Generator fur raumliche Transla-tionen von quantenmechanischen Zustanden ist der Im-pulsoperator Op = ~∇/i mit M(Op) = R3, und

Op N exp (i〈p, x〉/~) = p N exp (i〈p, x〉/~) , (82)

Page 34: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

34

wobei N eine Konstante bezeichnet. Offenbar liegen dieEigenfunktionen von Op nicht in Z. Eine rigorose Unter-suchung bezuglich der Fragestellung, ob Op selbstadjun-giert ist oder eine selbstadjungierte Erweiterung besitztwird hier nicht gegeben und ist Gegenstand der Theo-rie Linearer Operatoren in Hilbert–Raumen. Wir haltenfest:

Def. VI.3 (Impulsoperator) Sei AC(R) die Mengeder absolut stetigen Funktionen auf R. Der Impuls-operator Op ist definiert durch: D(Op) = AC(R) und(OpZ)(x) = −i~Z ′(x) , Z ∈ AC(R).

Bemerken Sie, daß die Definition fur eine Komponenteder Impulsobservablen gegeben wurde. Wichtig ist nunder

Satz VI.1 Es gilt Op = O†p, d.h. der Impulsoperator istselbstadjungiert.

Weiter oben, Gleichung (80), haben wir gefunden, daßU(Ta) = exp (−∇a) ist. Dies konnen wir aber auch sonotieren: U(Ta) = exp (−ia Op/~). Da Op selbstadjun-giert ist, ist U(Ta) unitar (nach einem Satz von Sto-ne). Wir mussen hier naturlich vorsichtig sein mit demVerstandnis von U(Ta) als Exponentialfunktion, da Opunbeschrankt und selbstadjungiert ist.

So einsichtig diese Konstruktion der quantenmechani-schen Impulsobservablen analog zur operationellen Vor-schrift in der Klassischen Mechanik verlauft, so bricht siedoch mit einer modernen Einsicht, namlich, daß essen-tielle Informationen des quantenmechanischen Systemsimmer von den Zustandsvektoren | z 〉 ∈ Z getragenwerden und Wellenfunktionen wie Z(x) ≡ 〈x | z 〉 oderZ(p) ≡ 〈p | z 〉 lediglich wegen ihres anschaulichen Cha-rakters Einzug finden. Mathematisch konnten wir an die-ser Stelle entgegnen, daß Wellenfunktionen wenigstens ineinem Hilbert–Raum liegen, aber das ist nur auf der for-malen Ebene von einer gewissen strukturellen Relevanz.

Mit Dirac fordern wir die Existenz von Eigenzustanden|p〉p∈M(Op) zu Op:

Op|p〉 = p|p〉 , (83)

auch wenn diese nicht normierbar sind, wichtig zur Na-turbeschreibung ist ja vielmehr

Z 3 Op | z 〉 =

∫R3

d3x |x〉〈x|Op | z 〉

=

∫R3

d3x |x〉 (OpZ) (x) , (84)

woraus folgt, daß 〈x|Op | z 〉 = OpZ(x). Insbesondereerhalten wir daraus die nutzliche Beziehung 〈x|Op|p〉 =Op〈x|p〉. Die Eigenwertgleichung (83) lautet dann ausge-druckt durch Wellenfunktionen: Op〈x|p〉 = p〈x|p〉. EinVergleich mit (82) liefert:

〈x|p〉 = N exp (i〈x, p〉/~) . (85)

Die Konstante N bestimmt sich aus der Rechnung(p, p′ ∈M(Op))

〈p|p′〉 =

∫R3

d3x 〈p|x〉〈x|p′〉

= |N |2∫R3

d3x exp (i〈x, p− p′〉/~)

= |N |2 (2π~)3δ(3) (p− p′) . (86)

Wir wahlen in Einklang mit 〈p|p′〉 != δ(3)(p−p′) die Kon-

stante als R+ 3 N = 1/√

(2π~)3.Es ist zwar fast schon offensichtlich, aber trotzdem in-

struktiv: Den Zusammenhang zwischen den Wellenfunk-tionen Z(x) und Z(p) erhalten wir ganz zwanglos:

Z(x) ≡ 〈x | z 〉 =

∫R3

d3p 〈x|p〉〈p | z 〉

=

∫R3

d3p√(2π~)3

exp (i〈x, p〉/~)Z(p) ,

Z(p) ≡ 〈p | z 〉 =

∫R3

d3x 〈p|x〉〈x | z 〉

=

∫R3

d3x√(2π~)3

exp (−i〈x, p〉/~)Z(x) , (87)

was noch einmal die Praktikabilitat von Diracs Nota-tion eindrucksvoll unterstreicht, insbesondere, wenn wiruns auch noch zu einer Verallgemeinerung der Einstein-schen Summenkonvention durchringen konnten. Dannwaren die Fourier–Transformationen kurz und bundigwie folgt notiert: Z(x) ≡ 〈x | z 〉 = 〈x|p〉〈p | z 〉 undZ(p) ≡ 〈p | z 〉 = 〈p|x〉〈x | z 〉, wobei |p〉〈p| = id und|x〉〈x| = id benutzt wurde in dieser Schreibweise. Sieverlangt eine gewisse Erfahrung, denn zum Beispiel ist(OpZ)(x) ≡ 〈x|Op | z 〉 = 〈x|Op|p〉〈p | z 〉 = p〈x|p〉〈p |z 〉 6= p〈x | z 〉 = pZ(x) wenn | z 〉 kein Eigenzustand vonOp ist.

C. Vertraglichkeit

Die sich aufdrangende Frage ist nun, ob sich ein Ana-logon zum Phasenraum der Klassischen Mechanik fin-den laßt. Dies setzt voraus, daß Ort und Impuls an ei-nem quantenmechanischen System im Zustand | z 〉 ∈Z quasi simultan gemessen werden konnen, d.h., daßOrts– und Impulsmessung sich nicht beeinflussen durfen.Dies konnen wir sofort uberprufen: Bezeichne Oq =Oq1 ,Oq2 ,Oq3, wobei qa ≡ 〈ea, q〉 , a ∈ 1, 2, 3, undOp = Op1 ,Op2 ,Op3, mit pb ≡ 〈eb, p〉 , b ∈ 1, 2, 3,usw. Dann ist

[Oqa ,Opb ] | z 〉 = (Oqa Opb −Opb Oqa) | z 〉 ,

Oqa Opb | z 〉 = xapb|x〉〈x|p〉〈p | z 〉 ,Opb Oqa | z 〉 = −i~δab | z 〉+ pbx

a|p〉〈p|x〉〈x | z 〉 .(88)

Page 35: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

35

Nun benutzen wir, daß M(Oq) = M(Op) und x, p stum-me Bezeichner sind. Daher konnen wir im letzten Termvon (88) folgende Identitat benutzen: pbx

a|p〉〈p|x〉〈x |z 〉 = xapb|x〉〈x|p〉〈p | z 〉. Als wichtiges Resultat erhaltenwir:

[Oqa ,Opb ] = i~ δab , (89)

fur alle moglichen Zustande eines beliebigen quantenme-chanischen Systems.

Also sind Orts– und Impulsmessung in der Quanten-mechanik nicht miteinander vertraglich. Folglich machtes keinen Sinn, daß ein Zustand als Speicher gleichzeitgOrts– und Impulsinformation tragen kann. Im Vergleichzur Klassischen Mechanik erlaubt die Quantenmechaniknur Zustande, aus denen eben nicht die gesamte denkbareObservablen–Information gleichzeitig ausgelesen werdenkann. Dies fuhrt zum Konzept der maximal moglichen(< gesamten) Information, die ein quantenmechanischerZustand quasi als Speicher tragen kann.

Wir konnen unser Erstaunen uber die prinzipielleUnvertraglichkeit von Orts– und Impulsmessung wei-ter quantifizieren: Der Erwartungswert der Koordinateqa , a ∈ 1, 2, 3 im Zustand | z 〉 ∈ Z ist

qazdf= 〈z|Oqa | z 〉 =

∫R

dx |Z(x)|2 xa . (90)

Ein Maß fur die Ungenauigkeit, mit der qa im Zustand| z 〉 festgelegt ist, gibt die sogenannte Varianz

Varz (qa)df=⟨z∣∣∣ (Oqa − qaz )2 ∣∣∣z⟩

=

∫R

dx∣∣∣ (Oqa − qaz )Z(x)

∣∣∣2 , (91)

beziehungsweise die Streuung

Streuz (qa)df=√

Varz (qa) . (92)

Fur die Impulskoordinate pb gilt entsprechendes.

Offenbar gibt es Zustande, fur die die Ortskoordina-te bzw. die Impulskoordinate beliebig genau lokalisiertsind, d.h. die Streuung der Orts– bzw. Impulskoordinateist beliebig klein. Jedoch ist es prinzipiell unmoglich, so-wohl Streuz (qa) als auch Streuz (pa) gleichzeitig beliebigklein (scharf) zu machen. Dieses ungeheuerliche Resultatformulieren wir als

Satz VI.2 (Unscharferelation von Heisenberg)Fur jeden normierten Zustand | z 〉 ∈ D ⊂ Z gilt:

Streuz (qa) · Streuz (pa) ≥ ~/2 . (93)

Beweis VI.1 Zunachst einmal gilt mit der Schwarz-

schen Ungleichung:

Streuz (qa) · Streuz (pa) =

=∥∥(Oqa − qaz ) | z 〉∥∥ ‖(Opa − pza) | z 〉‖ Schwarz

=

≥∣∣∣⟨z∣∣∣ (Oqa − qaz ) (Opa − pza)

∣∣∣z⟩∣∣∣≥∣∣∣Im⟨z∣∣∣ (Oqa − qaz ) (Opa − pza)

∣∣∣z⟩∣∣∣=∣∣∣⟨z∣∣∣ (Oqa − qaz ) (Opa − pza)

∣∣∣z⟩+

−⟨z∣∣∣ (Opa − pza)

(Oqa − qaz

) ∣∣∣z⟩∣∣∣/2=∣∣∣⟨z∣∣∣ [Oqa − qaz ,Opa − pza] ∣∣∣z⟩∣∣∣/2

=∣∣∣⟨z∣∣∣ [Oqa ,Opa ]

∣∣∣z⟩∣∣∣/2 (89)=

= ~/2 (94)

Damit ist die Unscharferelation bewiesen. ∗–< [; 0)

Die Unscharferelation von Heisenberg ist eine direkte Fol-ge der Unvertraglichkeit von Orts– und Impulsmessung,die von prinizpieller Natur ist und nicht eine praktischeSchranke darstellt. Sie besagt salopp gesschrieben, daßwir an einem quantenmechanischen System selbst mitidealen Meßapparaturen niemals Ort und Impuls gleich-zeitig beliebig scharf messen konnen. Und mehr noch:Legen wir Wert auf mehr Scharfe bei der Ortsmessung,so fuhrt das aus fundamentalen Grunden zwingend zumehr Unscharfe bei der Impulsmessung. Eine solche fun-damentale Unscharfe existiert im Gutligkeitsbereich derKlassischen Mechanik nicht. Sie widerspricht sogar ganzentschieden ihrer Zustandsbeschreibung. Damit sind wirgezwungen, die Suche nach einem direkten Analogon zumPhasenraum der Klassischen Mechanik nach Hamilton zuverwerfen.

Im ubrigen laßt sich die Unscharferelation wesentlichverallgemeinern:

Satz VI.3 (Verallgemeinerte Unscharferelation)Seien OA ,OB Observablen. Dann gilt fur alle Zustande| z 〉 ∈ D(OAOB) ∩ D(OBOA) ⊂ Z,

Streuz (A) · Streuz (B) ≥∣∣∣⟨z∣∣∣ [OA,OB ]

∣∣∣z⟩∣∣∣/2 . (95)

Beweis VI.2 Wie Beweis VI.1, da dort lediglich dieSelbstadjungiertheit von Oq ,Op ausgenutzt und keinespeziellen Eigenschaften dieser Observablen benutzt wur-den. ∗–< [; 0)

D. Energie als quantenmechanische Observable

Ein mechanisches System ist in der Formulierung nachHamilton charakterisiert durch das Paar (P, H), wo-bei P den Impuls–Phasenraum bezeichne und H dieHamilton–Funktion. Unsere bisherigen Uberlegungen ha-ben sich daran orientiert, das Konzept des Phasenraumes

Page 36: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

36

in die Quantenmechanik zu ubertragen. Wir waren semi–erfolgreich, da uns diese Uberlegungen zwar zu Orts–und Impulsobservablen gefuhrt haben, diese allerdingsnicht beide gleichzeitig beliebig scharf gemessen werdenkonnen. Mit der Energiefunktion H haben wir uns nochnicht beschaftigt und das holen wir nun an dieser Stellenach.

Dazu bedarf es einer Erinnerung: Auch die Energieeines Systems ist in der Klassischen Mechanik eine Be-wegungskonstante, allerdings ist der Zusammenhang zueiner Symmetrie etwas komplizierter zu verstehen, weilihre Erhaltung eine Konsequenz der Invarianz unter Zeit-translationen ist, und Zeit eine Sonderrolle in der Klas-sischen Mechanik spielt, was der Ignoranz gegenuver derSpeziellen Relativitatstheorie geschuldet ist. Zum einennamlich ist Zeit eine Komponente der Galilei–Raumzeit,andererseits wird sie als Paramer benutzt, der die Dyna-mik in P schlicht parametrisiert.

Um den Zusammenhang zwischen Energieerhaltungund Symmetrie bei Zeittranslationen aufzuzeigen, ist esnotwendig, die Doppelrolle der Zeit als Komponente derGalilei–Raumzeit einerseits und als dynamischer Para-meter andererseits in zwei getrennte Konzepte zu zerle-gen. Das geht schnell so: Wir betrachten ein Lagrange–System mit einem KonfigurationsraumQ ⊂ Rn und einerLagrange–Funktion L : Q× Rn −→ R. Wir erweitern Qzum neuen Konfigurationsraum Q′ := Q×R mit Koordi-naten (q, τ). Der erweiterte Geschwindigkeitsphasenraumist dann Q′ × Rn+1 mit den Koordinaten (q, τ, v, ν). DieParameter–Zeit bezeichnen wir mit t, nicht zu verwech-seln mit der physikalischen Zeit τ = f(t). Also ist ν =dτ/dt. Was ist nun der Zusammenhange zwischen derneuen (erweiterten) und der alten Lagrange–Funktion?Diese Frage muß mit besonderem Bedacht angegangenwerden: Das ist der Fall, weil in der ursprunglichen Wir-kung L ja uber die Parameter–Zeit integriert wird. Esgilt L′(q, v, ν)dτ = L(q, v/ν)νdt. Wahlen wir ν(t) = 1, soliefern die Euler–Lagrange–Gleichungen fur die erweiter-te Lagrange–Funktion die gleichen Bewegungsgleichun-gen wie fur die ursprungliche Lagrange–Funktion.

Die Schar von Zeittranslationen Tss∈R mit Ts :Q′ −→ Q′, definiert durch Ts(q, τ) := (q, τ + sb) , b ∈ Rerfullt offenbar L′(Ts(q, τ), DTs(v, ν)) = L′(q, v, ν) we-gen DTs = T0 = id, so daß sich nach dem Satz vonNoether uber X(q, τ) = d(q, τ+sb)/ds = (0, b) als Erhal-tungsgroße IX(q, v) = 〈∂L′/∂v, o〉+ (∂L′/∂ν)(q, v, 1)b =−bE ergibt. Der Name Energie ist gerechtfertigt, da furnaturliche Systeme E = T +U . Soweit die Wiederholungaus der elementaren Mechanik.

Alternativ: Sei B(q, τ, v) eine Observable im er-weiterten Geschwindigkeitsphasenraum. Wir vergleichenB(q, τ + δ, v) , δ ∈ R mit B(q, τ, v). Ohne große Beden-ken gilt formal B(q, τ + δ, v) = (1 + δ∂τ + . . . )B(q, τ, v).Operationell fuhren wir daher in die Klassische Mecha-nik einen Zeittranslationsoperator folgendermaßen ein:Tδ : O(P ′) −→ O(P ′), definiert durch

(Tδ (B)) (q, τ, v)df= B(q, τ + δ, v)

= exp (δ∂τ )B(q, τ, v) . (96)

Naturlich ist ∂τ der Generator fur Zeittranslationen.Die Fourier–konjugierte Variable zur physikalischen

Zeit τ hat die Maßeinheit einer Frequenz f . Durch ahn-liche Uberlegungen wie bei der Konstruktion der Impul-sobservablen kann diese Frequenz mittel E = ~2πf ≡ ~ωzu einer Energie E transformiert werden. Aus stilisti-schen Grunden bezeichnen wir die Energie–Funktion mitH(q, p) (Hamilton–Funktion). Also ist der Generator furZeittranslationen im Frequenzraum gerade die Hamilton–Funktion.

Die Ubertragung in die Quantenmechanik ist nichtso direkt, auch wenn sie trotzdem mittels unitarerDarstellungstheorie geschieht, da die Zeit auch in derQuantenmechanik eine Sonderrolle spielt. Tatsachlich istdie Buhne fur die Quantenmechanik auch die Galilei–Raumzeit. Vorab die Situation: Eine zweckmaßige Vor-stellung ist die, daß die Zeit mit einer Uhr gemessen wird,die Teil eines klassischen Labors ist, aber niemals auseinem quantenmechanischen Zustand extrahiert werdenkann. Mit anderen Worten, die Zeit bleibt eine externeGroße. Nun konnten Sie mit Fug und Recht einwenden,daß dies doch eigentlich auch fur den Ort so sein sollte,zumindestens sollten doch Ort und Zeit eigentlich uberMaßstab und Uhr beides Großen sein, die externen Cha-rakter haben, weil sie eher unsere Laborausstattung (Ko-ordinatensystem, etc) reflektieren, als eine intrinsischeEigenschaft eines Systems. Und Sie haben damit voll-kommen recht, sobald wir gezwungen sind, der spezielleRelativitatstheorie Rechnung zu tragen, wird dies auchso sein: dann werden weder Ort noch Zeit Eigenschaftensein, die ein Zustand intrinsisch tragt. Vielmehr wird derZustand vermessen in einem Laborsystem, daß mit einemKoordinatensystem und einer Uhr daherkommt.

Dass wir hier gegen Ihre Erwartung verstoßen liegtnur daran, daß bereits in der klassischen Mechanik derOrt (Konfigurationsraum, Phasenraum) eine ganz ande-re Rolle spielt als die Zeit (Parameter). Die Zeit ist be-reits in der Klassischen Mechanik keine Meßgroße. Wiegehen wir also vor? Zunachst einmal beschaffen wir unseine unitare Darstellung der Zeittranslation, die wir mitU(t − t0) , t ∈ [t0,∞) ⊂ R bezeichnen, und eine Zeit-translation von t0 nach t beschreiben soll. Wir setzenZ 3| z 〉(t) := U(t − t0) | z 〉, wobei wir | z 〉 den Zeit-punkt t0 zuordnen, also hierfur auch | z 〉(t0) schreibenkonnten. Dies setzt voraus, daß U(0) = id, was offenbarsinnvoll ist. Fur die Wellenfunktion im Ortsraum schrei-ben wir Z(t, x) := 〈x|U(t − t0) | z 〉(t0), auch wenn dasdie offenkundige Ungleichbehandlung von Zeit und Ortnotationstechnisch verwassert.

Ahnliche Uberlegungen wie zur Impulsobservablen zei-gen, daß i~∂t ein selbstadjungierter Operator ist undU(t− t0) = exp (−i(t− t0)(i~∂t)/~) die gesuchte unitareDarstellung fur Zeittranslationen uber das Zeitintervallt− t0. Eine ensprechende Analyse im Fourier–Raum legtnahe, i~∂t mit dem Hamilton–Operator OH zu identi-fizieren. Fur diesen suchen wir noch einen Ausdruck inAbhangigkeit von Orts– und Impulsobservablen, was ja

Page 37: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

37

die Analogie zur Klassischen Mechanik darlegt, in derdie Hamilton–Funktion ja im Impulsphasenraum defi-niert ist. Der Frage ob OH = H(Oq,Op) sinnvoll ist,gehen wir im Abschnitt Kanonische Quantisierungnach.

Im Moment haben wir folgende Beziehung zwischenOperatoren: i~∂t = OH , also gilt fur alle | z 〉 ∈ Z,

i~∂t | z 〉(t) = OH | z 〉(t) . (97)

Gleichung (97) heißt Schrodinger–Gleichung. Sie istdie grundlegende Prozessgleichung der Quantenmecha-nik und beschreibt die (externe) Zeitentwicklung einesquantenmechanischen Zustandes relativ zu einer exter-nen Uhr, die als klassische Komponente des Labors vor-ausgesetzt wird. Im modernen Zugang, also nicht uberdie Wellenmechanik, ist die Schrodinger–Gleichung ei-ne direkte Konsequenz der unitaren Darstellungstheo-rie von Zeittranslationen auf komplexen ZustandsraumenZ, wenn als Isometriegruppe der Raumzeit die Galilei–Gruppe angenommen wird.

Wir nehmen in dieser Vorlesung an, daß OH nicht ex-plizit von der Zeit abhangt. Dann kann die Schrodinger–Gleichung bequem integriert werden und wir erhalten alsformale Losung der Schrodinger Gleichung mit Anfangs-bedingung | z 〉(t)|t=t0 =| z 〉(t0):

| z 〉(t) = exp (−i(t− t0)OH/~) | z 〉(t0) . (98)

Dies war so bequem moglich, weil im Falle, daß OHexplizit zeitunabhangig ist, [OH ,OH ] = 0 ∀t ∈R. Im allgemeinen ist OH explizit zeitabhangig und[OH(t1),OH(t2)] 6= 0 , t1, t2 ∈ R. Dann ist immer nocheine formale Losung der Schrodinger–Gleichung moglich,und zwar in Form der sogenannten Dyson–Reihe.

Da zumindestens OH = f(Oq,Op) gilt, ist es nichtmoglich, direkt Energie–Eigenzustande zu konstruieren,denn Oq,Op vertragen sich ja nicht. Außerdem setztdie Operatorbeziehung i~∂t = OH ja die Energie–Observablen gleich der Zeittranslation relativ zu einerexternen Uhr, die nicht von den Zustanden | z 〉 ∈ Z ge-tragen wird und auch keine intrinsische Eigenschaft die-ser Zustande mißt. Es laßt sich aber folgendermaßen eineindirekte Konstruktion bewerkstelligen: Sei OA eine Ob-servable mit [OA,OH ] = 0, also eine zu OH vertraglicheObservable, mit OA|a〉 = a|a〉 , a ∈M(OA). Dann ist of-fenbar OH |a〉 = E(a)|a〉 , E(a) ∈ M(OH) ∀a ∈ M(OA),d.h. die moglichen Energie–Eigenwerte hangen von denOA–Eigenwerten ab.

Fur die Zeitevolution eines Zustandes | z 〉 gilt dann

| z 〉(t) ≡ U(t− t0) | z 〉(t0)

= U(t− t0)∑

a∈M(OA)

∫|a〉〈a | z 〉(t0)

=∑

a∈M(OA)

∫|a〉 exp (−i(t− t0)E(a)/~)Z(t0, a)

≡∑

a∈M(OA)

∫Z(t, a)|a〉 . (99)

Hier wird deutlich, daß die Zeitabhangigkeit den Ent-wicklungskoeffizienten zugeschrieben wird, nicht denEnergie–Eigenzustanden. Mit anderen Worten, Zustandeentwickeln sich intrinsich gar nicht, lediglich die Wahr-scheinlichkeiten, mit denen ein Zustand in einem be-stimmten Observablen–Eigenzustand vorliegt. Das ist einganz anderes Dynamik–Konzept, als wir es aus der Klas-sischen Mechanik gewohnt sind, naher an der Dynamikvon Systemen die wir im Rahmen der Statistischen Me-chanik behandeln.

Einsetzen unseres Resultates (99) in die Schrodinger–Gleichung gibt die Schrodinger–Gleichung fur dieWellenfunktion Z(t, a) ≡ 〈a | z 〉(t),

i~∂t Z(t, a) = OH Z(t, a) . (100)

Ein Zustand |a〉 eines quantenmechanischen Systemsheißt stationar, wenn er Eigenzustand von OH ist,d.h. wenn es eine Observable OA gibt mit [OA,OH ] = 0und OA|a〉 = a|a〉, sagen wir zum Energie–EigenwertE(a) ∈ M(OH). Im allgemeinen wird ein solcher Eigen-zustand nicht im physikalischen Zustandsraum Z liegen,aber das kummert uns im Moment nicht, weil wir ja jedenphysikalischen Zustand des Systems nach diesen Eigen-zustanden entwickeln konnen.

Fur diesen Fall liefert die Schrodinger–Gleichung|a〉(t) = exp (−i(t− t0)E(a)/~)|a〉(t0). Da |a〉 ein Ei-genzustand von OH ist, tritt in der Auswertungder Zeittranslation keine Superposition von Energie–Eigenzustanden auf, was eine wichtige Konsequenz hat:|a〉(t) ∼ |a〉(t0), wobei die Aquivalenzrelation beideZustande dem selben Strahl zuweist, womit beide exaktdie gleiche physikalische Zustandsbeschreibung liefern.

E. Nachlese: Unitare Operatoren & Symmetrien

Wir systematisieren ein wenig unsere Erkenntnisseuber Symmetrien in der Quantenmechanik und Obser-vablen.

Def. VI.4 Ein unitarer Operator ist eine surjektive C–lineare Abbildung U : Z −→ Z, welche das Skalarpro-dukt in Z invariant laßt, d.h. fur alle |φ〉, |ψ〉 ∈ Z gilt:〈φ|U†U |ψ〉 = 〈φ|ψ〉.

Ein unitarer Operator ist automatisch beschrankt(und deshalb auch stetig), denn es gilt ja ‖U |ψ〉‖2 =〈ψ|U†U |ψ〉 = 〈ψ|ψ〉 = ‖|ψ〉‖2 wegen der Invarianzei-genschaft, also ‖U‖ = sup‖U |ψ〉‖ : ‖|ψ〉‖ = 1 =sup‖|ψ〉‖ : ‖|ψ〉‖ = 1. Ein unitarer Operator ist au-ßerdem injektiv, denn fur |φ〉, |ψ〉 ∈ Z mit U |φ〉 = U |ψ〉gilt U(|φ〉 − |ψ〉) = 0, also ‖|φ〉 − |ψ〉‖ = 0, und es folgt|φ〉 = |ψ〉. Damit ist jeder unitare Operator U stetig(nicht gezeigt) und bijektiv. Daher ist auch der inverseOperator U−1 als linearer Operator auf ganz Z definiert,und ist auch ein unitarer Operator.

Da außerdem fur zwei unitare Operatoren U1, U2 auchdie Komposition U1 U2 : Z −→ Z unitar ist, bildet die

Page 38: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

38

Gesamtheit der unitaren Operatoren auf Z eine GruppeU(Z), die sogenannte unitare Gruppe.

Def. VI.5 Eine 1–Parametergruppe von unitaren Opera-toren ist eine Schar Uss∈R, welche durch die WirkungΦ : R × Z −→ Z der Gruppe R auf Z gegeben ist, alsoUs|ψ〉 = Φ(s, |ψ〉) fur (s, |ψ〉) ∈ R×Z, mit den folgendenEigenschaften:

(1) Us ∈ U(Z) ∀s ∈ R.

(2) s −→ Us|ψ〉 , s ∈ R, ist stetig ∀|ψ〉 ∈ Z.

Insbesondere folgt aus der Eigenschaft von Φ als Wir-kung, daß fur alle s, t ∈ R stets UsUt = Us+t gilt. In mo-derner Terminologie ist die Abbildung s −→ Us , s ∈ R,von R nach U(Z) eine unitare Darstellung der additivenGruppe R der reellen Zahlen.

Def. VI.6 Sei Uss∈R eine 1–Parametergruppevon unitaren Operatoren. Der zugehorigeinfinitesimale Erzeuger T ist wie folgt definiert:

D(T )df=|ψ〉 ∈ Z : ∃ lim

s→0(Us − idZ) |ψ〉/s

T |ψ〉 df

= i(

lims→0

(Us − idZ) |ψ〉/s), |ψ〉 ∈ D(T ) .

Es gilt jetzt der folgende

Satz VI.4 von Stone 1. Der infinitesimale Erzeuger ei-ner 1–Parametergruppe von unitaren Transformationenist selbstadjungiert.2. Zu jedem selbstadjungierten Operator T auf Z gibtes eine eindeutig bestimmte 1–Parametergruppe vonunitaren Operatoren, zu der T der infinitesimale Erzeu-ger ist. Diese 1–Parametergruppe von unitaren Trans-formationen wird in Abhangigkeit von T mit Us =exp (−isT ) bezeichnet.

Damit stehen also Observablen in einer eineindeutigenKorrespondenz zu einer 1–Parametergruppe von unitarenOperatoren.

Def. VI.7 Sei G eine (Matrix–) Gruppe, Z ein komple-xer Hilbert–Raum und U(Z) die unitare Gruppe von Z.Eine unitare Darstellung von G in Z ist ein Gruppenho-momorphismus

U : G −→ U(Z) , (101)

der in folgendem Sinn stetig ist: Fur alle konvergen-ten Folgen (gν) in G und alle |ψ〉 ∈ Z gilt: Die Folge(U(gν)|ψ〉) konvergiert bezuglich der Norm in Z und esgilt limU(gν)|ψ〉 = U(lim gν)|ψ〉.

Die Darstellung heißt treu, wenn U injektiv ist, alsowenn G isomorph zur Untergruppe U(G) ⊂ U(Z) ist.

Die Qualifikation unitar spielt eine wichtige Rolle, weilsie garantiert, daß die Darstellung auf Z normerhal-tend operiert.

Fur eine unitare Darstellung U im physikalischen Zu-standsraum Z macht die durch U definierte WirkungΦ : G × Z −→ Z , (g, | z 〉) −→ U(g) | z 〉 = Φ(g, | z 〉)die Gruppe G zu einer Symmetriegruppe im Sinne Ih-rer Mechanik–Vorlesung. Die Struktur, die erhalten wird,ist die unitare Struktur des Zustandsraumes Z, diedurch das Skalarprodukt oder durch die unitare GruppeU(Z) gegeben ist. Zu der in der Mechanik getroffenenDefinition kommt hier allerdings noch die Stetigkeitsbe-dingung hinzu.

Der Begriff der unitaren Darstellung fur Symmetrie-betrachtungen bei quantenmechanischen Systemen rucktins Zentrum des Interesses, weil, wie oben angemerkt,eine unitare Darstellung das Skalarprodukt und damitdie Ubergangswahrscheinlichkeit unverandert laßt. Wirnennen eine unitare Darstellung U : G −→ U(Z) ei-ne Symmetrie des quantenmechanischen Systems(Z,OH), wenn außerdem noch die Rolle von OH invari-ant gelassen wird in folgendem Sinne: Jede Losung derGleichung i~∂t | z 〉 = OH | z 〉 soll durch U(g) fur je-des g ∈ G in eine Losung uberfuhrt werden, das heißt,es soll gelten, i~∂tU(g) | z 〉 = OHU(g) | z 〉. Wegeni~∂tU(g) | z 〉 = U(g)i~∂t | z 〉 = U(g)OH | z 〉 folgt:[OH ,U(g)] | z 〉 = 0. Wir fassen zusammen:

Def. VI.8 Eine unitare Darstellung U der MatrixgruppeG im Zustandsraum Z ist eine Symmetrie des quanten-mechanischen Systems (Z,OH), wenn fur alle g ∈ G gilt:[OH , U(g)] = 0.

Mit dieser Definition von Symmetrie ist in Analogie zuder Situation in der Klassischen Mechanik ein Erhal-tungssatz verbunden. Der selbstadjungierte OperatorOXheißt Bewegungskonstante des quantenmechanischenSystems (Z,OH), wenn [OH ,OX ] = 0. Diese Definitionist sinnvoll, wie wir gesehen haben.

Wie in der Klassischen Mechanik ist es zweckmaßig,statt direkt mit der Symmetriegruppe G besser mit denzugehorigen ’infinitesimalen Symmetrien’, also den Ele-menten aus g = LieG, zu arbeiten.

Eine Rechtfertigung fur dieses Vorgehen findet sich inder Tatsache, daß eine unitare Darstellung der GruppeG in naturlicher Weise eine Darstellung der zugehorigenLie–Algebra wie folgt induziert. Sei U : G −→ U(Z) ei-ne endlichdimensionale Darstellung unitare Darstellung(d.h. dim(Z) < ∞) der Matrixgruppe G. Dann ist furX ∈ g durch Us := U(exp (sX)) , s ∈ R, eine 1–Parametergruppe von unitaren Transformationen gege-ben. Us hat einen infinitesimalen Erzeuger σ(X), wobei

σ(X)|ψ〉 df= i lim

s→0(Us − idZ) |ψ〉/s , |ψ〉 ∈ D(σ(X)) .

Tatsachlich ist σ(X) auf ganz Z definiert als

σ(X) = id

dsUs

∣∣∣∣s=0

. (102)

Das ist so, weil dim(Z) < ∞ und daher alle unitareOperatoren durch unitare Matrizen dargestellt werden

Page 39: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

39

konnen. Es gilt fur die Lie–Klammer auf g bzw. End(Z):

[σ(X), σ(Y )] = iσ ([X,Y ]) ,∀X, y ∈ g . (103)

Das sehen wir schnell ein: Wir setzen ρ(X) :=−iσ(X), also ρ(X) = dU(exp (sX))/ds|s=0 und rech-nen [ρ(X), ρ(Y )] = ρ([X,Y ]) nach. Somit ist ρ : g −→End(Z) eine Darstellung von g in Z, welche auch mitLieU = ρ bezeichnet wird.

Der angesprochene Erhaltungssatz lautet jetzt folgen-dermaßen:

Satz VI.5 Sei (Z,OH) ein quantenmechanisches Sy-stem mit einer Symmetrie, die durch eine unitare Dar-stellung U : G −→ U(Z) gegeben ist. Fur jedes ElementX ∈ g der Lie–Algebra g von G ist der infinitesimale Er-zeuger σ(X) von U(exp (sX)) eine Bewegungskonstante.

Beweis VI.3 Das ist klar, denn [OH , σ(X)] =[OH , idUs/ds|s=0] = i d[OH , Us]/ds|s=0. Nach Voraus-setzung gilt aber [OH , Us] = 0 ∀s ∈ R y [OH , σ(X)] = 0.Also ist σ(X) eine Bewegungskonstante. ∗–< [; 0)

Im Folgenden wollen wir einen kleinen Einblick in dieDarstellungstheorie von kompakten Gruppen wagen, umdann ausfuhrlich einen Uberblick uber die unitaren Dar-stellungen der Drehgruppe SO(3) zu bekommen. Das Zielist also das Konzept der Drehung vom Konfigurations-raum der klassischen Mechanik in die komplexen Zu-standsraume quantenmechanischer Systeme zu ubertra-gen. Dazu benotigen wir noch folgenden Begriff:

Def. VI.9 Sei U : G −→ U(Z) eine unitare Darstellung.Ein abgeschlossener linearer Unterraum V ⊂ Z heißtinvariant, wenn U(g)V ⊂ V ∀g ∈ G.

Ist V ein invarianter Unterraum, so ist die Ein-schrankung U |V : G −→ U(V), definiert durch U |V(g) :=U(g)|V : V −→ V , g ∈ G, eine unitare Darstellung in V,die sogenannte Reduktion von U auf V.

Die unitare Darstellung U heißt irreduzibel, wenn eskeine solche Reduktion gibt, das heißt, wenn fur jedeninvarianten Unterraum bereits gilt: V = Z oder V = ∅.

Es erweist sich nun als ungemein vorteilhaft, daß derDarstellungsraum ein Hilbert–Raum ist, der mit einerschonen und nutzlichen geometrischen Struktur ausge-stattet ist, daß wir zum Beispiel das Folgende leicht ein-sehen konnen: Sei U : G −→ U(Z) eine unitare Darstel-lung, und V ⊂ Z ein invarianter Unterraum. Dann istauch das orthogonale Komplement,

V⊥ df= |ψ〉 ∈ Z : 〈φ|ψ〉 = 0 ∀|φ〉 ∈ V ,

ein invarianter Unterraum zu U . Deshalb zerlegt sich imFalle ∅ 6= V 6= Z die unitare Darstellung U in die Ein-schrankungen U |V und UV⊥ von U aus V und V⊥. Esgilt somit: U = U |V ⊕ UV⊥ in folgendem Sinne: Jedes|χ〉 ∈ Z hat die eindeutige Zerlegung |χ〉 = |χ〉V ⊕ |χ〉V⊥mit |χ〉V ∈ V und |χ〉V⊥ ∈ V⊥. Und fur g ∈ G gilt:U(g)|χ〉 = U |V |χ〉V ⊕ UV⊥ |χ〉V⊥ . Falls nun V und V⊥

ebenfalls nichttriviale Unterraume enthalten, so laßt sichdieses Zerlegungsverfahren wiederholen. Es gilt der wich-tige

Satz VI.6 (von Peter und Weyl) Sei G eine kompakteMatrixgruppe. Dann gilt fur jede unitare Darstellung U :G −→ U(Z) in einem Hilbert–Raum Z:

(1) Ist U irreduzibel, so ist dim(Z) <∞.

(2) U zerfallt in irreduzible Darstellungen Uj in folgen-dem Sinne: Es gibt invariante Teilraume Vj ⊂ Z,welche paarweise orthogonal zueinander sind undZ aufspannen:Z = ⊕jVj, so daß fur die Ein-schrankungen U |Vj gilt U = ⊕jU |Vj . Je nachdem,ob Z endlich– oder unendlichdimensional ist, istdie Summation uber eine endliche oder unendlicheIndexmenge j zu verstehen.

Um den Satz von Peter und Weyl auf physikalischeSymmetrien mit einer kompakten Symmetriegruppe Ganwenden zu konnen, ist es also sinnvoll, die irreduziblenDarstellungen von G umfassend zu beschreiben. Es er-weist sich als zweckmaßig, anstelle der Gruppe G ersteinmal die zugehorigen infinitesimalen Symmetrien zubetrachten, wie wir bereits wissen.

Am Beispiel der Drehgruppe SO(3) gehen wir so ex-plizit vor, beschaffen uns also zunachst die irreduziblenDarstellungen der Lie–Algebra so(3) ∼= su(2). Eine Basisvon so(3) ist durch die drei Matrizen

M1 =

0 0 00 0 −10 1 0

, M2 =

0 0 10 0 0−1 0 0

,

M3 =

0 −1 01 0 00 0 0

, (104)

gegeben. Es gilt [Ma,Mb] = εabcMc , a, b, c ∈ 1, 2, 3.Dies ist die definierende Algebra von infinitesimalen Dre-hungen.

Sei Z ein Hilbert–Raum mit dim(Z) < ∞, und ρ :so(3) −→ End(Z) eine Darstellung von so(3) in Z. Wirsetzen Ja := iρ(Ma) , a ∈ 1, 2, 3. Ja ist dann der Ge-nerator fur Drehungen um die a–Achse und entsprichtder selbstadjungierten Version der a–ten Komponentedes Drehimpulses. Wir werden alsbald einsehen, daß diesmehr liefert als nur die kanonische Quantisierung desklassischen Bahndrehimpulses (siehe unten). Da ρ dieLie–Klammern respektiert, gilt [Ja, Jb] = iεabcJc.

Statt direkt mit dem Satz Jaa∈1,2,3 zu arbei-ten, erweist es sich als zweckmaßiger, mit folgendenOperatoren zu arbeiten: J3, J± := J1 ± iJ2. Dies istnaturlich nicht evident, insbesondere weil lediglich J3

ein selbstadjungierter Operator ist, wahrend J± offen-bar nicht selbstadjungiert sind, sondern zueinander ad-jungiert: (J+)† = J−. Andererseits wissen wir, daß dieKomponenten Ja , a ∈ 1, 2, 3 sich nicht vertragen, folg-lich konnen wir physikalische Zustande ohnehin nur mit

Page 40: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

40

einer Drehimpulskomponente charakterisieren. Wir ha-ben uns fur J3 entschieden. Die nicht–selbstadjungiertenOperatoren J± sind also in diesem Sinne genauso gutwie die verbleibenden Komponenten. Da wir algebraischvorgehen wollen, notieren wir

[J3, J±] = ±J± , [J+, J−] = 2J3 ,

J J = J−J+ + (id + J3) J3 . (105)

Die folgenden drei Aussagen enthalten die wesentlichenInformationen uber irreduzible Darstellungen von so(3).

Lemma VI.1 Sei |m〉 ∈ Z (dim(Z <∞)) mit J3|m〉 =m|m〉. Dann gilt:

J3(J±|m〉) = (m± 1)J±|m〉 . (106)

Beweis VI.4 Mittels elementarer Rechnung:

J3(J±|m〉)(105)= (±J± + J± J3) |m〉= (±J± + J±m) |m〉= (m± 1) J±|m〉 . (107)

Das war es auch schon. ∗–< [; 0)

Die Interpretation dieses Lemmas liefert uns eine In-terpretation fur die durch J± gegebenen Operationen,namlich, J±|m〉 ist wieder ein Eigenzustand zu J3, al-lerdings zu einem um eine Einheit erhohten/erniedrigtenEigenwert. Mit anderen Worten, mittels J± konnen wirdas Spektrum M(J3) von J3 in aquidistanten Abstandennach oben und unten durchlaufen, wobei jede Stufe die-ser Leiter selbst wieder durch einen Eigenwert von J3 ge-kennzeichnet. Das bedeutet naturlich noch nicht, daß wirauf diese Weise wirklich das gesamte Spektrum durchlau-fen, aber es rechtfertigt den Begriff Leiteroperator furJ±. Außerdem reflektiert sich hier eine gewisse Logik un-serer Methodik: da wir vereinbart haben, Zustande mitden moglichen Meßwerte von J3 zu bezeichnen, und J3

sich nicht mit J1, J2 vertragt, nutzen wir Linearkombi-nationen von lezteren, um moglichst viel uber M(J3) ausalgebraischen Betrachtungen zu lernen. Zum Beispiel:

Lemma VI.2 Es gibt einen Eigenzustand |m〉 ∈ Z vonJ3 mit J+|m〉 = 0.

Beweis VI.5 Anschaulich ist das klar, da nach Voraus-setzung dim(Z) < ∞. Nun ja: Sei |m〉 ∈ Z ,m ∈M(J3)beliebig. Mit (105) folgt: J3 J+|m〉 = (m + 1)J+|m〉,also J+|m〉 =: N|m + 1〉, wobei N ∈ C und wirwahlen N = 1. Wir denken uns uber J3|m + n〉 =(m + n)|m + n〉 , n ∈ N induktiv eine Folge von Eigen-zustanden erzeugt. Bricht diese Folge irgendwann ab? Danach Voraussetzung dim(Z) < ∞, existiert ein n′ ∈ Nmit J+|m + n′〉 = 0, sonst ware dim(Z) = ∞ im Wi-derspruch zur Voraussetzung. Sei nun n = supn′ ∈N : J3|m + n′〉 = 0. Fur den Zustand |m + n〉 ∈ Zgilt: m + n ∈ M(J3) und J+|m + n〉 = 0. Wir setzenm := m+ n. ∗–< [; 0)

Also ist M(J3) nach oben beschrankt. Wir sehen aberu.a. gleich, daß das Spektrum M(J3) auch nach untenbeschrankt sein muß, und zwar aus dem gleichen Grund,namlich der Voraussetzung eines endlichdimensionalenDarstellungsraumes.

Lemma VI.3 Sei m ∈M(J3) wie in Lemma VI.2. Danngilt m ∈ N/2. Wir setzen |m − k〉 := (J−)k|m〉 , k ∈ N.Die Menge |m〉, . . . , | −m〉 ist eine Basis eines invari-anten Untervektorraumes V ⊂ Z.

Es gilt mit J2 = J1J1+J2J2+J3J3, daß J2|m−k〉 =m(m + 1)|m − k〉 , k ∈ 0, . . . , 2m ⊂ N. Das bedeutet,daß V Eigenraum zu J2 zum Eigenwert m(m+ 1) ist.

Beweis VI.6 Zunachst ist m− k ∈M(J3) nach LemmaVI.1, und J−|m − k〉 = |m − (k + 1)〉 nach Definition.Außerdem gilt

J+|m− k〉 = k (2m− (k − 1)) |m− (k − 1)〉 ,(108)

wie Sie als Ubung per Induktion nach k zeigen sollen.Die Folge J−|m〉 muß wegen dim(Z) < ∞ irgendwannabbrechen. Sei m ∈ N mit |m−m〉 6= 0 und J−|m−m〉 =0, wobei m := infk′ ∈ N : J3|m − k′〉 = 0. Also ist|m− (m+ 1)〉 = 0 y

0 = J+|m− (m+ 1)〉 (108)= (m+ 1)(2m−m)|m−m〉 .

Nach Voraussetzung ist |m − m〉 6= 0y 2m − m =0y2m = m ∈ N.

Fur O ∈ J3, J± zeigen die aufgestellten Gleichungen,daß O|m − k〉 , k ∈ 0, . . . , 2m ⊂ N eine Linearkombi-nation der Basiszustande |m − k〉k∈0,...,2m ist. Also,OV ⊂ V, d.h. V ist invariant.

Schließlich ist J2 = J−J++J3(id+J3), woraus nacheiner kleinen Rechnung J2|m−k〉 = m(m+1)|m−k〉 , k ∈0, . . . , 2m ⊂ N folgt. ∗–< [; 0)

Wir fassen unsere Ergebnisse in einer gebrauchlichenNotation folgendermaßen zusammen:

Satz VI.7 Es sei ρ : so(3) −→ End(Z) eine endlichdi-mensionale Lie–Algebra–Darstellung. Sei j ∈M(J3) mit|j〉 6= 0 und J+|j〉 = 0.

(1) Sei zunachst k ∈ N und Z 3 |j−k〉 := (J−)k|j〉 , |j+1〉 = 0. Dann gilt fur m = j − k:

J3|m〉 = m|m〉 , J−|m〉 = |m− 1〉 , (109)

J+|m〉 = [j(j + 1)−m(m+ 1)] |m+ 1〉 , (110)

|m〉 = 0 fur m < j . (111)

(2) Es ist 2j ∈ N, und | − j〉, | − j + 1〉, . . . , |j〉 istBasis eines invarianten Unterraums V(j) ⊂ Z mitdim(V(j)) = 2j + 1.

(3) Fur jeden Zustand |m〉 ∈ V(j) gilt: J2|m〉 = j(j +1)|m〉. Daher gibt es j1, j2, . . . , jn , n ∈ N, so daßJ2 auf Z = ⊕na=1V(ja) die Darstellung J2 =⊕na=1ja(ja+1)Pa, wobei Pa : Z −→ Z die orthogo-nale Projektion auf den Teilraum V(ja) bezeichnet.

Page 41: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

41

(4) Die Einschrankung ρa von ρ auf V(ja) ist eine irre-duzible Darstellung ρa : so(3) −→ End(V(ja)), undρ zerlegt sich wie folgt: ρ = ⊕na=1ρa.

Jede endlichdimensionale irreduzible Darstellung ρ vonso(3) hat die im Satz VI.7 angegebene Form mit V(j) =Z fur n = 1, j = j1. Fur jede Zahl j ≥ 0 mit 2j ∈ N gibtes eine irreduzible Darstellung ρ(j) : so(3) −→ End(Zj)in einen (2j+1)–dimensionalen C–Vektorraum Zj mit ei-ner Basis |m〉m∈M(J3) und der Wirkung der J3, J± wiein Satz VI.7. Die Zahl j heißt der Spin der Darstellung.Eine bessere Bezeichnung ware Drehimpuls, da j sowohlden Bahndrehimpuls der Klassischen Mechanik, als aucheinen mit Spin bezeichneten intrinischen Drehimpuls um-faßt. Letzterer besitzt kein Analogon in der KlassischenMechanik.

An dieser Stelle bleibt noch, die unterdruckten Ein-heiten durch entsprechende Potenzen von ~ wieder zurestaurieren, zum Beispiel:

[Ja, Jb] = iεabc ~Jc . (112)

VII. QUANTISIERUNG & KANONISCHEQUANTISIERUNG

Die Schrodinger–Gleichung beschreibt die Enwtwick-lung eines quantenmechanischen Zustandes | z 〉 wahrenddes Zeitintervalls t− t0 ∈ R relativ zu einer externen Uhrwie oben beschrieben als | z 〉(t) = U(t, t0) | z 〉(t0) =exp (−i(t− t0)OH/~) | z 〉(t0). Dies motiviert die Frage-stellung, wie OH als Funktion der elementaren Observa-blen Oq ,Op ausschaut?

In diesem Abschnitt stellen wir uns der Frage, wiewir praktisch und konkret von einem gegebenen me-chanischen System mit Impulsphasenraum P und Ob-servablenmenge O(P) zum enstsprechenden quantenme-chanischen System mit Zustandsraum Z und Observa-blenmenge O(Z) ubergehen. Viele der prominentestenquantenmechanischen Systeme werden so erzeugt. DieTheorie der klassischen Observablen war recht einfach:Jeder klassischen Observablen ist eine Borel–FunktionO(P) 3 B : P −→ R , (q, p) −→ B(q, p) zugeordnet.Wichtige Beispiele (Abschnitt III C) waren die elemen-

taren klassischen Observablen Ort BjOrt = Pj Pr1 undImpuls BImp j = Pj Pr2 , j ∈ 1, 2, 3.

Quantisierung kann nun zunachst etwas salopp alsAbbildungQ : O(P) −→ O(Z) betrachtet werden, so daßjeder klassischen Observablen B ∈ O(P) ein selbstadjun-gierter Operator Q(B) ≡ OB auf dem Zustandsraum Zzugeordnet wird.

Diese Betrachtungsweise ist hauptsachlich von struktu-reller Relevanz, da O(P) selbst gewisse strukturelle Ei-genschaften hat, die bei der Quantisierung (moglicher-weise) erhalten bleiben, und daher selbst Einsicht in dieQuantisierungsvorschrift vermitteln. Da sind zunachsteinmal die beiden naturlichen Strukturen, die O(P)tragt, namlich 1. die ublichen linearen Operationen aufjedem Vektorraum, also fur B1 ,B2 ∈ O(P) und k1, k2 ∈

R ist (k1B1 + k2B2) ∈ O(P) ∀(q, p) ∈ P, und 2. ist furB1 ,B2 ∈ O(P) auch (B1B2) ∈ O(P) ∀(q, p) ∈ P, wobei(B1B2)(q, p) := B1(q, p)B2(q, p). Wir vereinbaren:

Vereinbarung VII.1 (Quantisierungsvorschrift)Quantisierung respektiert folgende Strukturen:

(1) Linearitat, d.h. die Abbildung Q : O(P) −→ O(Z),B −→ Q(B) := OB ist linear: Fur B1 ,B2 ∈ O(P)und k1, k2 ∈ R ist k1B1 +k2B2 −→ k1OB1

+k2OB2.

(2) Sei F(R) 3 F : R −→ R eine beliebige Funktionund O(P) 3 B : P −→ R eine klassische Observa-ble. Dies induziert qua Komposition folgenderma-ßen eine Abbildung H : F(R) × O(P) −→ O(P):(F,B) −→ H(F,B) := F B, also H(F,B)(q, p) =F (B(q, p)).

Bezeichne OB : Z −→ Z die zu B korrepondierendequantenmechanische Observable und |b〉b∈M(OB),so gilt:

OFB|b〉 = F (b)|b〉 . (113)

Fur unbeschrankte Observablen liegt |b〉b∈M(OB) nichtin Z, jedoch laßt sich die entscheidende Definition in (2)durch eine kleine Rechnung auf beliebige Zustande | z 〉 ∈Z ausweiten:

OFB | z 〉 =∑

b∈M(OB)

∫F (b)|b〉〈b | z 〉 . (114)

Diese Definition ist sinnvoll, zumindestens fur alle kom-plexwertige Polynome R auf R, denn ausgehend von derSpektraldarstellung fur OB,

OB =∑

b∈M(OB)

∫b |b〉〈b| , (115)

gilt fur diese (Funktionalkalkul)

R (OB) =∑

b∈M(OB)

∫R(b) |b〉〈b| . (116)

Leider ist die Quantisierungsvorschrift VII.1 noch nichtausreichend, schlimmer noch, sie muß um sogenannteErsetzungsregeln heuristisch erganzt werden. Das se-hen wir schnell an folgendem Beispiel ein: BOrtBImp

ist als klassische Observable genauso gut wie BImpBOrt,wahrend diese Aussage aufgrund der Unvertraglichkeitvon Oq und Op in der Quantenmechanik nicht mehr gel-ten kann. Die folgende Ersetzungsregel versucht diesemUmstand Rechnung zu tragen: BOrtBImp 7−→ (Oq Op +Op Oq)/2.

Die Quantisierungsvorschrift VII.1 erlaubt dann einezugige Verallgemeinerung: Seien B ,B′ ∈ O(P) beliebigeklassische Observablen. Es gilt dann folgende Ersetzungs-regel:

BB′ 7−→ (OB OB′ +OB′OB) /2 . (117)

Page 42: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

42

Eine letzte Anmerkung zu diesem Thema: Wir ha-ben hier die Quantisierung von klassisch realisiertenSystemen diskutiert, ausgehend von einer Hamilton–Formulierung fur das klassische System, insbesondere voneinem Impulsphasenraum P. Dieser ist mit einer weite-ren Struktur ausgestattet, der sogenannten symplekti-schen Struktur, die zum Beispiel uber die Poisson–Klammer charakterisiert werden kann: , : O(P) ×O(P) −→ O(P). Auch diese Struktur wird von der Quan-tisierung respektiert, in folgendem Sinne:

Vereinbarung VII.2 (Kanonische Quantisierung)Sei (P, H) ein Hamilton–System gegeben durch einenPhasenraum P ∼= Q × Rn , n ∈ N fur eine offene Men-ge Q ⊂ Rn, oder durch eine symplektische Mannigfaltig-keit P, zusammen mit einer Hamilton–Funktion H. Diegeometrische Struktur von P liefert die Poissonklammer,, : O(P)×O(P) −→ O(P), die O(P) zu einer Lie–Algebra macht.

Zu einer kanonischen Quantisierung gehort die Quan-tisierungsvorschrift VII.1 und eine Auswahl A ⊂ O(P)von klassischen Observablen, die quantisiert werden sol-len. Eine kanonische Quantisierung von (P, H,A) istdann eine Abbildung ρ : A −→ O(Z) mit den folgendenBedingungen:

(1) Fur alle B1 ,B2 ∈ A mit B1,B2 ∈ A gilt

[ρ (B1) , ρ (B2)] = iρ (B1,B2) . (118)

(2) Ist die konstante Funktion idP ∈ A, so ist

ρ (idP) = idZ . (119)

(3) Mit Oq := ρ(BOrt) und Op := ρ(BImp) liefert (1),

[Oqa ,Opb ] = iδab , a, b ∈ 1, 2, 3 . (120)

Bsp. VII.1 (Der 1–d harmonische Oszillator) DerPhasenraum ist P = R2. Als Menge der zu quantisie-renden Observablen wahlen wir A = q, p,H, idP, wobeidie Hamiltonfunktion durch H = (p2 + m2ω2q2)/(2m)gegeben ist. Als Hilbert–Raum wird L2(R) genommen.Durch ρ(q) := Oq, ρ(p) := Op, ρ(idP) := idZ undρ(H) := OH = (Op Op +m2ω2Oq Oq)/(2m) ist danneine kanonische Quantisierung gegeben, wobei OH fol-gendermaßen definiert ist: Der Definitionsbereich D(OH)enthalt den linearen Unterraum

D df=

ψ ∈ L2(R) :

∫R

dq |q|4|ψ(q)|2 <∞ ,

∃∆f ∈ L2(R) :

∫R

dq g∆f =

∫R

dq (∆g)f ,

∀g ∈ E(R) : Trager(g) kompakt in R, (121)

wobei E(R) die Menge der differenzierbaren Funktionenauf R bezeichne. Die Wirkung von OH auf D ist folgen-

dermaßen definiert: Fur |ψ〉 ∈ Z , ψ(q) ∈ D ist

〈q|OH |ψ〉 ≡ OHψ(q)

=(−~2∆ +m2ω2q2

)ψ(q) . (122)

Deibei ist ∆ := ∂2/∂q2.

Bsp. VII.2 (Der n–d harmonische Oszillator)Verlauft ganz analog zum 1−−d harmonischen Oszilla-tor, allerdings ist die Buchhaltung aufwendiger. Zunachstist der Hilbert–Raum L2(Rn) , n ∈ N. Wir gehen hiernicht explizit auf die Definitionsbereiche der Operatorenein, sondern notieren lediglich, daß die FestsetzungenOqaψ = qaψ, OPaψ = −i~∂ψ/∂qa , a ∈ I := 1, 2, 3und

OHψ(q) =1

2m

(−~2∆ +m2ω2

∑a∈IOqa Oqa

)ψ(q)

(123)

eine kanonische Quantisierung von A = qa, pa, H, idPliefern. Dabei ist ∆ der klassische Laplace–Operator.

Bsp. VII.3 (Das freie nicht–relativistische Teil-chen) Der Phasenraum ist P ∼= R3 ×R3, die Hamilton–Funktion H(q, p) = p2/2m. Die zu quantisierenden Ob-servablen sind A = qa, pa, H, idP. Als Hilbert–Raumdient L2(R3). Wie im vorherigen Beispiel wahlen wirOqa , OPa und OH := −~2∆/2m. Damit ist die kano-nische Quantisierung spezifiziert.

Bsp. VII.4 (Kanonische Quantisierung in Alge-braischer Manier) Wir diskutieren diese Konstrukti-on wieder am Beispiel des 1–d harmonischen Oszillators.Unter der Annahme, daß eine kanonische Quantisierungbereits gegeben ist, gelten folgende algebraische Relatio-nen fur die Observablen:

[Oq,Op] = i~ ,[Oq,OH , ] = i(~/m)Op ,[OH ,Op] = i(m2ω2/2)Oq . (124)

In der Klassischen Mechanik haben wir den harmoni-schen Oszillator auch qualitativ untersucht. Da die Ener-gie R+ 3 E = const. eine Bewegunsinvariante ist, giltH(q(t), p(t)) = E ∀t ∈ R. Dies fuhrt zum Konzept derEnergieniveauflachen, H−1(E) = (q, p ∈ P : m2ω2q2 +

p2 = 2mE = S1r mit r =

√2mE. Eine ubersicht uber al-

le Bahnen zu einer festen Energie E > 0 erhalten wir, in-dem wir auf H−1 folgende Aquivalenzrelation einfuhren:Fur a, b ∈ H−1(E) sei a ∼ b, wenn es eine Bahn mitEnergie E im Phasenraum P gibt, die a und b mitein-ander verbindet. Der Quotient BE := H−1/ ∼ ist dannder Bahnenraum zur Energie E und parametrisiert offen-bar alle moglichen Bahnen des Systems mit Energie E.In dieser Situation lassen sich die Bahnen mit Hilfe der

Page 43: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

43

komplexen Struktur auf R2 besonders einfach beschrei-ben: Fur (q, p) ∈ P schreiben wir z := mωq + ip ∈ C.Auf diese Weise ist R2 mit C identifiziert. Zeigen Sie,daß folgendes gilt: a ∼ b genau dann, wenn es φ ∈ R gibtmit a = exp (iφ)b. In der Mechanik haben wir an die-ser Stelle an den komplex–projektiven Raum P0(C) erin-nert, namlich P0(C) := S1

r/ ∼ mit der Aquivalenzrelationa ∼ b, wenn es ein λ ∈ U(1) := λ ∈ C : |λ| = 1 gibt mita = λb. Als Resultat erhalten wir so: Der BahnenraumBE fur den (1− d) harmonischen Oszillator zur EnergieE > 0 ist der komplex–projektive Raum P0(C), und dieQuotientenabbildung ϕ : H−1(E) −→ BE = P0(C) hatals Fasern ϕ−1(x) gerade die Bahnen zur Energie E.

Salopp gesprochen versucht die algebraische Metho-de, die Quantisierung auf obiger qualitativer Beschrei-bung aufzubauen, naturlich im Einklang mit (124). Al-

so, ρ(z) := (mωOq + iOp)/√

2m~ω =: a und ρ(z∗) :=

(mωOq − iOp)/√

2m~ω =: a† auf dem noch zu bestim-menden Hilbert–Raum. Die Operatoren a und a† sindnicht selbstadjungiert. Es gilt OH = (aa†−1/2)~ω. Wirbemerken, daß E0 := ~ω die Einheit einer Energie hat.Somit wird OH in Vielfachen von E0 gemessen (relativzur Grundzustandsenergie). Der Operator On := a a†ist selbstadjungiert und dimensionslos.

Die algebraischen Relationen (124) liefern:[a, a†

]= 1 . (125)

Offenbar ist OH = (On − 1/2)E0, also M(OH) =M(On) − 1/2. Wir nsetzen voraus, daß es einen Eigen-vektor |n〉 ∈ Z gibt mit On|n〉 = n|n〉 , n ∈ R. Offenbarist dann OH |n〉 = (n− 1/2)~ω|n〉.

Wir definieren |n − 1〉 := a|n〉. Der Bezeichner desneuen Zustandes ist schon sinnvoll, denn mit (125) ist:On|n − 1〉 = Ona|n〉 = a(On − 1)|n〉 = (n − 1)|n − 1〉.Genauso gilt mit der Definition |n+ 1〉 := a†|n〉 und we-gen (125): On|n + 1〉 = Ona†|n〉 = (1 + On)a†|n〉 =a†(1 + On)|n〉 = (1 + n)|n + 1〉. Außerdem ist fur je-des Z 3 |ψ〉 6= 0 auch a†|ψ〉 6= 0, denn ‖a†|ψ〉‖2 =〈ψ|On|ψ〉 = 〈ψ|a†a|ψ〉+ 〈ψ|ψ〉 = ‖a|ψ〉‖2 + ‖|ψ〉‖2 > 0.

Wir setzen |n−k〉 := (a)k|n〉 , k ∈ N, wobei (a)k die k–fache Komposition von a mit sich selbst bezeichne. Offen-bar ist On|n−k〉 = (n−k)|n−k〉 und ‖a†|n−k〉‖2 = 〈k−n|On|k−n〉 = (n−k)〈k−n|k−n〉 = (n−k)‖|n−k〉‖2 ∀k ∈N. Folglich ist (n−k) ≥ 0 oder 〈n−k|n−k〉 = 0 ∀k ∈ N.Daher gibt es ein N 3 k : |n − k〉 6= 0 und a|n − k〉 = 0.Fur diesen Zustand ist n − k − 1 = 0 y n = k + 1 ∈ N,also n ∈ N.

Mit all diesen Informationen konnen wir nuntatsachlich explizit einen geeigneten Hilbert–Raum mitden Operatoren Oq,Op,OH konstruieren. Sei |z〉 einZustand mit Wellenfunktion Z(n) := 〈n|z〉 und∑∞n=1 |Z(n)|2 < ∞. Dann konnen wir so vorgehen:

Es sei H = `2 der Hilbert–Raum der komplexen, qua-dratsummierbaren Folgen, `2 := (Z(n))n∈N : Z(n) ∈C ,∑∞n=1 |Z(n)|2 < ∞ mit dem Skalarprodukt 〈z|w〉 :=∑∞

n=1 Z(n)W (n) und den Einheitsvektoren enn∈N =(0, . . . , 1, . . . , 0), wobei die Eins an der Position n ∈ N

der Folge steht. Wir finden

a† en =√n en+1 ,

a en =√n− 1 en−1 , n ∈ N/0 ,

a e0 = 0 . (126)

Und weiter folgt fur alle |z〉 mit: ∀n ∈ N ist Z(n) ∈ `2:

On en = n en yOH en = (n− 1/2)E0 en ,

〈n|OH |z〉 ≡ OHZ(n)

= (n− 1/2)E0Z(n) . (127)

Geeignete Fortsetzungen von Oq,Op,OH sind dannselbstadjungierte Operatoren auf H, also Observablen,die den gewunschen Kommutator–Beziehungen (124)genugen.

Der Zusammenhang zu den Zustanden |n〉 , n ∈ N/0ist schnell hergestellt: en ↔ |n〉 := |n〉/

√〈n|n〉. In der

Tat ist dann, a†|n〉 = N(+)|n+ 1〉 , N(+) ∈ C. Wegen der

Definition |n + 1〉 = a†|n〉 folgt N(+) =√n. Genauso

sehen wir ein, daß a|n〉 =√n− 1|n− 1〉.

Die algebraische Behandlung des harmonischen Os-zillators in der Quantenmechanik heisst auch Beset-zungszahldarstellung des harmonischen Oszillators.Der Name stammt von folgender Uberlegung: Aufgrundder Wirkung von a und a† liegt es nahe, diese alsVernichtungs– und Erzeugungsoperatoren zu be-zeichnen. Was in dieser Sprache etws irrefuhrend ver-nichtet und erzeugt wird sind Anregungen des Oszilla-tors relativ zu seinem Grundzustand mit der Energie−E0/2 6= 0. Da diese Anregungen immer in naturlichenPortionen kommen, die wir mit n ∈ M(On) = N para-metrisiert haben, scheint diese Sprache sinvoll zu sein.Allerdings ist es wichtig zu betonen, daß eine solche An-regung mittels Operation von a und a† nicht wirklich ver-nichtet oder erzeugt werden kann, denn diese Operatorensind ja nicht selbstadjungiert und folglich kann ihre Wir-kung auf einen Zustand keinen physikalischen Prozessbeschreiben. Vielmehr erlaubt uns On zu zahlen, wievielAnregunsenergie in Portionen E0 relativ zur Grundzu-standsenergie E0/2 in diesem System steckt. Wir notie-ren auch, daß der Grundzustand nicht zu einem Teilchenmit verschwindender Energie korrespondiert!

Eine analoge Konstruktion funktioniert sogar fur einSystem von unendlich vielen harmonischen Oszillatoren,was zur ublichen Interpretation der Quantentheorie vonFeldern fuhrt. Bemerkenswert an dem 1-d Fall ist einer-seits, daß es nicht moglich ist, die so einfach strukturier-te Menge A = q, p,H, idP von klassischen Observa-blen auf dem Phasenraum P = R2 unter Vewendung ei-nes endlich–dimensionalen Hilbert–Raumes zu quantisie-ren. Andererseits ist in der Besetzungszahldarstellung dieKonstruktion des wichtigsten Operators, OH , der ja die

Page 44: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

44

Dynamik es quantenmechanischen Systems als selbstad-jungierter Generator der unitaren Darstellung von Zeit-translationen auf dem entsprechenden Hilbert–Raum her-vorbringt, von vornherein als in seine Eigenraume zerlegtgegeben.

VIII. ELEMENTARE ANWENDUNGEN

In diesem Kapitel betrachten wir einfache Systeme, dieimmer durch ein einzelnes Teilchen in einem von außenvorgegebenen klassischen Potentialfeld gegeben sind, unddie wir quantenmechanisch beschreiben wollen. Dazu be-darf es ab und an einer ausfuhrlicheren Vorbereitung, inder wir unsere algebraischen Einsichten um analytischeResultate aufstocken, etwa beim harmonischen Oszillatoroder beim quantenmechanischen Drehimpuls.

A. Harmonischer Oszillator in einer Dimension

Bei der algebraischen Behandlung des harmonischenOszillators in der Quantenmechanik haben wir uns aus-schließlich fur kinematische Informationen interessiert,die rein algebraisch abgerufen werden konnten. Die expli-zite Berechnung von Wellenfunktionen war hierfur nichterforderlich, beschaftigt uns aber im Folgenden.

Eine zentrale Rolle bei der algebraischen Behandlungkam den Erzeugungs– und Vernichtungsoperatoren zu,a† und a, die eine Besetzungszahldarstellung |n〉 , n ∈M(On := aa†) des Oszillators erlaubten. Gewisserma-ßen interessieren wir uns fur die Anzahl der elementa-ren Anregungen im Oszillator relativ zum nicht–trivialenGrundzustand, wobei jede Anregung die gleiche Ener-gie E0 = ~ω tragt. Die Gesamtenergie des harmonischenOszillators ergibt sich wegen der Additivitat der Ener-gie einfach aus der Anzahl der Anregungen mit EnergieE0 zuzuglich der Grundzustandsenergie E0/2. Die Be-setzungszahldarstellung ist salopp geschrieben ein Anre-gungsportrait des Oszillators.

Um ein wenig gelenkiger mit den algebraischen Relatio-nen zu werden, nutzen wir sogleich die zentrale Relation[a, a†] = 1 und redefinieren damit den Besetzungszahl–Operator On. Es gilt ja: On = 1 + a†a. Dies zeigt, daßauch N := a†a als Besetzungszahl–Operator fungierendarf. Damit gilt OH = (N +1/2)E0. Beim Ubergang vonOn nach N wird also lediglich die Grundzustandsenergieverschoben, und zwar wird sie um E0 erhoht. Mathema-tisch haben wir hier sicher alles richtig gemacht, aberverzerrt diese Energieverschiebung nicht unser physika-lisches Verstandnis? Dies ware sicherlich der Fall, wenndie Energiemessung absolut ware. Ist sie aber nicht, wirmessen in der Physik immer relative Energien, also Ener-giedifferenzen!

Die algebraischen nutzlichen Relationen sind jetzt:[a, a†

]= 1 , [N, a] = −a ,

[N, a†

]= a† . (128)

Mit der Wahl von ON als Besetzungszahl andert sichauch die Normierung der entsprechenden Zustande. Wirfinden:

a|0〉 = 0 , a|n〉 =√n|n− 1〉 ,N 3 n ≥ 1 , (129)

a†|n〉 =√n+ 1|n+ 1〉 , (130)

was konsistent mit (126) ist, wenn wir bedenken, daßjetzt n ∈M(N) ist.

Wir wollen nun die Energie–Eigenfunktionen im Orts-raum berechnen. Wie gehen wir geschickt vor? Geleitetvon unseren algebraischen Einsichten fragen wir zunachstnach der Wellenfunktion des Grundzustandes |0〉. Die-ser war definiert als der Besetzungszahl–Zustand fur dena|0〉 = 0 gilt, also von dem aus der Oszillator nicht weiterabgeregt werden kann. Um eine Differentialgleichung furdie Grundzustandswellenfunktion zu erhalten, bietet essich nun an, diese Definition in den Ortsraum zu brin-gen. Sei x ∈M(Oq). Dann gilt

〈x|a|0〉 =(x+ x 2

0 ∂x)〈x|0〉 = 0 , (131)

wobei wir x0 :=√~/mω eingefuhrt haben. Bemerken

Sie, daß [x0] = L, also setzt x0 eine durch die Kreisfre-quenz und die Masse des Oszillators gegebene charakte-ristische Langenskala.

Die Gleichung (131) ist rasch gelost, Z0(x) :=〈x|a|0〉 ∝ exp [−(x/x0)2/2]. Mit der korrekten Normie-rung finden wir explizit:

Z0(x) =1√√πx0

exp

[−1

2

(x

x0

)2]. (132)

Die Grundzustandswellenfunktion Z0(x) ist modulo ei-ner multiplikativen Konstante die eindeutige Losung von(131), es liegt also keine Entartung des Grundzustandesvor. Im Gegensatz zur klassischen Mechanik ist die Ener-gie des Grundzustandes von Null verschieden und derOszillator braucht sich nicht an der Stelle des Potential-minimums befinden, was durch die endliche raumlicheAusdehnung der zugehorgen Wellenfunktion Z0(x) zumAusdruck gibt, die ja wiederum durch x0 charakterisiertist.

Es ist instruktiv, sich die Erwartungswerte fur die ki-netische und potentielle Energie des harmonischen Os-zillators im Grundzustand zu beschaffen. Wir benotigenalso E(Op Op, |0〉) und E(Oq Oq, |0〉). Zunachst einmal

ist Op = i√mE0/2(a† − a) und daher

Op Op = −mE0

2

(a† a† + a a− a† a− a a†

).

Wenn wir den Erwartungswert von Op Op bezuglich desGrundzustandes bilden, dann tragen nur die letzten bei-den Summanden bei. Daher finden wir E(Op Op, |0〉) =mE0/2. Genauso finden wir, daß E(Oq Oq, |0〉) = x 2

0 /2ist. Der Erwartungswert der kinetischen Energie OT :=Op Op/2m im Grundzustand des harmonischen Os-zillators ist somit E(OT , |0〉) = E0/4. Im Grundzu-

Page 45: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

45

stand erwarten wir außerdem fur die potentielle Ener-gie OV := mω2Oq Oq/2 des harmonischen Oszilla-tors ebenfalls E(OV , |0〉) = E0/4. Mit anderen Worten:E(OT , |0〉) = E(OV , |0〉) = E(OH , |0〉)/2.

Weiterhin ist E(Op, |0〉) = 0 und E(OV , |0〉) = 0. Folg-lich gilt:

Streu|0〉(q) · Streu|0〉(p) = ~/2 . (133)

Damit ist die Unscharferelation zwischen dem quanten-mechanischen Ort und Impuls im Grundzustand des har-monischen Oszillators saturiert, das heißt, der minimalmogliche Wert fur die Unscharfe wird angenommen.

Fur beliebige Anregungszustande des harmonischenOszillators finden folgenden konstruktiven Ausdruck zurBerechnung der zugehorigen Wellenfunktionen im Orts-raum: Es sei Nn := 1/

√2nn!. Dann gilt

Zn(x) ≡ 〈x|n〉 = Nnx−n0

(x− x 2

0 ∂x)nZ0(x) .(134)

Fur diese Wellenfunktionen des angeregten harmonischenOszillators ist die prinzipielle Unscharfe in Ort und Im-puls großer als im Grundzustand. Es ist

Streu|0〉(q) · Streu|0〉(p) = (n+ 1/2)~ . (135)

Die Energie–Eigenzustande des harmonischen Oszil-lators sind naturlich stationar. Folglich oszillieren auchnicht die Erwartungswerte E(q, |n〉) , E(p, |n〉), sie ver-schwinden sogar unbhangig vom Anregungszustand. Wirkonnen aber umgekehrt fragen, ob es Linearkombina-tionen von Energie–Eigenzustanden gibt, die den klassi-schen harmonischen Oszillator moglichst treu imitieren?Die Antwort hierauf ist ja und fuhrt auf das Konzeptder koharenten Zustande, welches leider jenseits dieserEinfuhrung liegt.

B. Bahndrehimpuls und Kugelflachenfunktionen

Kanonische Quantisierung der kinetischen Energie ei-nes Teilchens liefert nach Beispiel VII.3 den selbstadjun-gierten Operator T := Op Op/2m = −~2∆/2m auf demHilbert–Raum L2(Rd). Der Laplace–Operator ∆ kannfolgendermaßen zerlegt werden:

∆ = ∆r + ∆Ω/r2 ,

∆rdf=

∂2

∂r2+d− 1

r

∂r,

∆Ωdf=

1

2

d∑j,k=1

(xj

∂xk− xk

∂xj

)2

,

=∑

1≤j<k≤d

(xj

∂xk− xk

∂xj

)2

. (136)

Hierbei bezeichnet r den euklidischen Abstand vom Ko-ordinatenursprung, und Ω soll an den Raumwinkel erin-nern. Letztere Bezeichnung ist sinnvoll, weil ∆Ω ein von

r unabhangiger Differentialausdruck ist, und insbeson-dere in Kugelkoordinaten lediglich vom Azimuth– undPolarwinkel abhangt. Dabei sind die Richtungsableitun-gen ∇ab ≡ xab · ∇ , a, b ∈ 1, . . . , d, wobei die Vek-toren xab := (0, . . . , 0,−xb, 0, . . . , xa, 0 . . . , 0) , (xab)

a =−xb, (xjk)b = xa , a, b ∈ 1, . . . , d, bis auf den Fak-tor −i~ gerade die Komponenten des Bahndrehimpulses,ublicherweise folgendermaßen bezeichnet: La = −i~∇bc.Tatsachlich gilt [La, Lb] = iεabc ~Lc.

Der Vektor xab beschreibt eine Tangente an die KugelK(0, |x|) mit Mittelpunkt 0 und Radius |x| im Punkt x,die parallel zur (xa, xb)–Ebene verlauft. ∆Ω ist also ge-wissermaßen ein Differentialausdruck auf der Sphare, denwir insbesondere auch auf der Einheitssphare Sd−1 :=y ∈ Rd : |y| = 1 ⊂ Rd untersuchen konnen.

Fur f ∈ C2(Sd−1) konnen wir den sogenanntenLaplace–Beltrami –Differentialausdruck Bf folgen-dermaßen erklaren: (Bf)(ω) := ∆Ωf(x/|x|)|x=ω , ω ∈Sd−1. Mit anderen Worten, wir setzen erst f radial kon-stant fort, wenden dann den Differentialausdruck ∆Ω an,und schranken anschließend wieder auf Sd−1 ein.

Damit ist auch klar, warum Kugelflachenfunktio-nen eine wichtige Rolle spielen — wie wir weiter un-ten sehen werden, bilden sie eine ONB von Eigenfunk-tionen zu B, denn Kugelflachenfunktionen erhalten wirdurch Einschrankung harmonischer Polynome in Rd aufdie Einheitssphare Sd−1.

Zur Notation: Ein Multi–Index der Dimension d ∈ Nist ein d–Tupel α = (α1, . . . , αd) ∈ Nd. Fur einen Multi-index α definieren wir:

|α| :=d∑a=1

αa , xα :=

d∏a=1

(xa)αa , x ∈ Rd . (137)

Fur ein beliebiges Polynom P vom Grad k ∈ N in dVariablen schreiben wir also

P(x) =∑|α|≤k

cαxα . (138)

Es genugt hier homogene harmonische Polynome zubetrachten:

Lemma VIII.1 Sei P ein harmonisches Polynom vomGrad k in d Variablen. Dann laßt sich P in der Form

P =∑kq=0 Pq schreiben mit homogenen harmonischen

Polynomen vom Grad q.

Beweis VIII.1 Wir wahlen Pq =∑|α|≤q cαx

α als ho-

mogene Polynome vom Grad q. Dann gilt offenbar

P(x) =

k∑q=0

Pq(x) , und 0 = ∆P(x) =

k∑q=0

∆Pq(x) .

Fur jedes q ∈ 0, . . . , k ist ∆Pq(x) entweder ein ho-mogenes Polynom vom Grad q − 2, oder ∆Pq = 0, wo-bei letzteres insbesondere fur q < 2 gilt. Also muß auch∆Pq = 0 ,∀q ∈ 1, . . . , k gelten. ∗–< [; 0)

Page 46: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

46

Fur niedrige Grade konnen die harmonischen Polynomeexplizit angegeben werden: Jedes Polynom von Grad 0und 1 ist harmonisch. Linear unabhangige Systeme har-monischer Polynome sind zum Beispiel: P0(x) = 1(1Funktion),P1(x) = xa , a ∈ 1, . . . ,m(m Funktionen),P2(x) = xaxb , 1 ≤ a < b ≤ d und (x1)2 − (xj)

2 , j ∈2, . . . , d. Fur diesen Grad haben wir 0 Funktionen furd = 1, 2 Funktionen fur d = 2, 5 Funktionen fur d = 3,und allgemein: (d+2)(d−1)/2–Funktionen. Weiter untenzeigen wir, daß dies jeweils maximal linear unabhangigeSysteme sind.

Eine Funktion F : Sd−1 −→ C heißt eine Kugel-flachenfunktion vom Grad k ∈ N, wenn es ein homo-genes harmonisches Polynom P vom Grad k gibt mit

F (ω) = P(ω) = P(rω)/rk ∀ω ∈ Sd−1 . (139)

Es ist faszinierend, daß diese sparlichen Informationenbereits ausreichen um zu zeigen, daß die Kugelflachen-funktionen in L2(Sd−1) total sind:

Satz VIII.1 (Approximationssatz) Zu jeder stetigenFunktion f : Sd−1 −→ C und zu jedem ε > 0 existiert ei-ne (endliche) Summe F von Kugelflachenfunktionen mit

|f(ω)− F (ω)| < ε ∀ω ∈ Sd−1 .

Insbesondere ist die Menge der Kugelflachenfunktionentotal in L2(Sd−1).

Beweis VIII.2 Der Beweis ist eher technisch und weniginstruktiv fur den weiteren Aufbau der Theorie, weshalbwir ihn der Mathematik uberlassen. Sie konnen ihn injedem guten Werk zur Theorie der Linearen Operatorenin Hilbert–Raumen finden.

Grob ist die Idee folgende: Sie uberzeigen sich zunachstvon der Aussage, daß fur jedes homogene (aber nicht not-wendig harmonische) Polynom Q vom Grad l ∈ N gilt,

Q(x) =∑

0≤k≤l/2

|x|2k Hl−2k ,

mit homogenen harmonischen Polynomen Hp vom Gradp ∈ N.

Im Beweis dieser Aussage steckt die Hauptarbeit. Dannnutzen Sie einen anderen beruhmten Approximationssatz— den von Weierstraß — und sind am Ziel. ∗–< [; 0)

Die zentrale Bedeutung der Kugelflachenfunktionen furdie analytische Theorie des Bahndrehimpulses liegt infolgendem

Satz VIII.2 Sei B der Laplace–Beltrami–Differentialausdruck auf Sd−1. Dann gilt

(a) B ist auf C∞(Sd−1) wesentlich selbstadjungiert. Dieselbstadjungierte Vervollstandigung nennen wir denLaplace–Beltrami–Operator in L2(Sd−1).

(b) Jede Kugelfunktion F vom Grad l ist Eigenfunktionvon B zum Eigenwert −l(l + d − 2). Insbesonderebilden Kugelfunktionen eine vONB.

Beweis VIII.3 Wir zeigen hier nur (b). Ist Φ eine Ku-gelflachenfunktion vom Grad 0, so ist Φ konstant, alsoEigenfunktion von B zum Eigenwert 0 = 0(0 + d− 2).

Sei Φ eine Kugelflachenfunktion vom Grad l ≥ 1,

φ(x)df=

|x|l Φ(x/|x|) fur x ∈ Rd − 0 ,0 fur x = 0 .

Da φ ein harmonisches Polynom vom Grad l ist, gilt furalle ω ∈ Sd−1:

0 = ∆φ(x) |x=ω = ∆(|x|l Φ(x/|x|)

)|x=ω

=(∆r + ∆Ω/r

2) (|x|l Φ(x/|x|)

)|x=ω

= [l(l − 1) + (d− 1)l] |x|l−2 Φ(x/|x|) |x=ω

+|x|l−2∆ΩΦ(x/|x|) |x=ω

= l(l + d− 2)Φ(ω) + (BΦ) (ω) , (140)

also gilt BΦ = −l(l + d− 2)Φ. ∗–< [; 0)

Wir wollen uns nun einen Uberblick uber die Gesamt-heit der Kugelflachenfunktionen verschaffen, d.h. insbe-sondere, daß wir die Anzahl N(l, d) der linear unabhangi-gen Kugelflachenfunktionen vom Grad l ∈ N in d ∈ NVariablen auf Sd−1 bestimmen. Wir wissen bereits, daßN(0, d) = 1, N(1, d) = d ∀d, und N(l, 1) = 0 ∀l ≥ 2.

Sei zunachst A(l, d) die Anzahl linear unabhangiger ho-mogener (nicht notwendig harmonischer) Polynome vomGrad l ∈ N in d ∈ N Variablen. Da jedes homogene Po-lynom f vom Grad l > 1 ind d > 1 Variablen in derForm

f(x1, . . . , xd) =

l∑k=0

gl−k (x1, . . . , xd−1) (xd)k ,

mit homogenen Polynomen gp vom Grad p ∈ N in (d−1)Variablen geschrieben werden kann, gilt

A(l, d) =

l∑k=0

A(k, d− 1) . (141)

Mit Hilfe von A(l, 1) = 1 ∀l ≥ 0 und

p∑k=n

(k

n

)=

(p+ 1

n+ 1

)fur p ≥ n , (142)

erhalten wir durch vollstandige Induktion

A(l, d) =

(l + d− 1

d− 1

)fur d ≥ 1 , l ≥ 0 . (143)

Um damit N(l, d) zu bestimmen, wollen wir zuerst dieallgemeine Form eines homogenen harmonischen Poly-noms u von Grad l ∈ N in d ∈ N Variablen ermitteln.Zunachst gilt wieder

u(x1, . . . , xd) =

l∑k=0

al−k (x1, . . . , xd−1) (xd)k,(144)

Page 47: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

47

mit homogenen Polynomen ap vom Grad p ∈ N. Da-mit ist u genau dann harmonisch, wenn mit ∆′ :=∆− (∂/∂xd)

2 folgendes gilt:

0 = ∆u(x) =

l−2∑k=0

∆′al−k (x1, . . . , xd−1) (xd)k

+

l∑k=2

k(k − 1)al−k (x1, . . . , xd−1) (xd)k−2

,

also (k + 2)(k + 1)al−2−k = −∆′al−k fur k ∈ 0, . . . , l −2. Folglich konnen al und al−1 beliebig (aber homogen)gewahlt werden, und dann daraus der Reihe nach

al−2−k = − 1

(k + 2)(k + 1)∆′al−k , k ∈ 0, . . . , l − 2

berechnen. Mit den so sukzessive bestimmten ap erhal-ten wir schließlich alle homogenen harmonischen Polyno-me vom Grad l ∈ N in x1, . . . , xd und damit alle Ku-gelflachenfunktionen vom Grad l auf der EinheitskugelSd−1.

Die eben konstruierten homogenen harmonischen Po-lynome u1, . . . , un , n ∈ N sind offenbar genau dann li-near unabhangig, wenn die entsprechenden Anfangster-me ak,l(x1, . . . , xd−1) + ak,l−1(x1, . . . , xd−1)xd : k ∈1, . . . , n linear unabhangig sind. Die Bezeichnungensind hoffentlich klar. Folglich gilt

N(l, d) = A(l, d− 1) +A(l − 1, d− 1)

(143)=

(l + d− 2

d− 2

)+

(l + d− 3

d− 2

)

=(2l + d− 2)(l + d− 3)!

l!(d− 2)!. (145)

Wir fassen zusammen:

Satz VIII.3 Fur die Anzahl N(l, d) von linear un-abhangigen Kugelflachenfunktionen vom Grad l auf Sd−1

gilt fur l ≥ 0 , d ≥ 2

N(l, d) =(2l + d− 2)(l + d− 3)!

l!(d− 2)!. (146)

Speziell gilt (siehe auch Satz VI.7)

N(l, 3) = 2l + 1 . (147)

Wir wissen bereits, daß kinematische Aspekte desBahndrehimpulses rein algebraisch behandelt werdenkonnen und insbesondere die explizite Form der Kugel-flachenfunktionen hierfur nicht benotigt werden. Aller-dings verlangen Fragestellungen, die mit der Dynamikeines quantenmechnischen Systems verknupft sind, nacheiner analytischen Behandlung. Deshalb und weil wirim nachsten Abschnitt das Wasserstoff–Atom diskutie-ren wollen, beschaffen wir uns noch rasch fur den Falld = 3 die Kugelflachenfunktionen ganz explizit.

Fur d = 3 hat B in Kugelkoordinaten S2 3 (x, y, z) =(sin θ cosϕ, sin θ sinϕ, cos θ) mit den ublichen Definiti-onsbereichen die Form

Bf(ϕ, θ) =1

s2(θ)

∂2

∂ϕ2f(ϕ, θ) +

1

s(θ)

∂θ

[s(θ)

∂θf(ϕ, θ)

],

wobei s(θ) := sin θ Es bietet sich offenbar ein Separati-onsansatz in der Gleichung Bf = −l(l + 1)f an. Etwasvornehmer heißt dies, daß B von den folgenden Teilraum-en reduziert wird:

Tkdf=

exp (ikϕ)f(θ) : f ∈ L2((0, π)), k ∈ Z ,

die den Hilbert–Raum L2(S2) ∼= L2((0, 2π)× (0, π)) auf-spannen. Die Einschrankung von B auf Tk(k ∈ Z) istaquivalent zu einer selbstadjungierten Realisierung von

τkf(θ) =1

s(θ)

∂θ

(s(θ)

∂θf(θ)

)− k2

s(θ)f(θ)

in L2((0, π)). Dies ist ein Sturm–Liouville–Differentialausdruck. Wir bezeichnen die selbstad-jungierte Realisierung ebenfalls mit τk. Aus der Theoriedes Eigenwertproblemes von Sturm–Liouville folgt dann,daß τk nur einfache Eigenwerte besitzt.

Wie schaut nun der N(l, 3) = (2l + 1)–dimensionaleTeilraum von L2(S2) der Kugelflachenfunktionen vomGrad l aus? Das ist ja der Eigenraum von B zum Ei-genwert −l(l + 1). Da die Teilraume Tk den Operator Breduzieren, besitzt dieser Eigenraum eine Basis der Form

Yla(ϕ, θ) = exp (ikaϕ)pla(θ) , fur a ∈ 1, . . . , 2l + 1 ,

mit der Eigenschaft

τka pla(θ) = −l(l + 1)pla(θ) , fur a ∈ 1, . . . , 2l + 1 .

Da die τk nur einfache Eigenwerte haben, mussen die kapaarweise verschieden sein. Fur ka kommen lediglich die(2l + 1) Werte ka ∈ −l,−l + 1, . . . , l − 1, l in Frage,da andernfalls das entsprechende homogene harmonischePolynom yla(x, y, z), dessen Einschrankung auf S2 gleichYla ist, als Funktion der ersten beiden Koordinaten (x, y)bereits ein Polynom der Ordnung > l ware. Also lassensich die Kugelflachenfunktionen in der folgenden Formdarstellen: Fur m ∈ −l,−l + 1, . . . , l − 1, l ⊂ Z ist

Ylm(ϕ, θ) = exp (imϕ)plm(θ) , ,

τmplm(θ) = −l(l + 1)plm(θ) .

Die Funktionen plm(θ) sind die sogenannten assoziier-ten Legendre–Polynome,

plm(θ) =(1− cos2 θ

)m/2 1

2ll!

(d

d cos θ

)l+m(cos θ − 1)

l.

Page 48: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

48

C. Zentralpotential & Das Wasserstoff–Atom

In diesem Abschnitt behandeln wir die Quantenme-chanik eines Teilchens im Zentralpotential V (r) , r ∈R+. Die Resultate aus dem vorherigen Abschnitt VIII Buber die analytische Theorie des Bahndrehimpulses sindhierfur essentiell.

Die Tatsache, daß V (r) invariant unter beliebigen Dre-hungen um den Ursprung ist, impliziert die Vertraglich-keit des Hamilton–Operators

H = − ~2

2µ (∆r + ∆Ω) + V (r)

= − ~2

(∂2

∂r2+

2

r

∂r

)+

1

2µr2δabLaLb + V (r)

mit allen drei Komponenten des Bahndrehimpuls–Operators. Da die Bahndrehimpulskomponenten nichtuntereinander vertraglich sind, kann der quantenmecha-nische Zustand eines Teilchens im Zentralpotential durchdie simultane Angabe der moglichen Eigenwerte vonH,La, L2 ≡ δabLaLb , a ∈ 1, 2, 3 charakterisiert wer-den, wobei wir ohne Beschrankung der AllgemeinheitL3 auszeichnen. Als Zustandsbezeichner wahlen wir al-so E ∈M(H) ,m : m~ ∈M(L3) , l : l(l + 1)~2 ∈M(L2).Offenbar ist zumindestens E = f(l).

Den stationaren Energie–Eigenzustand geben wir alsofolgendermaßen an: |E,m, l〉 wobei die Bezeichner mitden Spektren wie oben angegeben zusammenhangen, undH,L3, L

2|E,m, l〉 =

E,m~, l(l + 1)~2

|E,m, l〉 .

Wir haben bereits im letzten Abschnitt den zu L2, L3Satz von simultanen Eigenfunktionen ausgearbeitet. DieLogik der Separationstheorie gebietet daher folgendenAnsatz:

Φ(r, θ, φ) ≡ 〈(r, θ, φ)|E,m, l〉= R(r) Ylm(θ, φ) , (148)

wobei der radiale Anteil R(r) der WellenfunktionΦ(r, θ, φ) die folgende Eigenwertgleichung erfullt:[

− ~2

2µ∆r +

l(l + 1)~2

2µr2+ V (r)

]R(r) = ER(r) .

(149)

Dies ist aquivalent zu folgender Aufgabenstellung: Ge-geben sei ein Teilchen, welches sich in einer raumlichenDimension im effektiven Potential

Veff(r) = V (r) +l(l + 1)~2

2µr2(150)

befindet. Eine qualitative Diskussion dieser Aufgabe ken-nen wir bereits aus der klassischen Mechanik fur V (r) ∝1/r, die sich dort beim reduzierten 2–Korper–Problemstellte (µ war dort die reduzierte Masse der Relativbewe-gung um den Massenschwerpunkt). Fur das Wasserstoff–Atom ist V (r) = −e2/r, wobei QP = +e die Ladung

des Protons und QE = −e die Ladung des Elektrons inVielfachen der Elementarladung e ist.

Da das effektive Potential Veff von der azimuthalenQuantenzahl l : l(l+ 1)~2 ∈M(L2) abhangt, wird auchder Energie–Eigenwert E ∈ M(H) hiervon abhangen.Nun wird dieser sicherlich auch von dem Anteil der ki-netischen Energie abhangen, der in die Radialbewegunginvestiert wird. Das Teilchen kann im Zentralpotentialbei festgehaltener Energie, die in die Drehbewegung in-vestiert wird, sicherlich unterschiedliche Mengen an ki-netischer Energie in die Radialbewegung investieren. Da-her braucht es noch eine weitere Quantenzahl, die ra-diale Quantenzahl k, welche bei festgehaltenem l denradialen Bewegungszustand charakterisiert. Hierbei liegtk ∈ I ⊂ R, wobei I a priori unbekannt ist. Wir habenalso folgende Situation:

Eigenwert Quantenzahl Bezeichnung

Ekl k radiale Quantenzahl

l(l + 1)~2 l azimuthale Quantenzahl

m~ m magnetische Quantenzahl

Da der Hamilton–Operator von L3 ausschließlich uber L2

abhangt, ist der Energie–Eigenwert mindestens (2l+ 1)–fach entartet, was gerade der Anzahl von moglichen ma-gnetischen Quantenzahlen bei fester azimuthaler Quan-tenzahl l entspricht. Diese Entartung heißt essentielleEntartung und wird von der zufalligen Entartungunterschieden, die durch Ek′l′ = Ekl charakterisiert ist,und keinen fundamentalen Ursprung hat.

Zur Vereinfachung des Differentialoperators in (149)redefinieren wir Rkl(r) =: Ukl(r)/r und finden als radialeZustandsgleichung:[

− ~2

d2

dr2+ Veff(l, r)

]Ukl(r) = EklUkl(r) . (151)

Offenbar ist es wichtig, daß wir uns Gedanken uber dasVerhalten von Rkl(r) am Ursprung machen, der die Lageeiner Quelle ist, die als Ursache fur das Zentralpotentialfungiert und den Ursprung ubrigens uberhaupt erst alssolchen auszeichnet. Wir suchen Losungen von (151), dieam Ursprung hinreichend gutartig sind, und wagen denAnsatz (Ckl ∈ C , k ∈ I, l : l(l + 1)~2 ∈M(l))

limr→0

Ukl(r) ∼ Ckl rs+1 . (152)

Einsetzen in (151) liefert fur r −→ 0 die Bedingung s(s+1)− l(l + 1) = 0, woraus s ∈ l,−(l + 1) folgt, also

limr→0

Ukl(r) ∼ Ckl

rl+1 , wenn s = l

r−l , wenn s = −(l + 1) .

Um den am Ursprung divergenten Losungsast auszu-schließen, setzen wir eine entsprechende Randwertbedin-gung, die die physikalische Losung in Abhangigkeit vonder radialen und azimuthalen Quantenzahl eindeutig als

Page 49: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

49

Funktion vom Abstand zum Ursprung bestimmt:[− ~2

d2

dr2+ Veff(l, r)

]Ukl(r) = EklUkl(r) ,

Ukl(0) = 0 . (153)

Wir gehen zu dimensionslosen Variablen uber. Dazudefinieren wir in historischer Anlehnung folgende Großen:

a0df=

~2

µe2(Bohr’scher Atomradius) ,

EIdf=

µe4

2~2(Bohr’sche Ionisierungsenergie) .(154)

Die dimensionsbehafteten Großen drucken wir als Viel-fache des Atomradius und der Ionisierungsenergie imBohr’schen Atommodell aus:

ρdf= r/a0 ,

λkldf=√−Ekl/EI . (155)

Bemerken Sie, daß das Minuszeichen unter der Wurzel in(155) der Tatsache Rechnung tragt, daß wir uns fur Bin-dungszustande interessieren, und diese wegen der Formvon Veff allesamt durch negative Energie gekennzeichnetsind.

Mit diesen Skalierungen kann die radiale Wellenglei-chung folgendermaßen umgeschrieben werden:[

d2

dρ2− l(l + 1)

ρ2+

2

ρ− λ 2

kl

]Ukl(ρ) = 0 ,

Ukl(0) = 0 . (156)

Wir bestimmen zunachst das asymptotische Verhalten(ρ 1) von (156). Offenbar gilt asymptotisch

Ukl(ρ) a= exp (±ρλkl) . (157)

Aus Konsistenzgrunden (Normierbarkeit) sind wir ge-zwungen, die exponentiell wachsende Asymptotik alsunphysikalisch zu verwerfen. Die physikalisch sinnvolleAsymptotik ist also

Ukl(ρ) a= exp (−ρλkl) . (158)

Eine schone Eigenschaft dieser Asymptotik ist, daß siedas Verhalten der radialen Wellenfunktion im Intervallρ ∈ [0, 1) nur wenig beeinflußt. Insbesondere wird dasExponential im Limes ρ −→ 0 gerade Eins und respek-tiert damit auch die Randbedingung Ukl(0) = 0. Diesmotiviert folgenden Ansatz:

Ukl(ρ) = exp (−ρλkl) · Vkl(ρ) , ρ ∈ [0,∞) . (159)

Unsere neue Aufgabe lautet damit:d2

dρ2− 2λkl

d

dρ+

[2

ρ− l(l + 1)

ρ2

]Vkl(ρ) = 0 ,

Vkl(0) = 0 .

(160)

Die Randbedingung Vkl(0) = 0 und die Form der Dif-ferentialgleichung (160) motiviert einen Ansatz der FormVkl(ρ) ∝ ρsPkl(ρ) ,R 3 s > 0, wobei Pkl(ρ) eine Po-tenzreihe in ρ ist (mit Koeffizienten R 3 Cq , q ∈ N).Einsetzen in (160) ergibt nach Ordnen nach Potenzen inρ:

0 =

∞∑q=0

Cq [(q + s)(q + s− 1)− l(l + 1)] ρq+s−2 +

+

∞∑q=0

Cq2 [1− (q + s)λkl] ρq+s−1 . (161)

Nehmen wir an, daß C0 6= 0, so ist die niedrigste Potenzin ρ offenbar durch den Summanden mit q = 0 gegeben.Die Bedingung, daß dieser verschwindet ist

s(s− 1) = l(l + 1) , (162)

wobei s = l + 1 die einzige konsistente Losung darstellt,die die Randbedingung Vkl(0) = 0 respektiert. Fur eingegebenes N 3 q 6= 0 ist die niedrigste Potenz von ρnun q + s− 2 = q + l − 1. Fur die Koeffizienten erhaltenwir damit folgende Rekursionsbeziehung (nach geeigneterIndexverschiebung):

q(q + 2l + 1)Cq = 2 [(q + l)λkl − 1] Cq−1 ,

N 3 q 6= 0 . (163)

Nach Bestimmung von C0 (Normierung) folgen hierausrekursiv alle Koeffizienten von Pkl(ρ). Weiterhin gilt, daßCq/Cq−1 −→ 0 fur q −→ ∞. Die Reihe konvergiert also.Aber Vorsicht, genauer haben wir ja fur diesen GrenzfallCq/Cq−1 −→ 2λkl/q.

Sie konnen sich selbst davon uberzeugen, daß Cq −→(2λkl)

q/q! fur q −→ ∞ gilt. Fur jedes l ∈ N/2 (hiereigentlich l ∈ N) und fur jedes k ∈ I gibt es ein Q ∈ Nmit CQ = (2λkl)

Q/Q!+O(ε). Damit kann die PotenzreihePkl(ρ) folgendermaßen aufgespalten werden:

Pkl(ρ) = Rkl(ρ) +

∞∑q=Q

(2λkl)q

q!ρq . (164)

Im Grenzfall ρ −→∞ finden wir daher

Vkl(ρ)ρ→∞−→ lim

ρ→∞ρl+1

[Rkl(ρ) + exp (2λklρ)

], (165)

wobei Rkl(ρ) = Rkl(ρ) +∑Q−1q=0 (2λklρ)q/q!. Dies impli-

ziert aber, daß Vkl(ρ) und sogar Ukl(ρ) nicht normier-bar sind, da sie im Grenzfall ρ −→ ∞ divergieren, wasnaturlich keinen Sinn macht. Folglich muß die Rekursion(163) abbrechen, so daß Pkl(ρ) nur ein Polynom in ρ ist.Bricht die Rekusion ab, gibt es keine Normierungspro-bleme, da das Dampfungsexponential in Ukl(ρ) fur einephysikalisch vernunfitge Asymptotik sorgt.

Nehmen wir an, daß die Rekursion fur q = q∗ abbricht.Dann gilt [(q∗ + l)λkl − 1]Cq∗−1 = 0. Da C0 6= 0 ist auchCq∗−1 6= 0 und wir finden: λkl = 1/(q∗ + l). Mit anderen

Page 50: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

50

Worten, k = q∗ und die Rekursion bricht gerade fur q = kab. Dies schrankt I ⊂ R auf I = N/0 ein. Der Energie–Eigenwert in Abhangigkeit von der azimuthalen und derradialen Quantenzahl ist somit

Ekl =−EI

(k + l)2, l ∈ N , k ∈ N/0 . (166)

Die Funktion Vkl(ρ) ist daher ein Polynom in ρ vonOrdnung l + k, wobei die niedrigste Potenz gerade l + 1ist. Die Rekursionsbeziehung (163) wird

Cq = − 2(k − q)q(q + 2l + 1)(k + l)

Cq−1 , (167)

wobei der Rekursionsabbruch offenbar implementiert ist.Es lohnt sich in einer ruhigen Minute Cq = f(C0) explizitherzuleiten.

Bsp. VIII.1 Der radiale Anteil Rk,l(r) der stationarenWellenfunktion eines nichtrelativistischen Elektrons imklassischen Zentralpotential eines Protons (sogenann-tes Wasserstoff–Problem) ist fur einige radiale undazimuthale Quantenzahlen explizit durch folgende Aus-drucke gegeben:

R1,0(r) = 2(a0)−3/2 exp (−r/a0) ,

R2,0(r) = 2(2a0)−3/2 (1− r/2a0) exp (−r/2a0) ,

R1,1(r) = (2a0)−3/23−1/2(r/a0) exp (−r/2a0) .(168)

Fur festgelegtes l ∈ N gibt es unendlich viele Energie-werte Ekl ∝ −1/(k + l)2, da k ∈ N/0. Jeder dieserEnergiewerte ist wenigstens (2l+ 1)–fach entartet: Dieseessentielle Entartung hat ihren Ursprung in der Tatsa-che, daß die Gleichung fur den radialen Anteil der Wel-lenfunktion lediglich von l aber nicht von m abhangt.Zusatzlich gibt es zufallige Entartung: Fur Parchen(k1, l1) , (k2, l2) mit k1+l1 = k2+l2 gilt ja Ek1,l1 = Ek2,l2 .Die zugehorigen Zustande sind also energetisch nicht zuunterscheiden.

Speziell fur das H–Problem ist es zweckmaßig, die so-genannte Hauptquantenzahl n := k + l einzufuhren,da Ekl nur von dieser Kombination abhangt. Also, En ≡Ek+l := Ekl = −EI/n

2. Prinzipiell haben wir die Wahl,entweder (k, l) oder (n, l) zu spezifizieren, um die Eigen-zustande zu bestimmen. Wir folgen der ublichen Konven-tion und benutzen (n, l) als Quantenzahlen. Die Haupt-quantenzahl n charakterisiert die sogenannte Elektro-nenschale.

Da k ∈ N/0 ist, gibt es fur fixiertes n nur eine end-liche Anzahl von l–Werten, namlich l ∈ 0, 1, . . . , n− 1.Also kann l bei fixiertem n gerade n unterschiedlicheWerte annehmen. Daher hat sich folgende Sprechweiseeingeburgert: Die mit der Hauptquantenzahl n bezeich-nete Elektronenschale hat n Unterschalen, die ebendurch l ∈ 0, 1, . . . , n−1 charakterisiert sind. Schließlichkann jeder dieser Unterschalen (2l + 1) unterschiedlicheZustande unterbringen, die durch die (2l + 1) moglichenWerte von m ∈ −l, . . . , l ⊂ Z gegeben sind bei festem

l. Die totale Entartung ν(n) einer Elektronenschale n(Energie En) ist somit

ν(n) =

n−1∑l=0

(2l + 1) = n2 . (169)

Aus historischen Grunden, die vor der Entwicklung derQuantenmechanik ihren Ursprung haben, hat sich folgen-de spektroskopische Bezeichnung eingeburgert, dieauch heute noch im Gebrauch ist und ein quasi bota-nisches Erbe darstellt: l = 0 ↔ s , l = 1 ↔ p , l =2 ↔ d , l = 3 ↔ f , · · · . Fur N 3 l > 3 werden diel–Quantenzahlen mit den Buchstaben nach f in der kor-rekten alphabetischen Reihenfolge bezeichnet. Wie obendargelegt werden Unterschalen durch Wertepaare (n, l)charakterisiert, wobei in der spektroskopischen Schreib-weise nl benutzt wird und l durch den entsprechendenBuchstaben ersetzt wird.

Bsp. VIII.2 (Einige Energiestufen des H–Atoms)Der energetisch tiefliegendste Zustand eines Elektrons imCoulomb–Potential des Protons ist der 1s–Zustand, dafur die Hauptquantenzahl N 3 n ≥ 1 gilt. Folglich mußdie radiale Quantenzahl k = 1 sein und fur die azimutha-le Quantenzahl l = 0 ↔ s gelten. Der 1s–Zustand weisthinsichtlich der magnetischen Quantenzahl keine Entar-tung auf und es ist m = 0.

Der energetisch nachst tiefliegende Zustand hat n = 2.Dies ergibt fur die azimuthale Quantenzahl folgende Wer-temoglichkeiten: l ∈ 0, 1 ↔ s, p. Die moglichenZustande zu n = 2 korrespondieren somit zu den Unter-schalen 2s und 2p. Der 2s–Zustand weist hinsichtlich dermagnetischen Quantenzahl keine Entartung auf, der 2p–Zustand dagegen ist hinsichtlich der magnetischen Quan-tenzahl dreifach entartet: m ∈ −1, 0, 1. Die totale Ent-artung ist somit ν(2) = 4, was der Anzahl der moglichenunterscheidbaren Zustande zu n = 2 entspricht.

Fur n = 3 ist l ∈ s, p, d, die moglichen Unter-schalen sind also mit 3s, 3p und 3d bezeichnet. Neuist die azimuthale Quantenzahl l = 2 ↔ d, fur diem ∈ −2,−1, 0, 1, 2 ist. Zu n = 3 gibt es 1+3+5 = 9 un-terscheidbare Zustande, die alle auf dem gleichen Ener-gieniveau liegen.

Beachten Sie, daß E1/E2 = 4 , E1/E3 = 9 undE2/E3 = 9/4 ist.

Bsp. VIII.3 (Einige Wellenfunktionen) Die 1s–Unterschale wird von einem Zustand mit folgender Wel-lenfunktion Φn,l,m im Ortsraum populiert:

Φ1,0,0 = 1√πa 3

0

e−r/a0 . (170)

Die Wellenfunktion im Ortsraum zum 2s–Zustand ist:

Φ2,0,0 = 18πa 3

0

(1− r

2a0

)e−r/2a0 . (171)

Die 2p–Unterschale ist hinsichtlich der magnetischenQuantenzahl dreifach entartet. Die zugehorigen Wellen-

Page 51: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

51

funktionen sind (s(θ) := sin θ , c(θ) := cos θ):

Φ2,1,−1 = 1

8√πa 3o

ra0e−r/2a0 s(θ)e−iϕ ,

Φ2,1,0 = 1

4√

2πa 3o

ra0e−r/2a0 c(θ) , (172)

Φ2,1,1 = − 1

8√πa 3o

ra0e−r/2a0 s(θ)e+iϕ .

IX. ELEMENTARE STREUTHEORIE

Streuungen sind die elementaren Bausteine vieler phy-sikalischer Prozesse, die wir in der Natur beobachten, undstehen zudem in direktem Zusammenhang mit den funda-mentalen Wechselwirkungen, die in den Quantentheoriender Felder formuliert und studiert werden. Aber bereits inder Quantentheorie eines Massepunktes kann der forma-le Rahmen hierfur entwickelt und studiert werden, auchwenn die Streuung dann nur an einem externen Poten-tial stattfindet, welches bezuglich seiner quantenmecha-nischer Freiheitsgrade nicht aufgelost wird und daher alsklassisch angenommen wird.

Das mag ein wenig ernuchternd sein, hat aber wichtigeAnwendungen, wann immer externe Felder von Bedeu-tung sind, und ist auch schon ein Fortschritt relativ zurKlassischen Mechanik. Mit der beginnen wir ubrigens,denn hier kann eine intuitive Verankerung gelegt werden,durch deren Abstraktion der quantenmechanische Rah-men zur Behandlung von Streuprozessen verstandlicherwird.

A. Klassische Praliminarien

Gegeben sei ein Hamilton–System (P ∼= R3 × R3, H),wobei P durch (q, p) koordinatisiert sei, mit der Bewe-gungsgleichung

d

dtZ(t) = F (Z(t)) , (173)

wobei Z(t) = (q(t), p(t))T den mechanischen Zustandesdes Systems zur Zeit t ∈ R beschreibt. Im linearen Fall istdie rechte Seite der Hamilton–Bewegungsgleichung (173)durch

F(q(t)p(t)

)=(

p(t)/m−∇V (q(t))

), (174)

wobei V das Potentialfeld bezeichne und −∇V ist daszugehorige Kraftfeld. Der Einfachheit halber nehmen wirzunachst an, daß das Potential einen kompakten Tragerhat, und daß sich das Teilchen fur t −→ −∞ und t −→+∞ außerhalb dieses Tragers befinde. Dann gilt

limt→−∞

q(t) = Qin + tPin/m ,

limt→+∞

q(t) = Qfi + tPfi/m . (175)

Aufgrund der Energieerhaltung gilt |Pin| = Pfi. Prinzi-piell konnen die Großen (Qfi, Pfi ≡ limt→+∞ P (t)) aus

(Qin, Pin ≡ limt→−∞ P (t)) durch Integration der Be-wegungsgleichung mit den Anfangsbedingungen q(t0) =Qin+t0Pin/m , p(t0) = p1 berechnet werden, wobei wir t0so fern in der Vergangenheit wahlen, daß q(t) fur t < t0außerhalbt des Tragers von V ist.

Die Streuabbildung ist dann die Abbildung

S : P −→ P ,(Qin

Pin

)−→

(Qfi

Pfi

). (176)

Die Streuabbildung S ist auf ganz P ∼= R6 definiert undsurjektiv, das heißt jeder Zustand Z ∈ P kommt als An-fangszustand Zin (initial) und als Endzustand Zfi (fi-nal) vor.

Bsp. IX.1 (Klassische Streuung an beschranktemPotential in 1–d Konfigurationsraum) Sei P ∼= R2

und das Potential beschrankt, V (q) ≤ E∗ := max(V ).Fur Energien E < E∗ wird das Teilchen an dem Poten-tial reflektiert, wobei der Impuls des Teilchens zeitweisevariiert, solange der Ort des Teilchens im Trager von Vliegt, aber insgesamt wird nur das Vorzeichen des Im-pulses geandert. Die Streuabbildung hat also die folgendeForm:

S(Qin

Pin

)=(Qfi(Qin,Pin)−Pin

). (177)

Fur Energien E > E∗ bewegt sich das Teilchen durch dengesamten Trager von V , wobei innerhalb des Tragers seinImpuls zeitlich variiert, am Ende es jedoch den gleichenImpuls besitzt wie zu anfangs. Im Vergleich zur freienBewegung wird allerdings die Dynamik aufgrund der Exi-stenz von V eine andere sein. Die Streuabbildung hat dieForm

S(Qin

Pin

)=(Qfi(Qin,Pin)

Pin

). (178)

Im Fall E = E∗ kommt das Teilchen am Ort q∗ : V (q∗) =E∗ zur Ruhe, falls es diesen in endlicher Zeit erreichenkann.

Hat das Potential V keinen kompakten Trager, son-dern sind V und |∇V | fur große |t| nur hinreichend kleinaber endlich, so wird die Bewegung auch fur sehr große|t| nicht exakt durch Qin,fi + tPin,fi/m beschrieben. Es istaber intuitiv zu erwarten, daß die Bewegung wenigstensasymptotisch frei ist, also

∃ (Qin,fi, Pin,fi) : limt→±∞

|q(t)−Qin,fi + tPin,fi/m| = 0 .

Nun ja, es zeigt sich allerdings, daß dies viel wenigerintuitv ist, als gedacht, und zwar in folgendem Sinne:Das Potential muß asymptotisch schon sehr klein sein,zum Beispiel gilt asymptotische Freiheit bereits fur dasCoulomb–Potential nicht.

Wir waren ein wenig engstirnig, denn eigentlich werdennur die Impulse ausreichend vor und nach der Streuunggemessen. Diese sollten asymptotisch konstant sein, was

Page 52: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

52

auch fur langsamer abfallende Potentiale erwartet wer-den darf. Die Streuabbildung ist dann nur die AbbildungPin −→ Pfi.

Im Folgenden passen wir unsere intuitive Beschreibungvon Streuprozessen dem formalen Rahmen an, den dieQuantenmechanik zur Beschreibung von Streuung ver-langt. Der Zustand eines Teilchens sei durch Z(t) =(q(t), p(t)) gegeben und werde zum Beispiel zur Zeit t = 0durch Z(0) = (Q0, P0) beschrieben. Wie zuvor bezeich-nen wir die zugehorigen asymptotischen freien Zustandein der fernen Vergangenheit bzw. der fernen Zukunftdurch (Qin,fi, Pin,fi). Wir fuhren neue Abbildungen ein:

Win,fi : (Qin,fi, Pin,fi) −→ (Q0, P0) . (179)

Die Komposition S := Wfi−1 Win ist dann der soge-

nannte Streuoperator. Dieser Operator beschreibt of-fenbar den Streuvorgang im Endeffekt so, daß die Streu-ung selbst nicht dynamisch aufgelost wird, da wir jalediglich die asymptotisch freien Zustande miteinandervergleichen. Das ist komfortabel, aber stellt uns auchvor schwere Aufgaben, wenn wir das sogenannte inver-se Problem losen wollen, also von S auf das Potentialoder etwa die Form eines reflektierenden Korpers zuruck-schließen mochten. Dies ist offenbar eine der wichtigstenFragestellungen in der Streutheorie, aber auch eine derschwierigsten.

B. Ein instruktives Beispiel

Im folgenden Beispiel betrachten wir ein Paar von Evo-lutionsgleichungen, das so einfach ist, daß der Streuope-rator explizit berechnet werden kann. Die Uberlegungensind weitgehend unabhangig vom zu Grunde liegendenFunktionenraum und Funktionalanalysis spielt allenfallsim Hintergrund eine Rolle (aus diesem ist sie ohnehin nurschwerlich wegzudenken).

Bsp. IX.2 (Konstruiertes Beispiel zur raschenVeranschaulichung) Die Einfachheit der folgendenDiskussion liegt an folgender Annahme: Gegeben sei einklassisches System im R1 mit der Dispersionsrelation(Energie–Impuls–Beziehung fur ein freies Teilchen) E =p. Diese ist artifiziell, da sie nicht einmal approxima-tiv aus der relativistischen folgt. Wir benutzen sie trotz-dem, weil sie offenbar die schone Eigenschaft hat, quaQuantisierung eine Prozessgleichung zu liefern, die aus-schließlich Ableitungen erster Ordnung enthalt, was dieDiskussion enorm vereinfacht und eine exakte Behand-lung ermoglicht.

Kanonische Quantisierung liefert fur die freie Evoluti-on der Wellenfunktion im Ortsraum die Prozessgleichung

i~∂tΨ(t, x) = H0Ψ(t, x) , (180)

wobei H0 := Op ≡ −i~∂x auf R.Die freie Zeitentwicklung ist durch U0(t) :=

exp (−iH0/~) gegeben. Wegen der Form von H0 ist

U0(t) gerade die unitare Darstellung von raumlichenTranslationen um die Distanz t (c=1), jedenfalls imL2(R)–Fall. Mit anderen Worten, (180) hat die Losung

Ψ(t, x) = U0(t)Ψ(0, x) = Ψ(0, x− t) . (181)

Dies gilt naturlich nur dann, wenn Ψ differenzierbar ist.Der unitare Operator (im L2(R)–Fall) U0(t) dagegen istauf jedem vernunftigen Funktionenraum uber R wohl-definiert und stark stetig (uberlegen Sie sich Beispiele),insbesondere in L2(R). Unitaritat von U0(t) (im L2(R)–

Fall) impliziert U0†(t) = U0

−1(t) = U0(−t).Nun kann das Teilchen auch in den Einflußbereich

eines Potentials V (x) mit geeignetem Trager geraten,dann wird die zeitliche Entwicklung der zugehorigen Wel-lenfunktion nicht mehr von H0 generiert, sondern vonH = H0 +V (x). In vielen realistischen Fallen wird V (x)als Storung von H0 betrachtet, da die Evolution im allge-meinen nicht mehr exakt losbar sein wird, und die exak-te Evolution wird um die freie Evolution entwickelt. Dasfuhrt uns zu weit im Moment. Die exakte Evolution derWellenfunktion wird also folgendermaßen beschrieben:

i~∂tΨ(t, x) = (H0 + V (x)) Ψ(t, x) , (182)

wobei per Konstruktion die Anfangsbedingung mit der derfreien Evolution ubereinstimmen soll.

Wie schaut der Zeittranslationsoperator U(t) in diesemFall explizit aus? Zunachst setzen wir

W Φ(x)df= exp

(i

~

∫ x

0

dy V (y)

)Φ(x) . (183)

Offenbar ist H = W−1H0W, das heißt HΨ(t, x) =(W−1H0W)Ψ(t, x) fur geeignete Wellenfunktionen, wo-bei wir Kompositionszeichen unterdruckt haben. Also gilt(Zeigen Sie dies!)

Ψ(t, x) = U(t)Ψ(0, x) =W−1U0(t)WΨ(0, x)

= exp

(− i

~

∫ x

0

dy V (y)

)

U0(t) exp

(i

~

∫ x

0

dy V (y)

)Ψ(0, x)

= exp

(i

~

∫ x−t

x

dy V (y)

)Ψ(0, x− t) . (184)

Sie konnen das ganz explizit durch Einsetzen in die Pro-zessgleichung (182) uberprufen oder etwas formaler fol-gendermaßen:

∂tU(t)Ψ(0, x) = ∂tW−1U0(t)WΨ(0, x)

= W−1∂tU0(t)WΨ(0, x)

= W−1 (−iH0/~)U0(t)WΨ(0, x)

= −(i/~)W−1H0WW−1U0(t)WΨ(0, x)

= −(i/~)HU(t)Ψ(0, x) . (185)

Der Zustand eines freien Teilchens Ψ± ist genau dannasymptotisch gleich dem Zustand eines Teilchens, daß

Page 53: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

53

dem Potential ausgesetzt war, wenn in der fernen Ver-gangenheit bzw. Zukunft folgendes gilt:

limt→±∞

U0(t)Ψ±(0, x)− U(t)Ψ(0, x) = 0 . (186)

Dann gilt weiter

Ψ±(0, x) = lim t→ ±∞ exp

(i

~

∫ x

x+t

dy V (y)

)Ψ(0, x) .

Salopp gesprochen wird die Zeitentwicklung auf derrhs(187) vom Wechselwirkungsanteil (also vom Potenti-al) in H betrieben statt von H0 oder ganz H. Die Grenz-werte in (187) existieren genau dann, wenn V bei ±∞uneigentlich integrierbar ist. Dann ist

Ψ+(0, x) = exp

(i

~

∫ x

∞dy V (y)

)Ψ(0, x)

= exp

(− i

~

∫ ∞x

dy V (y)

)Ψ(0, x)

= exp

(− i

~

∫ ∞x

dy V (y)

)

exp

(− i

~

∫ x

−∞dy V (y)

)Ψ−(0, x)

= exp

(− i

~

∫ +∞

−∞dy V (y)

)Ψ−(0, x) .

Damit haben wir ein wichtiges Resultat gefunden,namlich: Wenn V bei ±∞ uneigentlich integrierbar ist,existiert also der Streuoperator S:

Ψ+ = SΨ−

= exp

(− i

~

∫ +∞

−∞dy V (y)

)Ψ− . (187)

Der Streuoperator ist einfach die Multiplikation mit einerkomplexen Zahl vom Betrag eins. Auf allen normiertenFunktionenraumen uber R ist S somit isometrisch undbijektiv, in L2(R) sogar unitar.

Die Abbildungen

W± : Ψ± −→ Ψ ,

W±Ψ±(0, x) = exp

(− i

~

∫ x

±∞dy V (y)

)Ψ±(0, x)

heißen Wellenoperatoren, und es gilt S =W+−1W−.

C. Das kleine ABC derSturm–Liouville–Operatoren

Dieser Einschub ist lediglich eine kleine Erinnerung,Auffrischung oder Einfuhrung in die aufregende undfur die Physik wichtige Theorie der Sturm–Liouville–Operatoren. Je nach dem, wie sehr Ihre kleinen grau-en Zellen diesen Stoff bereits verdaut haben, konnen Siediesen Abschnitt uberspringen, oberflachlich durchgehen

oder tiefsinnig studieren, auch wenn er nicht so tiefsinnigprasentiert wird.

Ein Sturm–Liouville–Differentialausdruck ist derfolgende gewohnlicher Differentialausdruck in einem be-liebigen (beschrankten oder unbeschrankten) IntervallI = (a, b):

OSLΨ(x)df= 1

r(x) −∂x (p(x)∂xΨ(x)) + V (x)Ψ(x) .(188)

mit einer als positiv vorausgesetzen Funktion r : R −→R, die die Rolle einer Gewichtsfunktion in einem Skalar-produkt spielen wird. Solche Differentialausdrucke tre-ten typischer Weise in der Physik auf, nach dem dieZeitabhangigkeit eines dynamischen Systems vom zu-gehorigen Zustand absepariert wurde. Wichtige Beispielesind die schwingende Saite, die schwingende Kreis-membran, oder der eindimensionale Schrodinger–Operator, also OSL := −Op Op + V (x) in I mit−∞ ≤ a < b ≤ ∞.

1. Voraussetzungen und minimaler & maximaler Operator

Wir setzen dabei stets voraus:

(1) p, V, r sind meßbare reellwertige Funktionen mit1/p, V, r ∈ L1

lok(I), das heißt sie sind uber jedeskompakte Teilintervall von I integrierbar.

(2) p(x) > 0 , r(x) > 0 fur fast alle x ∈ I.

Mit diesen recht allgemeinen Voraussetzungen ist es ofttechnisch sehr aufwendig und langwierig, die Theorie derSturm–Liouville–Operatoren zu entwickeln, und es istdann verlockend von folgenden wesentlich starkeren Vor-aussetzungen auszugehen:

(1′) V, r sind stuckweise stetige reellwertige Funktionenauf I, p ist stetig und stuckweise differenzierbar.

(2′) Es gilt r(x) > 0 und p(x) 6= 0 fur alle x ∈ I.

Die zusatzlichen Einschrankungen betreffen nur das Ver-halten der Koeffizienten im Innern von I. In vielen An-wendungen sind die Koeffizienten dort hinreichend re-gular und bereiten keine Probleme. Was beiden Satzenan Voraussetzungen gemein und damit also wichtig ist:Es wird beliebig singulares Verhalten am Rand von Izugelassen.

Ist Φ : I ≡ (a, b) −→ C meßbar und z ∈ C, soheißt eine Funktion Ψ : I −→ C eine Losung von(OSL − z)Ψ = Φ, wenn Ψ und p∂xΨ absolut stetig sindund −∂x(p∂xΨ)(x) + (q(x)− zr(x))Ψ(x) = r(x)Φ(x) furfast alle z ∈ I.

Wir fuhren folgenden Hilbert–Raum ein:

L2(I, r) df=

Ψ : I −→ C : Ψ meßbar , r|Ψ|2 ∈ L1(I)

Page 54: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

54

mit dem Skalarprodukt und der Norm

〈Ψ,Φ〉rdf=

∫I

dx (ΨΦr) (x) ,

‖Ψ‖rdf=√〈Ψ,Ψ〉r . (189)

Der maximale durch OSL erzeugte Operator T ist de-finiert durch

D(T )df=

Ψ ∈ L2(I,∇) : Ψ und p∂xΨ absolut stetig

in I ,OSLΨ ∈ L2(I, r)

TΨ = OSLΨ .

Der minimale durch OSL erzeugte Operator T ′0 ist dieEinschrankung von T auf

D(T ′0)df=f ∈ D(T ) : Ψ hat kompakten Trager in I

.

Der minimale Operator T ′0 besitzt selbstadjungierte Fort-setzungen, die auch als selbstadjungierte Realisie-rungen von OSL bezeichnet werden.

Um dies verstandlicher zu machen, benotigen wireinen allgemeinen Existenz– und Eindeutigkeitssatz furgewohnliche lineare Differentialgleichungen: Gegeben seidas Anfangswertproblem (AWP)

∂xy(x) = a(x)y(x) + h(x) , x ∈ I ,y(x0) = y0 , x0 ∈ I , y0 ∈ Cn , (190)

wobei y, h : I −→ Cn und a : I −→ GL(n,C), und dieublichen Meßbarkeitsanforderungen gelten. Eine Funkti-on nennen wir eine Losung von (190), wenn jede Kom-ponente absolut stetig ist und das (AWP) fur fast allex ∈ I erfullt ist.

Dieses (AWP) ist gewissermaßen das Rollenmodell furSturm–Liouville–Probleme, was wir alsbald zeigen. Zuvornehmen wir diese Aussage hin als Motivation, um diefolgenden grundsatzlichen Aussagen zu studieren.

Satz IX.1 (a) Im Anfangswertproblem (AWP) seien|a| , |h| lokal integrierbar in I Dann existiert furjedes x0 ∈ I und jedes y0 ∈ Cn genau eine Losung.Sind a, h stetig, so ist y stetig differenzierbar.

(b) Seien aj : I −→ Cn×n , j ∈ 1, 2 meßbar und lokalintegrierbar. Gilt a = a1 + za2 mit z ∈ C, so istdie Losung yz(x) , x ∈ I von (AWP) eine ganzeFunktion von z.

(c) Gilt aj −→ a, hj −→ h in L1lok(I) und y0 j −→ y0,

so konvergiere die entsprechenden Losungen yn inI lokal gleichmaßig gegen die Losung y.

Beweis IX.1 Sind die Koeffizienten von (AWP) stuck-weise stetig auf I = (a, b) und ersetzen wir in (c) dieL1

lok–Konvergenz durch gleichmaßige Konvergenz, so istder Satz Ihnen vermutlich aus der klassischen Theoriegewohnlicher linearer Differentialgleichungen bekannt.

(a) Die Idee zum Beweis dieser Aussage fußt auf einerlokalen Fixpunktkonstruktion. Lokal deswegen, weil ver-ankert um den Anfangswert es gelingt, eine Kontraktionzu konstruieren, deren Fixpunkt das (AWP) lokal ein-deutig lost. Die Konstruktion kann dann sukzessive aufI erweitert werden.

Das Anfangswertproblem (AWP) ist aquivalent zur In-tegralgleichung

y(x) = y0 +

∫ x

x0

dt [a(t)y(t) + h(t)] . (191)

Sei I(x, η) := [x − η, x + η] , x ∈ I , η > 0. Wir wahlenη > 0 so, daß gilt:∫

I(x0,η)

dt |a(t)| ≤ q < 1 .

Nun betrachten wir die Integralgleichung in dem Banach-raum C(I(x0, η)) mit der Maximumnorm ‖ ‖∞. In die-sem Raum ist die Abbildung B mit

Bu(x)df= y0 +

∫ x

x0

dt [a(t)y(t) + h(t)] , x ∈ I(x0, η)

eine Kontraktion, denn

‖Bu− Bv‖∞ ≤ ‖u− v‖∞∫I(x0,η)

dt |a(t)|

≤ q‖u− v‖∞ . (192)

Mit dem Fixpunktsatz von Banach folgt somit, daß Beinen eindeutig bestimmten Fixpunkt y hat, also By(x) =y(x) , x ∈ I(x0, η). Dieser Fixpunkt lost das Anfangs-wertproblem in I(x0, η). Das Verfahren kann nun an denRandern von I(x0, η) fortgesetzt werden, das heißt, dasgleiche Verfahren kann in I(x0 − η, η) und I(x0 + η, η)vollzogen werden, usw. Da I(x0, eta)∩I(x0±η, η) 6= 0und die Fixpunkte jeweils eindeutig sind, erhalten wir soschließlich eine eindeutige Losung in I.

Die Beweise der Aussagen (b) & (c) bleiben Ihnen be-ziehungsweise Ihrem Selbststudium uberlassen. ∗–< [; 0)

Es folgt nun die angepriesene verwandtschaftliche Be-ziehung zwischen (AWP) und dem Sturm–Liouville–Anfangswertproblem.

Lemma IX.1 Der Sturm–Liouville DifferentialausdruckOSL erfulle die obigen Voraussetzungen (1), (2) oder(1′), (2′). Ist Φ : I −→ C meßbar und rΦ ∈ L1

lok(I),so ist fur beliebige z ∈ C und (y0, y1) ∈ C2 das Anfangs-wertproblem

(OSL − z) Ψ = Φ ,

Ψ(x0) = y0 , (p∂xΨ) (x0) = y1 (193)

eindeutig losbar. Die Losung Ψz(x) ist fur jedes x ∈I eine ganze Funktion von z. Letzteres gilt auch fur(p∂xΨz)(x).

Page 55: Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) · 3 Polarisations lter fuhrt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvek-tor

55

Der Beweis ergibt sich aus der Aquivalenz von dem An-fangswertproblem (193) mit (AWP). Die Aquivalenz istrasch etabliert:

y =

p∂xΨ

), y(x0) =

(y0

y1

), h =

(0

),

a =

(0 1/p

V − zr 0

). (194)

Die Losungen der homogenen GLeichung (OSL−z)U = 0bilden einen zwei–dimensionalen Vektorraum uber demkomplexen Zahlenkorper. Zwei Losungen U1, U2 bildengenau dann ein Fundamentalsystem, wenn die (mo-difizierte) Wronskideterminante

W(U1, U2)df= det

(U1(x) U2(x)

p∂xU1(x) p∂xU2(x)

)(195)

nicht verschwindet. Beachten Sie, daß die Determinantenicht von x abhangt. Zeigen Sie das ruhig.

Ist Φ : I −→ C so, daß rΦ lokal integrierbar ist, undist U1, U2 ein Fundamentalsystem von (OSL−z)U = 0, sosind alle Losungen Ψ von (OSL−z)Ψ = Φ folgendermaßengegeben:

Ψ(x) = c1U1(x) + c2U2(x) +

+1

W(U1, U2)

U1(x)

∫ x

c

dt r(t)U2(t)Φ(t) +

−U2(x)

∫ x

c

dt r(t)U1(t)Φ(t),

(196)

wobei c1, c2 ∈ C, c ∈ I.

Def. IX.1 Seien Ψ,Φ : I ≡ (a, b) −→ C absolut steti-ge Funktionen, fur die p∂xΨ und p∂xΦ stetig sind. DieLagrange–Klammer von Ψ mit Φ fur x ∈ I ist definiertals

[Ψ,Φ]xdf= Ψ(x) (p∂xΦ) (x)− (p∂xΨ) (x)Φ(x) .(197)

Offenbar gilt speziell fur Losungen Ψ,Φ von (OSL−z)U =0, daß [Ψ,Φ]x = W(Ψ,Φ)(x).

Satz IX.2 (a) Sind Ψ,Φ : I = (a, b) −→ C undp∂xΨ, p∂xΦ absolut stetig, so gilt fur J = [α, β] ⊂I die Lagrange–Identitat∫

J

OSLΨ(x)Φ(x)−Ψ(x)OSLΦ(x)

r(x) =

= [Ψ,Φ]β − [Ψ,Φ]α =: [Ψ,Φ]βα . (198)

Sind Ψ,Φ ∈ D(T ), so existieren folgende Grenz-werte:

[Ψ,Φ]bdf= limx→b−

[Ψ,Φ]x , [Ψ,Φ]xdf= limx→b−

[Ψ,Φ]x ,(199)

und es gilt

〈TΨ,Φ〉r − 〈Ψ, TΦ〉r = [Ψ,Φ]ba .

(b) Ist λ ∈ R und U eine Lsoung von (OSL − λ)U = 0,so gilt [U,U ]x = W(U , U) = 0 genau dann, wennU komplexes Vielfaches einer reellen Losung ist.

Beweis IX.2 (a) Gleichung (198) folgt direkt durchpartielle Integration. Aus (198) folgt die Existenzder Grenzwerte in (199) und Gleichung (200) durchGrenzubergang α −→ a+ und β −→ b−.

(b) Es ist [U,U ]x = 2i=(Up∂xU

). Dieser Wert ist ge-

nau dann Null, wenn die Funktionen U und p∂xUin einem reellen Verhaltnis stehen. Dies gilt genaudann, wenn U bis auf einen komplexen Vorfaktoreine reelle Losung ist

Das war es auch schon. ∗–< [; 0)

Es ist instruktiv, zunachst sogenannte regulare Ope-ratoren zu betrachten. OSL heißt regular bei a, wenna > −∞ ist, und die Funktionen 1/p, V, r (neben den obi-gen allgemeinen Voraussetzungen) uber [a, c] integrierbarsind fur ein (dann alle) c ∈ I. Der Operator OSL heißtregular bei b, wenn b < ∞ ist und 1/p, V, r uber [c, b]integrierbar sind fur ein (dann alle) c ∈ I. OSL heißtregular, wenn er bei a und b regular ist. OSL heißt sin-gular bei a (bzw. b) wenn er bei a (bzw. b) nicht re-gular ist. OSL heißt singular, wenn OSL nichr regularist. Diese Flut von Begriffsbildungen sind der Gultigkeitdes folgenden Satzes gebuhrend geschuldet.

Satz IX.3 Sei OSL regular bei a, z ∈ C, Φ : I −→ Cmeßbar und rΦ uber I ′ := (a, c) integrierbar fur c ∈ I,zum Beispiel Φ ∈ L2(I ′, r).

(a) Fur jede Lsung Ψ von (OSL−z)Ψ = Φ existieren diefolgenden Grenzwerte:

Ψ(a)df= lim

x→a+Ψ(x) , p∂xΨ(a)

df= limx→a+

p∂xΨ(x) .(200)

(b) Fur beliebige c0, c1 ∈ C gibt es genau eine Losungvon (OSL−z)Ψ = Φ mit Ψ(a) = c0 und p∂xΨ(a) =c1.

(c) Ist OSL auch bei b regular, so gilt: Fur beliebigec0, c1, d0, d1 ∈ C gibt es ein (nicht eindeutig be-stimmtes) Ψ ∈ D(T ) mit Ψ(a) = c0 , p∂xΨ(a) = c1und Ψ(b) = d0 , p∂xΨ(b) = d1.

Die Aussage des Satzes ist, daß fur Elemente Ψ ∈ D(T )im regularen Fall Ψ und p∂xΨ stetig auf [a, b] fortsetzbarsind. Die Funktion ∂xΨ selbst kann im allgemeinen nichtstetig in die Randpunkte fortgesetzt werden.

Beweis IX.3 (a) Ergibt sich aus Lemma IX.1, das indiesem Fall bis zu den Randpunkten anwendbar ist.

(b) Ergibt sich aus Lemma IX.1, das in diesem Fall biszu den Randpunkten anwendbar ist.

(c)