Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf ·...

139
Separation von Leptonen und Hadronen mit Hilfe von neuronalen Netzen im ¨ Ubergangsstrahlungsdetektor von AMS-02 von Philip von Doetinchem de Rande Diplomarbeit in Physik vorgelegt der Fakult¨ at f ¨ ur Mathematik, Informatik und Naturwissenschaften der Rheinisch-Westf¨ alischen Technischen Hochschule Aachen im November 2004 angefertigt im I. Physikalischen Institut B Prof. Dr. Frank Raupach Prof. Dr. Stefan Schael

Transcript of Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf ·...

Page 1: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Separation von Leptonen und Hadronen mitHilfe von neuronalen Netzen im

Ubergangsstrahlungsdetektor von AMS-02

vonPhilip von Doetinchem de Rande

Diplomarbeit in Physikvorgelegt der

Fakultat fur Mathematik, Informatik undNaturwissenschaften

derRheinisch-Westfalischen Technischen Hochschule Aachen

im November 2004

angefertigt imI. Physikalischen Institut B

Prof. Dr. Frank RaupachProf. Dr. Stefan Schael

Page 2: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie
Page 3: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Inhaltsverzeichnis

1 Einleitung 1

2 Physikalische Prinzipien zum Verst andnis der AMS-02-Mission 32.1 Grundlagen der Teilchenphysik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.1.1 Das Standardmodell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.1.2 Strangelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.1.3 Probleme des Standardmodells . . . . . . . . . . . . . . . . . . . . . . . . . 52.1.4 Supersymmetrische Erweiterung . . . . . . . . . . . . . . . . . . . . . . . 6

2.2 Grundlagen der Kosmologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.2.1 Inflationare Theorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3 Galaxieentstehungsmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.3.1 Storungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.3.2 Galaxienentstehungsszenarien . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.4 Dunkle Materie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.4.1 Evidenz fur dunkle Materie . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.4.2 Kandidaten fur dunkle Materie . . . . . . . . . . . . . . . . . . . . . . . . . 142.4.3 Dichteparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3 Das AMS-02-Experiment 193.1 Zielsetzung der AMS-02-Mission . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.1.1 Suche nach Antimaterie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203.1.2 Suche nach kalter dunkler Materie . . . . . . . . . . . . . . . . . . . . . . . 203.1.3 Suche nach Strangelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.1.4 Weitere Untersuchungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.2 Ubersicht der Detektorkomponenten . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2.1 Ubergangsstrahlungsdetektor . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2.2 Silizium Spurdetektor (Tracker) und supraleitender Magnet . . . . . . . . 243.2.3 Flugzeitmessung (ToF) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.2.4 Anti-Coincidence Veto Zahler (ACC) . . . . . . . . . . . . . . . . . . . . . 263.2.5 Ring-Imaging Cerenkov Detektor (RICH) . . . . . . . . . . . . . . . . . . . 263.2.6 Elektromagnetisches Kalorimeter . . . . . . . . . . . . . . . . . . . . . . . . 283.2.7 Montage und Start des Detektors . . . . . . . . . . . . . . . . . . . . . . . . 29

4 Der Ubergangsstrahlungsdetektor 314.1 Theorie der Ubergangsstrahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314.2 Detektion der Ubergangsstrahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.2.1 Durchgang eines geladenen Teilchens durch Materie . . . . . . . . . . . . 364.2.2 Detektion der Photonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364.2.3 Zahlrohr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.3 Der Ubergangsstrahlungsdetektor von AMS-02 . . . . . . . . . . . . . . . . . . . . 394.3.1 Radiatormaterial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.3.2 Detektorkammern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.3.3 Tragestruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

iii

Page 4: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Inhaltsverzeichnis

4.3.4 Gasversorgung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414.3.5 Elektronik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424.3.6 Vibrations- und Thermo-Vakuum-Test . . . . . . . . . . . . . . . . . . . . . 42

4.4 Strahltest mit einem 20-lagigen Ubergangsstrahlungsdetektorprototyp . . . . . . 424.4.1 Aufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424.4.2 Ubersicht uber den Strahltest . . . . . . . . . . . . . . . . . . . . . . . . . . 43

5 Klassische Analyse 455.1 Datenaufbereitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.1.1 Spurfit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455.1.2 Mittleres Energiespektrum . . . . . . . . . . . . . . . . . . . . . . . . . . . 465.1.3 Spektren der einzelnen Lagen . . . . . . . . . . . . . . . . . . . . . . . . . . 485.1.4 Fits der einzelnen Lagenspektren . . . . . . . . . . . . . . . . . . . . . . . . 50

5.2 Analysemethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515.2.1 Effizienz und Rejektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515.2.2 Cluster-Counting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525.2.3 Likelihood Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535.2.4 Fisher-Diskriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555.2.5 Rejektionen bei allen betrachteten Energien . . . . . . . . . . . . . . . . . . 565.2.6 Toy-Monte-Carlo zum Einfluss der unterschiedlichen Overflow-Peaks . . 57

6 Einfuhrung in neuronale Netze 616.1 Konzept . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616.2 Kunstliche neuronale Netze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 626.3 Training . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

6.3.1 Backpropagation-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . 646.3.2 Optimale Lernrate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 666.3.3 Trainingsabbruch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 676.3.4 Nutzliche Verbesserungen von neuronalen Netzen . . . . . . . . . . . . . 686.3.5 Effektive Lernmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

6.4 Gutetest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 736.5 Einsatzgebiete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor 757.1 Analyseprozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 757.2 Ermittlung der besten Lernmethode . . . . . . . . . . . . . . . . . . . . . . . . . . 76

7.2.1 Resilient Propagation (RProp) . . . . . . . . . . . . . . . . . . . . . . . . . . 777.2.2 δ-δ-Lernregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 777.2.3 Vergleich eines mit allen Energien und eines nur mit 100 GeV-Protonen

trainierten Netzes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 787.2.4 Ermittlung der besten Lernparameter fur die δ-δ-Lernregel . . . . . . . . . 80

7.3 Trainingsgroßen und Struktur des neuronalen Netzes . . . . . . . . . . . . . . . . 837.4 Gutetest und Rejektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 837.5 Zusammenfassen aller Analysemethoden in einem weiteren neuronalen Netz . . 86

7.5.1 Parametervariation fur das zusammenfassende neuronale Netz . . . . . . 877.5.2 Trainingsgroßen des zusammenfassenden neuronalen Netzes . . . . . . . 90

7.6 Weitere Untersuchungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 937.6.1 Einfluss einzelner Detektorlagen . . . . . . . . . . . . . . . . . . . . . . . . 937.6.2 Reihenfolge der Energiedepositionen . . . . . . . . . . . . . . . . . . . . . 947.6.3 Verschmierung der Energiedepositionen . . . . . . . . . . . . . . . . . . . 94

7.7 Falsch erkannte Ereignisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

iv

Page 5: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Inhaltsverzeichnis

8 Zusammenfassung und Ausblick 101

A ANNA - AMS Neural Network Analysis 103A.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103A.2 Auswertung Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104A.3 Backpropagation Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106A.4 Cluster Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110A.5 Fisher Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111A.6 Likelihood Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112A.7 MCSchleife Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113A.8 Netz Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114A.9 Neuron Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119A.10 Schicht Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120A.11 Schleife Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121A.12 Verbindung Klassenreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

v

Page 6: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Inhaltsverzeichnis

vi

Page 7: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

1 Einleitung

Die Frage, wie die Welt entstanden ist, war lange Zeit eher philosophischer als physikalischerNatur. Die Menschen beschaftigten sich mit dieser Existenzfrage schon vor tausenden Jahren.In der heutigen Zeit ist diese Frage mindestens noch genauso spannend wie damals, obwohlman schon große Fortschritte gemacht hat. Mit Hilfe physikalischer Theorien wie der Teilchen-physik und der Kosmologie ist es den Menschen gelungen, ein Urknallmodell zu entwickeln,das die Entwicklung aus einer ”Ursuppe“ beschreibt. Die Urknalltheorie wird durch Beob-achtungen wie die Expansion des Universums, die primordiale Nukleosynthese und die kos-mische Hintergrundstrahlung gestutzt. Dieses Modell bildet das Gerust zum Verstandnis derStrukturbildung in Form von Galaxien und Sonnensystemen. Beobachtungen legen den Ge-danken nahe, dass es im Universum viel mehr Materie als die sichtbare Materie geben muss,um die Strukturen von und innerhalb von Galaxien zu verstehen. Diese Materie wird dunkleMaterie genannt.Eines der weiteren großen Ratsel der modernen Kosmologie und Teilchenphysik ist unseregrundsatzliche Existenz, da die Theorie zu jedem Teilchen ein Antiteilchen vorhersagt, die sichvernichten. Unsere Existenz ist der Beweis dafur, dass nicht alle Materie nach der Erzeugungwieder mit ihrer Antimaterie annihiliert hat. Woher kommt nun diese Asymmetrie? Um die-se nicht nur physikalischen, sondern auch philosophischen, Fragestellungen weiter sinnvollbearbeiten zu konnen, mussen weitere Beobachtungen gemacht werden.Die AMS1-02-Mission wird ihren Teil dazu beitragen, indem sie eine genaue Spektroskopie derkosmischen Hohenstrahlung vornimmt. Dazu soll der AMS-02 Detektor 2007 startbereit fur sei-nen Betrieb auf der ISS2 fur mindestens drei Jahre sein. Zum Verstandnis der AMS-02-Missionist notwendig, sich die physikalischen Grundlagen und offenen Fragestellungen vor Augenzu fuhren. In Kapitel 2 wird dazu ein Uberblick uber das Standardmodell der Teilchenphysikmit einer moglichen supersymmetrischen Erweiterung, uber die Theorie der Strukturbildungim Universum und uber die Notwendigkeit fur dunkle Materie gegeben. Ein guter Kandidatfur dunkle Materie konnte dabei das supersymmetrische Neutralino sein, das man eventuelldurch Uberhohungen in den kosmischen Antiteilchen (e+, p) und Photonspektren nachweisenkonnte. Neben der genauen Spektroskopie dieser Antiteilchenspektren ist eine weitere Haupt-aufgabe von AMS-02 die Suche nach Antikernen wie z.B. Anti-Helium He. Diese konnten alsHinweis auf Antisterne oder zumindest großere Ansammlungen von Antimaterie verstandenwerden.In Kapitel 3 wird ein Uberblick uber weitere Aufgaben von AMS-02, ebenso eine kurze Vor-stellung der einzelnen Detektorkomponenten, wie z.B. Ubergangsstrahlungsdetektor (TRD3),Si-Spurkammer und elektromagnetisches Kalorimeter gegeben. Diese Arbeit beschaftigt sichhauptsachlich mit der Auswertung von Teststrahldaten, die mit einem 20-lagigen Ubergangs-strahlungsdetektorprototypen im Jahr 2000 am CERN4 aufgezeichnet wurden, daher folgt inKapitel 4 eine Zusammenfassung der Theorie der Ubergangsstrahlung, eine Vorstellung desendgultigen Ubergangsstrahlungsdetektors und eine Ubersicht uber die Datennahme mit demPrototypen.Die Analyse der Daten erfolgt mit dem Ziel, eine Aussage uber die Trennbarkeit von Proto-nen und Positronen mit Hilfe des Ubergangsstrahlungsdetektors zu gewinnen. Die Haufig-

1engl.: Alpha Magnetic Spectrometer2engl. International Space Station3engl. Transition Radiation Detector4franz.: Centre Europeen pour la Recherche Nucleaire

1

Page 8: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

1 Einleitung

keitsverteilung der Anteile in der kosmischen Strahlung verlangen namlich eine Rejektion5

von 104 - 106, um eine beweiskraftige Aussage zum kosmischen Positronspektrum zu ma-chen. Allerdings ist kein Detektor alleine in der Lage diese Rejektion zu erreichen, so dassein elektromagnetisches Kalorimeter und ein Ubergangsstrahlungsdetektor jeweils einen Teilder Aufgabe ubernehmen. Der Ubergangsstrahlungsdetektor soll dabei eine Rejektion von 102

- 103 im Energiebereich der Positronen und Protonen von 5 - 300 GeV gewahrleisten. Die klassi-sche Analyse der gemessenen Prototypdaten wird in Kapitel 5 vorgestellt. Es wird erklart, wiedie Daten zur Analyse aufbereitet werden. Danach werden die unterschiedlichen MethodenCluster-Counting, Fisher-Diskriminante und Likelihood vorgestellt und verglichen.Die Hauptaufgabe dieser Arbeit ist es, zur Klassifizierung von Positronen und Protonen neu-ronale Netze zu verwenden. Diese Methode versucht die Reizweiterleitung von elektrischenSignalen im Nervensystem in einem sehr einfachen mathematischen Modell nachzubilden.Es soll eine moglichst allgemeine Abbildungsvorschrift gefunden werden, die Positronen undProtonen deutlich trennt und auch bei fehlerbehafteten Eingaben gute Ergebnisse liefert. Dazuwurde ein neuronales Netz (NN) in C++ programmiert. Um einen genauen Uberblick uber diein dieser Arbeit verwendete Methodik neuronaler Netze und die folgende Analyse zu erhal-ten, wird in Kapitel 6 eine Einfuhrung in dieses Thema gegeben. In Kapitel 7 folgt dann dieAnwendung auf die Prototypdaten und deren Auswertung.

5engl. Unterdruckung, gibt den Kehrwert des Anteils der durch die jeweilge Analysemethode falsch erkanntenProtonen an:

R =Nalle Protonen

Nfalsche Protonen. (1.1)

2

Page 9: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verst andnisder AMS-02-Mission

Die AMS-02-Mission wird Spektroskopie der kosmischen Hohenstrahlung betreiben. Anhandder aufgenommenen Spektren sollen, unter anderem, Aussagen zur Existenz von Antimate-rie und dunkler Materie gemacht werden. Zum Verstandnis dieser Fragestellungen, seien imFolgenden eine Zusammenfassung des Standardmodells der Teilchenphysik, einer moglichensupersymmetrischen Erweiterung selbiger, der Kosmologie und der Strukturbildung im Uni-versum gegeben.

2.1 Grundlagen der Teilchenphysik

In der Teilchenphysik werden die fundamentalen Wechselwirkungen zwischen punktformi-gen Elementarteilchen und den Elementarteilchen selber beschrieben. Bisher sind die elek-troschwache Kraft, die starke Kraft und die Gravitation bekannt. Im sogenannten Standard-modell der Teilchenphysik werden die elektroschwache und die starke Kraft mit Hilfe vonQuantenfeldtheorien beschrieben. Die Gravitation ist nicht Teil dieses Modells und ist aufgroßen Langenskalen die bestimmende Kraft. Die Gravitation wird bisher durch die Allge-meine Relativitatstheorie beschrieben. Im folgenden Abschnitt soll das Standardmodell derTeilchenphysik im Uberblick vorgestellt werden. Fur eine ausfuhrlichere Beschreibung der Zu-sammenhange sei auf [1] verwiesen.

2.1.1 Das Standardmodell

Das Standardmodell beschreibt die Theorie der Elementarteilchen. Elementarteilchen habenkeine Unterstrukturen mehr und bilden somit die Grundlage der bekannten Materie. Die Teil-chen lassen sich in Quarks und Leptonen aufteilen. Jede dieser Sorten lasst sich weiter in dreisog. Familien unterteilen. Die Teilchen sind durch ihre Quantenzahlen genau charakterisiert.Quarks und Leptonen sind Fermionen, d.h. sie haben Spin 1/2. Die Wechselwirkungen zwi-schen den Fermionen werden durch Eichbosonen vermittelt, die einen Spin von 1 haben.

Quarks und Leptonen spuren die elektroschwache Wechselwirkung, die aus einer Vereini-gung der elektromagnetischen und schwachen Wechselwirkung hervorgeht. Die entscheiden-den elektroschwachen Quantenzahlen sind hierbei die schwache Hyperladung und der schwa-che Isospin. Die Austauschteilchen der elektromagnetischen Wechselwirkung sind die masse-losen, ungeladenen Photonen. Die schwache Wechselwirkung hat als Austauschteilchen diemassebehafteten W±- und Z0-Bosonen. Da es sich um eine nicht-Abel’sche Eichthorie handelt,gibt es Selbstwechselwirkungen der Austauchteilchen. Eine Zusammenstellung aller Quarksund Leptonen ist in Tabelle 2.1 zu finden.

Quarks tragen neben der elektroschwachen Ladung noch die Farbladung, die die Quelle furdie starke Wechselwirkung bildet. Es gibt drei verschiedene Farbladungen. Die Austauschbo-sonen werden durch acht Gluonen gebildet, die alle auch eine Farbladung tragen, so dass es wiein der schwachen Wechselwirkung zu Selbstwechselwirkungen der Austauschteilchen kommt.

3

Page 10: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Fermionen (Spin 1/2)Familien Quantenzahlen

1. 2. 3. Q T3 YW

(ud′

)

L

(cs′

)

L

(tb′

)

L

2/3−1/3

1/2−1/2

1/31/3

QuarksuRd′R

cRs′R

tRb′R

2/3−1/3

00

4/3−2/3

(ν ′ee

)

L

(ν ′µµ

)

L

(ν ′ττ

)

L

0−1

1/2−1/2

−1−1

LeptoneneR µR τR -1 0 -2

Bosonen (Spin 1)Wechselwirkung Austauschteilchen Q T3 YW

elektromagnetisch γ 0 0 0

schwachZ0

W±0±1

0±1

00

stark g1...8 0 0 0

Tabelle 2.1: Ubersicht der Teilchen des Standardmodells mit den elektroschwachen Quantenzahlen. DieFermionen werden in linkshandige Dubletts und rechtshandige Singuletts eingeteilt. Das Neutrino hateine defnierte Handigkeit und wird in Experimenten zur schwachen Wechselwirkung linkshandig be-obachtet. Die Striche an den linkshandigen down-type-Quarks sollen anzeigen, dass es sich hierbei nichtum die physikalischen Masseneigenzustande handelt. Die echten Teilchen sind Mischzustande. Die Mi-schung wird durch die Cabbibo-Kobayashi-Maskawa-Matrix beschrieben. Letzte Erkenntnisse zeigen,dass auch Neutrinos massebehaftet sind [2]. Es handelt sich also auch hier um Mischzustande, die auchrechtshandig beobachtet werden konnen. Q bezeichnet die elektromagnetische Ladung, YW die schwa-che Hyperladung und T3 die dritte Komponente des schwachen Isospins.

Da die verschiedenen Teilchen teilweise ahnliche Eigenschaften haben, gibt es Symmetrien, diemathematisch durch folgende unitare Gruppen beschrieben werden konnen:

SU(3)C ⊗ SU(2)L ⊗ U(1)Y. (2.1)

SU(3)C ist die Gruppe der starken und SU(2)L⊗U(1)Y die Gruppe der elektroschwachen Wech-selwirkung. Die Starke einer Wechselwirkung wird durch die jeweilige Kopplungskonstantebestimmt. Man spricht von laufenden Kopplungskonstanten, da sie sich mit dem Impulsuber-trag Q verandern. Dadurch wird es uberhaupt erst theoretisch moglich, eine Vereinigung die-ser Kopplungskonstanten zu beobachten. Im Standardmodell ist diese Vereinigung aber nurfur die elektromagnetische und die schwache Wechselwirkung gelungen (siehe Abbildung 2.2,links).

Die Masse der Teilchen ist ein Resultat der Wechselwirkung mit dem skalaren Higgs-Feld, wel-ches uberall prasent ist. Wenn das Higgs-Feld einen bestimmten Vakuumerwartungswert an-nimmt, wird die lokale Eichinvarianz gebrochen und es werden alle Massen festgelegt.

4

Page 11: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Die Quantenfeldtheorie, die das Grundgerust fur das Standardmodell bildet, macht die Vorher-sage, dass es zu jeder Symmetrie ein Teilchenspektrum aus Teilchen und Antiteilchen gibt, diebeide nach dem Standardmodell gleichberechtigt existieren mussten. Diese Symmetrie wirdallerdings im beobachtbaren Weltall nicht bestatigt. Die sog. CP -Verletzung kann erklaren,warum es Materie und Antimaterie nicht in gleichem Maße gibt. Allerdings sind die CP -verletzenden Prozesse des Standardmodells zu schwach, um die komplette Asymmetrie zuerklaren [3].

2.1.2 Strangelets

Abbildung 2.1: Strangeletmodell: links 12C-Kern, rechts: Strangelet A = 12, aus [4]

Eine Folgerung des Standardmodells kann auch mit AMS-02 untersucht werden und findetdeswegen Erwahnung. Es gibt die Vermutung, dass der Grundzustand von hadronischer Ma-terie1 mit einer Baryonzahl großer als 100 eine Anordnung von vielen u-, d- und s-Quarksin einem hadronischen Bag (Abbildung 2.1) ist, da dieser Zustand energetisch gunstiger undsomit stabiler ist [4]. Die Suche nach kleinen Strangelets an Schwerionenbeschleunigern hatbisher aber noch keine Hinweise auf diese Form der Materie ergeben.Beobachtungen konnten jedoch im Universum moglich sein, da Neutronensterne als sehr großeStrangelets betrachtet werden konnen. Fragmente dieser Sterne wurden dann zur kosmischenStrahlung beitragen. Das Verhaltnis der Masse zur Ladung dieser Teilchen musste sehr kleinsein. Bei Strangelets mit nur einer Farbe wurde gelten [5]:

Z = 0, 3A23 . (2.2)

2.1.3 Probleme des Standardmodells

Das Standardmodell beschreibt die Wechselwirkungen zwischen den Fermionen mit den imMoment auf der Erde realisierbaren Beschleunigerenergien sehr gut. Es gibt allerdings Phano-mene im Universum, die durch das Standardmodell nicht beschrieben werden. Wahrend dieNeutrinomassen einfach in das bestehende Standardmodell eingebaut werden konnen, ist eseventuell von Noten eine weitreichendere Erweiterung fur die Beschreibung der dunklen Ma-terie (siehe Abschnitt 2.4) zu verwenden. Weitere Probleme sind [6]:

@ Warum gibt es genau drei unabhangige Symmetriegruppen?

1Teilchen aus Quarks tragen folgende Bezeichnungen:Hadron: Teilchen aus Quarks,Meson: Teilchen aus zwei Quarks,Baryon: Teilchen aus drei Quarks.

5

Page 12: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

@ Wie kann die Zahl der freien Parameter im Standardmodell reduziert werden?

@ Warum gibt es genau drei Fermion-Familien? Wo ruhrt die Symmetrie zwischen Quarksund Leptonen her? Sind diese Teilchen fundamental?

@ Warum sind die elektromagnetischen Ladungen von Proton und Elektron exakt entgegen-gesetzt?

@ Warum ist die schwache Skala relativ gesehen so klein2? Warum ist mW-Boson/mPlanck ≈10−17 (Hierarchie-Problem)?

@ Woher kommt die bisher beobachtete Asymmetrie von Materie und Antimaterie im Weltall?

@ Existiert das Higgs-Teilchen? Falls ja, welche Masse hat es?

@ Wie kann die Gravitation eingebunden werden?

2.1.4 Supersymmetrische Erweiterung

Grundlagen

Die Supersymmetrie ist eine Erweiterung des Standardmodells, die eine Symmetrie zwischenFermionen und Bosonen einfuhrt. Die Fermionen des Standardmodells bilden die linkshandi-gen Komponenten eines chiralen Superfeldes. Die rechtshandigen Komponenten sind super-symmetrische Partnerbosonen. Die Austauschbosonen des Standardmodells bilden zusammenmit ihren supersymmetrischen Partnerfermionen die Vektorsuperfelder. Es kommt also zu ei-ner Verdoppelung des Teilchenspektrums. Die Unterscheidung zwischen Partner und Super-partner wird durch eine neue multiplikative Quantenzahl R beschrieben. Da bei Experimentenbisher noch keine supersymmetrischen Teilchen gefunden wurden, muss diese Symmetrie, fallses Supersymmetrie gibt, gebrochen sein, so dass es moglich ist, dass die supersymmetrischenPartner sehr große Massen haben. Eine Ubersicht der unteren Massengrenzen durch bisherigeMessungen sind in [2] zu finden.

Ein mogliches supersymmetrisches Modell ist das Minimal Supersymmetrische Standardmo-dell (MSSM), das nur eine minimale Anzahl von neuen Parametern einfuhrt und bei Erhal-tung der R-Quantenzahl, zur Existenz eines stabilen, leichtesten, supersymmetrischen Teil-chens fuhrt. Dieses Modell hat zwei Higgs-Dubblets aus je einem geladenen und einem un-geladenen Higgs. Demnach gibt es auch vier supersymmetrische Higgs-Partner, die Higgsinos.

Eine der Hauptmotivation fur Supersymmetrie ist die mogliche Vereinigung der Kopplungs-konstanten der elektroschwachen und starken Kraft (Abbildung 2.2, rechts), die Losung desHierarchie-Problems und die Erklarung der Materie-Antimaterie-Asymmetrie durch weitereCP -verletzende Prozesse [7],[8],[9]. Die Supersymmetrie ist hingegen nicht in der Lage dieAnzahl der Symmetriegruppen und die exakt entgegengesetzen Ladungen von Elektron undProton zu erklaren. Auch die Anzahl der freien Parameter wird nicht reduziert, sondern sogarerhoht. Die Gravition ist ebenfalls kein Bestandteil dieser Erweiterung des Standardmodells.

Neutralinos und Charginos

Die realen supersymmetrischen Teilchen sind, ahnlich wie die Quarks, Linearkombinationender Masseneigenzustande der neutralen Superteilchen Bino B, Wino W 3 und den neutralen

2Planck-Masse: mPlanck =

√~G

6

Page 13: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Abbildung 2.2: Vereinigung der Kopplungskonstanten im MSSM, aus [10]

Higgsinos H01 und H0

2 . Die Mischungsmatrix der neutralen supersymmetrischen Teilchen, denNeutralinos, lautet [8]:

Mχ01,2,3,4

=

M1 0 −g′v1√2

g′v2√2

0 M2gv1√

2−gv2√

2

−g′v1√2

gv1√2

δ33 −µg′v2√

2−gv2√

2−µ δ44

. (2.3)

M1, M2 sind die Massenparameter der Gauginos, den supersymmetrischen Partnern der Aus-tauschbosonen. g, g′ sind die SU(2)-, U(1)-Kopplungskonstanten. v1, v2 sind die Vakuumer-wartungswerte der neutralen Higgs-Komponenten. µ ist der Higgsino-Massenparameter. δ33,δ44 sind wichtige Schleifenkorrekturen, die einen nicht unerheblichen Einfluss auf die Neutra-linomasse nehmen. Die Neutralinos haben also folgende Zusammensetzung:

χ0i = Ni,1B + Ni,2W

3 + Ni,3H01 + Ni,4H

02 . (2.4)

Ni,j sind dabei komplexe Zahlen, die die Mischung beschreiben. Das Neutralino mit der ge-ringsten Masse ist χ0

1 ≡ χ. Nach [2] ist die untere Massengrenze des Neutralinos bei 95 % C.L.46 GeV.

Die geladenen Superteilchen, die Charginos, sind Mischungen der geladenen Winos W± undder geladenen Higgsinos H−

1 , H+2 . Die Mischungsmatrix lautet:

Mχ± =(

M2 gv2

gv1 µ

). (2.5)

Damit lautet die Zusammensetzung der Charginos:

χ− = Ui,1W− + Ui,1H

−1 , (2.6)

χ+ = Vi,1W+ + Vi,2H

+2 . (2.7)

Es gilt detU = 1 und U∗Mχ±V † = diag(mχ±1,mχ±2

). mχ±isind die positiven Chargino-Massen.

Nach [2] sind die unteren Massengrenzen der Charginos bei 95 % C.L. 94 GeV.

7

Page 14: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Abbildung 2.3: Veranschaulichung der Geometrie des Raumes, aus [13]

Auch fur die Superpartner der Quarks, die sog. Squarks, und der Leptonen, die sog. Sleptonen,lasst sich eine Mischung ahnlich zur Cabbibo-Kobayashi-Maskawa-Matrix finden.

Das minimal supersymmetrische Standardmodell (MSSM) wird durch funf Parameter charak-terisiert: m0, m1/2, tanβ, sign(µ) und A0. m0 und m1/2 sind die Massen der Gauginos undSkalare an der GUT3-Skala, die durch die Vereinigung der drei Kopplungskonstanten festge-legt wird. Das Verhaltnis der Vakuumerwartungswerte der beiden neutralen Komponenten desHiggs-Dubblets ist tanβ = v2/v1. A0 ist die trilineare Kopplung an der GUT-Skala [11].Es gehort sicherlich zu den wichtigsten Aufgaben der nachsten Beschleunigergeneration su-persymmetrische Teilchen zu suchen.

2.2 Grundlagen der Kosmologie

Die Kosmologie liefert zusammen mit dem Standardmodell der Teilchenphysik die Grundla-gen fur die Evolution und Strukturbildung des Universums. Die Langenskalen fur Wechsel-wirkungen im Universum sind sehr groß, so dass hier die Gravitation auf Grund der Ladungs-neutralitat die Hauptrolle spielt. Die Gravitation wird durch die Allgemeine Relativitatstheoriebeschrieben, die eine Krummung des Raumes als Ursache der Gravitation annimmt. Die Feld-gleichung lautet [12]:

Rµν − 12Rgµν = 8πGTµν + Λgµν . (2.8)

Rµν ist der Ricci-Tensor, der ein Maß fur die Abweichung des Raumes von einem flachenMinkowski-Raum darstellt. Tµν ist der Energie-Impuls-Tensor, welcher die Materieverteilungbeschreibt. gµν ist der Metrische Tensor, er beschreibt die Geometrie der Raumzeit. R ist derkosmische Skalenfaktor oder der Ricci-Skalar, Λ die Kosmologische Konstante und G die Gra-vitationskonstante. Die Lichtgeschwindigkeit wird in naturlichen Einheiten verwendet, alsoc = 1.Die Metrik der Raumzeit zur Abstandsbestimmung ist die Robertson-Walker-Metrik [12]:

ds2 = dt2 −R2(t)[

dr2

1− kr2+ r2dθ2 + r2 sin2 θdϕ2

]. (2.9)

3engl.: Grand Unification Theory

8

Page 15: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

(t, r, ϕ, θ) sind die Koordinaten in der Raumzeit und k legt die Raumkrummung, und damitden weiteren Verlauf der Entwicklung des Weltalls fest. Diese Metrik wird zusammen mit Glei-chung (2.8) benutzt, um Vorhersagen zur zeitlichen und raumlichen Entwicklung des Univer-sums zu machen. Dabei spricht man bei k = 1 spricht von einem spharischen Universum, dasirgenwann unter dem Einfluss der Gravitation wieder kollabieren wird. k = −1 wurde un-endliche Ausbreitung und Abkuhlung des Universums bedeuten und k = 0 hat ein flachesUniversum mit Gesamtenergie null zur Folge, so dass die Expansion asymptotisch angehaltenwerden kann (siehe Abbildung 2.3).An dieser Stelle muss die kritische Dichte ρC des Universums eingefuhrt werden, die den Ge-halt der Materie und Energie des Universums beschreibt, wenn es flach ist. Fur ein offenes Uni-versum ist ρ < ρC und fur ein geschlossenes ist ρ > ρC. Die Anteile, die zur Dichte beitragenwerden auf ρC normiert. Die gesamte normierte Dichte des Universums ist der Dichteparame-ter Ω.Die Expansion des Universums wurde durch Hubble beobachtet. Zu jeder Zeit des Universumslasst sich die sog. Hubble-Konstante angeben:

H =R(t)R(t)

. (2.10)

H kann man sich als Maß fur die aktuelle Ausbreitungsgeschwindigkeit vorstellen [12].Um die heutige Materieanordnung im Weltall zu verstehen, wird das sog. Urknallmodell her-angezogen, in dem man annimmt, dass sich das gesamte Universum aus einer Singularitat ent-wickelt hat. Zunachst standen alle unterschiedlichen Teilchensorten in Wechselwirkung, dochmit Abnahme der Temperatur durch die Expansion geriet zunachst die Reaktion νν ­ ee ausdem Gleichgewicht, so dass die Neutrinos von den anderen Teilchen entkoppelten. Bei einerTemperatur von ca. 3000 K entkoppelten auch die Photonen von der Materie, da sich neutraleAtome bildeten, die nicht mehr mit den Photonen wechselwirkten. Ein wichtiger Effekt ist derErhalt der Teilchenzahl bei Entkopplung, so dass heute noch die gleiche Anzahl von Photo-nen wie damals bei der Entkopplung vorhanden ist. Die Besetzung der einzelnen Energien derPhotonen ist nach der Bose-Einstein-Verteilung:

N =1

exp( ~ω

κT

)− 1. (2.11)

N ist die Anzahl der Photonen bei Energie ~ω bei einer Temperatur T . κ ist die Boltzmann-Konstante. Durch die Expansion kuhlten sich die Photonen immer weiter ab. Messungen erge-ben eine heutige Schwarzkorper-Temperatur der Photonen von [14]:

T = (2,725± 0,002) K. (2.12)

Diese Photonen, die von der Materie entkoppelten, werden kosmische Hintergrundstrahlunggenannt und sind eine wesentliche Stutze der Urknalltheorie [6], [15].Eines der Hauptprobleme ist das Verstandnis der Strukturanordnung im heutigen Universum.Wenn man eine isotrope Verteilung der Hintergrundstrahlung annimmt, sind die Strukturennicht zu verstehen. Genaue Beobachtungen mit WMAP4 (siehe Abbildung 2.4) haben Abwei-chungen von der Isotropie der Hintergrundstrahlungstemperatur gemessen, die proportionalzu den Dichtefluktuationen des fruhen Universums sind, und somit die Startwerte fur die heu-tigen Strukturen bildeten. In Abbildung 2.4 sind die Bereiche unterschiedlicher Temperatur mitunterschiedlichen Farben gekennzeichnet. Es sind Schwankungen von -200 bis +200 µK einge-zeichnet.

4Wilkinson Microwave Anisotropy Probe

9

Page 16: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Abbildung 2.4: WMAP-Anisotropie. Zur Verdeutlichung wurde eine gewichtete lineare Kombinationbei verschiedenen aufgenommenen Frequenzen verwendet, aus [14]

2.2.1 Inflation are Theorie

In das konventionelle Urknallmodell muss fur die Klarung einiger Probleme ein weiterer Me-chanismus eingebaut werden. Einige dieser Probleme sind [6]:

@ Warum ist die Materieverteilung und die Verteilung der kosmischen Hintergrundstrah-lung so homogen? Das Universum besteht namlich aus Gebieten, die bei einer Standard-Expansion des Universums unmittelbar nach dem Urknall nicht in kausalem Kontakt stan-den.

@ Warum ist das Universum so flach (Ω ≈ 1, Abschnitt 2.4.3)? Im Rahmen einer Standard-Expansion ware dazu unmittelbar nach dem Urknall eine extrem exakte Abstimmung vonMateriedichte und kinetischer Energie erforderlich gewesen, fur die es keine Erklarung gibt.Falls diese exakte Abstimmung nicht vorgelegen hatte, ware das Universum entweder schonlange kollabiert oder die Materiedichte verschwindet gering.

@ Wie konnten so große Strukturen wie Galaxien aus den anfanglichen Quantendichtefluktua-tionen hervorgehen?

Zur Losung dieser Problem wird ein Phasenubergang eines sog. Inflaton-Feldes am Beginn desUrknalls angenommen. Dieses skalare Feld geht aus einem symmetrischen Anfangszustanddurch spontane Symmetriebrechung in ein globales Minimum uber. Es kann gezeigt werden,dass wahrend dieses Ubergangs die Expansion des Universums zur Zeit t mit [2]:

R(t) ∝ exp

(√Λ3

t

)(2.13)

ablauft. Λ ist die Kosmologische Konstante. In der Zeit der sog. Inflation des Universumsnimmt die Entropie relativ zum Anfangszustand stark zu. Durch die immense Expansion wirdes moglich, dass kleine homogene Bereiche zu sehr großen homogenen Bereichen aufgeblasenwerden. Der Dichteparamter Ω = 1 wird durch die extreme Große des gesamten Universums

10

Page 17: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

moglich, da wir nur einen sehr kleinen Teil beobachten konnen. Die kleinen Dichtefluktuatio-nen konnten auf die Große von Galaxien aufgeblasen werden [2].

2.3 Galaxieentstehungsmodelle

In den bisherigen kosmologischen Betrachtungen wurde ein homogenes Universum angenom-men. Um die Anordnung der Materie im heutigen Zustand zu verstehen, mussen aber zumin-dest kleine Abweichungen im Universum vorhanden gewesen sein, die durch Gravitationsef-fekte verstarkt wurden. Die heutigen Erkenntnisse weisen daraufhin, dass die Strukturen imUniversum aus Quantenfluktuationen entstanden sind [16].

2.3.1 Storungen

Kleine Abweichungen von der Homogenitat im Universum konnen durch eine lineare Storungs-theorie beschrieben werden, sobald die Inhomogenitaten groß sind, muss aber nicht-lineareStorungstheorie betrieben werden.

Man nimmt eine Storung des Ricci-Tensors – der grundlegenden geometrischen Struktur desRaumes – Rαβ und des Energie-Impuls-Tensors Tαβ an. Bei kleinen Storungen kann man fol-genden linearen Ansatz machen:

Rαβ −→ Rαβ + δRαβ , (2.14)Tαβ −→ Tαβ + δTαβ. (2.15)

Die Einstein-Gleichung:

Rαβ − 12Rgαβ = −8πGTαβ (2.16)

wird zu folgender Form genahert:

L(Rαβ)δRαβ = δTαβ . (2.17)

Dabei ist L ein linearer Differentialoperator der Raumzeit.

Weiterhin kann man annehmen, dass die Materie im Universum aus drei Hauptkomponentenbesteht:

@ baryonische Materie,

@ relativistische Materie (z.B. Photonen),

@ dunkle Materie.

Die Motivation fur die Forderung nach dunkler Materie und Beschreibung ihrer Eigenschaftenfolgt in Abschnitt 2.4. An dieser Stelle sei nur gesagt, dass es sich hier um wenig wechselwir-kende massive Teilchen (WIMPs5) handeln konnte. Die WIMPs entkoppelten bei einer Tempe-ratur T = TD und wurden nicht-relativistisch bei einer Temperatur von T = Tnr. Da Baryonenund Photonen bis zur Zeit tdec aneinander koppeln und WIMPs dies im Allgemeinen nicht tun,mussen diese beiden Komponenten getrennt betrachtet werden.

5engl.: Weakly Interacting Massive Particles

11

Page 18: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Die Storungen werden als Dichtewellen betrachtet, da die Losungen von Gleichung (2.17) se-parate Wellen mit unterschiedlichen Wellenlangen λ sind. Die weiteren Betrachtungen hangennun von der Wellenlange relativ zum Hubble-Radius dH ab:

dH =1

H0. (2.18)

Fur den Fall, dass die Storungswellenlange großer als der Hubble-Radius ist, gibt es keineBehinderung der Storungsausbreitung durch Gegendruck oder Viskositat. Die Storungsampli-tude wachst somit sowohl in der strahlungs- als auch in der materiedominierten Ara an.Im Falle von kleineren Wellenlangen als der Hubble-Radius, kann es zwei behindernde Effektegeben. Es besteht zum einen die Moglichkeit, dass es einen schnelleren Druckausgleich gibt,als sich ein Anwachsen der Storung ausbreitet oder dass die Expansion des Universums zuschnell vonstatten geht, als dass es einen Kollaps geben konnte.Man definiert die kritische Jeans-Lange λJ, unterhalb derer ein Anwachsen der Storungsampli-tude unterdruckt ist:

λJ ≡√

πvdis√Gρ

. (2.19)

ρ ist die Dichte des Mediums, in dem sich die Storung ausbreitet. Die Dispersionsgeschwin-digkeit ist vdis. Die Ausbreitung von Storungen in gemischten Medien aus Strahlung und Ma-terie geschieht auf verschiedene Arten. Bei einer adiabatischen Storung bleibt die Entropie desGesamtmediums und bei einer isothermen Storung die gesamte Energiedichte erhalten. Im all-gemeinen handelt es sich um Superpositionen aus adiabatischen und isothermen Storungen[16].

2.3.2 Galaxienentstehungsszenarien

Man unterscheidet zwei unterschiedliche Modelle der Galaxieentstehung. Sie hangen empfind-lich von der Art der Storung und der Art der dunklen Materie ab.

Bottom-Up-Theorie

In diesem Modell dominieren isotherme Storungen. Hier werden die Storungen in der Strah-lungsepoche weder verstarkt noch geschwacht. Wenn Materie und Strahlung entkoppeln, kor-respondiert die Jeans-Lange ungefahr zu einer Masse von 105 bis 106 M¯ Sonnenmassen, wasungefahr der Masse von Kugelsternhaufen entspricht. Die einfachste Vorstellung der Galaxie-entstehung ist nun, dass die Kugelsternhaufen sich durch Gravitation zu Galaxien angeord-net haben und Galaxiehaufen durch Gravitationswechselwirkungen zwischen den Galaxienentstanden sind. Man nennt diese Vorstellung Bottom-Up-Theorie, in der sich aus kleinerenStrukturen großere gebildet haben [17].Dieses Modell ist moglich, wenn das Universum durch kalte dunkle Materie – also durch Teil-chen mit nicht-relativistischen Geschwindigkeiten – dominiert ist, da die langsamen Teilchenbereits auf kleinen Skalen gravitativ wechselwirken.

Top-Down-Theorie

Bei adiabatischen Storungen gilt fur die langsten Storungen immer λ > λJ. Sie wachsen inder Strahlungs- und in der Materieepoche an. Mittelgroße Storungen konnen zunachst ange-wachsen sein und dann stagnieren. Bei der Entkopplung von Strahlung und Materie fallt dieJeans-Lange aber so stark, dass danach ein weiteres Anwachsen moglich wird. Da die lang-sten adiabatischen Storungen wahrend der gesamten Entwicklung des Universums anwach-sen, werden die großten Gaswolken gut voneinander getrennt, bevor kleinere Gaswolken ent-stehen konnen, die zu Galaxien kollabieren. Dieses Modell heißt Top-Down-Theorie [17].

12

Page 19: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Abbildung 2.5: Spiralgalaxie M100, nach [19]

Das Modell ist moglich, wenn die dunkle Materie durch massebehaftete relativistische Neu-trinos dominiert ist. Die Neutrinos sind so schnell und haben einen so geringen Wechselwir-kungsquerschnitt, dass sie sehr leicht aus Masseansammlungen entkommen und so weit von-einander getrennte Wolken bilden konnen. Die Neutrinodichten sind so gering, dass Struk-turbildung nur auf außerst großen Skalen mit Massen im Bereich von Superhaufen stattfin-den kann. Dieses Szenario wird aber weitestgehend durch Beobachtungen ausgeschlossen. EinNeutrino-dominiertes Universum scheidet somit aus [16],[18].

2.4 Dunkle Materie

Zum Verstandnis der Strukturbildung im Universum ist es unerlasslich, sich uber die Existenzdunkler Materie Gedanken zu machen. Im nachsten Abschnitt wird gezeigt, dass es Hinweiseauf dunkle Materie gibt. Im Weiteren werden Kandidaten fur dunkle Materie vorgestellt.

2.4.1 Evidenz fur dunkle Materie

Das Problem beim Nachweis der dunklen Materie ist die Massenbestimmung der Galaxien. InSpiralgalaxien (siehe Abbildung 2.5) wird die Existenz dunkler Materie uber Rotationskurvengezeigt. Eine Spiralgalaxie besteht aus Milliarden von Sternen, die um das galaktische Zentrumrotieren. Dabei bildet ein Teil der Sterne den bulge6, ein kugelformiges Gebilde in der Mitte derGalaxie, und ein anderer Teil die galaktische Scheibe. Galaktische Scheibe und bulge umgibtder Halo, der vornehmlich aus metallarmen alten Sternen besteht.Die sog. Rotationskurven ergeben sich aus dem Ansatz, die Bahngeschwindigkeit aus dem

6engl.: bulge - Wolbung

13

Page 20: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Abbildung 2.6: Rotationskurve. Es sind auch die theoretischen Anteile fur einen Halo aus dunkler Ma-terie die Scheibe und das Gas eingezeichnet, aus [20]

Kraftegleichgewicht von Zentrifugal- und Gravitationskraft herzuleiten. Es wird eine rotati-onssymmetrische Anordnung der Massen angenommen:

FG =GmMr

r2=

mv2

r= FZ, (2.20)

⇒ v(r) =

√GMr

r. (2.21)

Mr ist die Masse innerhalb der Bahn mit Radius r. Nimmt man fur den bulge ein kugelformigesGebilde mit konstanter Dichte ρ und eine vernachlassigbare Masse der Scheibe an, so folgt:

Mr =43ρπr3 (2.21)

=⇒ v ∝

r, r < R,

r−12 , r > R.

(2.22)

R ist die maximale radiale Ausdehnung des bulge. Die Messung der Rotationskurven vonSpiralgalaxien mittels Dopplerverschiebung der Emission des interstellaren Gases im Radio-bereich liefert allerdings fur große R:

v(r) = const.. (2.23)

Die Ergebnisse der Beobachtungen (Abbildung 2.6) besagen nun, dass die Masse linear mitdem Radius auch bis zu großen Entfernungen vom galaktischen Zentrum ansteigen muss. DerVerlauf kann bei Anwendung des Newton’schen Gravitationsgesetzes nicht durch die sichtbareMasse zustande kommen. Zur Erklarung kann eine sehr große nichtleuchtende Masse in derGalaxie eingefuhrt werden. Diese Form der Materie wird dunkle Materie genannt. Man stelltnun auf Grund der spharischen Anordnung der Kugelsternhaufen im Halo die Vermutung an,dass die dunkle Materie ebenfalls im Halo lokalisiert ist.

2.4.2 Kandidaten fur dunkle Materie

Baryonische dunkle Materie

Zur baryonischen dunklen Materie zahlt man Objekte wie Planeten, Braune Zwerge, WeißeZwerge oder Schwarze Locher. Es handelt sich also um Korper, die es entweder nie geschaffthaben, ein Stern zu werden (M < 0, 08 M¯, wie etwa Planeten oder Braune Zwerge), oder umUberbleibsel eines Sterns, wie etwa die Weißen Zwerge oder die Schwarzen Locher. Bei demAnteil, den die baryonische dunkle Materie zum Dichteparameter Ω beitragt, muss man die

14

Page 21: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Ergebnisse der inflationaren Theorie, die einen Dichteparameter von Ω = 1 vorhersagt, undder primordialen Nukleosynthese miteinbeziehen. Der theoretische Wert darf

ΩBaryon ≤ 0, 11 (2.24)

nicht ubersteigen. Die Rotationskurven der Galaxien lassen sich innerhalb dieses Bereiches guterklaren, so dass man andere Arten dunkler Materie erst fur die Strukturbildung auf großerenSkalen zu benotigen scheint.Da die Kurven sich so gut innerhalb dieser Grenze erklaren lassen, sucht man in den Galaxi-en nach sehr massiven Objekten. Man vermutet diese Objekte im Halo und nennt sie deshalbMAssive Compact HAlo Objects (MACHO) Es wurden erste MACHOs gefunden, die aller-dings noch keine aureichende Masse aufweisen [21].

Heiße dunkle Materie, Neutrinos

Neutrinos wurden lange Zeit als gute Kandidaten fur nicht-baryonische dunkle Materie gehan-delt. Es ware moglich, dass sie auch bei kleiner Masse einen signifikanten Anteil zur dunklenMaterie liefern. Mittlerweile gibt es Beweise fur die Existenz von Neutrinomassen durch denNachweis von Neutrino-Oszillationen an den Experimenten SuperKamiokande, SNO und Kam-LAND [2]. Abschatzungen fur die Massen der drei Neutrinogenerationen sind in Tabelle 2.2zusammengefasst.

Neutrinoart Masse [MeV]e-neutrino νe < 3 · 10−6

µ-Neutrino νµ < 0, 19τ -Neutrino ντ < 18, 2

Tabelle 2.2: Neutrino Massengrenzen, aus [2]

Neutrinos stellen die sog. heiße dunkle Materie dar, da sie sich mit relativistischen Geschwin-digkeiten bewegen. Es ist aber schwierig, die Strukturbildung auf kleinen Skalen zu erklaren(siehe Abschnitt 2.3.2), so dass die heiße dunkle Materie vermutlich nicht die dominante Kom-ponente der dunklen Materie ist [18].

Kalte dunkle Materie, WIMPs

Die bisher besprochenen Kandidaten, baryonische und heiße dunkle Materie, scheinen nichtauszureichen, um die Strukturbildung des Universums zu erklaren. Man muss also versuchen,neue Teilchen einzufuhren, die die entsprechenden Eigenschaften fur die Strukturbildung be-sitzen. Diese Teilchen mussen Geschwindigkeiten auf nicht-relativistischen Skalen besitzen.Man nennt diese Art der dunklen Materie kalte dunkle Materie. Da man bisher keine gu-ten Kandidaten fur kalte dunkle Materie beobachtet hat, muss es sich um Teilchen handeln,die nur schwache Wechselwirkung mit der Materie haben und ansonsten gravitativ wechsel-wirken (WIMP). Ein erster Ansatz ware eine vierte Lepton-Generation mit einem schwerenNeutrino. Jedoch haben die Prazisionsmessungen bei LEP7 auf der Z0-Resonanz die Zahl dermoglichen Generationen zu exakt drei bestimmt (Abbildung 2.7). Die Massengrenze fur einevierte Lepton-Generation liegt nach diesen Messungen bei [2]:

mνx ≥m(Z0)

2≈ 46 GeV. (2.25)

7engl.: Large Elektron Positron

15

Page 22: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

87 88 89 90 91 92 93 94 95 96 0

5

10

15

20

25

30

35

40

σ (n

b)

= Ecm (GeV)

2 ν's

3 ν's

4 ν'sL3

ALEPH

DELPHI

OPAL

s√

Abbildung 2.7: Z-Resonanz, aus [22]

Art Symbol Anteildunkle Energie ΩΛ 0, 73± 0, 04Materie ΩM 0, 27± 0, 04dunkle Materie ΩDM 0, 22± 0, 04Baryonen ΩBaryon 0, 044± 0, 004Photonen Ωγ (4, 9± 0, 5) · 10−5

Neutrinos Ων < 0, 015/95 % C.L.TOTAL Ω 1, 02± 0, 02

Tabelle 2.3: Anteile am Dichteparameter,aus [2]

Abbildung 2.8: Messung der kosmologischenDichteparameter ΩΛ, ΩM, aus [23]

Diese Masse ist zu groß, als dass entsprechende Mengen, die fur die Strukturbildung notigwaren, beim Urknall hatten entstehen konnen. Man kann diese Moglichkeit als WIMP-Kandi-daten ausschließen. Man muss sich also weiter auf die Suche nach geeigneten Kandidaten ma-chen. Wenn man nun die vierte Lepton-Generation ausschließt und WIMPs in Betracht zieht,die schwacher als Neutrinos an das Z0 koppeln, sind die supersymmetrischen Neutralinos ausdem MSSM gute Kandidaten fur kalte dunkle Materie (siehe Abschnitt 2.1.4). Diese Teilchensind stabil und haben eine große Masse.

2.4.3 Dichteparameter

Die Zusammensetzung der gesamten Dichte sieht eine Mischung fur die dunkle Materie vor:

Ω = ΩBaryon + Ων + ΩDM︸ ︷︷ ︸ΩM, Materie

+ ΩΛ︸︷︷︸dunkle Energie

. (2.26)

Moderne Messungen von Supernovae Ia als Standardkerzen ermoglichen es, die Beschleuni-gung des Universums zu messen, die im Moment großer als null ist [23]. Die Messung derAnisotropie der kosmischen Hintergrundstrahlung lasst ebenfalls die Bestimmung der Raum-krummung zu [24]. Die Beoachtungen von Galaxie-Clustern im Universum mit dem ChandraObservatorium kommen zu der Aussage, dass ΩM ≈ 0, 3 ist [25]. Fur das Universum gilt abernach den Anisotropiemessungen sehr wohl Ω ≈ 1, so dass der Rest der Dichte in sog. dunkleEnergie stecken muss, die man sich als fur die Expansion verantwortliche repulsive Kraft vor-stellen kann. Die Ergebnisse dieser drei Untersuchungsmethoden sind in Abbildung 2.8 zu-sammengefasst. Die Beobachtungen uberschneiden sich ziemlich genau in einem Punkt. Die

16

Page 23: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

Anteile der unterschiedlichen Materieformen an der Gesamtdichte des Universums sind nach[2] in Tabelle 2.3 zusammengestellt. Die Summe von ΩM + ΩΛ macht eine direkte Aussageuber die Krummung des Universums. Ein Wert großer als 1 ist gleichbedeutend mit einem kol-labierenden Universum, ein Wert gleich 1 hat ein flaches Universum zur Folge und ein Wertkleiner als 1 zieht ein offenes Universum nach sich. Der Schnittpunkt in Abbildung 2.8 liegt aufder Geraden fur ein flaches Universum. Die aktuellen Beobachtungen mit einer totalen DichteΩ = 1, 02± 0, 02 zeigen also, dass das Universum beinahe flach ist.

17

Page 24: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

2 Physikalische Prinzipien zum Verstandnis der AMS-02-Mission

18

Page 25: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

Abbildung 3.1: AMS-02 auf der ISS, aus [26]

Das AMS-02-Experiment ist ein Weltraumexperiment, das auf der Internationalen Raumstation(ISS1) in einer Hohe von ca. 400 km fur mehrere Jahre installiert wird. Es soll kosmische Teil-chen sehr prazise vermessen. Aus den besonderen Bedingungen des Weltalls, der Raumstationund des Flugs zur Raumstation ergeben sich eine Reihe von Herausforderungen fur ein Teil-chenspektrometer. Es muss im Vakuum Temperaturschwankungen von -180 C bis 50 C undbis zu neunfache Erdbeschleunigung beim Start aushalten. Fur den Betrieb stehen dabei nur2 kW zur Verfugung. Damit das Experiment mit einem Space Shuttle auf die ISS gebracht wer-den kann, ist eine Beschrankung des Gewichts auf 7 t notig. Die Datenrate fur den Transportder Daten zur Erde soll nur 2 Mb/s betragen. Bei einer Messdauer von mehreren Jahren aufder ISS hat das AMS-02-Experiment eine wesentlich großere Akzeptanz von 0,5 m2sr als z.B.das PAMELA2-Experiment, das auf einem Satelliten installiert werden soll [27]. So ist eine vielexaktere Vermessung der Hohenstrahlung moglich.Dem AMS-02-Experiment ist das Prototypexperiment AMS-01 vorangegangen, das 1998 furzehn Tage auf einem Space Shuttle erfolgreich Daten gemessen hat. Hier konnten Erfahrungenmit den Weltraumbedingungen gesammelt und die Grenzen fur die Suche nach Antimaterieverbessert werden (Abbildung 3.2) [28]. Es wurden ebenfalls erfolgreich e±- und p-/p-Spektrenvermessen. Das Detektordesign fur AMS-02 wurde mit Hilfe dieser Mission optimiert. Im Fol-genden sollen die physikalischen Ziele der AMS-02-Mission kurz vorgestellt werden.

1engl.: International Space Station2engl.: A Payload for Antimatter Matter Exploration and Light-nuclei Astrophysics

19

Page 26: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

3.1 Zielsetzung der AMS-02-Mission

3.1.1 Suche nach Antimaterie

Abbildung 3.2: Mit AMS-01 gemessenes Spektrum von He und He im Vergleich zum erwartetendenSpektrum mit AMS-02 unter der Annahme kein He zu finden. Die Rigidity (engl.: rigidity - Steifigkeit)ist der Impuls pro Ladung. Bild aus [29]

Auf Grund der bisher gemessenen Asymmetrie des Vorkommens von Antimaterie und Mate-rie, soll genauer nach Antimaterie gesucht werden. Hierfur eignen sich Antiprotonen und Po-sitronen nicht besonders gut, da diese Teilchen in Kollisionen von der kosmischen Strahlungmit dem interstellaren Gas entstehen. Ein guter Hinweis auf Antimaterie und somit Anti-Sternewaren Anti-Helium-Kerne He, die aus der Kernfusion von Anti-Sterne stammen konnten. Anti-Helium ware auch ein Hinweis auf Bereiche von primordialer Antimaterie. Es ist also wichtigden Betrag der Ladung |q| ≥ 2 und das Vorzeichen genau zu messen [30].

3.1.2 Suche nach kalter dunkler Materie

Fur die Suche nach supersymmetrischer kalter dunkler Materie in Form des Neutralinos (sieheAbschnitt 2.4.2) wird ein indirekter Nachweis gewahlt, da es keine Ladung besitzt. Annihilatio-nen von Neutralinos in z.B. bb, tt oder W+W− folgen weitere Zerfalle in nachweisbare Materiewie Protonen, Elektronen oder Neutrinos und deren Antiteilchen oder in Photonen. Ziel istes deshalb, Uberhohungen in den Antiteilchenspektren oder Photonspektren der kosmischenStrahlung zu finden, um so einen Hinweis auf Neutralinos zu erhalten. Positronen eignen sichbesonders gut, da im Universum bisher noch keine Quellen von hochenergetischen primarenPositronen entdeckt wurden [32]. Die Feynman-Diagramme einiger Annihilationen sind in Ab-bildung 3.5 gezeigt. Die direkten Zerfalle χχ → e+e− sind sehr stark unterdruckt. Ein wichtigerParameter des MSSM ist tanβ. Nach LEP-Ergebnissen muss tanβ uber 4,3 liegen. Man sprichtvon der hohen tanβ-Losung, die auch fur die Unterdruckung des Zerfalls χχ → W+W− sorgt.Der Zerfall nach bb hat die großte Wahrscheinlichkeit [33].Abbildung 3.4 zeigt die bisherigen Messungen des Positronspektrums mit moglichen Abwei-chungen zu dem theoretisch vorhergesagten Verlauf des Spektrums ohne Uberhohungen durch

20

Page 27: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

Abbildung 3.3: Photonspektrummit moglicher Uberhohung durchNeutralino-Annihilationen. Es sinddie Daten aus dem EGRET-Experiment(engl.: Energetic Gamma Ray ExperimentTelescope) gezeigt. Bild aus [31]

Abbildung 3.4: Positronspektrum mit moglicher Uberhohung durch Neutralino-Annihilationen. DerUntergrund der Positronen bei hohen Energien stammt also aus sekundaren Reaktionen der kosmi-schen Strahlung mit der interstellaren Materie. Es sind die Daten aus dem HEAT- und dem AMS01-Experiment gezeigt. Bild aus [11]

21

Page 28: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

Abbildung 3.5: Neutralino-Annihilationen, aus [7]

Neutralinoannihilationen, also der sekundare Untergrund. Der statistische Fehler des HEAT3-Experimentes ist aber zu groß fur einen aussagekraftigen Nachweis. Man sieht auch das Er-gebnis von Simulationen zu Neutralinoannihilation mit Neutralinomassen von 207 GeV und427 GeV bei hohen tanβ-Werten und verschiedenen anderen Werten fur die weiteren MSSM-Parameter (siehe Abschnitt 2.1.4). Der Anteil der bb-Annihilationen ist zusatzlich eingezeich-net. Das χ2 der Fits an die Spektren verbessert sich unter Berucksichtigung der Neutralino-annihilationen deutlich [11]. In Abbildung 3.3 sind Simulationen mit Neutralinomasse mχ =90 GeV der Photonspektren gezeigt. Auch hier wird die Anpassung deutlich besser mit denNeutralinoannihilationen.Der Positronfluss aus den Annihilationen muss mit einem sog. Boostfaktor multipliziert wer-den, der die Anordnung von dunkler Materie in galaxieahnlichen Strukturen statt einer homo-genen Verteilung beschreibt. N -Korper-Simulationen machen die Vorhersage, dass die dunkleMaterie sich zu Clustern mit der zehnfachen Große des Sonnensystems mit einer Dichte von25 pc−3 anordnen. Die Annihilationen hangen quadratisch von der Dichte der dunklen Mate-rie ab, so dass die Anhaufung in Clustern zu einer Erhohung des Positronflusses fuhrt (Boost)[34]. Der Boostfaktor liegt bei den Simulationen, die in Abbildung 3.4 gezeigt sind, bei 5,9 bzw.5 [11].Eine der Anforderungen an den AMS-02-Detektor ist die deutliche Identifikation von Positro-nen mit Energien bis zu 500 GeV. Fur diesen Zweck muss man sich den Anteil der Komponen-ten der kosmischen Strahlung ansehen. Diese hat einen Anteil von primaren Teilchen, die inastrophysikalischen Quellen wie Sternen oder Quasaren beschleunigt werden. Zu diesen Teil-chen zahlen Elektronen, Protonen, Helium und weitere Elemente, die bei den Fusionen in Ster-nen entstehen. Sekundare kosmische Strahlung entsteht aus der Wechselwirkung von primarenTeilchen mit dem interstellaren Gas. Dazu gehoren z.B. Lithium, Beryllium und Bor, ebenso wieein großer Teil der Antiprotonen und Positronen. Der Fluss von Protonen in der kosmischenStrahlung ist 104 mal großer als der Fluss der Positronen (Abbildung 3.6). Es muss also fur einesichere Aussage uber den Positronfluss gewahrleistet sein, dass man die Positronen mit einemFaktor von 104 bis 106 von Protonen unterscheiden kann, um einen Protonuntergrund < 1 %zu erhalten.

3High-Energy Antimatter Telescope

22

Page 29: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

Abbildung 3.6: Flusse der Komponen-ten der kosmischen Strahlung. Man sieht,dass der Fluss der Protonen 104-malgroßer ist als der Positronen, aus [35]

Abbildung 3.7: Fluss von Strangelets un-ter der Annahme von 5 Events pro Jahr.Zusatzlich sind die Grenzen aus anderenExperimenten eingetragen [36].

3.1.3 Suche nach Strangelets

Die Suche nach Strangelets geschieht auf zwei Arten. Bei der einen Art kann man Geschwin-digkeit, und damit die Masse, und Ladung der Teilchen bestimmen und bei der anderen nurdie Geschwindigkeit, da die Ladung zu groß ist und somit im Sattigungsbereich von AMS-02liegt. Das Verhaltnis von Ladung zu Masse wird dann mit der theoretischen Erwartung ver-glichen. Fur den Fall, dass nur die Geschwindigkeit genau gemessen werden kann, kann eineuntere Schranke des Ladung-Masse-Verhaltnisses angegeben werden. Der Untergrund dieserMessung ist dabei klein [36].

3.1.4 Weitere Untersuchungen

Im Folgenden sei eine kurze Ubersicht uber weitere Untersuchungsmoglichkeiten mit AMS-02gegeben [30]:

@ Zur Bestimmung des Alters der kosmischen Strahlung wird das Verhaltnis der Vorkommendes stabilen 9Be zu dem radioaktiven 10Be herangezogen.

@ Untersuchungen zu hochenergetischen γ-Strahlen konnen bei solchen Photonen durchge-fuhrt werden, die in ein Elektron-Positron-Paar konvertieren. AMS-02 besitzt eine Kamera(Star-Tracker), die in der Lage ist, die Punktquelle, die die γ-Strahlung emittiert hat, zu er-mitteln.

@ AMS-02 wird die genauen Beobachtungen der Teilchen in der direkten Umgebung der Er-de, die eine zu niedrige Energie haben, um durch das Erdmagnetfeld in die Atmosphareeinzudringen, von AMS-01 fortfuhren.

@ Eventuell konnen Hinweise auf Teilchen, die in Mikroquasaren beschleunigt wurden, ge-funden werden. Diese Teilchen werden alle auf die nahezu gleiche Energie beschleunigtund konnen somit fur eine Erhohung in den Spektren sorgen.

23

Page 30: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

3.2 Ubersicht der Detektorkomponenten

Der AMS-02-Detektor (Abbildung 3.8) besteht zur Erfullung der vielfaltigen Aufgaben aus ver-schiedenen Komponenten, die in den folgenden Abschnitten kurz vorgestellt werden sollen.

Abbildung 3.8: AMS-02-Detektor, aus [26]

3.2.1 Ubergangsstrahlungsdetektor

Der Ubergangsstrahlungsdetektor (Abbildung 3.9) sitzt an der Spitze des gesamten Detektors.Er hat die Aufgabe mittels des Ubergangsstrahlungsprinzips Teilchen anhand des Lorentz-Faktors γ = E/m bei hohen Energien zu unterscheiden. Das genaue Prinzip wird in Kapitel 4vorgestellt. An dieser Stelle sollen nur die wichtigsten baulichen Eigenschaften erklart werden.Um ausreichend Ubergangsstrahlung zu erzeugen, wurde eine Konfiguration aus 20 Detek-torlagen mit dazwischen liegenden Radiatorschichten gewahlt. Die ersten und die letzen vierLagen sind relativ zu den zwolf dazwischen liegenden Lagen um 90 gedreht, um eine drei-dimensionale Ortsauflosung der Spur zu ermoglichen. Die einzelnen Lagen bestehen aus Mo-dulen, die aus jeweils 16 Proportionalkammern zusammengesetzt sind. Insgesamt werden 328Module, die mit einem Xenon/CO2-Gemisch im Verhaltnis von 80:20 durchstromt werden,verwendet.Fur die Tragestruktur des Detektors wurde in Tests und Simulationen eine konische Oktagon-struktur gewahlt, die sowohl die Proportionalkammern aufnimmt, als auch den Belastungenbei Start und Landung eines Space Shuttles standhalt.Der Ubergangsstrahlungsdetektor soll in der Lage sein, Positronen von Protonen in einem Be-reich von 5 bis 300 GeV mit einem Faktor von 102 bis 103 zu unterscheiden.

3.2.2 Silizium Spurdetektor (Tracker) und supraleitender Magnet

Der Tracker (Abbildung 3.10) bildet das Zentrum des AMS-02-Detektors und befindet sich in-nerhalb eines supraleitenden Magneten. Der Tracker dient der Spurrekonstruktion der gelade-

24

Page 31: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

Abbildung 3.9: Ubergangsstrahlungsdetektor, aus [26]

Abbildung 3.10: Silizium Spurdetektor,aus [26]

Abbildung 3.11: Supraleitender Magnet,aus [26]

25

Page 32: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

nen Teilchen im Detektor, dabei wird die Spur mit Hilfe von acht dunnen doppelseitigen Plat-ten aus Silizium-Mikrostreifen-Detektoren (insgesamt 6 m2) mit einem raumlichen Auflosungs-vermogen von ca. 17 µm in der Ebene des Magneten und ca. 30 µm in der dazu senkrechtenEbene rekonstruiert. Die einzelnen Platten bestehen aus 192 Silizium-Leitern. Es konnen so-wohl die Impulse der Teilchen uber die Messung des Krummungsradien, als auch die Ladunguber eine Energieverlustmessung bestimmt werden. Die Impulsauflosung von 100 GeV Proto-nen liegt bei ca. 3 %. Bei Energien von ca. 1 GeV verschlechtert sich diese Auflosung durch dieVielfachstreuung auf ca. 5 %. Die außeren Platten befinden sich außerhalb des Magnetfeldesum den Eintritts- und Austrittsort des Teilchens genau zu bestimmen.Fur die Rekonstruktion spielt die exakte Ausrichtung der Platten eine große Rolle. Man ver-wendet dafur ein Laser-Alignment System, das mit Hilfe von zwei Lasern die Si-Streifendetek-toren durchleuchtet und die relative Lage bis zu 5 µm genau vermessen kann.Da AMS auch in der Lage ist, γ-Strahlung zu vermessen, ist es interessant zu wissen, aus wel-cher Richtung die γ-Strahlung auf den Detektor eingefallen ist, um die Strahlung einem Objektim Weltraum zuordnen zu konnen. Mit Fixsternen wird die genaue Position von AMS-02 kon-tinuierlich gemessen. Dieser Teil des Detektors wird Star-Tracker genannt [37],[38].

Der supraleitende Magnet (Abbildung 3.11) kann im Zentrum ein Magnetfeld von 0,87 T furden Tracker erzeugen. Dies gelingt durch einen mit Aluminium angereicherten NbTi-Drahtbei einem Strom von 459 A. Der Magnet wird dabei durch eine Helium-Kuhlung auf einerTemperatur von 1,8 K gehalten. Das Magnetfeld fallt zu den ca. 115 cm vom Zentrum entferntenRandern hin auf 2 mT ab.Durch einen 2500 l Helium-Tank ist es moglich, dass der Magnet drei Jahre lang durch Verdun-stung uber Strahlungsschilde gekuhlt werden kann, ohne dass Gas ausgetauscht werden muss.Der Magnet macht ca. die Halfte des gesamten Detektorgewichts von 7 t aus [39].

3.2.3 Flugzeitmessung (ToF)

Zur Flugzeitmessung (Abbildung 3.12) sind ober- und unterhalb des Trackers jeweils zwei La-gen aus gekreuzten Plastikszintillatoren installiert. Hier kann nicht nur die Geschwindigkeitder Teilchen ermittelt werden, sondern auch durch Messung des Energieverlustes eine Aussa-ge uber den Betrag der Ladung gemacht werden. Weiterhin dienen die beiden ToFs zur Erzeu-gung eines Triggersignals fur das Experiment [40].

3.2.4 Anti-Coincidence Veto Z ahler (ACC)

Der ACC (Abbildung 3.13) ist um den Tracker angeordnet und sorgt zusammen mit den beidenToFs fur die Selektion der zu analysierenden Ereignisse. Es werden nur die Ereignisse verwen-det, die Eintrage in beiden ToFs haben, aber keine Eintrage im ACC, die aus Ruckstreuung vonim Tracker erzeugten Sekundarteilchen oder von seitlich in den Detektor eindringenden Teil-chen stammen konnen. Der ACC besteht aus sechzehn 8 mm-dicken Plastikszintillatoren. DieSzintillationen werden uber einen Wellenlangenschieber mit Photomultipliern ausgelesen [41].

3.2.5 Ring-Imaging Cerenkov Detektor (RICH)

Der RICH (Abbildung 3.14) wird benotigt, um die Geschwindigkeit von Teilchen mit den Mas-senzahlen von A < 15 − 20 in einem Impulsbereich von 1 GeV < p/A < 12 GeV sehr genauzu trennen. Die Unterschiede von z.B. 9Be und 10Be sind so klein, dass sie vom ToF und demTracker nicht unterschieden werden konnen. Die Geschwindigkeitsmessung ist im RICH aller-dings so prazise, dass eine Unterscheidung moglich ist. Es wird der Cerenkov-Effekt ausge-nutzt, der auftritt, wenn sich ein Teilchen durch ein Medium schneller als die Lichtgeschwin-digkeit dieses Mediums bewegt. Es kommt zur kurzzeitig Ausbildung von Dipolen, die Pho-

26

Page 33: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

Abbildung 3.12: Flugzeitmessung, aus [40]

Abbildung 3.13: Anti-Coincidence VetoZahler, aus [26]

Abbildung 3.14: Ring-ImagingCerenkov Detektor, aus [26]

27

Page 34: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

Abbildung 3.15: Elektromagnetisches Kalorimeter, aus [26]

tonen abstrahlen. An der Oberseite des Detektors ist eine Radiatorschicht aus Silica Aerogel(Brechungsindex n = 1, 05) angebracht, in der sich charakteristische Cerenkov-Ringbilder aus-bilden. In der Detektorebene sind insgesamt 680 Sensoren in einem Abstand von 450 mm un-terhalb des Radiators angebracht. In der Mitte der Detektorebene ist eine Offnung zum elektro-magnetischen Kalorimeter, damit die Teilchen nicht in den Photomultipliern der Detektorebenegebremst werden, und somit die Messung dort ungenauer machen. Um die Akzeptanz des De-tektors zu erhohen, ist der Abstand zwischen Radiator- und Detektorlage mit einem konischenSpiegel umschlossen.Der RICH ist 184 kg schwer und benotigt eine Leistung von 110 W [42].

3.2.6 Elektromagnetisches Kalorimeter

Mit dem elektromagnetischen Kalorimeter (Abbildung 3.15) ist neben dem Ubergangsstrah-lungsdetektor eine Unterscheidung von hochrelativistischen Leptonen und Hadronen mit |Z| =1 anhand von Schauerausbildung moglich. Es ist in der Form eines Sandwich-Kalorimters miteiner Hohe von 166 mm und einem Gewicht von 640 kg gebaut und wird in einer Alumini-umtragestruktur gehalten. Das Kalorimeter besteht aus neun Superlagen, die wiederum aus je10 Bleilagen mit dazwischenliegenden Plastikszintillationsfasern aufgebaut sind. Die Superla-gen sind zur raumlichen Spurauflosung abwechselnd zueinander senkrecht angeordnet. In derBleilage ist die Wahrscheinlichkeit fur Wechselwirkungen der Positronen/Elektronen durchdie hohe Massenzahl groß, so kommt es zu Teilchenschauern durch die Sekundarteilchen ausden Wechselwirkungen, die in den Szintillationszahlern nachgewiesen und genau aufgelostwerden konnen. Das Szintillationslicht wird in insgesamt 324 Photomultipliern ausgelesen.Die Granularitat betragt dabei in x- und in y-Richtung 0,5 Moliere-Radien und in z-Richtung0,9 Strahlungslangen4 X0. Die gesamte Lange von ca. 16,5 X0 des Kalorimeters fuhrt also zuinsgesamt ca. 18 Eintragen in der z-Richtung. Die Energieauflosung ist dabei

δE

E=

(12± 0, 4)%√E/GeV

⊕ (2, 8± 0, 1)%. (3.1)

4Eine Strahlungslange gibt die Lange an, bei der die Energie eines hochenergetischen Elektrons durch Bremsstrah-lung auf den 1/e-ten Teil gefallen ist.

28

Page 35: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

Die unterschiedlichen Schauerformen von Protonen/Anti-Protonen und Elektronen/Positronensorgen fur eine gute Unterscheidung der beiden Teilchensorten bei Energien von 10 - 500 GeVohne den Tracker von 102 - 103. Wenn die Energie des Teilchens bekannt ist, also die Informati-on aus dem Tracker verwendet wird, verbessert sich die Rejektion um einen Faktor 10. Es wirdalso insgesamt eine Rejektion von 103 - 104 erreicht.Im elektromagnetischen Kalorimeter ist es zudem moglich, die Gesamtenergie der Teilchen zumessen [43],[44].

3.2.7 Montage und Start des Detektors

Die einzelnen Komponenten von AMS-02 werden auf der gesamten Welt gefertigt und separatgetestet. Jedoch mussen vor einem Start zur ISS noch ausfuhrliche Tests des gesamten Detek-tors auf der Erde durchgefuhrt werden. Der gesamte Detektor muss im Herbst 2007 bereit furden Start sein. Einmal auf der ISS montiert, wird es nicht mehr moglich sein, das Experimentzu warten.

29

Page 36: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

3 Das AMS-02-Experiment

30

Page 37: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Der Effekt der Ubergangsstrahlung wurde 1945 von Ginzburg und Frank [45] vorhergesagt.Experimentell nachgewiesen wurde er in den 50er Jahren von Goldsmith und Jelly [46].Er tritt auf, wenn ein geladenes Teilchen sich in einem Medium auf ein anderes Medium zu be-wegt. In dem zweiten Medium bildet sich eine Spiegelladung aus, die mit der tatsachlichen La-dung einen zeitabhangigen Dipol bildet, der Photonen abstrahlt (Abbildung 4.1). Ubergangs-strahlungsphotonen, die durch hochrelativistische Teilchen erzeugt werden, haben dabei meistEnergien im Rontgenbereich.Wie im Folgenden gezeigt wird, ist die Wahrscheinlichkeit fur Ubergangsstrahlung propor-tional zum Lorentzfaktor γ = E/m. Der AMS-02-Detektor nutzt diese Tatsache zur Unter-scheidung von hochrelativistischen Positronen und Protonen, die auf Grund ihrer stark unter-schiedlichen Massen verschiedene Wahrscheinlichkeiten fur Ubergangsstrahlung aufweisen.Der Detektor soll eine Rejektion von 102 - 103 leisten.

4.1 Theorie der Ubergangsstrahlung

Bei einer genaueren Betrachtung eines geladenen Teilchens, das sich in einem Medium aufein anderes Medium zubewegt, kann man davon ausgehen, dass sich die elektromagnetischenFelder des Teilchens in den beiden Medien unterschiedlichen verhalten, und demnach etwasan der Flache zwischen den Medien passieren muss. Fur den Ubergang zwischen zwei Mediensind folgende Stetigkeitsbedingungen aus der Elektrodynamik bekannt [48]:

~B1,⊥ = ~B2,⊥, (4.1)~D1,⊥ = ~D2,⊥, (4.2)~E1,‖ = ~E2,‖, (4.3)~H1,‖ = ~H2,‖. (4.4)

Man kann sich den Prozess nun so vorstellen, dass die Felder des Teilchens in dem Medium,auf das es sich zu bewegt, eine zeitabhangige Polarisation induzieren, die Strahlung verursacht.Fur einen merklichen Effekt muss es zu einer koharenten Uberlagerung der Strahlung von den

+-M e d i u m 1 M e d i u m 2

z e i t a b h ä n g i g e rD i p o l

Abbildung 4.1: Modellvorstellung zur Ubergangsstrahlung

31

Page 38: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Abbildung 4.2: Prinzip der Ubergangsstrahlung, aus [47]

verschiedenen Raumpunkten kommen, was nur gewahrleistet ist, wenn fur das erzeugendeTeilchen gilt:

γ À 1, (4.5)

und sich die Strahlungsprozesse somit nur auf den Vorwartskegel beschranken [49].Die Wahrscheinlichkeit fur Ubergangsstrahlung eines Elektrons lasst sich nach der quasiklas-sischen Operatormethode [50] berechnen:

dw =e2

(2π)2d3k

∞∫

−∞dt2

∞∫

−∞dt1R

∗(t2)R(t1)e

− i

E′

t2∫

t1

(kp− ~k

2

2

)dt

. (4.6)

wobei p = pµ = (E, ~p) der anfangliche 4er-Impuls des Elektrons ist und k = kµ = (ω,~k) der4er-Impuls des abgestrahlten Photons in einem Medium |~k| = nω. n ist der Brechungsindexund E′ = E − ~ω. R(t) hat die Struktur eines Stromes. Fur die Lichtgeschwindigkeit gilt c = 1.Es werden also wie in anderen Feynman-Graphen auch zwei Strome mit einem Propagatormultipliziert und dann integriert. Fur den Strom gilt bei Spin-1/2-Teilchen:

R(t) =m√EE′usf

(~p′)e∗usi(~p) = ϕ+sf

(A(t) + i~σ ~B(t))ϕsi , (4.7)

A(t) =~e∗~p(t)2√

EE′

[√E′ + m

E + m+

√E + m

E′ + m

]' 1

2

(1 +

E

E′

)~e∗~ϑ, (4.8)

~B(t) =

12√

EE′

[√E′ + m

E + m(~e∗ × ~p(t))−

√E + m

E′ + m(~e∗ × (~p(t)− ~~k))

]

' ~ω2E′

(~e∗ ×

(n

γ− ~ϑ

)).

(4.9)

~e ist der Polarisationsvektor des Photons in Coulomb-Eichung. Die vierkomponentigen Spino-re usf

, usi und zweikomponentigen Spinore ϕsf, ϕsi beschreiben Anfangs- und Endzustand der

Polarisation des Elektrons, ~ϑ ist die senkrechte Komponente der Elektrongeschwindigkeit. Die-se Gleichungen gelten fur den hochrelativistischen Fall der Elektronen. Wenn man nun die Be-rechnung fur den Ubergang zwischen einem Vakuum und einem Medium durch Verwendung

32

Page 39: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

eines entsprechenden Stromes durchfuhrt, erhalt man die quantentheoretische Beschreibungder Ubergangsstrahlung [51]:

dw

d~ω=

e2

2π~ω

(~2ω2

E2

[1 +

1κ− 2

κ− 1lnκ

]+

(1 +

E′2

E2

)[1 +

2κ− 1

lnκ− 2])

, (4.10)

κ = 1 +ω2

0

ω2

E′Em2

. (4.11)

ω0 ist die Plasmafrequenz. Der vollstandige mittlere Energieverlust eines Elektrons bei einemGrenzubergang zwischen Vakuum und einem Medium berechnet sich also nach:

∆E =

E∫

0

~ωdw

d~ωd~ω. (4.12)

Mit der Naherung ~2k2/4m2 ¿ 1 ergibt sich:

∆E =α~3

ω0

(1− 3

~ω0

m

)· γ. (4.13)

α = e2/~ ist die Feinstrukturkonstante. Der erste Term ist das klassische Resultat und derzweite Term die erste Quantenkorrektur [51]. Der mittlere Energieverlust ∆E an der Ober-flache durch Ubergangsstrahlung ist also proportional zu γ und unabhangig von der Ladung.Ein konkurrierender Prozess zur Ubergangsstrahlung ist die Ubergangspaarproduktion. Beidem Ubergang eines Photons von einem Medium in ein anderes ist es moglich, dass sich dasMassenquadrat ~2k2 andert und somit Elektron-Positron-Paarproduktion moglich wird. DieWahrscheinlichkeit beim Ubergang von Photonen aus dem Vakuum in ein Medium ist in derNaherung ~2k2/4m2 ¿ 1:

w =α

(835

(~2k2

4m2

)2

+256945

(~2k2

4m2

)3

+O((

~2k2

4m2

)4))

. (4.14)

Dieser Prozess ist also ∝ ~4k4/m4 unterdruckt [51].

Im weiteren Verlauf reicht es, die klassische Beschreibung der Ubergange zu betrachten. Imallgemeinen Fall fur den Ubergang zwischen zwei Medien ergibt sich mit den beiden Plasma-frequenzen ω1 und ω2 fur das jeweilige Medium ein Energieverlust von [48]:

∆E =α~3

(ω1 − ω2)2

ω1 + ω2γ. (4.15)

Die mittlere Zahl von Ubergangsstrahlungsphotonen ist:

〈Nγ〉 =∫

1~ω

dw

~ωd~ω ≈ 0, 5α. (4.16)

An dieser Gleichung erkennt man, dass es fur eine großere Ausbeute an Photonen notwen-dig ist, mehrere Ubergange zu verwenden, da die Anzahl der Photonen aus einem einzigenUbergang klein ist [48].

Ubergangsstrahlung an einem Folienstapel

Es bietet sich also die Verwendung von mehreren Grenzubergangen an, wenn man, wie beiUbergangsstrahlungsdetektoren erforderlich, moglichst viele Photonen erhalten mochte. Es

33

Page 40: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Abbildung 4.3: Ubergangsstrahlung an Folienstapel, aus [47]

sollen im Folgenden kurz die wichtigsten Formeln fur einen Stapel aus N Folien vorgestelltwerden. Fur eine genauere Betrachtung sei auf [48] verwiesen. Bei einer Folie ist zu beachten,dass man einen Ubergang von Medium 1 in Medium 2 und einen Ubergang von Medium 2 inMedium 1 hat. Die Erzeugungsamplituden fur diese Vorgange mussen koharent addiert undquadriert werden. Fur nur eine Folie im Vakuum gilt:

(d2w

dθd~ω

)

Folie

=

(d2w

dθd~ω

)

Grenzflache

· 4 · sin2 φ

2. (4.17)

Die Phasendifferenz betragt dabei:

φ =ωl12·(

1γ2

+ θ2 +ω2

1

ω2

). (4.18)

ω1 ist die Plasmafrequenz und l1 die Dicke der Folie. Die Phasendifferenz wird so optimiert,dass es konstruktive Interferenz gibt, d.h. φ = (2n+1)π mit n = 0, 1, 2 . . . . Unter der Annahmevon γω1 À ω und der Abschatzung θ ≈ 1/γ gilt fur den maximalen Energiewert:

~ωmax =l1ω

21

(n +

12

) , n = 0, 1, 2 . . . . (4.19)

Unter zwei Annahmen lasst sich nun leicht die Wahrscheinlichkeit fur Ubergangsstrahlung aneinem Folienstapel mit N Folien angeben. Die erste Annahme ist, dass der Absorptionskoeffi-zient

σ1(ω) = l1µ1(ω) (4.20)

fur eine einzelne Folie vernachlassigbar ist. µ1 ist der Rontgenabsorptionskoeffizient. Als zwei-tes seien die Interferenzen und die Absorption zwischen den N Folien vernachlassigbar:

Nσ2 = Nl2µ2 ¿ 1. (4.21)

Unter der Annahme, dass die Strahlung von Folie i bei Folie i + 1 um e−σi+1 abgeschwachtwird, erhalt man:

d2w

dθd~ω=

(d2w

dθd~ω

)

Folie

1− e−Nσ1

1− e−σ1︸ ︷︷ ︸effektive Folienzahl

. (4.22)

34

Page 41: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Abbildung 4.4: a) Berechnetes Energiespektrum fur einen Radiator aus 200 Polypropylenfolien (~ω1 =19 eV ) der Dicke 20 µm mit einem Folienabstand von 200 µm im Vakuum, γ ≈ 8000. b) Mittlere errech-nete Anzahl der erzeugten Ubergangsstrahlungsphotonen als Funktion des Lorentzfaktors des durch-gehenden Teilchens, aus [47]

In Abbildung 4.4 a) erkennt man, dass sich fur einen Folienstapel ein Interferenzmuster ergibt.Einige Energien werden viel starker absorbiert als andere, wobei die Absorption im niederener-getischen Teil viel hoher ist. Bei Verwendung von vielen hintereinander geschalteten Folien istes zwar moglich, die Anzahl der Ubergangsstrahlungsphotonen zu erhohen, jedoch ist diesedurch die Absorption beschrankt. In Abbildung 4.4 b) erkennt man, dass die Zahl der Uber-gangsstrahlungsphotonen zunachst mit dem Lorentzfaktor stark ansteigt, die Steigung dannjedoch geringer wird. Hierin ist der Grund fur die Limitierung der Trennbarkeit von Protonenund Positronen bei hohen Energien zu sehen.Bisher wurde angenommen, dass die Foliendicke und der Abstand der Folien konstant sind(regularer Radiator). Wenn man zu einer realistischeren Annahme ubergeht und Verteilungs-funktionen fur diese Großen annimmt, spricht man von einem irregularen Radiator. Auch imFalle des AMS-02-Ubergangsstrahlungsdetektors wird ein irregularer Radiator verwendet, deraus einem Vliesmaterial besteht.An den gerade aufgezeigten Effekten erkennt man, dass die Wahl der Foliendicke, des Abstan-des und der Zahl der Folien einen entscheidenden Einfluss auf die Ausbeute von Ubergangs-strahlungsphotonen und deren Energie haben. Zusatzlich zu den Radiatorlagen mussen auchnoch die Detektionslagen berucksichtigt werden (Abschnitt 4.2).

4.2 Detektion der Ubergangsstrahlung

Zur Detektion von Ubergangsstrahlung kommt bei AMS-02 ein System aus gasgefullten Pro-portionalkammern zum Einsatz. Der detektierte Energieverlust setzt sich bei geladenen Teil-chen aus zwei Komponenten zusammen. Zum einen gibt es den Anteil des Energieverlustesbei Durchgang eines geladenen Teilchens durch Materie (dE/dx) und zum anderen den Anteildurch Ubergangsstrahlungsphotonen. Die Photonen werden in Flugrichtung des Primarteil-chens emittiert (siehe Abschnitt 4.1), so dass es zu einer Superposition der beiden Effekte inder jeweilgen Proportionalkammer kommt. Da die Ubergangsstrahlung zur Trennung von Po-

35

Page 42: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

sitronen und Protonen dienen soll, gilt es nun eine Detektorkonfiguration zu finden, die furdie Ubergangsstrahlung im Rontgenbereich eine moglichst kleine Absorption und eine kleineDichte zur Verringerung des dE/dx-Effektes hat. Es bietet sich die Verwendung eines Edelgasesmit hoher Ordnungszahl und geringer Dichte an wie z.B. 54Xe, das eine hohe Rontgenabsorpti-on durch die hohe Ordnungszahl und eine niedrige Ionisierbarkeit durch die verhaltnismassigkleine Anzahl von Elektronen auf der außeren Schale im Vergleich zur Gesamtelektronenan-zahl hat.

4.2.1 Durchgang eines geladenen Teilchens durch Materie

Wenn ein geladenes Teilchen durch Materie fliegt, verliert es einen Teil seiner Energie durchIonisationen oder Anregungen der Atome. Der mittlere Energieverlust eines geladenen Teil-chens pro Einheitslange wird bei noch nicht hochrelativistischen Geschwindigkeiten durch dieBethe-Bloch-Gleichung beschrieben [2]:

− dE

dx=

NAe4

4πε20mec2

z2Z

A

1β2

[12

ln(

2mec2β2γ2Tmax

I2− β2 − δ

2

)]. (4.23)

NA ist die Avogadrozahl, Z bzw. A ist die Ordnungs- bzw. Massenzahl des durchgequertenMaterials , ε0 ist die Dielektrizitatskonstante, e bzw. me ist die Ladung bzw. die Masse einesElektrons, β = v/c ist die Geschwindigkeit, c ist die Lichtgeschwindigkeit, z ist die Ladungdes Teilchens, γ ist der Lorentzfaktor, Tmax ist der maximal mogliche Energieubertrag, I ist diemittlere Anregungsenergie und δ ist der Dichteeffekt bei Ionisationen.

Bei Elektronen und Positronen gilt eine angepasste Variante der Bethe-Bloch-Gleichung fur denEnergieverlust durch Kollisionen [52]:

− dE

dx= 2πNAr2

emec2ρ

Z

A

1β2

ln

τ2(τ + 2)2I

mec2

+ F (τ)− δ − 2

C

Z

, (4.24)

τ =Te

mec2, (4.25)

F (τ, e−) = 1− β2 +

τ2

8− (2re + 1) ln 2

(τ + 1)2. (4.26)

re ist der klassische Elektronenradius und C ist die Schalenkorrektur. Ab einigen MeV domi-nieren die Energieverluste durch Strahlung bei den Elektronen [1]:

dE

dx= − E

X0mit

1X0

=4Z2n0α

3~2

m2ec

2ln

192Z1/3

. (4.27)

n0 ist die Dichte der Kerne und α die Feinstrukturkonstante.Die Gleichung (4.23) hat bei γ ≈ 3 ein Minimum des Energieverlustes. Teilchen mit dieser Ener-gie bezeichnet man als minimal ionisierende Teilchen. Die statistischen Fluktuationen der Ener-gieverluste folgen einer Landau-Verteilung. Es kann auch vorkommen, dass sekundare Elektro-nen eine Energie uber der mittleren Anregungsenergie haben, und somit auch Atome anregenkonnen. Die Wahrscheinlichkeit fur diese Teilchen ist allerdings sehr gering (δ-Elektronen) [2].

4.2.2 Detektion der Photonen

Der statistische Prozess des Intensitatsverlustes eines Photonstrahls in Materie wird durch dasLambert-Beer’sche-Gesetz beschrieben [53]:

I(x) = I0 exp(−µ(E)

ρx

). (4.28)

36

Page 43: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

0,1 1 10 0,1

1

10

100

µ to

t [cm

-1 ]

Photonenergie [keV]

Abbildung 4.5: Absorptionskoeffizient aller Prozesse fur Xe, aus [54]

Die Ausgangsintensitat I0 wird in Abhangigkeit des zuruckgelegten Weges x, des Massenab-schwachungskoeffizienten µ(E) und der Dichte ρ des Materials abgeschwacht. Der Prozesssetzt sich dabei aus verschiedenen Effekten zusammen, die bei verschiedenen Energien ihrengroßten Einfluss haben. Es handelt sich um Photoeffekt, koharente Rayleigh- und inkoharen-te Compton-Streuung, Elektron-Positron-Paarproduktion im Feld eines Atomkerns und dieWechselwirkungen zwischen Photonen und Atomkernen [54]. Die Ubergangsstrahlungspho-tonen haben eine Energie von ca. 8 - 10 keV. In diesem Energiebereich ist nur der Photoeffektwichtig, der im folgenden vorgestellt werden soll.

Photoeffekt

Als Photoeffekt bezeichnet man den Prozess der Emission eines Elektrons aus der i-ten Schaleder Elektronenhulle infolge der Absorption eines Photons. Die kinetische Energie des soge-nannten Photoelektrons Ee betragt:

Ee = Eγ −E(i)B mit i = K, L,M, . . . (4.29)

Eγ = ~ω ist die Energie des Photons und E(i)B die Bindungsenergie eines Elektrons auf der i-ten

Schale [55].

Auf das Atom wird ein Teil des Impulses des Photons ubertragen. Da Impuls- und Energie-erhaltungssatz gleichzeitig gelten mussen, kann der Photoeffekt nur an einem gebundenenElektron stattfinden. Fur den Photoeffekt an einem freien Elektron kann der Impuls- und Ener-gieerhaltungssatz nicht gleichzeitig gelten.Es treten starke Maxima im Absorptionskoeffizienten µtot(Eγ) auf (siehe Abbildung 4.5), wenndie Energie der Quanten gerade ausreicht, um Elektronen der i-ten Schale aus dem Atomfreizusetzten (Eγ = E

(i)B ). An den Absorptionskanten erkennt man auch den Effekt der Fein-

strukturaufspaltung, da es leichte Untermaxima gibt. Unterhalb dieser Energien kann der Pho-toeffekt aus Grunden der Energieerhaltung nur an den jeweils hoheren, d.h. schwacher ge-

37

Page 44: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Abbildung 4.6: Prinzip eines Zahlrohrs, aus [47]

bundenen Schalen stattfinden. Oberhalb dieser Energiewerte sinkt die Wahrscheinlichkeit desPhotoeffektes mit steigender Photonenergie. Die untere Energieschwelle ergibt sich aus derBindungsenergie der außeren Elektronenschale des Atoms. Infolge der Auffullung der freige-wordenen Platze auf den inneren Schalen durch außere Hullenelektronen wird charakteristi-sche Rontgenstrahlung emittiert.Fast die gesamte Photonenergie wird so zur Erzeugung freier Elektronen verwendet.

4.2.3 Zahlrohr

Ein Zahlrohr besteht aus einem Kathodenzylinder mit Radius b und einem darin axial verlau-fenden Anodendraht mit Radius a (siehe Abbildung 4.6). Das Innere ist mit einem Gasgemischgefullt. Durch Anlegen einer außeren Spannung V0 erhalt man zwischen Kathode und Anodeein radialsymmetrisches Feld. Die Feldstarke E(r) fur einen zylindrischen Kondensator ist:

E(r) =V0

ln(

b

a

) · 1r. (4.30)

Bei Durchgang eines geladenen Teilchens durch das Zahlrohr kommt es in Abhangigkeit derangelegten Spannung zu verschiedenen Effekten (siehe Abbildung 4.7). Durch das geladeneTeilchen werden Elektron-Ionen-Paare erzeugt, wobei die positiven Ionen zur Zahlrohrwandund die Elektronen zum Draht wandern. Wenn die Spannung zu gering gewahlt ist, erreichtnur ein Teil der erzeugten Elektronen den Draht, weil der Rest durch Rekombination verlorengeht.Bei hoherer Feldstarke sinkt die Rekombinationswahrscheinlichkeit schnell ab, so dass prak-tisch alle erzeugten Elektronen bis zum Anodendraht gelangen. Der kontinuierlich zwischenAnode und Kathode fliessende Ionisationsstrom ist dann proportional zur Energie und zurIntensitat der einfallenden Strahlung. Ein Gerat, das unter diesen Bedingungen arbeitet, stellteine Vorstufe zum Zahlrohr dar. Es wird ublicherweise als Ionisationskammer bezeichnet.Eine weitere Erhohung der Spannung hat zur Folge, dass die Sekundarelektronen im elektri-schen Feld genugend Geschwindigkeit aufnehmen, um wiederum Ionisationen durchzufuhren.Dieser Effekt hat allerdings zunachst nur eine lokale Bedeutung und sorgt fur eine lawinenar-tige Verstarkung der Primarionisation. Die Gasverstarkung soll im AMS-02-Ubergangsstrah-lungsdetektor bei 3000 liegen. Eine sehr wichtige Eigenschaft dieses Spannungsbereichs ist,dass die Ladung, die am Draht gemessen wird, immer noch proportional zur Energie desPrimarteilchens ist, so dass anhand der Pulshohe eine Energiemessung erfolgen kann. In die-sem Bereich operierende Zahlrohre nennt man daher auch Proportionalzahlrohre. Diese Zahl-rohrart wird auch bei AMS-02 verwendet.

38

Page 45: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Abbildung 4.7: Betriebsarten eines Zahlrohrs

Liegt die Betriebsspannung uber dem Proportionalbereich, so wird die erzeugte Ladung schließ-lich unabhangig von der Primarionisation. Man spricht vom Auslosebereich. Das ist der Ar-beitsbereich des Geiger-Muller-Zahlrohrs. Die primare Elektronlawine sorgt durch Stoße furAnregungen der Gasatome, die diese Energie in Form von UV-Photonen wieder abgeben. DieseUV-Photonen sind in der Lage freie Elektronen zu erzeugen. Es bildet sich hier, anders als beimProportionalzahlrohr, eine Elektronlawine uber das gesamte Volumen aus. Die Ladungspulsesind unabhangig von der Primarenergie.Um den Proportionalbereich zu vergroßern, ist es moglich, dem sog. Zahlgas ein Loschgas zuzufugen, was die UV-Photonen absorbiert und in Form von Dissoziationen oder elastischenStoßen wieder abgibt. Bei AMS-02 wird als Zahlgas Xenon und als Loschgas CO2 in einemVerhaltnis von 80:20 verwendet.

4.3 Der Ubergangsstrahlungsdetektor von AMS-02

In diesem Abschnitt sollen die Komponenten des finalen AMS-02-Ubergangsstrahlungsdetek-tors zusammenfassend dargestellt werden. Fur eine genauere Betrachtung sei auf [56], [47]verwiesen. Die Beschrankungen fur den Ubergangsstrahlungsdetektor geben eine Hohe von60 cm vor. In GEANT1 3.21-Simulationen wurde die optimale Konfiguration von Radiatordickeund Zahl von Radiatorlagen ermittelt. Weitere Anforderungen sind ein moglichst geringes Ge-wicht und ein geringer Leistungsbedarf von 16 W fur die Ausleseelektronik. Das endgultigeLayout sieht somit 20 Radiatorlagen mit einer Dicke von 22 mm vor. Die oberen und die un-teren vier Detektorlagen sind um 90 gedreht, um eine dreidimesionale Spurrekonstruktionzusatzlich zum Tracker (Abschnitt 3.2.2) zu ermoglichen. Der Ubergangsstrahlungsdetektor

1Programm zur Beschreibung und Simulation von Detektoren

39

Page 46: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Abbildung 4.8: Ubergangsstrahlungsdetektor auf dem Magneten, aus [26]

Abbildung 4.9: Proportionalzahlrohrmodul aus 16 Einzelrohren, aus [47]

wird uber dem Magneten und dem ersten Flugzeitzahler angebracht und hat eine Masse von494 kg inklusive des Gassystems und der Elektronik bei einem Durchmesser von 2,2 m (sieheAbbildung 4.8). Wahrend des Betriebs darf die Temperaturschwankung innerhalb der Detek-torlagen und auf einem Orbit der ISS nur maximal ∆T = 1 K betragen, da die Gasverstarkungtemperaturabhangig ist und eine moglichst konstante Gasverstarkung die Bedingung fur einePrazisionmessung der Energie und somit zu einer moglichst guten Trennung von Positronenund Protonen ist.

4.3.1 Radiatormaterial

Als Radiator wird das gleiche Material wie im ATLAS2 Ubergangsstrahlungsdetektor verwen-det. Es handelt sich dabei um ein hochirregulares Vlies-Material, das aus Polyethylen- undPolypropylenfasern besteht. Die Dichte betragt 0,06 g/cm3. Insgesamt werden 50 m2 Radiatorverwendet. Um die NASA-Bestimmungen zur Ausgasungsrate des Materials zu erfullen, wirddas Vlies chemisch gereinigt.

4.3.2 Detektorkammern

Es werden insgesamt 328 Proportionalzahlrohrmodule (siehe Abbildung 4.9) zur Detektionverwendet. Sie bestehen aus je 16 einzelnen Rohren mit einem Durchmesser von 6 mm undeiner Lange von 0,8 bis 2,2 m. Die Rohre werden aus zwei mehrlagigen Folie gewickelt, die

2A Toroidal LHC ApparatuS - LHC-Experiment

40

Page 47: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Abbildung 4.10: Achteckige Tragestruktur fur die Proportionalkammern, aus [47]

jeweils aus 6 µm Kohlefaserpolymid, 0,2 µm Aluminimum, 25 µm Kapton, 5 µm Polyurethanbesteht. Die Folie wird an den Polyurethanflachen aufeinander gelegt und durch Erwarmenverschmolzen. Den Anodendraht bildet ein Wolfram-Draht. Die 16 Rohre werden zusammenmit sechs longitudinalen Verstrebungen in ein Polycarbonat-Endstuck eingeklebt. Zusatzlichgibt es noch je nach Rohrlange transversale Verstarkungen. Das Gas durchfließt dabei achtRohre in die eine und acht Rohre in die andere Richtung. An einem Ende sind die Elektronikfur die Hochspannungsverteilung und Signalauskopplung (UFE-Platine) angeschlossen.

Tests

Um die Qualitat der Module zu uberprufen, wird eine Reihe von Tests durchgefuhrt. Dazugehort ein Drahtspannungstest, eine Messung des elektrischen Rauschens, ein Test zur Leck-uberprufung, ein Test zur Uberprufung der Gasdichtigkeit im Vakuum und ein finaler Test zurGasverstarkung, der mit γ-Quanten von 55Fe durchgefuhrt wird.

4.3.3 Tragestruktur

Die mechanische Tragestruktur wird durch zwei Komponenten gebildet, zum einen das koni-sche Oktagon (Abbildung 4.10), was zur Aufnahme der 328 Module dient, und zum anderendie M-Struktur, die den gesamten TRD stutzt. Das Oktagon ist aus einer Aluminiumstruktur,die von einer Kohlefaserhaut umgeben wird, mit einer Prazison von 100 µm gebaut, um Ver-biegungen der Module, die Gasverstarkungsanderungen zur Folge hatten, zu verhindern. DieM-Struktur ist aus Aluminium und bildet auch die Verbindung zur USS3.

4.3.4 Gasversorgung

Als Gas wird ein Gemisch von Xenon und CO2 im Verhaltnis von 80:20 verwendet. Das Gasdurchstromt mit 1 l/h die 328 Kammern in insgesamt 41 einzel abtrennbaren Gaskreislaufen,damit bei Ausfall einiger Module der weitere Betrieb des restlichen Detektors gewahrleistetwerden kann. Die Gasverstarkung ist auch von der genauen Zusammensetzung des Gasesabhangig, die sich durch Diffusion durch die Rohrwande verandert. Das Gassystem mussgewahrleisten, dass die Mischung von 80:20 aufrecht erhalten wird. Zu diesem Zweck wer-den 8100 l Xenon und 2000 l CO2 mitgefuhrt.

3engl.: Universal support structure

41

Page 48: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

4.3.5 Elektronik

Die Elektronik hat vielfaltige Aufgaben. Sie ist fur die Spannungsversorgung und das Auslesender 328 Module, die Digitalisierung der Signale mit einem 12 bit ADC4, die Kontrolle der Tem-peraturen und Spannungen und die Datennahme zustandig. Sie benotigt eine Leistung von16 W, da die Auslese gemultiplext stattfindet, d.h. das nicht jedes Proportionalzahlrohr seineneigenen ADC hat, sondern die Auslese nacheinander uber einen einzigen ADC ablauft. Furzwei Module aus je 16 Rohren wird ein ADC verwendet. Die Auslese erfolgt mit VA-Chips.Fur genauere Informationen sei auf [57] verwiesen.

4.3.6 Vibrations- und Thermo-Vakuum-Test

Zur Simulation der Belastungen beim Start eines Space Shuttles muss der Detektor Vibrati-onstests ausgesetzt werden, der die Beschleunigungen beim Start simuliert. Beim Thermo-Vakuum-Test wird die Temperatur in ahnlichen Zyklen, wie sie im Weltall auftreten werden,von -40 bis 60C variiert. Nach diesen Tests mussen die Gasdichtigkeittests wiederholt werden.Es zeigt sich keine Veranderung in der Dichtigkeit und der Gasverstarkung.

4.4 Strahltest mit einem 20-lagigenUbergangsstrahlungsdetektorprototyp

In dieser Arbeit geht es um die Auswertung von Daten, die mit dem Prototypen fur dentatsachlichen AMS-02-Ubergangsstrahlungsdetektor genommen wurden. Im folgenden Ab-schnitt wird der Aufbau, die Wahl der Designparamter und der durchgefuhrte Beamtest zu-sammenfassend dargestellt. Fur eine ausfuhrlichere Behandlung sei auf [56] verwiesen.

4.4.1 Aufbau

Der Prototyp besteht wie der finale Ubergangsstrahlungsdetektor ebenfalls aus 20 Lagen, wo-bei hier die Lagen 3 und 4 und die Lagen 17 und 18 gegenuber den anderen Lagen um 90 ge-dreht sind. Die Module einer Lage sind um 14,5 mm versetzt. Man kann sich den Detektor alsoaus zwei Detektorturmen zusammengesetzt vorstellen. Der in z-Achse (siehe Abbildung 4.11)tieferliegende Turm wird als N-Turm und der hoherliegende als P-Turm bezeichnet. Zwischenden Detetektorlagen und vor der ersten Lage befinden sich je 20 mm Radiatormaterial (sieheAbbildung 4.12). Im N-Turm handelt es sich dabei um das chemisch gereinigte ATLAS-Vlies-Material. Der P-Turm enthalt in den mittleren vier Lagen Separet 405, das Ausgasungsrateninnerhalb der NASA-Beschrankungen aufweist, und ansonsten auch ATLAS-Fleece. Es zeigtsich, dass eine Verwendung des ATLAS-Vlieses ausreicht [56].Es muss angemerkt werden, dass vor den gedrehten Lagen fur jeweils einen Turm nicht genu-gend Platz fur 20 mm Radiatormaterial sind, was dazu fuhrt, dass in dieser Lage weniger Uber-gangsstrahlung ausgesandt wird. Auch im finalen Ubergangsstrahlungsdetektor wird es vorden gedrehten Lagen zu dieser Problematik der Konfiguration kommen.Die Gasversorgung und die Tests der Proportionalkammern werden wie beim finalen Uber-gangsstrahlungsdetektor durchgefuhrt. Die Elektronik hat drei 12 bit ADCs. Beim Prototypenwerden VA-Chips verwendet, die einen kleineren linearen Bereich haben (Abbildung 4.13),das fuhrt dazu, dass der Cut-Off der Elektronik schon bei Energien von 25 - 30 keV auftritt,wahrend beim endgultigen Detektor der Cut-Off in einem Bereich um ca. 80 keV liegen wird.

4engl.: Analog Digital Converter

42

Page 49: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Abbildung 4.11: 20-lagiger Ubergangsstrahlungsdetektorprototyp, aus [47]

4.4.2 Ubersicht uber den Strahltest

In dieser Arbeit werden Daten verwendet, die mit dem X7-Strahl des SPS5 am CERN im Som-mer 2000 genommen wurden. Eine Ubersicht der in dieser Analyse benutzten Daten findet sichin Tabelle 4.1. Es wurden keine Positrondaten aufgezeichnet, sondern Elektronen, weil mit die-sen einfacher eine hohere Statistik zu erreichen ist. Ziel dieser Arbeit ist aber eine Aussage zurTrennbarkeit von Positronen und Protonen mit Hilfe des AMS-02-Ubergangsstrahlungsdetek-tors. Aus der Formel (4.13) zur Intensitat der Ubergangsstrahlung geht hervor, dass der Prozessladungsunabhangig ist, und man somit die Analyse mit Elektronen anstatt von Positronen ma-chen kann.Die aufgezeichneten Ereignisse wurden eines Spurfits zur Anpassung der Primarspur unter-zogen. Ereignisse, die Sekundarspuren z.B. durch harte Wechselwirkungen aufweisen, werdenin der weiteren Analyse nicht betrachtet. Der Teststrahl wurde unter verschiedenen Winkelnrelativ zur z-Achse auf den Detektor gerichtet. Fur eine genaue Ubersicht des Testaufbaus undaller aufgezeichneten Daten sei wiederum auf [56] verwiesen.

5CERN-Teilchenbeschleuniger: Super Proton Synchrotron

43

Page 50: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

4 Der Ubergangsstrahlungsdetektor

Radiator

6 mm

Radiator

98 mm

100 mm

20 mm29 mm

Abbildung 4.12: Aufbau der Lagenstruktur, aus [56]

Abbildung 4.13: Linearitat der VA-Chips beim Prototyp (links) und endgultigem Detektor (rechts), aus[56]

Typ Energie [GeV] Winkel [] Ereignisse EinzelspurereignisseElektron 20 -1,5 50000 27534

9,3 10091 5233Proton 20 -1,5 10000 6595

7,5 20165 13276Proton 40 7,5 40000 25339Proton 60 7,5 20000 12472Proton 80 7,5 19998 12051Proton 100 -1,5 30306 18822

8,3 20000 11854Proton 120 -1,5 10000 6092

7,5 20000 11849Proton 140 -1,5 13527 8146

7,5 19999 11710Proton 160 -1,5 20000 11007

7,5 20000 10874Proton 180 -1,5 20000 11061

7,5 20000 10450Proton 200 -1,5 29999 15986

7,5 20000 10900Proton 250 -1,5 10000 5402

Tabelle 4.1: Daten fur die Analyse

44

Page 51: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

Ziel der Analyse ist es, die Rejektion von Positronen und Protonen mit Hilfe des AMS-02-Uber-gangsstrahlungsdetektors in Abhangigkeit der Energie zu gewinnen. Statt Positronen werdenElektronen verwendet (siehe Abschnitt 4.4.2). Fur die Analyse werden verschiedene Methodenverwendet, die teilweise ahnlich in [56] benutzt wurden.

5.1 Datenaufbereitung

5.1.1 Spurfit

Bevor die eigentliche Analyse beginnen kann, mussen die Rohdaten vorprozessiert werden,d.h. die Daten, die mit den ADCs aufgenommen wurden, mussen in Energien transformiertwerden. Fur jede Proportionalkammer mussen das Pedestal, die Gasverstarkung und Unter-schiede in der VA-Verstarkung kalibriert werden, um die Daten untereinander vergleichbar zumachen.An die Kalibration schließt sich eine Spuranpassung an, der saubere Einzelspuren findet. Die-ser Fit versucht durch zweifache lineare Regression der einzelnen Hits1 pro aufgezeichnetemEreignis Spuren von Sekundarteilchen, die durch Wechselwirkung mit dem Material vor demDetektor, wie z.B. Plastikszintillatoren, oder durch Wechselwirkungen im Innern des Detek-tors entstanden sind, ausfindig zu machen. Die Analysen werden ausschließlich mit sauberenEinzelspuren gemacht. Die Kriterien hierfur sind in Tabelle 5.1 zusammengefasst. Durch die90 -verdrehten Lagen ist es moglich eine dreidimesionale Spurrekonstruktion durchzufuhren.Die vier verdrehten Lagen verlaufen dabei in X-Richtung und die anderen 16 Lagen in Y -Richtung. Die Strahlachse ist die Z-Achse. Die Schwelle durch den Cerenkov-Zahler wurdenur bei den Protondaten als Veto verwendet, um zu gewahrleisten, dass keine leichteren Teil-chen aufgezeichnet werden. In Tabelle 5.1 ist mit der außeren Spur ein breiter Schlauch umdie tatsachliche Einzelspur gemeint. Die minimale Z-Distanz fur X-Lagen stellt sicher, dassnur solche Spuren verwendet werden, die in beiden Anordnungen von gedrehten Lagen Hitshaben. Es wird im Folgenden die gleiche Vorprozessierung und Spurfindung wie in [56] ver-wendet.Nach dem Spurfit ist uber jeden aufgezeichneten Hit im Detektor bekannt, ob er sich auf ei-ner Einzelspur befindet. Da die Rejektion anhand der Energieeintrage bestimmt werden soll,ist es im Hinblick auf die Analyse mit neuronalen Netzen in Kapitel 7 ratsam, genau einenEnergieeintrag pro Lage zu verwenden. Es muss entschieden werden, was mit Ereignissen ge-schieht, die zwei Hits in einer Lage auf der Spur wie in Abbildung 5.2 und 5.3 haben. Wenn dieHits in einem Turm liegen (Abbildung 5.2), werden die Energien addiert und bilden fortan denEintrag dieser Lage. Man kann davon ausgehen, dass das Teilchen zwischen den Rohrchen hin-durch gegangen ist oder das Ubergangsstrahlungsphoton in das benachbarte Rohrchen geflo-gen ist. Wenn die Hits allerdings genau in dem Ubergang zwischen den beiden Turmen liegen(Abbildung 5.3), wie es bei Ereignissen der Fall sein kann,, die unter einem großeren Winkeleingeschossen wurden, macht diese Addition keinen Sinn, da es sich um zwei in Z-Richtunggetrennte Hits handelt. Hier wird das arithmetische Mittel der beiden Energien genommen.

1engl.: Hits - Treffer

45

Page 52: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

Kriterium GrenzeHits auf der XY -Spur ≥ 15Hits auf außerer Spur ≤ 4Hits außerhalb der Spur ≤ 15Hits mit Energien uber ≤ 16,5 keV außerhalb der SpurLagen mit mehr als einem Hit ≤ 5ESpur/Etotal [%] ≥ 75Hits auf der Spur in Y -Lagen ≥ 12minimale Z-Distanz fur X-Lagen ≥ 14Cerenkov-Schwelle ≤ 500

Tabelle 5.1: Kriterien fur Einzelspuren,aus [56]

Abbildung 5.1: Veranschaulichung derunterschiedlichen Hit-Arten, aus [56]

5.1.2 Mittleres Energiespektrum

In Abbildung 5.4 sieht man die Spektren der Energiedepositionen aus allen 20 Lagen fur 20 GeV-Elektronen und 100 GeV-Protonen, die auf diese Weise gewonnen wurden. In den Spektrensieht man bei Elektronen und Protonen deutlich den MOP2-Peak, der durch den dE/dx-Verlustvon geladenen Teilchen in Materie zustande kommt. Bei den Elektronen erkennt man eine wei-tere Uberhohung durch die Ubergangsstrahlungsphotonen bei ca. 9 keV (Rontgenbereich). AmEnde des Spektrums gibt es einen leichten weiteren Peak, der durch die Ausleseelektronik zu-stande kommt. Energien konnen nur bis zu einem gewissen Maximalwert aufgelost werden.Uberhalb dieses Wertes werden die Energiedepositionen auf den Maximalwert abgebildet, dahier der ADC seine Grenze hat. Dieser Overflow3 ist abhangig vom Pedestal des jeweiligenVA, so dass der genaue Overflow-Wert von Modul zu Modul variieren kann. Die Breite desOverflows-Peaks betragt ca. 2 %. Die Breite der Position des Overflow in Abhangigkeit vomModul, und damit dem VA, betragt aber ca. 5 %, so dass in der gemittelten Verteilung (Ab-bildung 5.4) nur noch ein breiter Peak zu sehen ist [58]. Auf diese Problematik wird in denAbschnitten 5.1.4 und 5.2.6 genauer eingegangen. Da es pro Lage zwei Module gibt, gibt esauch zwei verschiedene VAs mit unterschiedlichen Pedestals. In fast allen Lagen liegen diebeiden Overflow-Werte so nah beieinander, dass durch die Verschmierung der Overflows kei-ne deutliche Trennung der beiden VAs ausgemacht werden kann. Nur in den Lagen 5 und 6liegt jeweils ein Overflow-Peak so niedrig, dass zwei deutliche Peaks zu erkennen sind. Um zugewahrleisten, dass man ein gemeinsames Spektrum dieser Lagen verwenden kann, werdendie Energiewerte der Lagen 5 und 6, die uber dem niedrigeren Overflow-Peak liegen auf diesenWert zuruckgesetzt.

Fur die Analysen werden die Daten der unterschiedlichen Winkel zu einem Datensatz zusam-mengefasst.

2engl.: MOst Propable3engl.: overflow - Uberfluss

46

Page 53: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

3.3 keV20

1.4 keV19

4.7 keV 0.6 keV18

10.7 keV 0.9 keV17

7.8 keV16

2.4 keV15

19.6 keV14

1.3 keV13

1.3 keV12

2.8 keV11

3.1 keV10

9.1 keV 1.1 keV9

1.4 keV8

7

19.7 keV6

19.1 keV5

6.6 keV4

6.9 keV3

2.5 keV2

4.3 keV1

Abbildung 5.2: 20 GeV-Elektron, Winkel:-1,5

1.1 keV20

27.3 keV19

1.8 keV18

1.4 keV17

22.8 keV16

26.3 keV15

27.5 keV14

2.4 keV13

7.9 keV12

5.4 keV11

6.2 keV10

1.6 keV9

6.7 keV8

3.2 keV7

3 keV6

18.4 keV5

12.5 keV 0.9 keV4

16.6 keV 1.2 keV3

14.2 keV2

9.8 keV1.4 keV

1

Abbildung 5.3: 20 GeV-Elektron, Winkel:9,3

Energie [keV]0 5 10 15 20 25 30 35 40

rel.

Hae

ufi

gke

it

-610

-510

-410

-310

-210

-110

20 GeV Elektronen

100 GeV Protonen

Abbildung 5.4: Energiedeposition fur 20 GeV Elektronen und 100 GeV Protonen aus allen Lagen

47

Page 54: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

1 10 100 1

10

100

1000

Wirk

ungs

quer

schn

itt [c

m 2 /g

]

Photonenergie [keV]

Abbildung 5.5: Wirkungsquerschnitt von Photonen und einem Xe/CO2-Gemisch (80:20), aus [59]

5.1.3 Spektren der einzelnen Lagen

Wenn man die Spektren der einzelnen Lagen (Abbildung 5.6 bis 5.9) betrachtet und mit denmittleren Spektren (Abbildung 5.4) vergleicht, fallt auf, dass in Lage 1 fur die Elektronen dasEnergiespektrum bei hohen Energiedepositionen flacher ist als das mittlere Energiespektrum.Das Spektrum von Lage 20 und das mittlere Energiespektrum verlaufen in etwa gleich. DieserEffekt resultiert daraus, dass in der Lage 1 nur die Photonen, die in der ersten Radiatorschichterzeugt werden, detektiert werden konnen. In den weiteren Lagen werden nicht nur Photonendetektiert, die direkt in der Lage davor erzeugt wurden, sondern auch Photonen, die in Lagendavor erzeugt wurden. Der Detektionswirkungsquerschnitt von hochenergetischen Photonenund einem Xe/CO2-Gemisch (80:20) ist namlich klein (Abbildung 5.5), so dass viele Photonenauch undetektiert durch die Proportionalkammern fliegen.Bei den Spektren der Protonen (Abbildung 5.8 und 5.9) beobachtet man nicht, dass die Spektrenbei Lage 1 flacher fur hohe Energien sind als in Lage 20. Hier gibt es nahezu keine Ubergangs-strahlung. In jeder Lage findet nur der Energieverlust durch Ionisation und Anregung statt,der fur die unterschiedlichen Lagen stochastisch unabhangig ist.Was man bei allen Spektren der einzelnen Lagen deutlich sieht, sind die Abweichungen imBereich des Overflow-Peaks. Fur die einzelnen Lagen handelt es sich um einen scharfen Peak,der jedoch von Lage zu Lage variiert, so dass er im mittleren Spektrum aller Lagen viel breitererscheint.Bei Betrachtung der mittleren Energien pro Lage (Abbildung 5.10) fur nahezu gerade (-1,5 )und schrag (9,3/8,3 ) eingeschossene Teilchen fallt besonders der Unterschied vor Lage 3 insAuge. Die gerade eingeschossenen Teilchen durchqueren viel weniger Radiatormaterial vorLage 3 bevor sie in die Detektorlage eintreten als Teilchen, die schrag eingeschossen werden.Dieser Effekt ist also geometriebedingt durch den Versatz der Module in jeder Lage nicht zuvermeiden. Vor Lage 17 fallt solch eine starke Abweichung nicht auf, weil die Erzeugung von

48

Page 55: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

Energie [keV]0 5 10 15 20 25 30 35 40

rel.

Hae

ufi

gke

it

-410

-310

-210

-110

0 5 10 15 20 25 30 35 40

Ver

hae

ltn

is

00.5

11.5

22.5

3

Abbildung 5.6: Verteilung der Energie-deposition der 20 GeV Elektronen in Lage1 und Vergleich mit der mittleren Vertei-lung

Energie [keV]0 5 10 15 20 25 30 35 40

rel.

Hae

ufi

gke

it

-410

-310

-210

-110

0 5 10 15 20 25 30 35 40V

erh

aelt

nis

00.5

11.5

22.5

3

Abbildung 5.7: Verteilung der Energie-deposition der 20 GeV Elektronen in Lage20 und Vergleich mit der mittleren Vertei-lung

Energie [keV]0 5 10 15 20 25 30 35

rel.

Hae

ufi

gke

it

-410

-310

-210

-110

0 5 10 15 20 25 30 35

Ver

hae

ltn

is

00.5

11.5

22.5

3

Abbildung 5.8: Verteilung der Energie-deposition der 100 GeV Protonen in Lage1 und Vergleich mit der mittleren Vertei-lung

Energie [keV]0 5 10 15 20 25 30 35

rel.

Hae

ufi

gke

it

-410

-310

-210

-110

0 5 10 15 20 25 30 35

Ver

hae

ltn

is

00.5

11.5

22.5

3

Abbildung 5.9: Verteilung der Energie-deposition der 100 GeV Protonen in Lage20 und Vergleich mit der mittleren Vertei-lung

49

Page 56: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

Abbildung 5.10: rechts: Mittlere Energien pro Lage fur die 20 GeV-Elektronen und die 100 GeV-Protonen, Winkel: -1,5 ; links: Mittlere Energien pro Lage fur die 20 GeV-Elektronen (9,3 ) und die100 GeV-Protonen (8,3 )

Energie [GeV] Residuum BreiteElektron 20 0.138 ± 0.053 1.403 ± 0.326Proton 20 0.083 ± 0.040 1.119 ± 0.261Proton 40 -0.054 ± 0.070 1.277 ± 0.297Proton 60 0.088 ± 0.048 1.139 ± 0.264Proton 80 -0.029 ± 0.041 1.058 ± 0.245Proton 100 -0.141 ± 0.0587 1.271 ± 0.297Proton 120 -0.009 ± 0.041 1.210 ± 0.285Proton 140 -0.026 ± 0.0431 1.186 ± 0.277Proton 160 -0.092 ± 0.046 1.180 ± 0.273Proton 180 -0.068 ± 0.058 1.195 ± 0.276Proton 200 -0.057 ± 0.038 1.261 ± 0.296Proton 250 0.116 ± 0.029 0.965 ± 0.223

Tabelle 5.2: Mittlere Residuen der Fits

Ubergangsstrahlungsphotonen und Detektion selbiger hier schon in Sattigung ist, also genugPhotonen aus den vorherigen Lagen bis in Lage 17 fliegen.Da im Radiator Absorption der Ubergangsstrahlungsphotonen stattfindet, verschiebt sich beiunterschiedlichen Dicken des Materials das Absorptionsspektrum. Eine großere Dicke ziehtmehr Absorption im niederenergetischen Bereich nach sich.

5.1.4 Fits der einzelnen Lagenspektren

Fur die folgende Likelihood-Analyse (Abschnitt 5.2.3) benotigt man analytische Parametrisie-rungen der einzelnen Lagenspektren, um die statistischen Fluktuationen auszugleichen. Da diestatistische Verteilung des Energieverlustes bei Durchgang eines geladenen Teilchens durchMaterie einer Landau-Verteilung folgt, ist ein Teil der Parametrisierung eine Landau-Funktion[60]:

φ(λ) =1

2πi

e+i∞∫

e−i∞es log s + λsds. (5.1)

Hierbei gilt λ = R(E − EMOP). EMOP ist die wahrscheinlichste Energie und R eine Konstante,die vom Absorber abhangt. Um die Ubergangsstrahlungsuberhohung anzupassen, wird ei-

50

Page 57: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

ne zweite Landau-Verteilung mit einem verschobenen Peak verwendet. Zur Parametrisierungdes Overflow-Peaks wird eine Gauß-Verteilung mit anschließendem harten Schnitt durch eineFermi-Kante verwendet. Die gesamte Funktion, deren Parameter pro Lage bestimmt werden,sieht also wie folgt aus:

P (E) =

C1 · 1

2πi

e+i∞∫

e−i∞exp(s log s + (E − C2) · C3 · s)ds

+ C4 · 12πi

e+i∞∫

e−i∞exp(s log s + (E − C5) · C6 · s)ds

+C7√2πC2

8

exp(−(E − C9)2

2C28

)]· 11 + exp (C10 · (E − C11))

.

(5.2)

Die Ci sind die anzupassenden Parameter. Diese Funktion wird auch fur die Protonspektrenverwendet, um die abfallende Flanke nach dem Maximum moglichst gut anpassen zu konnen.In den Abbildungen 5.11 bis 5.13 ist solch ein Fit fur die Elektronen exemplarisch gezeigt.Die relativen Abweichungen (Residuen) des Fits sind Gauß-verteilt mit einer Breite von σ =1, 233 ± 0, 112. Die Parametrisierung ist also fur diese Lage gut gewahlt. In den Abbildungen5.14 bis 5.16 ist ein Fit fur ein Protonspektrum exemplarisch gezeigt. Auch hier zeigt sich, dassdie Abweichungen mit einer Breite von σ = 1, 412 ± 0, 128 in einem guten Bereich liegen. Zu-sammenfassend sind in Tabelle 5.2 fur jede Energie die mittleren Mittelwerte der Abweichun-gen mit ihren mittleren Breiten zusammengestellt. Die Mittelwerte der Abweichungen liegenalle ungefahr bei 0 mit einer Breite von 1, d.h. es handelt sich um gute Anpassungen.

5.2 Analysemethoden

5.2.1 Effizienz und Rejektion

Da die Begriffe Effizienz und Rejektion fur die folgenden Analysen eine zentrale Rolle einneh-men, seien sie hier kurz wiederholt. Die Rejektion gibt den Kehrwert des Anteils der durch diejeweilge Analysemethode falsch erkannten Protonen an:

R =Nalle Protonen

Nfalsche Protonen. (5.3)

Die Elektroneffizienz legt den Anteil der richtig erkannten Elektronen fest. Sie soll bei 90 %liegen und legt in jeder Analysemethode eine Schwelle fest. Die statistischen Fehler berechnensich unter Annahme einer Poisson-Verteilung, dass es sich um ein Zahlexperiment handelt zu[61]:

σNalle Protonen =√

Nalle Protonen, (5.4)

σNfalsche Protonen =√

Nfalsche Protonen. (5.5)

Die Fehler sind im Allgemeinen nicht statistisch unabhangig. Eine Fehlerfortpflanzung mitAnnahme einer positiven vollstandigen Korrelation liefert [61]:

σR,korr. =

√√√√√ Nalle Protonen

N2falsche Protonen

− 2N

32

alle Protonen

N52

falsche Protonen

+N2

alle ProtonenN3

falsche Protonen, (5.6)

(5.3)=

√R

Nfalsche Protonen(√

R− 1). (5.7)

51

Page 58: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

Energie [keV]0 5 10 15 20 25 30 35 40

rel.

Hae

ufi

gke

it-410

-310

-210

-110

Abbildung 5.11: Anpassung der 20 GeV-Elektrondaten jeder Lage mit analyti-scher Funktion

Energie [keV]0 5 10 15 20 25 30 35 40

σM

essw

ert

- P

aram

etri

sier

un

g

-6

-4

-2

0

2

4

6

Abbildung 5.12: Abweichungen der An-passung bei den Elektronen

Residuum-6 -4 -2 0 2 4 6

#

0

5

10

15

20

25

ResiduenEntries 97Mean 0.02432RMS 1.336Prob 0.7073Constant 3.24± 23.49 Mean 0.1311± 0.1336 Sigma 0.112± 1.233

Abbildung 5.13: Verteilung der Abwei-chungen bei den Elektronen

Wenn man die Fehler als statistisch unabhangig annimmt, ergibt sich:

σR,unkorr. =

√Nalle Protonen

N2falsche Protonen

+N2

alle ProtonenN3

falsche Protonen

(5.3)=

√R

Nfalsche Protonen

√R + 1. (5.8)

Man kann im Folgenden die Fehler als statistisch unabhangig betrachten, da bei hohen Rejek-tionen R gilt: √

R− 1√R + 1

≈ 1. (5.9)

Die Fehler der Rejektionen werden bei allen kunftigen Angaben in dieser Arbeit mit Formel(5.8) berechnet.

5.2.2 Cluster-Counting

Die Cluster-Counting-Methode ist ein erster Ansatz zur Klassifizierung von Ereignissen alsElektron oder Proton. Die Methode macht sich die großeren Haufigkeiten von hohen Energie-eintragen bei den Elektronen zu Nutze. Um ein Ereignis als Elektron zu identifizieren, musseine bestimmte Anzahl von Hits Ubergangsstrahlungs-Cluster auf der Spur aufweisen. AlsCluster4 bezeichnet man Hits ab einer bestimmten Energieschwelle, bei denen man annimmt,

4engl.: Cluster - Anhaufung

52

Page 59: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

Energie [keV]0 5 10 15 20 25 30 35 40

rel.

Hae

ufi

gke

it-410

-310

-210

-110

Abbildung 5.14: Anpassung der100 GeV-Protondaten jeder Lage mitanalytischer Funktion

Energie [keV]0 5 10 15 20 25 30

σM

essw

ert

- P

aram

etri

sier

un

g

-6

-4

-2

0

2

4

6

Abbildung 5.15: Abweichungen der An-passung bei den Protonen

Residuum-6 -4 -2 0 2 4 6

#

0

5

10

15

20

25

ResiduenEntries 73Mean -0.1061RMS 1.356Prob 0.9331Constant 2.36± 16.25 Mean 0.176± -0.148 Sigma 0.128± 1.412

Abbildung 5.16: Verteilung der Abwei-chungen bei den Protonen

dass es sich um Ubergangsstrahlungsphotonen (TR-Photonen) handelt. Die Schnitte auf dieAnzahl und die Energie werden hier so wie in [56] festgelegt. Ein Ereignis wird als Elektronklassifiziert, wenn sechs Energieeintrage auf der Spur uber 6,5 keV liegen. In Abbildung 5.17ist die Klassifizierung anhand von Clustern fur den Vergleich von 20 GeV-Elektronen mit den100 GeV-Protonen gezeigt. Es wird eine Rejektion von 337 ± 35 bei einer Effizienz von 90,8 %erreicht. Der Fehler ergibt sich nach Formel (5.8). Dieser Wert liegt schon uber dem gefordertenMindestwert von 100, obwohl die Methode recht starre Schnitte setzt. Das Neyman-Pearson-Lemma erklart im folgenden Abschnitt den besten Test auf zwei verschiedene Hypothesen.

5.2.3 Likelihood Analyse

Der beste Test eines Ereignisses ~x, wobei die unterschiedlichen Komponenten von ~x die Ei-genschaften des Ereignisses wiederspiegeln, auf zwei Hypothesen H0 und H1 ist nach demNeyman-Pearson-Lemma der Quotient der jeweiligen Likelihood-Werte des Ereignisses [62],[63]:

P0(~x)P1(~x)

> c. (5.10)

53

Page 60: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

# TR-Photonen0 5 10 15 20

rel.

Hae

ufi

gke

it

-510

-410

-310

-210

-110

120 GeV Elektronen

100 GeV Protonen

35±Rejektion: 337 Effizienz: 90.8 %

HitCut: 6ECut: 6.5 keV

Abbildung 5.17: 20 GeV-Elektronen und 100 GeV-Protonen bei der Cluster-Counting-Methode. Es istauch der Schnitt bei 6 TR-Photonen als Klassifikationsmerkmal fur Elektronen eingezeichnet.

P0/1 ist die Likelihood-Funktion der jeweilgen Hypothese und gibt die Wahrscheinlichkeit furdas Ereignis ~x im Rahmen der jeweiligen Hypothese an. c ist eine Schwelle des Tests, die durchdie gewunschte Effizienz festgelegt wird. Die zu bildende Testgroße ist also:

L′ =P0(~x)P1(~x)

. (5.11)

Als Test eignen sich alle monotonen Funktionen von L′ genauso gut. Im Folgenden wird dieTestgroße:

L =1

1 +1L′

=P0(~x)

P0(~x) + P1(~x)(5.12)

verwendet. Die Hauptschwierigkeit des Tests besteht darin die Likelihoods fur die beiden Hy-pothesen in Abhangigkeit von ~x zu bestimmen. Als Kriterium dienen in dieser Analyse die20 Energiedepositionen auf der Spur, was zu 20-dimensionalen Funktionen fur die Likelihoodsfuhrt. Um die Anzahl der Dimensionen zu verkleinern, wird eine mittlere Likelihood-FunktionPe/p fur die Elektron- und Protonhypothese verwendet und auf die folgende Art fur jedes Er-eignis bestimmt [56]:

Pe/p = n

√√√√n∏

i

P(i)e/p(E). (5.13)

Es werden nur die n Hits auf der Spur zur Bildung der Likelihood verwendet. Fur jedes Ereig-nis wird also die Anzahl n fur die Mittelung aus der aktuellen Hitanzahl dieses Ereignisses be-stimmt. Als Likelihoods fur die Elektron- und Protonhypothesen werden die Fits aus Abschnitt5.1.4 verwendet. Um die Abhangigkeit der Energieeintrage von der Lage zu berucksichtigen,wird immer der entsprechende Fit P

(i)e/p(E) der Lage verwendet. Bei der Multiplikation wird

also fur einen Hit in der i-ten Lage die Likelihood P(i)e/p(E) der i-ten Lage benutzt. Durch die

Mittelung geht naturlich ein Teil der Infomationen verloren, so dass es sich nicht mehr um

54

Page 61: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

-ln(L)0 0.2 0.4 0.6 0.8 1 1.2

rel.

Hae

ufi

gke

it

-510

-410

-310

-210

-11020 GeV Elektronen

100 GeV Protonen

112±Rejektion: 730 Effizienz: 89.99 %

Schwelle: 0.59

Abbildung 5.18: 20 GeV-Elektronen und 100 GeV-Protonen mit der Likelihood-Methode. Es ist auch derSchnitt bei 90 % Elektroneffizienz eingezeichnet, der die Klassifikationsschwelle festlegt.

den mathematisch besten Test im Sinne des Neyman-Pearson-Lemma handelt. Die endgultigeTestgroße ist nun also:

L =Pe

Pp + Pe. (5.14)

In Abbildung 5.18 ist das Ergebnis fur den Test der 20 GeV-Elektronen und der 100 GeV-Protonengezeigt. Die Rejektion liegt hier mit 730 ± 112 deutlich hoher als bei der Cluster-Counting-Methode, da die genauen Wahrscheinlichkeiten der Energiedepositionen in der jeweiligen La-ge verwendet werden.

5.2.4 Fisher-Diskriminante

Die Fisher-Diskriminante versucht das Problem der Dimensionsreduktion durch eine Trans-formation des Ereignisvektors ~x auf einen Skalar t zu losen [61],[62],[64]. Als Eingabe fur dieseAnalysemethode sollen die 20 Energiedeposition auf der Spur dienen.

t(~x) = ~aT~x. (5.15)

Um die Transformation ~a zu bestimmen, betrachtet man die Mittelwerte t0/1 und die Varianzσ2

t0/1:

t0/1 =∫

t(~x)P (~x)0/1d3x = ~aT ~x0/1, (5.16)

σ2t0/1

=∫

(t(~x)− t0/1)2P (~x)0/1d3x = ~aT V0/1~a. (5.17)

~x0/1 sind die Mittelwerte der jeweiligen Ereignisvektoren einer Klasse. P (~x)0/1 sind die 20-dimensionalen Likelihoods fur die Klassen 0 und 1. V0/1 ist die geschatzte Kovarianzmatrixeiner Klasse:

V0/1,mk =1

N0/1

N0/1∑

i=1

(x(i)0/1,m − x0/1,m)(x(i)

0/1,k − x0/1,k). (5.18)

55

Page 62: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

Fisher-Testgroesse t5 10 15 20 25 30 35 40 45 50

rel.

Hae

ufi

gke

it

-510

-410

-310

-210

-110

120 GeV Elektronen

100 GeV Protonen

45±Rejektion: 398 Effizienz: 89.99 %Schwelle: 12.23

Abbildung 5.19: 20 GeV-Elektronen und 100 GeV-Protonen mit der Fisher-Diskriminante. Es ist auchder Schnitt bei 90 % Elektroneffizienz eingezeichnet, der die Klassifikationsschwelle festlegt.

N0/1 ist die Anzahl der Ereignisse pro Klasse. Die Trennung zwischen den Klassen soll maximalsein. Hierfur sieht man sich den folgenden Quotienten an:

J(~a) =(t0 − t1)2

σ2t0

+ σ2t1

. (5.19)

Die Mittelwerte von t(~x) fur die beiden Klassen sollen moglichst weit auseinander liegen undeine schmale Breite haben. Innerhalb dieser Methode wird also die beste Trennung erreicht,wenn das Maximum von J(~a) bestimmt wird. Differenzieren und Umformen nach ~a liefert diefolgende Proportionalitat:

~a ∝ W−1(~x0 − ~x1). (5.20)

W =12(V0+V1) ist die gemittelte geschatzte Kovarianzmatrix. Man nennt diese Transformation

Fisher’sche Diskriminantenmethode. Nun kann man fur den Vektor ~x die 20 Energiedepositio-nen einsetzen. In Abbildung 5.19 ist das Ergebnis fur den Vergleich der 20 GeV-Elektronen mitden 100 GeV-Protonen gezeigt. Die Rejektion ist mit 398± 45 schlechter als bei der Likelihood-Methode und nur leicht besser als bei der Cluster-Counting-Methode.

5.2.5 Rejektionen bei allen betrachteten Energien

In Abbildung 5.20 werden die drei Methoden fur alle genommenen Daten bei elf verschie-denen Protonenergien miteinander verglichen. Die Likelihood-Methode liefert durchweg diehochsten Rejektionen, wahrend die Rejektionen von Cluster-Counting und Fisher-Diskriminanteden gleichen Verlauf im Bereich der Fehler nehmen. Die Rejektion liegt bei 20 GeV-Protonenergiemit der Likelihood-Methode bei 1529±424, was sogar uber den geforderten 103 liegt. Bei einemAnstieg der Energie fallt auch die Rejektion, da wie in Kapitel 4 beschrieben wurde, die Anzahlder erzeugten Ubergangsstrahlungsphotonen mit dem Lorentzfaktor γ ansteigt. Bis zu 200 GeVliegt die Rejektion von Cluster-Counting und Fisher-Diskriminante auch uber den geforderten102. Bei 250 GeV wird die Mindestanforderung nur noch von der Likelihood-Methode erfullt.

56

Page 63: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

Protonenergie [GeV]0 50 100 150 200 250

Rej

ekti

on

210

310

Likelihood

Cluster Counting

Fisher-Diskriminate

Abbildung 5.20: Rejektion fur alle klassischen Methoden in Abhangigkeit der Protonenergie

5.2.6 Toy-Monte-Carlo zum Einfluss der unterschiedlichen Overflow-Peaks

Wie in Abschnitt 5.1.1 angesprochen, haben die verschiedenen Lagen unterschiedliche Posi-tionen des Overflow-Peaks durch die unterschiedlichen VA-Chips. Um den Einfluss der Peak-position zu untersuchen, wird ein simples Toy-Monte-Carlo verwendet, was anhand der ein-zelnen Spektrenfits (Abschnitt 5.1.4) Energien zufallig erzeugen kann. Im Folgenden konnendie Aussagen uber die Rejektion nur qualitativ betrachtet werden, da es sich bei diesem Toy-MC nicht um ein ausgereiftes realistisches Modell handelt. Es ist nicht berucksichtigt, dassTeilchen durch Lagen fliegen konnen, ohne eine Energiedeposition zu hinterlassen, da derWirkungsquerschnitt der Photonen mit dem Detektorgas klein ist (siehe Abbildung 5.5). AufGrund dieser Vereinfachungen sind die Rejektionen in dieser Modellvorstellung viel hoher alsin der Realitat.Zunachst wird der Fall betrachtet, dass sich die Energiedepositionen in allen Lagen gleich ver-halten. Dazu werden je 150000 20 GeV-Elektron- und 100 GeV-Protonereignisse nach den Spek-tren der Lage 15 zufallig erzeugt. Diese Lage hat einen recht hohen Overflow bei ca. 30 keV,so dass dessen Einfluss moglichst gering ist. Die Analyse der Ereignisse erfolgt dann mit derLikelihood-Methode (Abbildung 5.21). Wenn man nun die Lagen 5 und 6 in einer zweiten Si-mulation nach ihren tatsachlichen Verteilungen mit niedrigen Overflows bei ca. 23 bzw. 24 keVund die anderen Lagen genauso wie in der ersten Simulation mit Lage 15 erzeugt, nimmt dieRejektion ab (Abbildung 5.22). Die Position des Overflows hat also, wie zu erwarten war, di-rekten Einfluss auf die Rejektion.In einem nachsten Schritt wird jede Lage mit Hilfe des Fits des tatsachlichen Energiespektrumserzeugt und analysiert (Abbildung 5.23). In diesem realistischeren Modell sinkt die Rejektionim Vergleich zu den vorherigen Modellen stark ab. Da die statistischen Fluktuationen geradebei hohen Energiedepositionen recht groß sind, ist es interessant eine Mittelung der Fits furdie Likelihood-Analyse zu testen. Fur die Elektronen andert sich die mittlere Energie in den

57

Page 64: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

-ln(L)0 0.2 0.4 0.6 0.8 1 1.2

rel.

Hae

ufi

gke

it

-510

-410

-310

-210

-110

20 GeV Elektronen

100 GeV Protonen

8099±Rejektion: 21428

Abbildung 5.21: Toy-MC: Likelihood mitnur einer Energieverteilung

-ln(L)0 0.2 0.4 0.6 0.8 1 1.2

rel.

Hae

ufi

gke

it

-510

-410

-310

-210

-110

20 GeV Elektronen

100 GeV Protonen

4743±Rejektion: 15000

Abbildung 5.22: Toy-MC: Likelihood mitabw. Verteilung fur Lagen 5 und 6

-ln(L)0 0.2 0.4 0.6 0.8 1 1.2

rel.

Hae

ufi

gke

it

-510

-410

-310

-210

-110

20 GeV Elektronen

100 GeV Protonen

869±Rejektion: 4838

Abbildung 5.23: Toy-MC: Erzeu-gung/Analyse: einzeln/einzeln

-ln(L)0 0.2 0.4 0.6 0.8 1 1.2

rel.

Hae

ufi

gke

it

-510

-410

-310

-210

-110

20 GeV Elektronen

100 GeV Protonen

496±Rejektion: 3333

Abbildung 5.24: Toy-MC: Erz./Ana.: ein-zeln/Mittelung (e−: Lagen 1-4 einzeln)

-ln(L)0 0.2 0.4 0.6 0.8 1 1.2

rel.

Hae

ufi

gke

it

-510

-410

-310

-210

-110

400±Rejektion: 2884

20 GeV Elektronen

100 GeV Protonen

Abbildung 5.25: Toy-MC: Erzeu-gung/Analyse: einzeln/Mittelung

58

Page 65: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

ersten vier Lagen stark, so dass hier die einzelnen Fits verwendet werden. Uber die restlichenLagen wird gemittelt. Bei den Protonen gibt es keine signifikanten Abweichungen der mittlerenEnergien (Abbildung 5.10), so dass uber alle Lagen gemittelt wird:

Pe(E) =

P (i)(E), Lage i = 1, . . . 4,

116

20∑

i=5

P(i)e , andere Lagen,

(5.21)

Pp(E) =120

20∑

i=1

P(i)p . (5.22)

In der Analyse mit gemittelten Fits nimmt die Rejektion ab (Abbildung 5.24). Die Rejektionsinkt noch weiter ab, wenn fur die Elektronen auch nicht mehr die besonderen Eigenschaftender ersten vier Lagen berucksichtigt werden und ebenfalls uber alle Lagen gemittelt wird (Ab-bildung 5.25). Die Rejektion ist also am besten, wenn die speziellen Eigenschaften jeder Lageberucksichtigt werden.Die unterschiedlichen Diagramme sehen sich alle recht ahnlich bis auf den Bereich um denSchnitt bei 90 % Elektroneffizienz, da der Unterschied in der Anzahl der falsch erkannten Pro-tonen auch nur in einem Bereich von ca. 10 bis ca. 50 variiert.

59

Page 66: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

5 Klassische Analyse

60

Page 67: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

6.1 Konzept

Abbildung 6.1: Nervenzelle, aus [65]

Bei kunstlichen neuronalen Netzen handelt es sich um ein sehr vereinfachtes mathematischesModell der Reizweiterleitung in biologischen Systemen wie z.B. dem Gehirn. Hier sind dieNervenzellen, die Neuronen genannt werden, durch Axone verbunden. Bei einer Stimulationder Nervenzellen oberhalb einer gewissen Schwelle kommt es zu einem elektrischen Puls, deruber die Axone, Synapsen und Dendriten an das nachste Neuron weitergeleitet wird und dortmit moglichen Pulsen aus anderen Neuronen die Eingabe in dieses Neuron bildet, welches wie-derum einen Puls aussendet, falls die gesamte Eingabe die Schwelle dieses Neurons ubersteigt.Die Pulse werden dabei zwischen den Neuronen unterschiedlich stark weitergeleitet. Das Ler-nen des Gehirns kann man sich dabei vereinfacht so vorstellen, dass die Starke der Axone, alsodas Gewicht der Signalweiterleitung, solange verandert wird, bis sich das Lernziel einstellt.Das Gehirn ist so in der Lage, Muster viel schneller wiederzuerkennen als ein Computer, dermit einem exakten Algorithmus das gleiche Probleme zu losen versucht. Selbst bei unsaubererPrasentation und Ausfall einiger Neuronen ist es dem Gehirn bis zu einem gewissen Grademoglich, das Muster richtig zu erkennen. Computer, die mit herkomlichen Algorithmen arbei-ten, liefern falsche Ergebnisse bei einer unsauberen Datenprasentation [66].

Ziel von kunstlichen neuronalen Netzen ist es nun, diese Lernfahigkeit des Gehirns auf Ma-schinen zu ubertragen. Dazu soll anhand von Trainingsmustern, die moglichst charakteristischfur das zu lernende Problem sind, eine allgemeine Abbildungsvorschrift gefunden werden, dienicht nur die Trainingsmuster richtig beschreibt, sondern auch andere ahnliche Muster. Vorteile

61

Page 68: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

x 1x 2x 3x 4

x iSx n

s

Abbildung 6.2: Modellneuron

sollen dabei die parallele Datenverarbeitung und das Zurechtkommen mit fehlerhaften Datensein.

6.2 Kunstliche neuronale Netze

In einem einfachen mathematischen Modell kann man ein Neuron durch folgende Eigenschaf-ten charakterisieren (siehe Abbildung 6.2):

@ Eingabevektor ~x,

@ Ausgabefunktion s.

Die Ausgabefunktion s erhalt dabei, die Summe∑

xi der einzelnen Komponenten des Einga-bevektors als Input. Eine der einfachsten Realisierungen fur eine Ausgabefunktion ist uber dieHeavyside-Funktion:

s(~x) = Θ

(∑

i

xi − S

), (6.1)

wobei S, die Schwelle des Neurons ist, oberhalb derer das Neuron eine Ausgabe hat.

Als nachsten Schritt stellt man sich nun eine Verknupfung von vielen dieser Neuronen vor(siehe Abbildung 6.3). Die Neuronen sind untereinander mit sog. Gewichten verbunden, diedie Starke des Weitertransports der Ausgabe eines Neurons bestimmen. Die i-te Komponentedes Eingabevektors in ein Neuron ist also:

xi = wi,j · sj , (6.2)

hierbei ist wi,j das Gewicht zwischen dem Neuron mit der Ausgabe sj und dem Neuron mitEingabe ~x.Es gibt nun verschiedene Moglichkeiten, die Neuronen mit den Gewichten zu einem Netz an-zuordnen. Die einfachste Moglichkeit, die auch fur die weitere Analyse verwendet wird, isteine schichtweise Anordnung. Es gibt eine Eingabeschicht, in die das zu lernende Muster ein-gegeben wird. Darauffolgend gibt es einige versteckte Lagen, wobei eine Lage in der Regelausreicht. Als letztes gibt es eine Ausgabeschicht. Die Daten werden in die erste Schicht einge-geben und erzeugen die Eingabe fur die erste versteckte Schicht, die wiederum die nachstenEingaben erzeugt. Die letzte Schicht ergibt dann die Ausgabe des Netzes. Diese Art des neuro-nalen Netzes heißt feedforward1-Netz (siehe Abbildung 6.3).

1engl.: feedforward - vorwarts geleitet

62

Page 69: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

Einga

be

Ausg

abe

Abbildung 6.3: Feedforward Netz mit einer versteckten Lage

Die Neuronen konnen auch durch alle anderen beliebigen Kombinationen miteinander verbun-den werden. So kann z.B. die Ausgabe eines Neurons wiederum als eigene Eingabe dienen. Eskonnen auch Verbindungen zwischen den Neuronen einer Schicht oder nicht aneinandergren-zender Schichten bestehen. Auf diese weiteren moglichen Modelle soll hier aber nicht einge-gangen werden, da die feedforward-Netze mit recht einfachen Algorithmen gut zu behandelnsind [66].

6.3 Training

Im nachsten Schritt muss die Lernfahigkeit in kunstlichen neuronalen Netze implementiertwerden. Man benotigt dafur einen Datensatz aus vielen einzelnen Ereignissen, die den allge-meinen Sachverhalt moglichst gut beschreiben. Dieser Datensatz soll vom neuronalen Netzerlernt werden, d.h. jedes Ereignis des Datensatzes soll auf einen bestimmten erwarteten Aus-gabevektor abgebildet werden.Man benotigt ein Maß fur den Fehler des Netzes, um festzustellen, wie gut die Abbildung derDaten auf den Ausgabevektor funktioniert. Hierfur bietet es sich an, die quadratische Abwei-chung der tatsachlichen Ausgabe ~o der letzen Lage von der zu lernenden Ausgabe ~E zu bilden.Fur das k-te Ereignis mit dem Eingabevektor ~xk ergibt sich also folgender Fehler fk:

fk(~w) =(

~Ek(~xk)− ~ok(~xk, ~w))2

. (6.3)

~w ist der Vektor aller Gewichte zwischen den Neuronen. Man mochte aber eine Fehlermessungerhalten, die moglichst unabhangig von den Ereignissen ist, mit denen der Fehler bestimmtwurde. Deshalb geht man zum mittleren quadratischen Fehler (MSE2) uber:

F (~w) = limN→∞

1N

N∑

k=1

fk(~w). (6.4)

2engl.: Mean Square Error

63

Page 70: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

N ist die Anzahl der zur Fehlerbestimmung verwendeten Ereignisse. Fur eine große Anzahlvon Ereignissen ist der Fehler nahezu unabhangig von den verwendeten Ereignissen.

Das Netz soll den Datensatz moglichst gut erlernen, so dass ein globales Minimum des Fehlersgefunden werden soll. Da der Fehler von allen Gewichten abhangt, kann es sich um ein sehrhochdimensionales Problem handeln, das Minimum in Abhangigkeit der Gewichte zu bestim-men. Es muss folgende Gleichung gelost werden:

~∇wF (~w) = ~0. (6.5)

Das Problem lasst sich im Allgemeinen nicht analytisch losen und eine numerische Bestim-mung der gesamten multidimensionalen Fehleroberflache ist mit einem zu großen Rechen-aufwand verbunden, so dass sich das Gradientenabstiegsverfahren als Losung anbietet. Dabeigeht man mit einer bestimmten Schrittweite in Richtung des negativen Gradienten auf der Feh-leroberflache (siehe Abbildung 6.4), was automatisch bei der richtigen Wahl der Schrittweite inein Minimum fuhrt. Es kann allerdings keine Aussage daruber gemacht werden, ob es sich umein lokales oder globales Minimum handelt. In der Regel sind mehrere Schritte notwendig umein Minimum zu erreichen. Man spricht von einem Training. Ein Trainingszyklus besteht ausder Berechnung des Fehlers und der Veranderung der Gewichte.

Fur den Fehler gilt:

~∇wF (~w) = limN→∞

1N

N∑

k=1

~∇wfk(~w). (6.6)

Also kann fur jedes Ereignis der Gradient des Fehlers separat berechnet werden, um anschlie-ßend durch Mittelung den mittleren Fehler zu bestimmen.

Mathematisch ergeben sich folgende Gleichungen fur die Veranderung der Gewichte zu einemkleineren Fehler hin [66]:

~w(t + 1) = ~w(t)−∆~w(t + 1), (6.7)

∆wi(t + 1) = η · limN→∞

1N

N∑

k=1

∂fk(~w)∂wi

. (6.8)

t zahlt die Trainingszyklen durch. η ist die Schrittweite, mit der das Gewicht in Richtung desMinimums verandert wird. Diese Schrittweite heißt Lernrate und beeinflusst das Training emp-findlich.

6.3.1 Backpropagation-Algorithmus

Der Backpropagation-Algorithmus stellt eine Vorgehensweise zur Verfugung, die Ableitungdes Fehlers nach jedem Gewicht zu berechnen, indem der Fehler der Ausgabe ruckwarts in dasNetz eingegeben wird. Fur den Algorithmus muss vorausgesetzt werden, dass die Neuroneneine differenzierbare Ausgabefunktion haben (weiteres in Abschnitt 6.3.4)In den Berechnungen folge ich weitgehend [66]. Die Aktivierung Ak

h,i eines Neurons, also dieSumme der Eingaben bei Prasentation von Ereignis k, berechnet sich nach:

Akh,i =

#(Nh−1)∑

j=1

okh−1,jwh,i,h−1,j . (6.9)

Der Index h zahlt dabei die Schichten des Netzes durch. i gibt die Position des Neurons inder Schicht an. j ist die Position des Neurons in der Schicht h − 1. wh,i,h−1,j gibt die Starke

64

Page 71: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

Gewicht 1 4 0-20 -15 -10 -5 0 5 10

Gewicht 1 0 0 -20-15

-10-5

05

10

Feh

ler

0

0.5

1

1.5

2

2.5

Abbildung 6.4: Beispiel einer Fehleroberflache

des Gewichts zwischen den Neuronen mit den Indizes (h, i) und (h − 1, j) an. #(Nh−1) ist dieAnzahl der Neuronen in der Vorgangerschicht. ok

h−1,j ist die Ausgabe des j-ten Neurons ausder Vorgangerschicht. Die Ausgabe des Neurons (h, i) berechnet sich nach

okh,i = s(Ak

h,i). (6.10)

Bildet man nun die Ableitung des Fehlers nach einem beliebigen Gewicht, so gilt unter Ver-wendung der Kettenregel:

∂fk(~w)∂wh,i,h−1,j

=∂fk(~w)∂Ak

h,i

· ∂Akh,i

∂wh,i,h−1,j. (6.11)

Es ergibt sich mit δkh,i ≡

∂fk(~w)∂Ak

h,i

:

∂fk(~w)∂wh,i,h−1,j

= δkh,i ·

∂wh,i,h−1,j

#(Nh−1)∑

l=1

okh−1,lwh,i,h−1,l

︸ ︷︷ ︸δj,lo

kh−1,l

= δkh,io

kh−1,j . (6.12)

Die Ableitung des mittleren Fehlers nach einem bestimmten Gewicht lasst sich also schreibenals:

∂F (~w)∂wh,i,h−1,j

= limN→∞

1N

N∑

k=1

δkh,io

kh−1,j . (6.13)

Fur die Berechnung von δkh,i gilt:

δkh,i =

∂fk(~w)∂Ak

h,i

=∂fk(~w)∂ok

h,i

· ∂okh,i

∂Akh,i︸ ︷︷ ︸

(6.10)= s′(Ak

h,i)

. (6.14)

65

Page 72: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

Der erste Term aus Gleichung (6.14) ist abhangig von der Art der Schicht. Es gibt zwei Artenvon Schichten: die Ausgabeschicht und die versteckten Schichten. Fur die Ausgabeschicht giltmit (6.3):

∂fk(~w)∂ok

h,i

=∂

∂okh,i

(~Ek(~xk)− ~ok

h(~xk, ~w))2

= −2 ·(Ek

i (~xk)− okh,i(~xk, ~w)

). (6.15)

Fur die versteckten Schichten ist die Ableitung von fk(~w) abhangig von den Ausgaben derletzten Schicht, deswegen gilt fur die Berechnung:

∂fk(~w)∂ok

h,i

=#(Nh+1)∑

l=1

∂fk(~w)∂ok

h+1,l

∂okh+1,l

∂okh,i

. (6.16)

Wenn man jetzt mit Gleichung (6.10) substituiert, ergibt sich:

∂fk(~w)∂ok

h,i

=#(Nh+1)∑

l=1

∂fk(~w)∂Ak

h+1,l︸ ︷︷ ︸δkh+1,l

∂Akh+1,l

∂okh,i︸ ︷︷ ︸

(6.9)=

wh+1,i,h,l

=#(Nh+1)∑

l=1

δkh+1,l · wh+1,i,h,l. (6.17)

Es gilt also fur die Ableitung des mittleren Fehlers je nach Lage:

∂F (~w)∂wh,i,h−1,j

= limN→∞

1N

N∑

k=1

okh−1,j ·s′(Ak

h,i)·

(−2) ·(Ek

i (~xk)− okh,i(~xk, ~w)

), Ausgabeschicht,

#(Nh+1)∑

l=1

δkh+1,l · wh+1,i,h,l, versteckte Schichten.

(6.18)

6.3.2 Optimale Lernrate

Im vorherigen Abschnitt wurde gezeigt, wie die Ableitung der Fehlerfunktion nach jedem Ge-wicht berechnet wird. Als nachsten wichtigen Schritt muss man sich der Lernrate η aus Glei-chung (6.8) zuwenden, die entscheidend die Konvergenz des Verfahrens bestimmt und beifalscher Wahl entweder zu einem Stillstand des Lernprozesses oder zu einer drastischen Ver-schlechterung des Netzes fuhren kann. Dieses Verhalten soll im Folgenden genauer erklartwerden.

Wenn man fur den Bereich um ein Minimum des Fehlers in Abhangigkeit eines Gewichtes einequadratische Naherung macht (siehe Abbildung 6.5), gilt:

F (w) = F (waktuell) + (w − waktuell)dF (waktuell)

dw+

12(w − waktuell)2

d2F (waktuell)dw2

. (6.19)

Da der Fehler minimal sein soll, gilt:

wmin = waktuell −(

d2F (waktuell)dw2

)−1

︸ ︷︷ ︸ηopt

dF (waktuell)dw

. (6.20)

Die optimale Lernrate ist also der Kehrwert der zweiten Ableitung der Fehlerfunktion nachden Gewichten. Wenn man diese Naherung auf ein multidimensionales Problem mit vielen Ge-wichten ausweitet, ergibt sich eine Matrix von Ableitungen, die Hesse-Matrix genannt wird. Da

66

Page 73: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

Abbildung 6.5: Gradientenabstieg bei verschiedenen Lernraten. In Abbildung (i) erkennt man, dass einezu kleine Lernrate η nur fur eine langsame Konvergenz in ein Minimum sorgt. Eine optimale Lernrateηopt erledigt dies in einem Schritt. Wenn man die Lernrate großer als ηopt wahlt, wird das Training wiederlangsamer oder es kommt sogar zu einer Entfernung vom Minimum (η > 2ηopt). Abbildung (ii) zeigt,dass die optimale Lernrate das Inverse der zweiten Ableitung der Fehlerfunktion ist, aus [67]

die zweiten Ableitungen der Fehlerfunktion fur alle Gewichte im Allgemeinen unterschiedlichsind, ergibt sich fur jedes Gewicht eine individuelle Lernrate [67].Auch im biologischen Vorbild ist es leicht einsichtig, dass nicht alle Axonen zwischen den Neu-ronen gleich stark trainiert werden mussen, sondern eine dem zu lernenden Problem angepas-ste Veranderung pro Axon vorgenommen werden muss.In Abbildung 6.5 erkennt man, dass sich der Fehler vergroßert, wenn man eine Lernrate ver-wendet, die zweimal großer als die optimale Lernrate ηopt ist. Umgekehrt verandert sich derFehler nur wenig, wenn man eine zu kleine Lernrate wahlt.

6.3.3 Trainingsabbruch

Eines der Hauptprobleme neben der richtigen Wahl der Lernraten ist die Bestimmung des Trai-ningsabbruchs. Ziel ist es, dass Training dann abzubrechen, wenn das Netz die beste Konfigu-ration in Bezug auf das allgemeine Problem erreicht hat. Als Kriterium wird hierfur der mittle-re quadratische Fehler des Netzes verwendet. Es ist nun aber so, dass der Backpropagation-Algorithmus eine globale Konvergenz besitzt [68], und sich der Fehler somit fur die Trai-ningsereignisse immer weiter verkleinert, wenn man die Lernraten kleiner als das doppelte deroptimalen Lernrate gewahlt hat. Man spricht von einem Auswendiglernen der Trainingsereig-nisse durch das Netz. Dieses Verhalten ist nicht erwunscht, da man eine moglichst gute allge-meine Abbildungsvorschrift erhalten mochte.

Um das Auswendiglernen zu verhindern, wird der komplette Datensatz in drei Unterdatensatze

67

Page 74: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

Trainingszyklus0 20 40 60 80 100 120

MS

E

-110

TrainingValidation

Abbildung 6.6: Trainings- und Validationsfehler

aufgeteilt, namlich den Trainings-, den Validations- und den Analysedatensatz. Es wird nunfolgendermaßen vorgegangen: Die Veranderung der Gewichte wird nur auf Grundlage derTrainingsereignisse nach dem Backpropagation-Algorithmus berechnet. Nach jedem Trainings-schritt wird dann der mittlere quadratische Fehler der Validationsereignisse mitprotokolliert.Das Training wird abgebrochen, wenn der Validationsfehler sein globales Minimum erreichthat (siehe Abbildung 6.6) [64]. Eine endgultige Aussage wird mit dem Analysedatensatz ge-macht. Mit dieser Methode kann man sicher sein, ein Auswendiglernen weitestgehend zu ver-hindern und das Netz tatsachlich an einem unabhangigen Datensatz zu testen.

Diese Methode erfordert einen Datensatz, der das Problem moglichst gut beschreibt und großgenug ist, um in drei Unterdatensatze unterteilt zu werden, ohne an statistischer Signifikanzzu verlieren.

6.3.4 Nutzliche Verbesserungen von neuronalen Netzen

Ausgabefunktion

Die Heavyside-Funktion als Ausgabefunktion andert unstetig ab einer bestimmten Schwelledie Ausgabe von null auf eins. Bei dem Vorbild neuronaler Netze in der Natur gibt es solcheunstetigen Sprunge nicht, sondern immer einen glatten, differenzierbaren Ubergang. Es eignensich als Ausgabefunktionen besonders gut die sog. sigmoiden Funktionen. Diese Funktionens(x) sind monoton wachsend, differenzierbar und haben die Eigenschaften [66]:

limx→∞ s(x) = a1 ∧ lim

x→−∞ s(x) = a2 mit a2 < a1. (6.21)

Die zwei gebrauchlichsten Funktionen sind hierbei einerseits die logistische Funktion:

s(x) =1

1 + exp(−x), (6.22)

und der Tangens Hyperbolicus (siehe Abbildung 6.7)

s(x) = tanh(x). (6.23)

Die Wahl von tanh als Ausgabefunktion ist zu bevorzugen, da die Funktion um null punkt-symmetrisch ist und Ausgaben mit einem Mittelwert von null produziert. Bei der logistischenFunktion ist der Mittelwert immer positiv. Mit einer um null symmetrischen Funktion konver-giert das Training meist schneller [67].

68

Page 75: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

-3 -2 -1 0 1 2 3

-1,0

-0,5

0,0

0,5

1,0

y

x

Abbildung 6.7: Tangens Hyperbolicus

Bias

Der Tangens Hyperbolicus wird nur fur die versteckten Schichten und die Ausgabeschicht alsAusgabefunktion gewahlt. Der Transport der Daten durch die Eingabeschicht in das neuronaleNetze erfolgt linear. Man konnte nun jedem Eingabeneuron eine feste Schwelle zuweisen, ober-halb derer die Eingabe uberhaupt erst transportiert wird. Diese Schwellen waren im Verlauf desTrainings nicht mehr anderbar. Um anpassbare Schwellen zu haben, fuhrt man in der Einga-beschicht ein Bias-Neuron ein. Dieses Neuron hat fur jedes Ereignis die Ausgabe 1. Durch dievariablen Gewichte zu den Neuronen der versteckten Schicht erhalt man eine variable Schwel-le fur jedes Eingabeneuron [66]. Es wird schnell klar, warum es sich um variable Schwellenhandelt. Bisher musste fur das i-te lineare Neuron die Schwelle Si uberschritten werden, also∑n

j xi,j ≥ Si, wobei xi,j die n Eingaben in das i-te Neuron sind. Bei Einfuhrung eines Bias-Neurons wird die Schwelle fur jedes Neuron auf 0 gesetzt:

n∑

j

xi,j + wi,0 · 1 ≥ 0. (6.24)

Es gibt also eine weitere Eingabe in das neuronale Netz, die immer konstant 1 ist, so dassuber die Gewichte wi,0, die das Bias-Neuron mit den Neuronen der nachsten Schicht verbindet,eine variable Schwelle eingerichtet ist, die uber den jeweiligen Lernalgorithmus ganz leichtmitangepasst werden kann.

Normierung

Bevor die Daten durch das Netz propagiert werden, ist es sinnvoll eine Transformation vor-zunehmen. Ziel ist die gleichwertige Berucksichtigung aller Eingabeneuronen, da diese sehrverschiedene Großenordnungen haben konnen. Da die Ausgabefunktion um null punktsym-metrisch ist, sollen auch die Mittelwerte der transformierten Daten fur jedes Eingabeneuron 0sein. Ebenfalls hilfreich ist eine gleichmaßige Breite fur alle Eingaben von 1. Es gibt nun zweiMethoden diese Transformation durchzufuhren [67]:

69

Page 76: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

( 1 )

( 2 )

Abbildung 6.8: Datentransformation, nach [67]

Methode 1: Es werden der Mittelwert x und die Varianz σ fur jedes Eingabeneuron aus allenTrainingsdaten bestimmt. Dann wird von den echten Daten xi der Mittelwert abgezogenund auf die Varianz normiert [64]:

xtrafoi =

xi − x

σ. (6.25)

Die Transformation ist in zwei Dimensionen in Abbildung 6.8 (1) dargestellt.

Methode 2: Auch hier wird der Mittelwert fur jedes Eingabeneuron bestimmt. Zusatzlich wirddie Kovarianzmatrix mit folgender Formel abgeschatzt:

V =∑

n

(~xn − ~x)(~xn − ~x)T . (6.26)

Um eventuelle Korrelationen der Eingaben zu eliminieren, wird diese Matrix V auf Diago-nalgestalt transformiert:

D = θV θT . (6.27)

Auf der Spur von D stehen die Eigenwerte von V . Fur θ gilt:

θθT = 1. (6.28)

Wenn man die Daten mit θ transformiert und den i-ten Eintrag des transformierten Vek-tors durch die Wurzel des i-ten Eigenwertes teilt, ergibt sich als neue Kovarianzmatrix dertransfomierten Daten die Einheitsmatrix. Die Transformation ist in zwei Dimensionen inAbbildung 6.8 (2) dargestellt .

Startgewichte

Die Wahl der Startgewichte fur das neuronale Netz hat einen entscheidenden Einfluss auf denVerlauf und den Ausgang des Trainings. Die Gewichte sollten auf jedenfall zufallig verteilt sein,da so ungewollte Symmetrien nicht auftreten konnen. Dem Algorithmus ist es sonst vielleichtnicht moglich, die Symmetrie zu brechen, und die Verbesserung des Netzes wird behindert.

Es zeigt sich, dass eine Normalverteilung fur die Zufallsgewichte gut geeignet ist. Es bleibtalso die Frage nach der Breite der Normalverteilung. Die Daten wurden so transformiert, dasssie eine Breite von 1 haben, wenn sie die Eingabeschicht verlassen. Die Werte, die die nachsteSchicht verlassen, sollen ebenfalls wieder eine Breite von 1 haben. Die Gewichte mussen also

70

Page 77: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

entsprechend gewahlt werden. Die Ausgabe der zweiten Schicht ist fur das i-te Neuron inlinearer Naherung:

oi =n∑

j=1

wi,jxj . (6.29)

Die Formel fur die Fehlerfortpflanzung lautet:

σoi =

√√√√n∑

j=1

(doi

dxj

)2

σ2j . (6.30)

xj ist die Ausgabe und σj ist die Breite der Daten aus der Vorgangerschicht. Die Breite derAusgabe ist also:

σoi =

√√√√n∑

j=1

w2i,j . (6.31)

Fur den Erwartungswert 〈w2i,j〉 ergibt sich bei Annahme einer Normalverteilung der Gewichte

um 0 von

f(wi,j) =1√

2πσ2w

exp

(−w2

i,j

2σ2w

)(6.32)

folgender Erwartungswert:〈w2

i,j〉 = σ2w. (6.33)

Unter der Annahme σ2oi

=∑n

j=1〈w2i,j〉 = 1 ergibt sich fur die Breite der Gewichtsverteilung:

σw =1√n

. (6.34)

Die Breite der Zufallsgewichte hangt also von der Anzahl der Eingaben in die nachste Schichtab.

Da die Gewichte zufallig nach einer Gauß-Verteilung erzeugt werden, kann es passieren, dasses einige wenige Ausreißer mit besonders großen oder kleinen Gewichten gibt. Diese Gewichtekonnen von Anfang an dafur sorgen, dass sich das Training nur auf diese Gewichte konzen-triert. Es sollte darauf geachtet werden, dass die gewurfelten Startgewichte alle in einem Be-reich von 3σ um den Mittelwert 0 liegen. Man sollte auch immer Tests mit verschiedenen An-fangszahlen fur den Zufallszahlengenerator machen, da die Startgewichte auch einen Einflussauf den Trainingsausgang haben. Die Anzahl der Gewichte ist in den meisten Fallen namlichnoch nicht hoch genug, um von der genauen Kombination der Gewichtswerte unabhangig zusein. Um moglichst gute Anfangsbedingungen des Netzes zur Verfugung stellen zu konnen,mussen also verschiedenen Kombinationen der Gewichtswerte getestet werden.

Batch-Modus und wechselnde Ereignisreihenfolge

Es gibt verschiedene Arten, die Veranderung der Gewichte durchzufuhren. Im Online-Moduswerden alle Ableitungen der Fehlerfunktion fur ein Ereignis berechnet und die Veranderungder Gewichte nach jedem Ereignis durchgefuhrt. Im Batch3-Modus werden die mittleren Ab-leitungen aus allen Ereignissen berechnet und erst dann eine Veranderung der Gewichte vor-genommen. Als beste Methode erweist sich eine Kombination der beiden Methoden, bei dernach Mini-Batches mit 200 Ereignissen eine Veranderung der Gewichte erfolgt. Die Gewichte

3engl.: batch - Bundel

71

Page 78: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

verandern sich so nicht zu schnell in Richtungen, die durch außergewohnliche Ereignisse er-zeugt werden, da es immer noch eine Mittelung gibt. Gleichzeitig ist das Training schneller alsim Batch-Modus, bei dem es nur viel kleinere Veranderungen der Gewichte gibt. Durch dieMini-Batches ist auch gewahrleistet, dass die Gewichte in andere Minima springen konnen,was im Batch-Modus durch die Mittelung uber sehr viele Ereignisse kaum moglich ist.

Ein Trainingszyklus besteht aus der einmaligen Prasentation jedes Mini-Batches. Die Reihen-folge der Batches muss zufallig gewahlt werden, da sonst die Gefahr besteht, dass es eine Vor-eingenommenheit auf die Abfolge der Batches gibt.

6.3.5 Effektive Lernmethoden

δ-δ-Algorithmus

Zur Bestimmung der optimalen Lernrate ware es am besten, die Hesse-Matrix aus Gleichung(6.20) zu ermitteln. Prinzpiell kann dies in einem weiteren Backpropagation-Schritt geschehen[64], jedoch ist die benotigte Rechenleistung bei N Gewichten von der Ordnung O(N2), wasbei einer großen Anzahl von Gewichten schnell zu einem sehr langsamen Training fuhrt. AuchNaherungen zur Hesse-Matrix sind entweder recht rechenaufwendig oder zu ungenau [67], sodass es am einfachsten ist, sich zur Ermittlung von guten individuellen Lernraten zu uberlegen,welche Anforderungen man hat. Wenn man sich auf einem flachen Stuck der Fehleroberflachebefindet, kann das Training mit einer großeren Lernrate beschleunigt werden. Jedoch muss dieLernrate wieder reduziert werden, falls die Krummung der Fehleroberflache zunimmt. Zusatz-lich zu der Veranderung der Gewichte muss also eine Veranderung der Lernraten vorgenom-men werden. Die Veranderung der Gewichte geschieht mit folgender Gleichung:

∆wi(t + 1) = ηi(t + 1) · 1N

N∑

k=1

∂fk(~w)∂wi

(t + 1) + α ·∆wi(t). (6.35)

t zahlt die Lernzyklen durch, ηi ist die individuelle Lernrate und α ein sog. Moment, das denAnteil angibt, mit dem zusatzlich zur neu berechneten Veranderung die Veranderung aus demletzten Schritt wiederholt wird. So hat das Training eine Art Gedachtnis und haufige Fluktua-tionen der Veranderungsrichtung werden vermieden. Die Veranderung der Lernrate erfolgtnach dem Schema:

ηi(t + 1) =

ηi(t) · η−,∂fk(~w)

∂wi(t + 1)∂fk(~w)

∂wi(t) < 0,

ηi(t) + η+,∂fk(~w)

∂wi(t + 1)∂fk(~w)

∂wi(t) > 0,

ηi(t), sonst.

(6.36)

Wenn sich aufeinanderfolgende Gradienten im Vorzeichen andern, wurde das Minimum uber-sprungen und die Lernrate wird multiplikativ mit dem zunachst frei wahlbaren η− verkleinert.Wenn das Vorzeichen der Gradienten gleich bleibt, kann die Lernrate vergroßert werden. DieseVeranderung erfolgt nur additiv mit dem frei wahlbaren η+, da die Lernraten sonst zu schnellzu groß werden [69].

Resilient Propagation (RProp)

Eine weitere Moglichkeit ist Resilient4 Propagation zur Bestimmung guter individueller Lern-raten. Der Gradient auf der Fehleroberflache gibt hier nur die Richtungsanderung vor und tragtnicht mehr zum Wert der tatsachlichen Veranderung der Gewichte bei. Falls zwei aufeinander-folgende Gradienten das Vorzeichen wechseln, wird dieser Schritt zuruckgenommen und im

4engl.: resilient - dehnbar

72

Page 79: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

nachsten Schritt eine Veranderung mit einer kleineren Lernrate durchgefuhrt. Die Veranderungder Lernraten erfolgt dabei auch nach Gleichung (6.36) [69].

Parametervariation

Die Wahl der richtigen Lernparameter ist bei beiden Methoden sehr wichtig und beeinflusstdie Gute des Netzes empfindlich. Um einen guten Satz von Parametern in der spater folgendenAnalyse zu erhalten, werden Parametervariationen durchgefuhrt.

6.4 Gutetest

Eine der Hauptaufgaben, fur die neuronale Netze sehr gut geeignet sind, ist die Klassifikation.Wenn zwischen zwei Klassen a und b unterschieden werden soll und die Ausgabefunktion derAusgabeschicht ein Tangens Hyperbolicus ist, nimmt man praktischer Weise die beiden asymp-totischen Grenzwerte des tanh, namlich -1 und 1, als Erwartungswerte fur die Klassen a undb. Um die Gute des trainierten Netzes zu uberprufen, bildet man zunachst fur jede Ausgabe ofolgendes Verhaltnis:

Pa =ηa

ηa + ηb. (6.37)

ηa/b ist dabei der Anteil der jeweiligen Ereignisse der Klasse bei Ausgabe o. Der mittlere qua-dratische Fehler fur jede Ausgabe o lasst sich angeben als:

F (o) = Pa(1− o)2 + (1− Pa)(−1− o)2. (6.38)

Hier geht die Annahme ein, dass die Klasse a einen Erwartungswert von 1 und die Klasse beinen Erwartungswert von -1 hat. Der Fehler soll nun fur jede Ausgabe o minimal sein. Diffe-renzieren dF (o)/do = 0 ergibt:

Pa =o + 1

2. (6.39)

Das Verhaltnis aus Gleichung (6.37) muss also bei einem guten Netz der Funktion aus Glei-chung (6.39) folgen [70].

6.5 Einsatzgebiete

Neuronale Netze konnen bei verschiedensten Aufgaben in Wirtschaft und Technik eingesetztwerden. Das hier vorgestellte Netz wurde im Hinblick auf die Klassifikation in zwei Klassen,die durch Ereignisse mit einer recht großen Anzahl von Parametern charakterisiert werden, op-timiert. Neuronale Netze konnen auch bei viel komplizierteren Anwendungen wie der Dich-teapproximation oder dem Anpassen von Funktionen verwendet werden. In anderen Algorith-men zur Bestimmung der besten Netzarchitektur konnen noch viele weitere mathematischeMethoden zum Einsatz kommen. Die Hauptprobleme dieser Algorithmen sind dabei immer:

@ Wie findet man die beste Netzarchitektur?

@ Wie gut ist die Verallgemeinerungsfahigkeit?

@ Wie vergleicht man Netze mit unterschiedlichen Architekturen moglichst sinnvoll?

@ Wie groß ist der numerische Aufwand?

Es gibt fur diese Probleme keine allgemein gultige Losung, so dass man zu einem gegebenenProblem nie das allgemein bestmogliche Netz angeben kann. Eine Optimierung des Netzeskann immer nur im Rahmen der Lernmethode geschehen.

73

Page 80: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

6 Einfuhrung in neuronale Netze

74

Page 81: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zurLepton-Hadron-Trennung imUbergangsstrahlungsdetektor

In diesem Kapitel soll das Konzept der neuronalen Netze, wie es im vorangegangenen Kapitelbeschrieben wurde, auf das vorliegende Problem der Klassifikation von Elektronen und Proto-nen anhand von Ubergangsstrahlung angewandt werden. Der Einsatz von neuronalen Netzenbietet sich an, weil es sich um ein hochdimensionales Klassifikationsproblem handelt und neu-ronale Netze die Fahigkeit besitzen, komplexe Zusammenhange und Muster zu erkennen. Wiegut ein neuronales Netz eine Abbildungsvorschrift fur ein Problem finden kann, ist sehr starkvon der Netzarchitektur, der Lernmethode und den Lernparametern abhangig. Ein wichtigerTeil der Analyse ist also das Auffinden guter Parameter fur das jeweilige Problem.

Hier sollen neuronale Netze auf Elektronen und Protonen trainiert werden. Die Klassifikationsoll anhand des Eingabevektors eines Ereignisses in das Netz stattfinden, der in einem erstenSchritt aus den 20 Energiedepositionen auf der Spur eines Ereignisses besteht. In einem wei-teren Schritt werden dann alle verschiedenen Analysemethoden in einem Netz zusammenge-fasst (siehe Abschnitt 7.5).Das neuronale Netz soll eine moglichst allgemeine Abbildungsvorschrift finden, die alle Elek-tronereignisse auf den Wert 1 und alle Protonereignisse auf den Wert -1 abbildet. Auf dieseWeise soll es zu einer guten Trennung von Elektronen und Protonen kommen. Eine weite-re Aufgabe des Netzes ist das Auffinden von Korrelationen der Energiedepositionen zwischenden unterschiedlichen Lagen, da bei den Elektronen die mittlere Energiedeposition mit der An-zahl der durchflogenen Lagen wachst (Abbildung 5.10). Das neuronale Netz soll in der Lagesein, diesen Sachverhalt ausfindig zu machen.

7.1 Analyseprozess

Fur den Analyseprozess werden die Datensatze der Elektronen und Protonen in drei Unterda-tensatze aufgeteilt (Abbildung 7.1). 40 % der Daten werden zum Training und 20 % zur Valida-tion verwendet. So kann vermieden werden, dass das Netz ubertrainiert wird (Abschnitt 7.5),wenn man das Training bei minimalem Validationsfehler abbricht. Die Abbildungsvorschrifthangt somit wenig von den genauen Trainingsereignissen ab. An dieser Stelle sei betont, dassfur das Training, also die Veranderung der Gewichte, ausschließlich der Trainingsdatensatzverwendet wird. Die tatsachliche Auswertung wird mit den restlichen 40 % des Datensatzesvorgenommen. Die Aufteilung der Ereignisse in die drei Unterdatensatze erfolgt zufallig.Anhand der Trainingsdaten wird die Normierung berechnet (siehe Abschnitt 6.3.4), die auchauf die Validations- und Analysedaten angewandt wird.Die Schwierigkeit, dass nicht gleich viele Elektron- und Protondaten aufgezeichnet wurden,wird zunachst auf folgende Weise gelost. Im Folgenden wird ein Netz zunachst auf 20 GeV-Elektronen und 100 GeV-Protonen trainiert, um die beste Lernmethode zu ermitteln. Die Stati-stik der Elektronen und Protonen ist zwar recht ahnlich (siehe Tabelle 4.1), jedoch nicht exaktgleich. Um eine Tendenz des Netzes in Richtung von Elektronen oder Protonen zu vermei-den, wird die hohere Anzahl von Elektrontrainingsdaten auf die niedrigere der Protontrai-ningsdaten herabgesetzt. Die Elektron- und Protontrainingsdaten werden dann in Batches von

75

Page 82: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Abbildung 7.1: Schema des Analyseprozesses

je 200 zufallig gemischten Trainingsereignissen eingeordnet. Nachdem solch ein Batch demNetz prasentiert wurde, werden die Gewichte mit der jeweiligen Lernmethode angepasst. EinTrainingszyklus ist beendet, wenn alle Batches einmal prasentiert wurden. Fur den nachstenTrainingszyklus wird die Reihenfolge der Batches zufallig verandert, damit es nicht zu einerVoreingenommenheit in Bezug auf die Reihenfolge kommt.Nach der Ermittlung der besten Trainingsmethode mit jeweils nur recht grob variierten Para-metern, wird eine genauere Variation der Lernparameter bei der besten Methode vorgenom-men. Hierzu werden alle Datensatze in einem Training verwendet, das bedeutet, dass der Pro-tondatensatz aus allen Datensatzen der Energien von 20 bis 250 GeV besteht. Dies hat den Vor-teil, dass zur Analyse nur ein Netz statt vieler verschiedener Netze fur die jeweiligen Energienverwendet werden kann. Es kann zusatzlich auch die teilweise recht geringe Statistik einigerProtondatensatze, wie z.B. bei 60 oder 80 GeV, unter der Annahme, dass sich Datensatze mitbenachbarten Energien ahnlich verhalten, ausgeglichen werden. Das Problem des relativ zumzusammengefassten Protondatensatz recht kleinen Elektrondatensatzes fur das Training wirdso gelost, dass die Elektrontrainingsereignisse so oft dem Netz prasentiert werden, bis sie mitder Anzahl der Protontrainingsereignisse ubereinstimmen. Es ist namlich wichtig, dass beideKlassen durch die gleiche Anzahl von Trainingsereignissen vertreten werden, damit eine Vor-eingenommenheit des Netzes in Richtung der Protonen vermieden wird. Die Trainingsereignis-se werden zufallig auf Batches aufgeteilt. Damit die Anpassung der Gewichte nach der Prasen-tation eines Batches nicht in eine bestimmte Richtung (Elektron oder Proton) geschieht, mussenungefahr gleich viele Elektron- und Protonereignisse in einem Batch enthalten sein. Dies kannnur mit einer Angleichung der Anzahl der Trainingereignisse erreicht werden. Durch die haufi-gere Eingabe der Elektrondaten wird gewahrleistet, dass eine ausreichende Anzahl von Elek-tronen fur die Analyse ubrig bleiben, die das Netz vorher noch nie prasentiert bekommen hat.

7.2 Ermittlung der besten Lernmethode

Das verwendete neuronale Netz besteht aus drei Lagen. Die Eingabeschicht besteht aus 20Neuronen, die die Eingaben identisch weiterleiten, und einem Bias-Neuron, das die Funkti-on einer variablen Schwelle fur jedes Eingabeneuron ubernimmt. Die zweite, versteckte Lage

76

Page 83: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

hat als Ausgabefunktion den Tangens Hyperbolicus. Die dritte Schicht besteht aus nur einemAusgabeneuron, welches ebenfalls einen Tangens Hyperbolicus als Ausgabefunktion hat.Wie in Abschnitt 6.3.2 gezeigt wurde, bietet sich als optimale Lernrate eines Netzes die Hesse-Matrix an. Die exakte Berechnung dieser Matrix ist theoretisch moglich, allerdings sehr rechen-aufwendig. Der Rechenaufwand fur den Backpropagation-Algorithmus ist bei N Gewichtenvon der Großenordnung O(N). Fur die Berechnung der Hesse-Matrix ist der Rechenaufwandallerdings von der Großenordnung O(N2). Bei recht großen neuronalen Netzen, wie sie hierschon auf Grund der 20 Eingabeneuronen Verwendung finden, ist der Rechenaufwand viel zuhoch. Naherungen zur Hesse-Matrix, z.B. mit dem Levenberg-Marquardt-Verfahren [64],[67]sind jedoch zu ungenau. Aus diesem Grund werden im Folgenden nur noch die RPROP- undδ-δ-Lernregel betrachtet.Als erstes soll nun bestimmt werden, welche der beiden Lernmethoden im Weiteren verwen-det wird. Zusatzlich soll entschieden werden, ob statt der Energieeingaben die entspechendenLikelihood-Raten − ln(L(i)) = ln(P (i)

e /(P (i)p + P

(i)e )) verwendet werden sollen. Die P

(i)e/p sind

die gefitteten Wahrscheinlichkeiten fur Elektronen und Protonen der jeweiligen Lage i bei ei-ner bestimmten Teilchenenergie. Auch uber die Art der Normierung der Eingabedaten mussentschieden werden (siehe Abschnitt 6.3.4, Methode 1 und 2).Die Variationen werden mit den 20 GeV Elektronen und den 100 GeV Protonen durchgefuhrt.Bei diesen Energien liegt ungefahr die gleich Statistik vor und es handelt sich um eine mittlereEnergie des aufgenommenen Energiebereichs von 20 bis 250 GeV.

7.2.1 Resilient Propagation (RProp)

Als Parameter fur das RProp-Verfahren werden gewahlt:

Anfangswert aller Lernraten: η = 10−4,Lernrate verkleinern: η− = 0, 3 . . . 0.9,Lernrate vergroßern: η+ = 10−6 . . . 10−4.

Das Training wird nach 400 Zyklen abgebrochen. Dann wird nach dem geringsten Valida-tionsfehler gesucht und noch einmal bis zu dieser Stelle trainiert. Die Ergebnisse dieser Va-riation fur 30 mittlere Neuronen ist in den Abbildungen 7.2 bis 7.4 gezeigt. Man erkennt deut-liche Unterschiede zwischen den verschiedenen Methoden. Die Normierung nach Methode 1mit der Eingabe der Energien liefert dabei die besten Rejektionen, da hier die Variationen derEingabedaten untereinander großer sind und das neuronale Netz somit eine bessere Entschei-dungsgrundlage besitzt.Die Eingabe von Likelihood-Werten sorgt nicht fur eine signifikante Trennung. Die Ursachehierfur ist wahrscheinlich darin zu sehen, dass die Likelihoods zu sensitiv auf den genauenEnergiewert sind, da sie nicht nur linear von ihnen abhangen. Da der Analysedatensatz abernur ahnliche und nicht identische Ereignisse zu den Trainingsdaten bereithalt, sind diese Un-terschiede schon zu groß.In Abschnitt 7.6 wird der Einfluss von Verschmierungen der Originalenergiedepositionen uber-pruft. Auch dort zeigt sich, dass die Likelihood-Methode sensitiver auf die Verschmierung rea-giert als die energiebasierten Analysemethoden.

7.2.2 δ-δ-Lernregel

Als Parameter fur das δ-δ-Verfahren werden gewahlt:

Anfangswert aller Lernraten: η = 10−2,Moment: α = 0, 3,Lernrate verkleinern: η− = 0, 3 . . . 0, 9,Lernrate vergroßern: η+ = 10−3 . . . 10−2.

77

Page 84: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

0.20.3

0.40.5

0.60.7

0.80.9

1

-0.00020

0.00020.0004

0.00060.0008

0.0010.0012

Rej

ekti

on

100200300400500600700

100

200

300

400

500

600

700

Abbildung 7.2: RPROP-Lernregel, 30mittlere Neuronen, Normierung (1),Energieeingabe

0.20.3

0.40.5

0.60.7

0.80.9

1

-0.00020

0.00020.0004

0.00060.0008

0.0010.0012

Rej

ekti

on

100200300400500600700

100

200

300

400

500

600

700

Abbildung 7.3: RPROP-Lernregel, 30mittlere Neuronen, Normierung (2),Energieeingabe

0.20.3

0.40.5

0.60.7

0.80.9

1

-0.00020

0.00020.0004

0.00060.0008

0.0010.0012

Rej

ekti

on

100200300400500600700

100

200

300

400

500

600

700

Abbildung 7.4: RPROP-Lernregel, 30mittlere Neuronen, Normierung (1),Likelihood-Eingabe

Das Training wird nach 400 Zyklen abgebrochen und bis zum geringsten Validationsfehlernoch einmal wiederholt. Die Ergebnisse dieser Variation fur 30 mittlere Neuronen ist in denAbbildungen 7.5 bis 7.7 gezeigt. Man erkennt auch hier wieder ahnlich deutliche Unterschie-de zwischen den verschiedenen Methoden. Die Normierung nach Methode 1 mit der Ein-gabe der Energien liefert wieder die besten Rejektionen, die hier ca. 1,5 hoher als bei derRProp-Lernregel liegen. Als Grund fur diesen Unterschied kann man die Verwendung des gan-zen Fehlergradientenwertes – statt der ausschließlichen Verwendung des Vorzeichens bei derRProp-Lernregel– und eines Moments ansehen. Fur die Eingaben mit Likelihoods beobachtetman das gleiche Verhalten wie bei der RProp-Methode.

7.2.3 Vergleich eines mit allen Energien und eines nur mit 100 GeV-Protonentrainierten Netzes

In diesem Abschnitt werden zwei unterschiedlich trainierte Netz verglichen. Beim ersten Netzhandelt es sich um das beste Netz aus Abschnitt 7.2.2. Das zweite Netz wird mit denselbenElektronen wie das erste Netz und einem gemischten Datensatz aus allen Energien fur die Pro-tonen trainiert. Die gesamte Anzahl dieses gemischten Protondatensatzes wird der Anzahl des100 GeV-Protondatensatzes aus dem Training des ersten Netzes angepasst. Die Zusammenset-

78

Page 85: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

0.20.3

0.40.5

0.60.7

0.80.9

1

+η0

0.0020.004

0.0060.008

0.010.012

Rej

ekti

on

100200300400500600700

100

200

300

400

500

600

700

Abbildung 7.5: δ-δ-Lernregel, 30 mittlereNeuronen, Normierung (1), Energieein-gabe

0.20.3

0.40.5

0.60.7

0.80.9

1

+η0

0.0020.004

0.0060.008

0.010.012

Rej

ekti

on

100200300400500600700

100

200

300

400

500

600

700

Abbildung 7.6: δ-δ-Lernregel, 30 mittlereNeuronen, Normierung (2), Energieein-gabe

0.20.3

0.40.5

0.60.7

0.80.9

1

+η0

0.0020.004

0.0060.008

0.010.012

Rej

ekti

on

100200300400500600700

100

200

300

400

500

600

700

Abbildung 7.7: δ-δ-Lernregel, 30 mittlereNeuronen, Normierung (1), Likelihood-Eingabe

Protonenergie [GeV]0 50 100 150 200 250

Rej

ekti

on

210

310+NN - alle p

+NN - 100 GeV p

Abbildung 7.8: Rejektionen eines mit al-len Energien und eines nur mit 100 GeV-Protonen trainierten Netzes

Protonenergie [GeV]0 50 100 150 200 250

100

/Ral

leR

0.95

1

1.05

1.1

1.15

1.2

1.25

Abbildung 7.9: Quotient der Rejektioneneines mit allen Energien und eines nurmit 100 GeV-Protonen trainierten Netzes

79

Page 86: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

zung erfolgt entsprechend der Einzelspurereignisanzahl fur die jeweilige Energie. Fur beideNetze lauten die Trainingsparameter:

Anfangswert aller Lernraten: η = 10−2,Moment: α = 0, 6,Lernrate verkleinern: η− = 0, 6,Lernrate vergroßern: η+ = 0, 0055,mittlere Neuronen: 30,Anfangswert der Zufallsverteilung: 0.

In den Abbildungen 7.8 und 7.9 sind die Ergebnisse im Vergleich gezeigt, wenn die beiden Net-ze auf alle Datensatze angewendet werden. Es ist unmittelbar einsichtig, dass das ausschließ-lich mit 100 GeV-Protonen trainierte Netz bei 100 GeV eine Uberhohung aufweist. Auch beidem Training mit dem zusammengesetzten Datensatz, wird der großte Anteil von den 100 GeV-Protonen gestellt. Es ist also auch hier einsichtig, dass das Netz eine Uberhohung bei 100 GeVliefert. In den folgenden Analysen wird dieser Vorteil bei 100 GeV durch Erhohung der Trai-ningsereignisanzahlen fur jede Energie verwischt, da die Rejektionen auch bei den anderenEnergien steigen (Abschnitt 7.4).Das nur mit den 100 GeV-Protonen trainierte Netz weist leichte Vorteile im hochenergetischenBereich auf, wie der Vergleich der mittleren Rejektionen in Abbildung 7.9 zeigt. Die Vorteile beiniedrigeren Energien fur das Netz, das mit dem gemischten Datensatz trainiert wurde, uber-wiegen die Vorteile des anderen Netzes bei hohen Energien. Im Weiteren werden also gemisch-te Datensatze zum Training verwendet, da es fur die Analyse einerseits einfacher ist, wenn nurein Netz fur alle Energien verwendet wird und andererseits die Statistik fur benachbarte Ener-gien unter der Annahme eines ahnlichen Verhaltens der Energiedepositionen erhoht wird, sodass man insgesamt hohere Rejektionen fur alle Energien erwartet.

7.2.4 Ermittlung der besten Lernparameter fur die δ-δ-Lernregel

In den vorherigen Abschnitten hat sich gezeigt, dass die δ-δ-Lernregel die besten Rejektionenliefert. Von diesem Ergebnis wird angenommen, dass es auch fur die anderen Energien gilt. ImWeiteren wird nur noch die δ-δ-Methode mit der Normierungsmethode 1 bei Eingabe der Ener-gien verwendet. Die Protondaten aller Energien werden jetzt zusammengefasst in das Netz ein-gegeben (siehe Abschnitt 7.1) und es werden weitere Parametervariationen mit dieser Methodedurchgefuhrt.

Anfangswert aller Lernraten: η = 10−2,Moment: α = 0, 3 . . . 0, 9,Lernrate verkleinern: η− = 0, 3 . . . 0, 9,Lernrate vergroßern: η+ = 10−3 . . . 10−2,mittlere Neuronen: 20 . . . 100.

Das Training wird zunachst nach 120 Trainingszyklen abgebrochen und dann bis zum minima-len Wert des Validationsfehlers wiederholt. In den Abbildungen 7.10 bis 7.12 ist das Netz mit 60mittleren Neuronen und einem Moment α = 0, 6 gezeigt. Die Rejektion ist hier aus den Ereig-nissen aller Energien berechnet. Es wird also die Anzahl der jeweiligen Trainingsereignisse proEnergie berucksichtigt. Das Netz ist sensitiver auf 100 GeV-Protonen als auf 250 GeV-Protonen,da die Statistik sechsmal hoher ist (Tabelle 4.1). Der Fehler berechnet sich nach Gleichung (5.8).In Abbildung 7.11 ist zusatzlich der Mittelwert der einzelnen Rejektionen fur die Energien von100 bis 250 GeV gezeigt. Untersuchungen zeigten namlich, dass die Anforderungen fur denniedrigen Energiebereich bei allen Netzen erfullt waren, so dass die Auswahl des besten Net-zes anhand der Rejektionen bei hohen Energie getroffen wird. In Abbildung 7.12 erkennt man,

80

Page 87: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

0.20.3

0.40.5

0.60.7

0.80.9

1

+η 00.002

0.0040.006

0.0080.01

0.012

Rej

ekti

on

260280300320340360380400

260

280

300

320

340

360

380

400

Abbildung 7.10: Rejektion bei 60 mittle-ren Neuronen und einem Moment vonα = 0, 6

0.20.3

0.40.5

0.60.7

0.80.9

1

+η 00.002

0.0040.006

0.0080.01

0.012

Rej

ekti

on

260280300320340360380400

260

280

300

320

340

360

380

400

Abbildung 7.11: Mittlere Rejektion bei100 - 250 GeV bei 60 mittleren Neuronenund einem Moment α = 0, 6

0.20.3

0.40.5

0.60.7

0.80.9

1

+η 00.002

0.0040.006

0.0080.01

0.012Tra

inin

gsz

ykle

n

020406080

100120

0

20

40

60

80

100

120

Abbildung 7.12: Zahl der Trainingszy-klen bei 60 mittleren Neuronen und ei-nem Moment α = 0, 6

dass das Training umso langer dauert, je kleiner die Vergroßerung der Lernrate ist. Die Langedes Trainings hat aber keinen auffallenden Einfluss auf die resultierende Rejektion.In Abbildung 7.13 ist die maximale Rejektion zu dem jeweiligen Moment und der jeweiligenmittleren Neuronenzahl aufgetragen. Man erkennt einen recht flachen Anstieg der Rejektionmit der Anzahl an mittleren Neuronen, die bei 60 mittleren Neuronen ein leichtes Maximumaufweist.In Abbildung 7.14 ist die Verteilung bei Variation des Anfangswertes fur die Zufallsverteilungder Gewichte gezeigt, der einen erheblichen Einfluss auf die resultierende Rejektion hat. DieStandardabweichungen der Rejektionen der verschiedenen Netze sind ca. 25, so dass es sichnicht nur um eine statistische Fluktuation handelt, sondern um eine tatsachlich bessere Aus-gangskonfiguration des Netzes.Als bestes Netz wird im Folgenden ein Netz bezeichnet, das den hochsten Mittelwert der Re-jektion bei den Energien von 100 bis 250 GeV aufweist.

81

Page 88: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Anzahl mittlerer Neuronen20 30 40 50 60 70 80 90 100

α

Moment 0.20.3

0.40.5

0.60.7

0.80.9

1

Rej

ekti

on

260

280

300

320

340

360

380

400

260

280

300

320

340

360

380

400

Abbildung 7.13: Maximale Rejektion desjeweiligen Momentes und der mittlerenNeuronenanzahl

Rejektion280 300 320 340 360 380

#

0

1

2

3

4

5

6

7

8

Abbildung 7.14: Verteilung der Rejektionbei Variation des Anfangswertes der Ge-wichtszufallsverteilung

Trainingszyklus0 5 10 15 20 25 30 35

Mit

telw

ert

des

NN

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

Trainingszyklus0 5 10 15 20 25 30 35

Mit

telw

ert

des

NN

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1Elektronen

Protonen

Abbildung 7.15: Verlauf der Mittelwer-te fur Elektronen und Protonen wahrenddes Trainings

Trainingszyklus0 5 10 15 20 25 30 35

Sig

ma

des

NN

0

0.1

0.2

0.3

0.4

0.5

0.6

Trainingszyklus0 5 10 15 20 25 30 35

Sig

ma

des

NN

0

0.1

0.2

0.3

0.4

0.5

0.6Elektronen

Protonen

Abbildung 7.16: Verlauf der Standardab-weichungen fur Elektronen und Protonenwahrend des Trainings

Trainingszyklus0 20 40 60 80 100 120

MS

E

-110

TrainingValidation

Abbildung 7.17: Verlauf des MSE furTrainings- und Validationsereignisse. Ab-bruch bei 35 Zyklen.

Ausgabe des NN-0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

rel.

Hae

ufi

gke

it

-410

-310

-210

-110

1Elektronen

Protonen

Abbildung 7.18: Ausgabe des neurona-len Netzes fur Elektronen und Protonennach dem Training

82

Page 89: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

7.3 Trainingsgr oßen und Struktur des neuronalen Netzes

Das beste neuronale Netz aus Abschnitt 7.2.4 hat die folgenden Parameter:

Anfangswert aller Lernraten: η = 10−2,Moment: α = 0, 6,Lernrate verkleinern: η− = 0, 6,Lernrate vergroßern: η+ = 0, 0055,mittlere Neuronen: 60,Anfangswert der Zufallsverteilung: 7,Trainingszyklen bis zum MSE-Minimum: 35.

Die Abbildungen 7.15 bis 7.17 dokumentieren den Verlauf des Mittelwertes fur die Trainingser-eignisse, der Standardabweichungen fur die jeweilige Klasse und des Fehlers fur die Trainings-und die Validationsereignisse. Es ist jeweils die Schwelle des Trainingsabbruchs bei 35 Zykleneingezeichnet. Man erkennt, dass schon nach nur einem Trainingsschritt eine große Anpassungdes Netzes an die Erwartung erfolgt ist. Im weiteren Verlauf werden die Standardabweichun-gen der einzelnen Verteilungen immer geringer und die Fehler nehmen weiter ab. Ab einemgewissen Punkt sinkt der Fehler fur die Validationsereignisse nicht mehr und es kommt zueiner zu großen Spezialisierung des Netzes auf die Trainingsereignisse, als Resultat steigt derFehler der Validationsereignisse wieder an. Das Netz lernt die Trainingsereignisse auf Kostender Verallgemeinerungsfahigkeit auswendig. Das entspricht genau den Vorhersagen.In Abbildung 7.18 ist die Ausgabe des trainierten neuronalen Netzes fur die Analysedatensatzegezeigt. Die Flache der beiden Histogramme ist dabei auf 1 normiert. Man erkennt die deutlichgeringere Statistik der Elektronen an der großeren Zerkluftung. Der Protondatensatz bestehtaus den Datensatzen aller Energien. Bei 1 ist ein deutlicher Peak der Elektronen und bei -1ein deutlicher Peak der Protonen zu erkennen. Der Großteil der Analysedaten ist also richtigklassifiziert worden. Es ist nun interessant, sich die falsch klassifizierten Ereignisse anzusehen.Ungefahr 0,8 % der Elektronen bzw. 0,1 % der Protonen liefern einen Wert des neuronalen Net-zes von -1 bzw. 1. Auf diese Ereignisse wird in Abschnitt 7.7 genauer eingegangen. Zusatzlichist die Schwelle eingezeichnet, bei der 90 % der Elektronen richtig erkannt werden.In den Abbildungen 7.19 bis 7.21 ist die Struktur des trainierten neuronalen Netzes dargestellt.Die Betrage der Gewichte werden durch Farben von blau bis rot dargestellt. Ein positives Vor-zeichen des Gewichts wird durch eine durchgezogene Linie, ein negatives Vorzeichen wirddurch eine gestrichelte Linie wiedergegeben. In Abbildung 7.19 sind zur besseren Ubersichtnur Gewichte uber einem gewissen Betrag dargestellt. In den Abbildungen 7.20 und 7.21 sinddie Gewichtswerte zwischen der Eingabe und der Mitte und der Mitte und der Ausgabe his-togrammiert. Die Farben entsprechen hier genau den Farben in Abbildung 7.19. Man erkennt,dass die Gewichte recht eng um null verteilt sind. Auf Grund der geringen Statistik fur die Ver-teilung zwischen Mitte und Ausgabe sind hier naturliche großere Fluktuationen zu erkennen.Die wichtigste Aussage ist aber, dass es keine besonders hohen Gewichte gibt und die Gewich-te alle recht ahnliche niedrige Werte aufweisen. So kann eine gute Generalisierungsfahigkeitdes Netzes gewahrleistet werden. Alle Eingaben in das Netz werden ungefahr gleich starkberucksichtigt, was bei Ausfall einer der Lagen nicht direkt zu einer starken Beeinflussung derAusgabe fuhrt und das Netz robust gegen Verschmierung der Energien macht (siehe Abschnitt7.6).

7.4 Gutetest und Rejektion

Um den Abbruch des Trainings beim geringsten Validationsfehler zu rechtfertigen, ist in Abbil-dung 7.22 der Verlauf der Rejektion von allen Protonen gegen die 20 GeV-Elektronen wahrend

83

Page 90: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

niedriger Gewichtsbetr.

hoher Gewichtsbetr.

negativpositiv

linearer Output

sigmoider Output

Bias-Neuron

Abbildung 7.19: Struktur des trainierten neuronalen Netzes. Zur Verdeutlichung, sind nur Gewichte,die einen Betrag uber einen gewissen Schwelle haben eingezeichnet.

Gewichtswert-1 -0.5 0 0.5 1 1.5

#

0

20

40

60

80

100

120

140

160

180

200

Abbildung 7.20: Verteilung der Ge-wichtsstarken zwischen der Eingabe-und der Mittelschicht

Gewichtswert-1 -0.5 0 0.5 1

#

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

Abbildung 7.21: Verteilung der Ge-wichtsstarken zwischen der Mittel- undder Ausgabeschicht

84

Page 91: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Trainingszyklus0 10 20 30 40 50 60 70 80

Rej

ekti

on

0

50

100

150

200

250

300

350

400

450

Tra

inin

gsa

bb

ruch

Abbildung 7.22: Verlauf der Rejektionwahrend des Trainings

Ausgabe des NN-0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

Ele

ktro

n-N

N +

Pro

ton

-NN

Ele

ktro

n-N

N

0

0.2

0.4

0.6

0.8

1

Abbildung 7.23: Signal-Background-Verhaltnis des trainierten Netzes

Effizienz0.75 0.8 0.85 0.9 0.95 1

Rej

ekti

on

10

210

310

Abbildung 7.24: Anderung der Rejektionbei Variation der Effizienz

des Trainings dokumentiert. Das Training wird bei 35 Trainingszyklen abgebrochen, was ziem-lich genau dem Maximum dieses Verlaufs entspricht. Diese Tatsache dient als Rechtfertigungdes Trainingsabbruchs beim geringsten Validationsfehlers.In Abbildung 7.23 ist das Verhaltnis des Anteils der Elektronen bei Ausgabe o zu der Summeder beiden Anteile von Elektronen und Protonen bei Ausgabe o gezeigt (Gleichung (6.37)). DerFehler ergibt sich aus dem Fehler eines Poisson-Zahlexperiments. Fur ηe/p = ne/p/Ne/p mitder Anzahl ne/p der Ereignisse bei Ausgabe o und Ne/p der Gesamtzahl der jeweiligen Analy-sedaten. Die Fehler der unterschiedlichen Anzahlen werden wieder als statistisch unabhangigangenommen (siehe Abschnitt 5.2.1):

σPe = P 2e

√N2

e np

N2pn2

e+

N2e n2

p

N3pn2

e+

Nen2p

N2pn2

e+

N2e n2

p

N2pn3

e. (7.1)

In Abschnitt 6.4 wurde gezeigt, dass das Netz optimal trainiert ist, wenn gilt:

Pe =o + 1

2. (7.2)

Diese Gerade ist in Abbildung 7.23 eingezeichnet. Man erkennt, dass die Fehler bei den Peak-werten -1 bzw. 1 des neuronalen Netzes am kleinsten sind, was an der großeren Statistik indiesen Bereichen liegt. Zwischen den Extremwerten liegen die Verhaltnisse im Rahmen derFehler auf der Geraden. Dies zeigt, dass das Netz gut an die Problemstellung angepasst ist.

85

Page 92: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Protonenergie [GeV]0 50 100 150 200 250

Rej

ekti

on

210

310

Neuronales Netz

Likelihood

Cluster Counting

Fisher-Diskriminate

Abbildung 7.25: Rejektion fur alle Methoden in Abhangigkeit der Protonenergie

In Abbildung 7.24 ist die Variation der Effizienz, die fur die Berechnung der Rejektion zu Grun-de gelegt wird, mit der Minimalanforderung fur die Rejektion von 100 bei 90 % Elektroneffizi-enz gezeigt. Es handelt sich hier wieder um die Rejektion fur alle Protonenergien. Man beob-achtet das erwartete Ergebnis einer steigenden Rejektion fur die Abnahme der Effizienz. DieKurve zeigt keine Ausreißer, so dass man sicher sein kann, nicht nur einer lokalen Eigenschaftder Effizienz aufgesessen zu sein.Statt der mittleren Rejektion aus allen Energien werden jetzt die einzelnen Rejektionen fur je-den Energiedatensatz separat fur das neuronale Netz berechnet. Abbildung 7.25 zeigt den Ver-lauf der Rejektion in Abhangigkeit der Energien bei allen Analysemethoden. Die Rejektion desneuronalen Netzes liegt von 20 bis 200 GeV uber der Mindestanforderung von 100. Bei 250 GeVist die Rejektion 95± 20, liegt also im Bereich von weniger als einer Standardabweichung uber100. Da die Statistik bei dieser Energie von allen am geringsten ist, konnte das Netz durch dasTraining nicht sensitiver auf die 250 GeV-Protonen werden. Bei einer großeren Anzahl von Da-ten ware hier noch eine weitere Steigerung der Rejektion zu erwarten. Bei fast allen Energienliegt das neuronale Netz im Bereich der Fehler mit der Likelihood-Methode gleichauf. Es istalso deutlich besser als das Cluster-Counting und die Fisher-Diskriminantenmethode.

7.5 Zusammenfassen aller Analysemethoden in einem weiterenneuronalen Netz

In einem nachsten Schritt soll ein weiteres neuronales Netz trainiert werden, was die einzel-nen Analysemethoden als Eingabe erhalt. Da keine der einzelnen Methoden ein bester Testist (siehe Abschnitt 5.2), ist es das Ziel, mogliche individuelle Vorteile der Methoden in ei-nem neuronalen Netz zusammenzufassen. Bevor dies geschieht, mussen die Korrelationen derunterschiedlichen Großen betrachtet werden. Nur wenn keine vollstandige Korrelation einer

86

Page 93: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Analysemethode mit einer anderen vorliegt, konnen weitere Infomationen aus der Kombina-tion gewonnen werden. Zusatzlich zur Cluster-Counting-Methode, zur Likelihood-Methode,zur Fisher-Testgroße und zum ersten neuronalen Netz wird uberpruft, ob die Eingabe der mitt-leren Energie auf der Spur sinnvoll ist (Abbildung 7.26 bis 7.35). Die Abbildungen 7.27, 7.29,7.33 zeigen nur eine sehr geringe Korrelation. Die Abbildungen 7.26 und 7.31 zeigen eine et-was großere Korrelation, haben dennoch Abweichungen von einer perfekten Korrelation. DieAbbildungen 7.28, 7.34 und 7.35 sind die Korrelationsdiagramme, die die Vergleiche mit demneuronalen Netz zeigen. Besonders fur die Ereignisse, die vom neuronalen Netz falsch erkanntwerden, ist nur eine geringe Korrelation zu erkennen, so dass eine Kombination der jeweiligenMethoden gerade fur diese problematischen Falle eine Verbesserung verspricht.Nur die Korrelation zwischen den mittleren Energien und den Fisher-Testgroßen ist nahezuperfekt, so dass aus der Kombination dieser beiden Großen keine neue Information gewonnenwerden kann. Aus diesem Grund wird ein Netz mit den vier Großen der unterschiedlichenAnalysemethoden als Eingabe im Folgenden verwendet:

@ Anzahl von Hits mit Energien uber 6,5 keV (siehe Cluster-Counting, Abschnitt 5.2.2),

@ mittlerer Log-Likelihood-Wert − lnL. (Dafur werden uber alle Protonenergien gemittelteLikelihood-Funktionen verwendet.),

@ mittlere Fisher-Testgroße t aus Vergleich der 20 GeV-Elektronen mit allen Protonen,

@ den Wert des ersten neuronalen Netzes auf Energiebasis.

7.5.1 Parametervariation fur das zusammenfassende neuronale Netz

Auch fur das zusammenfassende neuronale Netz wird eine Parametervariation zur Ermittlungder besten Netz- und Lernparameter durchgefuhrt. Als Trainingsmethode dient dabei wiederdie δ-δ-Lernregel. Fur die Analyse wird die gleiche Aufteilung der Datensatze in Trainings-,Validations- und Analysedatensatz gewahlt, damit die beiden neuronalen Netze untereinandervergleichbar bleiben. Die Parameter lauten:

Anfangswert aller Lernraten: η = 10−2,Moment: α = 0, 3 . . . 0, 9,Lernrate verkleinern: η− = 0, 3 . . . 0, 9,Lernrate vergroßern: η+ = 10−3 . . . 10−2,mittlere Neuronen: 5 . . . 23.

Da das Netz weniger Eingabeneuronen hat, werden fur die mittlere Lage weniger Neuronengebraucht. Dafur ist die Schrittweite fur die Neuronvariation statt 10 auch nur 3. Das Trainingwird nach 250 Zyklen abgebrochen und dann bis zum minimalen Validationsfehler wiederholt.In den Abbildungen 7.36 bis 7.38 sind die Variationen fur ein Moment α = 0, 9 und 8 mittlereNeuronen gezeigt. Die Rejektion liegt hier um ca. 200 hoher als beim ersten neuronalen Netz.In Abbildung 7.39 ist die maximale Rejektion bei Variation von Moment und mittlerer Neu-ronenanzahl gezeigt. Es gibt ein leichtes Maximum bei 8 mittleren Neuronen und Momentα = 0, 9. Auch hier zeigt die Variation der Anfangsverteilung der Gewichte (Abbildung 7.40)wieder einen nicht unwesentlichen Einfluss auf die resultierende Rejektion. Zur endgultigenBestimmung des besten neuronalen Netzes wird wieder der gemittelte Wert der Rejektion beiProtonenergien von 100 bis 250 GeV bestimmt. Da der Rejektionwert bei 140 GeV recht großeSchwankungen fur die unterschiedlichen Parameter aufweist, wird dieser Wert bei der Mitte-lung vernachlassigt. Die großen Schwankungen haben ihre Ursache darin, dass im Mittel nurca. 5 Protonereignisse falsch erkannt werden. Wenn unterschiedliche Parameter dafur sorgen,dass ein Proton mehr oder weniger erkannt wird, nimmt dies also schon einen großen Einflussauf die Rejektion.

87

Page 94: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Abbildung 7.26: Korrelation: Cluster-Counting - Fisher-Diskriminante

Abbildung 7.27: Korrelation: Cluster-Counting - Likelihood

Abbildung 7.28: Korrelation: Cluster-Counting - Neuronales Netz

Abbildung 7.29: Korrelation: Likelihood- Fisher-Diskriminante

Abbildung 7.30: Korrelation: Likelihood- Neuronales Netz

Abbildung 7.31: Korrelation: Energiemit-telwert - Cluster-Counting

Abbildung 7.32: Korrelation: Energiemit-telwert - Fisher-Diskriminante

Abbildung 7.33: Korrelation: Energiemit-telwert - Likelihood

Abbildung 7.34: Korrelation: Energiemit-telwert - Neuronales Netz

Abbildung 7.35: Korrelation: NeuronalesNetz - Fisher-Diskriminante

88

Page 95: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

0.20.3

0.40.5

0.60.7

0.80.9

1

+η 00.002

0.0040.006

0.0080.01

0.012

Rej

ekti

on

460480500520540560580600

460

480

500

520

540

560

580

600

Abbildung 7.36: Rejektion bei 20 mittle-ren Neuronen und einem Moment α =0, 9

0.20.3

0.40.5

0.60.7

0.80.9

1

+η 00.002

0.0040.006

0.0080.01

0.012

Rej

ekti

on

460480500520540560580600

460

480

500

520

540

560

580

600

Abbildung 7.37: Mittlere Rejektion bei100 - 250 GeV bei 20 mittleren Neuronenund einem Moment α = 0, 9

0.20.3

0.40.5

0.60.7

0.80.9

1

+η 00.002

0.0040.006

0.0080.01

0.012Tra

inin

gsz

ykle

n

0

50

100

150

200

250

0

50

100

150

200

250

Abbildung 7.38: Zahl der Trainingszy-klen bei 20 mittleren Neuronen und ei-nem Moment α = 0, 9

Anzahl mittlerer Neuronen4 6 8 10 12 14 16 18 20 22 24

α

Moment 0.20.3

0.40.5

0.60.7

0.80.9

1

Rej

ekti

on

460480500520540560580600

460

480

500

520

540

560

580

600

Abbildung 7.39: Maximale Rejektion desjeweiligen Momentes und der mittle-ren Neuronenanzahl fur das zusammen-fasssende neuronale Netz

Rejektion440 460 480 500 520 540 560 580 600

#

0

1

2

3

4

5

6

7

8

Abbildung 7.40: Verteilung der Rejektionbei Variation des Anfangswertes der Ge-wichtszufallsverteilung fur das zusam-menfassende neuronale Netz

89

Page 96: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Trainingszyklus0 50 100 150 200 250

MS

E

-110

TrainingValidation

Abbildung 7.41: Verlauf des Trainings-und Validations-MSEs fur das zusam-menfasssende neuronale Netz. Abbruchbei 45 Zyklen.

Ausgabe des NN-0.8 -0.6 -0.4 -0.2 -0 0.2 0.4 0.6 0.8

rel.

Hae

ufi

gke

it

-410

-310

-210

-110

1Elektronen

Protonen

Abbildung 7.42: Ausgabe fur Elektro-nen und Protonen nach dem Training furdas zusammenfasssende neuronale Netz.Schwelle bei 90 % Elektroneffizienz.

Ausgabe des NN-0.8 -0.6 -0.4 -0.2 -0 0.2 0.4 0.6 0.8

Ele

ktro

n-N

N +

Pro

ton

-NN

Ele

ktro

n-N

N

0

0.2

0.4

0.6

0.8

1

Abbildung 7.43: Signal-Background-Verhaltnis des trainierten zusammenfas-senden Netzes. Theoretische Gerade furden optimalen Verlauf.

Effizienz0.75 0.8 0.85 0.9 0.95 1

Rej

ekti

on

10

210

310

Abbildung 7.44: Anderung der Rejektionbei Variation der Effizienz fur das zusam-menfasssende neuronale Netz. Minimal-anforderung bei 90 % Elektroneffizienz.

7.5.2 Trainingsgr oßen des zusammenfassenden neuronalen Netzes

Das beste neuronale Netz aus Abschnitt 7.5.1 hat die folgenden Parameter:

Anfangswert aller Lernraten: η = 10−2,Moment: α = 0, 9,Lernrate verkleinern: η− = 0, 6,Lernrate vergroßern: η+ = 0, 0055,mittlere Neuronen: 8,Anfangswert der Zufallsverteilung: 0,Trainingszyklen bis zum MSE-Minimum: 23.

Die Abbildungen 7.41 bis 7.44 zeigen einige Großen dieses zusammenfassenden neuronalenNetzes. Das Training wird nach 45 Zyklen abgebrochen und die Ausgabe weist wieder zweiklare Peaks bei -1 und 1 auf. Die Verhaltnisse der Anteile liegen auch wieder im Rahmen derFehler auf der theoretisch vorhergesagten Geraden. Bei Erhohung der Effizienz fallt die Rejek-tion streng monoton.Die Gewichtswerte sind wieder recht eng um 0 verteilt, was fur eine gute Verallgemeine-rungsfahigkeit spricht (Abbildung 7.45 bis 7.47).

90

Page 97: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

niedriger Gewichtsbetr.

hoher Gewichtsbetr.

negativpositiv

linearer Output

sigmoider Output

Bias-Neuron

Abbildung 7.45: Struktur des trainierten zusammenfasssenden neuronalen Netzes

Gewichtswert-2.5 -2 -1.5 -1 -0.5 0 0.5 1

#

0

0.5

1

1.5

2

2.5

3

3.5

4

Abbildung 7.46: Verteilung der Ge-wichtsstarken zwischen der Eingabe-und der Mittelschicht fur das zusammen-fasssende neuronale Netz

Gewichtswert-2 -1.5 -1 -0.5 0 0.5 1 1.5

#

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Abbildung 7.47: Verteilung der Ge-wichtsstarken zwischen der Mittel- undder Ausgabeschicht fur das zusammen-fasssende neuronale Netz

91

Page 98: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Protonenergie [GeV]0 50 100 150 200 250

Rej

ekti

on

210

310

Neuronales Netz aller MethodenNeuronales NetzLikelihoodCluster CountingFisher-Diskriminate

Abbildung 7.48: Rejektion fur alle Methoden in Abhangigkeit der Protonenergie

Die Rejektionen fur alle Protonenergien von allen in dieser Arbeit verwendeten Methoden sindin Abbildung 7.48 zu sehen. Die mittleren Rejektionen des zusammenfassenden neuronalenNetzes liegen bei allen Energien uber der Likelihood-Methode und dem ersten neuronalenNetz. Die Werte reichen von 1581 ± 707 bei den 20 GeV-Protonen bis zu 129 ± 31 bei den250 GeV-Protonen. Die Anforderungen von einer Rejektion uber 100 werden also in diesemEnergiebereich durch das zusammenfassende Netz voll erfullt.Interessant ist es nun, die Differenz zwischen den Rejektionen fur das zusammenfassende neu-ronale Netz RA und der Likelihood-Methode RLH zu vergleichen. Da beide Großen fehlerbe-haftet sind und die Likelihood-Methode eine Eingabe fur das neuronale Netz bildet, kann beider Fehlerfortpflanzung zur Berechnung des Fehlers der Rejektiondifferenz D = RA−RLH einevollstandige Korrelation der Großen angenommen werden. d.h. der Korrelationskoeffzient istρA,LH = 1 [61]:

σ2D = σ2

A + σ2LH − 2σA,LH ∧ σA,LH = ρA,LH︸ ︷︷ ︸

= 1

√σ2

Aσ2LH, (7.3)

=⇒ σ2D = σ2

A + σ2LH − 2

√σ2

Aσ2LH. (7.4)

In Abbildung 7.49 ist D/σD uber der Energie aufgetragen. Ein Wert uber 1 bedeutet, dass dieDifferenz im Rahmen einer Standardabweichung großer als 0 ist. Die Rejektion hat sich alsogegenuber der Likelihood-Methode vergroßert. Bei sechs Energien ist dies der Fall. Die anderenEnergien weisen ebenfalls eine mittlere positive Differenz auf. Im Rahmen von nur etwa 1,5Standardabweichung hat aber auch hier eine Verbesserung stattgefunden. Nur bei den 20 GeV-Protonen ist der Fehler funfmal großer als die Differenz.Bei der gesamten Rejektionanalyse muss die geringe Statistik der nicht erkannten Protonenbeachtet werden, z.B. werden vom gesamten 20 GeV-Protonanalysedatensatz nur drei Proto-

92

Page 99: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Protonenergie [GeV]0 50 100 150 200 250

DσL

H-R

AR

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Abbildung 7.49: Differenz der Rejektion des zusammenfassenden Netzes und der Likelihood-Methode

nen als Elektron klassifiziert. Auch bei anderen Energien werden teilweise weniger als zehnEreignisse falsch klassifiziert. Eine Erhohung der Statistik wurde hier gesichertere Aussagenliefern.

7.6 Weitere Untersuchungen

7.6.1 Einfluss einzelner Detektorlagen

Mit den trainierten Netzen werden nun weitere Untersuchungen durchgefuhrt. Um den Ein-fluss jeder einzelnen Detektorlage zu verstehen, wird im ersten neuronalen Netz die Rejektionberechnet, wenn jede Detektorlage einmal weggelassen wird, d.h. die Eingabeenergie wird auf0 gesetzt. In einem nachsten Schritt werden immer vier aufeinanderfolgende Lagen mit Ener-gie 0 keV initialisiert. Die Ergebnisse fur die Rejektionen von allen Protonen gegen die 20 GeV-Elektronen sind in Abbildung 7.50 zu sehen.Die ersten vier Lagen senken die Rejektion nicht so stark wie die hinteren Lagen. Das lasst sichanhand des Anstiegs der mittleren Energie pro Lage leicht verstehen (siehe Abschnitt 5.1.3). DieKlassifikation, ob es sich um ein Elektron oder Proton handelt, wird namlich zu einem großenTeil durch die Hohe der einzelnen Energiedepositionen auf der Spur bestimmt, die fur dieersten vier Lagen bei den Elektronereignissen im Mittel deutlich geringer ist. Die Fehlerbalkenin x-Richtung der blauen Kurve sollen andeuten, welche Lagen in der Rejektionberechnungauf 0 gesetzt wurden. Die Rejektion sinkt naturlich starker, als bei Nullsetzung einer einzelnenLage. Es lasst sich auch hier wieder erkennen, dass der Einfluss der vorderen Lagen auf dieRejektion geringer ist als der hinteren.Eine weitere Eigenschaft des Detektors, die man an dieser Untersuchung gut erkennt, ist dieVerdrehung der Lagen 3, 4, 17 und 18. Vor diesen gedrehten Lagen befindet sich weniger Ra-

93

Page 100: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Lage0 2 4 6 8 10 12 14 16 18 20

Rej

ekti

on

0

50

100

150

200

250

300

350

4001 Lage mit Energiedep. 0 keV

4 Lagen mit Energiedep. 0 keV

ged

reh

te L

agen

ged

reh

te L

agen

keine Nulllagen

Abbildung 7.50: Einfluss der unterschiedlichen Lagen auf die Rejektion

diatormaterial, so dass weniger Ubergangsstrahlung erzeugt wird, die das Unterscheidungs-kriterium zwischen Elektronen und Protonen darstellt. Die gedrehten Lagen haben also einengeringeren Einfluss auf die Rejektion.

7.6.2 Reihenfolge der Energiedepositionen

Ein wichtiger Test fur die Gute des neuronalen Netz ist die Uberprufung der Sensitivitat auf dieReihenfolge der Energiedepositionen des einzelnen Ereignisses. In Abbildung 7.51 sind die Re-jektionen fur alle Energien bei Eingabe der Ereignisse in richtiger, zufalliger und ruckwartigerReihenfolge gezeigt. Nach dem Vertauschen der Energiedepositionen wurden die Ereignissemit der gleichen Normierung wie bei der richtigen Reihenfolge in das Netz eingegeben. Fur diezufallige Eingabe sinken die Rejektionen am meisten ab, aber auch eine ruckwartige Eingabesorgt fur eine Verringerung der Trennbarkeit. Das Netz ist also sensitiv auf die Eingabereihen-folge und hat eine Korrelationen zwischen den Lagen erkannt, was man bei dem Anstieg dermittleren Energiedepositionen fur die Elektronen auch erwartet hatte.

7.6.3 Verschmierung der Energiedepositionen

Bisher wurde angenommen, dass die Energiedepositionen exakt bekannt sind. Durch Abwei-chungen in der Gasverstarkung oder andere leichte bauliche Unterschiede zwischen den Pro-portionalkammern kann es zu einer Verschmierung der Energien kommen. Um den Einflussder Verschmierung auf die Rejektionen der einzelnen Methoden zu untersuchen, werden indiesen keine Anpassungen an die verschmierten Daten vorgenommen, d.h. die Netze werdennicht neu trainiert, die Spektren werden nicht neu angepasst, die Kovarianzmatrix der Fisher-Methode wird nicht neu berechnet und die Schnitte des Cluster-Countings werden beibehalten.

94

Page 101: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Protonenergie [GeV]0 50 100 150 200 250

Rej

ekti

on

210

310

normal

random

rueckwaerts

Abbildung 7.51: Anderung der Eingabereihenfolge

Die Verschmierung wird auf verschiedene Arten durchgefuhrt. Bei allen Methoden werdendie Veranderungen der mittleren Rejektionen Rschmier aus allen Datensatzen mit den nicht ver-schmierten mittleren Rejektion R0 durch Quotientenbildung verglichen. Bei den Simulationendes Rauschens muss beachtet werden, dass verschmierte Energie, die oberhalb des Overflowsder Elektronik liegen, auf einen Wert des Overflows abgebildet werden mussen, da ja keineVeranderungen der Elektronik simuliert werden sollen. Zur Bestimmung der Energieschwel-len, oberhalb derer die Energien auf den Overflow-Peak abgebildet werden, werden die Pa-rametrisierungen der einzelnen Lagen fur die jeweiligen aus Abschnitt 5.1.4 verwendet. DieEnergieschwelle wird auf den Wert gesetzt, bei dem die Wahrscheinlichkeit unter 10−7 sinkt.Werte daruber werden nach der Verteilung

Pov(E) =1√

2πC28

exp(−(E − C9)2

2C28

)· 11 + exp (C10 · (E − C11))

(7.5)

zufallig auf den Overflow-Peak abgebildet. Als Parameter fur die Ci dienen die angepasstenWerte aus Abschnitt 5.1.4 fur die unterschiedlichen Lagen und Energien. Energien, die durchdie Verschmierung negativ werden, werden auf null gesetzt.

Zunachst soll ein elektronisches Rauschen simuliert werden, dies geschieht auf zwei verschie-dene Arten. Bei der ersten Methode wird fur jeden Hit eine Verschmierung mit einer Gauß-Verteilung, die einen bestimmten Prozentsatz des jeweiligen Hits als Breite erhalt, zufallig er-zeugt und auf den ursprunglichen Wert addiert:

E′ = E + Z (Gauß(0, E · a1)) . (7.6)

E′ ist der neue Energiewert, E ist die ursprungliche Energie, a1 der Prozentsatz der Verschmie-rung und Z(Gauß(0, E · a1) ist eine Zufallszahl, die nach einer Gauß-Verteilung mit Mittelwert

95

Page 102: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Verschmierung der Energie [%]0 2 4 6 8 10 12 14 16 18 20

0/R

sch

mie

rR

0

0.2

0.4

0.6

0.8

1

1.2

NN aller MethodenNeuronales NetzLikelihoodCluster CountingFisher-Diskriminate

Abbildung 7.52: Simulation: elektroni-sches Rauschen (prozentual)

Verschmierung der Energie [eV]0 200 400 600 800 1000

0/R

sch

mie

rR

0

0.2

0.4

0.6

0.8

1

1.2

NN aller MethodenNeuronales NetzLikelihoodCluster CountingFisher-Diskriminate

Abbildung 7.53: Simulation: elektroni-sches Rauschen (Energie)

Verschmierung der Energie [%]0 2 4 6 8 10 12 14 16 18 20

0/R

sch

mie

rR

0

0.2

0.4

0.6

0.8

1

1.2

NN aller MethodenNeuronales NetzLikelihoodCluster CountingFisher-Diskriminate

Abbildung 7.54: Simulation: Abweichun-gen in der Gasverstarkung

Verschmierung der Energie [%]-20 -15 -10 -5 0 5 10

0/R

sch

mie

rR

0

0.5

1

1.5

2

2.5

NN aller MethodenNeuronales NetzLikelihoodCluster CountingFisher-Diskriminate

Abbildung 7.55: Simulation: absoluteEnergieverschmierung

0 und Breite E · a1 fur jeden Hit neu erzeugt wird. Die Ergebnisse fur Verschmierungen a1 von2 bis 20 % sind in Abbildung 7.52 zu sehen. Die Analysetechniken, die direkt auf den Energie-depositonen basieren (neuronales Netz, Cluster-Counting, Fisher-Diskriminante), zeigen sichetwas robuster gegen verrauschte Energien als die Likelihood-Methode. Eine weitere Moglich-keit elektronisches Rauschen zu simulieren, ist uber eine feste Breite fur alle Hits unabhangigvon der jeweiligen Hit-Energie:

E′ = E + Z (Gauß(0, EBreite)) . (7.7)

EBreite ist die feste Verschmierungsbreite und Z eine Zufallszahl die fur jeden Hit neu erzeugtwird. In Abbildung 7.53 sind die Ergebnisse fur Breiten von 10 bis 1000 eV gezeigt. Auch hierzeigen sich die energiebasierten Methoden wieder robuster als die Likelihood-Methode. DerAbfall der Likelihood-Methode ist hier viel starker als in der vorherigen Simulationsmethode,da der prozentuale Anteil der Verschmierungsbreite EBreite von dem jeweiligen Hit bis zu ca.100 % betragen kann, was eine wesentlich starkere Verschmierung als im ersten Fall ist. Derstarkere Abfall der Likelihood-Methode als bei den anderen Methoden erklart sich dadurch,dass eine kleine Veranderung der Energiedeposition eine große Veranderung des entsprechen-den Likelihood-Wertes nach sich zieht (siehe Abbildung 5.4).

Eine weitere Simulation macht Aussagen zu Abweichungen in der Gasverstarkung, z.B. durchKalibrationsfehler, in den einzelnen Proportionalzahlrohren. Fur jedes Proportionalzahlrohr

96

Page 103: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

wird eine feste prozentuale Verschiebung der Energiedeposition festgelegt. Diese prozentualenVerschiebungen werden Gauß-formig zufallsverteilt:

E′ = E (1 + Z (Gauß(0, a2))) . (7.8)

a2 ist prozentuale Verschmierung und Z eine Zufallszahl die fur jedes Proportionalzahlrohreinmal festgelegt wird. In Abbildung 7.54 ist die Breite a dieser Gauß-Funktion gegen die re-lative Veranderung der einzelnen Analysemethoden gezeigt. Der Verlauf ist dem Verlauf inAbbildung 7.52 sehr ahnlich. Auch hier zeigen sich die Methoden, die auf Energieeingaben ba-sieren, etwas robuster als die auf Wahrscheinlichkeiten basierende Likelihood-Methode.

Als vierte Art der Verschmierung wird eine Verschiebung aller Energiedepositionen mit einemfesten Anteil a3 durchgefuhrt:

E′ = E(1 + a3). (7.9)

Die Ergebnisse sind in Abbildung 7.55 zu sehen. Bei den Ergebnissen des Cluster-Countingsist zu beachten, dass sich die Effizienz von 70 % bei -20 %-Verschmierung auf 95 % bei 10 %-Verschmierung bei Verwendung der gleichen Schnitte verandert. Die relative Veranderungnimmt dementsprechend bei niedrigen Effizienzen sehr hohe Werte und bei hohen Effizien-zen sehr niedrige Werte an. Fisher-Diskriminante und das erste neuronale Netz sind nahezuunempfindlich auf die Veranderungen der Energien. Beim neuronalen Netz ist dieser Sachver-halt offensichtlich, wenn man sich uberlegt, dass die Gewichte, die die Eingaben weitertrans-portieren einen Mittelwert von null mit ungefahr gleich vielen positiven und negativen Ge-wichten haben. Die gleichmassige Verschiebung aller Energien um einen festen Prozentsatz hatalso innerhalb des Netzes im Mittel keinen Einfluss. Die relative Veranderung des zusammen-fassenden neuronalen Netzes sinkt recht stark bei hoheren Verschmierungen ab. Dieser Sach-verhalt ist auf den Einfluss der Cluster-Counting- und Likelihood-Werte zuruckfuhren, derenrelative Veranderungen ebenfalls stark abfallen. Die Asymmetrie des Anstiegs und des Ab-falls der relativen Veranderungen bei der Likelihood-Methode erklaren sich dadurch, dass dasHauptunterscheidungskriterium zwischen Elektronen und Protonen die Anzahl von hohenEnergieeintragen ist. Wenn Protonenergien in den Bereich der Energien der Ubergangsstrah-lungsuberhohung der Elektronen verschoben werden, sinkt die Rejektion. Umgekehrt sorgteine Erniedrigung der Energien nicht fur solch eine drastische Verschlechterung der Rejektion,da die Energieverteilung der Elektronen ebenfalls einen Peak bei ca. 2 keV aufweist.

Mit diesen Untersuchungen kann man auch verstehen, warum die Eingabe von Likelihood-Raten in das neuronale Netz (Abschnitt 7.2) zu schlechteren Ergebnissen gefuhrt hat. Die Un-terschiede zwischen Trainings- und Analysedatensatz sind bei einer geringen Variation derEnergie fur die Likelihood-Raten großer als bei der linearen Eingabe der Energie. Die Abbil-dungsvorschrift ist somit zu ungenau.

7.7 Falsch erkannte Ereignisse

Eine weiterer interessanter Punkt ist die Untersuchung der falsch erkannten Ereignisse. In denAbbildungen 7.56 bzw. 7.57 sind typische falsch identifizierte Elektronen bzw. Protonen ge-zeigt. Die falsch klassifizierten Elektronen zeichnen sich durch sehr niedrige und die Protonendurch einige sehr hohe Energieeintrage aus. Bei den Analysen wurde bisher immer angenom-men, dass die Teilchenart der Datensatze genau bekannt ist. Es ist aber bekannt, dass der Test-strahl eine Kontamination mit anderen Teilchen aufweist [56]. Die Elektronen konnten dabeiz.B. mit Myonen und die Protonen durch Pionen verunreinigt sein. Zur Untersuchung die-ser Vermutungen werden Monte-Carlo-Simulationen von Pionen und Myonen verwendet [56].Die mittleren Verteilungen der Energiedepositionen uber alle Detektorlagen sind in Abbildung

97

Page 104: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

1 keV20

1.6 keV19

1.5 keV18

2 keV17

2.5 keV16

2.5 keV15

14

2.5 keV13

4 keV12

2.4 keV11

1.4 keV10

2.8 keV9

2.2 keV8

1.7 keV7

6

0.7 keV5

1.7 keV4

1 keV3

2.9 keV2

2.4 keV1

Abbildung 7.56: Falsch erkanntes20 GeV-Elektron

18.3 keV20

3.2 keV19

2 keV18

3 keV17

3.2 keV16

5 keV15

3.1 keV14

11.7 keV13

1.5 keV12

11

0.9 keV10

11.3 keV9

20.6 keV8

1.9 keV7

3.4 keV6

19.6 keV5

4

9.6 keV3

2

0.9 keV1

Abbildung 7.57: Falsch erkanntes100 GeV-Proton

Energie [keV]0 5 10 15 20 25 30 35 40

rel.

Hae

ufi

gke

it

-610

-510

-410

-310

-210

-110

20 GeV Elektronen

100 GeV Protonen

100 GeV MC-Pionen

100 GeV MC-Myonen

Abbildung 7.58: Energiedepostionen vonElektronen, Protonen, Myonen und Pio-nen

98

Page 105: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

Ausgabe des NN-0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

rel.

Hae

ufi

gke

it

-410

-310

-210

-110

1Elektronen 20 GeV

MC-Myonen 100 GeV

Abbildung 7.59: Ausgabe des neurona-len Netzes bei Myonen

Ausgabe des NN-0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

rel.

Hae

ufi

gke

it

-410

-310

-210

-110

1MC-Pionen 100 GeV

Protonen 100 GeV

Abbildung 7.60: Ausgabe des neurona-len Netzes bei 100 GeV-Pionen

Ausgabe des NN-0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

rel.

Hae

ufi

gke

it

-410

-310

-210

-110

1Elektronen 20 GeV

MC-Myonen 60 GeV

Abbildung 7.61: Ausgabe des neurona-len Netzes bei 60 GeV-Myonen

7.58 gezeigt. Die 100 GeV-Myonen haben im Gegensatz zu den 20 GeV-Elektronen eine wenigerstark ausgepragte Uberhohung durch Ubergangsstrahlung, da ihre Masse ca. 200 mal hoher ist.Die Pionen haben im Gegensatz zu den Protonen eine kleine Uberhohung durch Ubergangs-strahlungsphotonen.Zum Vergleich der Protonen mit den Pionen und der Elektronen mit den Myonen werden dieEreignisse durch das auf Protonen und Elektronen trainierte Netz propagiert. Die Ergebnissesind in den Abbildungen 7.59 und 7.60 dargestellt. Die Pionen haben eine breite Verteilungder Ausgabewerte. Es sind zwei deutliche Peaks bei -1 und 1 zu erkennen. Ein Teil der Pio-nen verhalt sich also wie ein Proton und ein anderer Teil erzeugt Ubergangsstrahlung, so dasseine Klassifikation als Elektron erfolgt. Dies lasst die Vermutung zu, dass es sich bei einemTeil der nicht erkannten Protonen um Pionen handeln konnte. Die Unterschiede zwischen den20 GeV-Elektronen und den 100 GeV-Myonen sind noch etwas deutlicher. Die Verteilung derMyonen hat zwei deutliche ungefahr gleichhohe Peaks bei -1 und 1. Das gibt einen starkenHinweis darauf, dass es sich bei Ereignissen wie in Abbildung 7.56 nicht um Elektronen, son-dern um Myonen handeln konnte. Wenn man sich nun auch die Ausgabe von Myonen miteiner niedrigeren Energie von 60 GeV ansieht (Abbildung 7.61), ist der Myon-Peak bei 1 nahe-zu verschwunden, da fast keine Ubergangsstrahlung mehr erzeugt wird. Die Vermutung, dasses sich bei den falsch erkannten Ereignissen um Myonen statt um Elektronen handeln konnte,wird damit weiter verstarkt.Die verwendeten Simulationen sind bisher ohne die Simulation der Elektronik gemacht, die zu

99

Page 106: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

7 Neuronale Netze zur Lepton-Hadron-Trennung im Ubergangsstrahlungsdetektor

einem Overflow-Peak fuhren wurde. Man kann die Ergebnisse aber trotzdem als Hinweis aufKontaminationen sehen.Die mogliche Kontamination fuhrt zu einer Verschlechterung der Rejektion. Die tatsachlichmit diesem Detektor erreichbare Rejektion wurde also bei Verwendung reiner Elektron- undProtondatensatze hoher liegen.

100

Page 107: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

8 Zusammenfassung und Ausblick

Der AMS-02-Detektor wurde und wird im Rahmen einer internationalen Kollaboration ent-wickelt und soll zur genauen Spektroskopie der kosmischen Hohenstrahlung auf der Inter-nationalen Raumstation fur mehrere Jahre installiert werden. Mitte des Jahres 2007 muss derDetektor fertig fur den Start sein. Einer der Aspekte, auf den die Hohenstrahlung untersuchtwerden soll, ist die dunkle Materie. Ein moglicher Kandidat hierfur ist das supersymmetri-sche Neutralino, was indirekt uber Annihilationen und damit verbundene Uberhohung inAntiteilchenspektren nachgewiesen werden konnte. Insbesondere ist hier das Spektrum derkosmischen Positronen wichtig. Fur einen Nachweis muss eine gute Trennung der Positronenvon den Protonen, die einen viel großeren Anteil der kosmischen Hohenstrahlung ausmachen,gewahrleistet werden. Zu diesem Zweck ist der AMS-02-Detektor mit einem elektromagneti-schen Kalorimeter und einem Ubergangsstrahlungsdetektor ausgestattet.Ziel dieser Arbeit ist es, mit unterschiedlichen Analysetechniken Daten eines 20-lagigen Uber-gangsstrahlungsdetektorprototyps zu analysieren und eine Aussage uber die Trennung vonPositronen und Protonen zu gewinnen. Da der Effekt der Ubergangsstrahlung ladungsun-abhangig ist, wurden statt Positronen Elektronen aufgenommen. Der Ubergangsstrahlungs-detektor soll einen Unterdruckungsfaktor – oder Rejektion – von 102 bis 103 im Energiebereichvon 5 bis 300 GeV gewahrleisten.Eine klassische Analyse wurde mit den Techniken Cluster-Counting, Fisher-Diskriminante undLikelihood-Test durchgefuhrt. Alle drei Methoden liefern bis zu 200 GeV-Protonenergie eineRejektion von uber 100 und genugen damit der Mindestanforderung. Die Likelihood-Methodekann als einzige Methode auch bei 250 GeV eine Rejektion von uber 100 gewahrleisten.Die Hauptaufgabe dieser Arbeit war die Anwendung des Konzepts kunstlicher neuronalerNetze als Klassifikationsmethode fur Positronen und Protonen. Dazu wurde ein neuronalesNetz in der Programmiersprache C++ geschrieben, das anhand zahlreicher Parameter mog-lichst gut an den vorliegenden Sachverhalt zur Proton-Positron-Trennung angepasst wurde.Das neuronale Netz erreicht dabei im Bereich der statistischen Fehler bei Protonenergien von20 bis 250 GeV eine Rejektion im gewunschten Bereich (20 GeV: 1129±427; 250 GeV: 95±20) undist ahnlich gut wie die Likelihood-Methode und somit deutlich besser als das Cluster-Countingund die Fisher-Diskriminante. Es handelt sich also um eine weitere gute Analysemoglichkeit.In einem zweiten Schritt wurde ein neuronales Netz verwendet, das die Eingaben der vorheri-gen Analysemethoden in einer Methode zusammenfasst. So konnen die unterschiedlichen in-dividuellen Vorteile der Methoden genutzt werden. Es zeigt sich, dass dieses Netz tatsachlichdie besten Rejektionen bei allen Energien liefert von 1581 ± 707 bei 20 GeV bis 129 ± 31 bei250 GeV.Das neuronale Netz mit den Energien als Eingabe stellt eine sehr robuste Methode bei ver-rauschten Energiedepositionen dar. Das zusammenfassende neuronale Netz ist auch immernoch etwas robuster als die Likelihood-Methode.Es wurde anhand von Monte-Carlo-Simulationen gezeigt, dass die aufgenommenen Elektron-daten eventuell mit Myonen und die Protonen eventuell mit Pionen kontaminiert sind. Dieswurde dazu fuhren, dass bei reinen Datensatzen die Rejektion steigen wurde.Es zeigte sich auch, dass die Ausleseelektronik einen Einfluss auf die Rejektion nimmt. Im Ge-gensatz zum Prototypen werden bei dem tatsachlichen Detektor bessere Auslesechips verwen-det, die eine gleichmaßigere Aufnahme der Energiedepositionen bis ca. 80 keV gewahrleisten,was ebenfalls wieder zu einer Verbesserung der Unterdruckungsfahigkeit von Protonen fuhrt.

101

Page 108: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

8 Zusammenfassung und Ausblick

102

Page 109: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.1 Einleitung

In dieser Analyse wurde das Programm ANNA verwendet. Es ist in der objektorientiertenComputersprache C++ geschrieben und stellt folgende Analysemethoden zur Verfugung:

@ Neuronales Netz,

@ Likelihood-Quotient,

@ Cluster-Counting,

@ Fisher-Diskriminante.

Zur Konstruktion des neuronalen Netzes werden Neuron -Objekte zu Schicht -Objekten an-geordnet, die durch Verbindung -Objekte miteinander verknupft werden. Ein Netz -Objektbeschreibt das gesamte neuronale Netz. Die Daten aus root-Dateien werden mit einem Schleife -Objekt eingelesen. Fur den Fall, dass Monte Carlo Simulationen eingelesen werden sollen,wird ein MCSchleife -Objekt erzeugt. Das Training mit einigen verschiedenen Methoden wirddurch ein Backpropagation -Objekt erledigt. Zur Auswertung der Daten werden Auswertung -Objekte fur die zwei zu klassifizierenden Datensatze erstellt.Die weiteren Analysemethoden werden jeweils durch ein Objekt der folgenden Klassen abge-deckt: Cluster , Likelihood und Fisher .In den folgenden Abschnitten wird eine kurze Ubersicht uber die Klassen und eine stichpunkt-artige Erlauterung ihrer Funktionen gegeben.

103

Page 110: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.2 Auswertung Klassenreferenz

Diese Klasse stellt Funktionen zur Verfugung, mit denen die Analysedaten im neuronalen Netzausgewertet werden konnen.

#include <Auswertung.hpp >

Offentliche Methoden

• Auswertung (Netz ∗netz, int Flag, int TrainingsEvents, int ValidationsEvents, char Versions-nummer[200], char Pfad[300])

Dieser Konstruktor sorgt dafur, dass nur die Ereignisse zur Auswertung verwendet werden, die noch nichtfur das Training benutzt wurden.

• Auswertung (Netz ∗netz, int Flag, char Versionsnummer[200], char Pfad[300])Dieser Konstruktor liest alle Ereignisse eines Datensatzes zur Auswertung ein.

• ∼Auswertung ()Dekonstruktor.

• void RandomIndizesHolen ()Einlesen der zufallig verteilten Indizes, die die Ereignisnummern der Trainingsereignisse angeben.

• void ErgebnisseBerechnen ()Berechnung der Ausgaben des neuronalen Netzes fur den Analysedatensatz.

• void AlleErgebnisseBerechnen ()Alle Ergebnisse berechnen.

• vector< double > GetAlleErgebnisse ()Ausgabe aller Ergebnisse des Datensatzes.

• void MittelwertBerechnen ()Mittelwertberechnung.

• double GetMittelwert ()Mittelwertausgabe.

• void FehlerBerechnen ()Berechnung des mittleren Fehlers des Mittelwertes.

• void SigmaBerechnen ()Berechnung der Standardabweichung.

• double GetFehler ()Ausgabe des mittleren Fehlers des Mittelwertes.

• double GetSigma ()Ausgabe der Standardabweichung.

104

Page 111: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

• int GetAnzahlEinzelevents ()Ausgabe der Anzahl der ausgwerteten Ereignisse.

• double GetAnzahlEinzeleventsDouble ()Ausgabe der Anzahl der ausgwerteten Ereignisse.

• double GetErgebnis (int i)Ausgabe des i-ten Analyseereignisses aus dem neuronalen Netz.

• void SetErgebnis (int i, double Wert)Ergebnis des i-ten Ereignisses auf einen bestimmten Wert setzen.

• double Schwelle (double SollEffizienz)Bestimmen der Schwelle fur eine bestimmte Effizienz.

• vector< double > SchwellenArray (double SollEffizienz, int Subsamples)Unterteilung der Ereignisse in bestimmte Anzahl und Berechnung der jeweiligen Schwellen.

• double GetEffizienz ()Ausgabe der Effizienz.

• double Minimum ()Minimum der Ergebnisse.

• double Maximum ()Maximum der Ergebnisse.

Offentliche Attribute

• vector< int > NichtTrainingsEventsIndizes der Nicht-Trainingsereignisse.

105

Page 112: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.3 Backpropagation Klassenreferenz

Klasse fur das Training des neuronalen Netzes. Es werden verschiedene Lernmethoden fur dasTraining des neuronalen Netzes vorgestellt.

#include <Backpropagation.hpp >

Offentliche Methoden

• Backpropagation (Netz ∗netz, double Eventanteil, double ElektronAusgabeErwartungswert,double ProtonAusgabeErwartungswert, int FehlerFlag, int Batchsize, char Versionsnum-mer[200], char Pfad[300])

Konstruktor.

• ∼Backpropagation ()Dekonstruktor.

• void ElektronzahlReset (int ElektronTrainingsevents)Setzen von Werten fur die Anzahl der Elektronereignisse fur das Training und fur die Validation.

• void SetNetz (Netz ∗netz)Setzen eines Netzes.

• void IndizesErstellen ()Trainings- und Validationsindizes wurfeln und speichern.

• int GetElektronTrainingsEvents ()Anzahl der Elektrontrainingsereignisse.

• int GetProtonTrainingsEvents ()Anzahl der Protontrainingsereignisse.

• int GetElektronValidationsEvents ()Anzahl der Elektronvalidationsereignisse.

• int GetProtonValidationsEvents ()Anzahl der Protonvalidationsereignisse.

• void TrainingszyklenLaden ()Zahl der Trainingszyklen laden.

• void TrainingszyklenSpeichern ()Zahl der Trainingszyklen speichern.

• int GetTrainingszyklen ()Zahl der Trainingszyklen ausgeben.

• void SetTrainingszyklen (int Trainingszyklen)Zahl der Trainingszyklen setzen.

106

Page 113: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

• void TrainingszyklenAusgeben ()Zahl der Trainingszyklen ausgeben.

• vector< double > RegularisierungLaden (double alpha1, double alpha2, double alpha3,double beta)

Regularisierung laden und speichern.

• void RegularisierungSpeichern (double alpha1, double alpha2, double alpha3, double beta)Zahl der Trainingszyklen speichern.

• void TrainingsEigenschaftenErstellen ()Trainingseigenschaften erstellen.

• void TrainingsEigenschaftenBerechnen ()Trainingseigenschaften berechnen.

• double GetElektronTrainingsMittelwert ()• double GetProtonTrainingsMittelwert ()• double GetElektronTrainingsSigma ()• double GetProtonTrainingsSigma ()• double GetTrainingsFehler ()• void ValidationsEigenschaftenErstellen ()

Validationseigenschaften erstellen.

• void ValidationsEigenschaftenBerechnen ()Validationseigenschaften berechnen.

• double GetElektronValidationsMittelwert ()• double GetProtonValidationsMittelwert ()• double GetElektronValidationsSigma ()• double GetProtonValidationsSigma ()• double GetValidationsFehler ()• void TrainingsEigenschaftenSpeichernNoReplace ()

Speichern der Eigenschaften vor dem Training.

• void ValidationsEigenschaftenSpeichernNoReplace ()Speichern der Eigenschaften vor dem Training.

• void TrainingsEigenschaftenAusgeben ()• void ValidationsEigenschaftenAusgeben ()• void BatchesErstellen ()• vector< int > BatchesWuerfeln (int seed)• void AbleitungenErstellen ()

Ableitungsarrays erstellen.

• void Ableitungen2teErstellen ()Ableitungsarrys fur 1. und 2. Abl. erstellen.

107

Page 114: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

• void AbleitungenAltLaden ()• void AbleitungenAltSpeichern ()• void VeranderungenAltLaden ()• void VeranderungenAltSpeichern ()• void AbleitungenAltAltLaden ()• void AbleitungenAltAltSpeichern ()• void VeranderungenAltAltLaden ()• void VeranderungenAltAltSpeichern ()• void AbleitungenBerechnen (int Reihenfolge)

Ableitungen der Fehlerfunktionen nach jedem Gewicht berechnen.

• void AbleitungenBerechnen (int Reihenfolge, int GewichtsLage, int PositionLinks, int Position-Rechts)

Ableitungen der Fehlerfunktionen nach jedem Gewicht berechnen.

• void Ableitungen2teBerechnen (int Reihenfolge)1. und 2. Ableitungen (nur Diagonalelemente der Hesse-Matrix) uber Backpropagation-Schritt berechnen

• TMatrixD ∗ HesseMatrix (int Reihenfolge, double Veranderung)Bestimmung aller 2. Ableitungen nach dem Gewicht uber Grenzwertbildung.

• TMatrixD ∗ HesseMatrix ()Bei dieser Methoden werden die 1. Ableitungen miteinander multipliziert.

• vector< double > Bayesian Reg (int Reihenfolge, double Veranderung, double alpha1, dou-ble alpha2, double alpha3, double beta)

Ermittelung der Bayesian Regulatoren zur Einfuhrung einer Strafe auf hohe Gewichte.

• vector< double > Bayesian Reg (double alpha1, double alpha2, double alpha3, double beta)Hesse-Matrix mit Multiplikation der 1. Ableitungen wird verwendet.

• void LernratenLaden (double Lernrate)Laden der Dateien mit Lernraten oder, falls diese nicht vorhanden sind, Initialisierung der Lernrtraten miteinem bestimmten Wert.

• void LernratenSpeichern ()Lernraten speichern.

• void LernrateAnpassen DeltaDeltaBar (double LernrateGrosser, double LernrateKleiner)Lernraten fur die bar-delta-delta-Lernregel anpassen.

• void EigenschaftenSpeichernApp (vector< double > &ElektronTrainingsMittelwert, vector<double > &ProtonTrainingsMittelwert, vector< double > &ElektronTrainingsSigma, vector<double > &ProtonTrainingsSigma, vector< double > &TrainingsFehler, vector< double >&ElektronValidationsMittelwert, vector< double > &ProtonValidationsMittelwert, vector<double > &ElektronValidationsSigma, vector< double > &ProtonValidationsSigma, vector<double > &ValidationsFehler, int Schrittweite)

Speichern der Eigenschaften und Loschen der Vektoren.

108

Page 115: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

• void EigenschaftenLaden ()Eigenschaften laden.

• int MinimumTrainingszyklen ()• void VersionsnummerWechseln (char VersionsnummerNeu[120])

Wechseln der Versionsnummer.

• void DeltaDeltaBar Lernregel (int MaxTrainingszyklen, double Lernrate, double Lernrate-Grosser, double Lernrate Kleiner, double Moment, int Schrittweite, double alpha1, doublealpha2, double alpha3, double beta, int RegFlag)

bar-delta-delta-Lernregel zur Gewichtsanpassung

• void RProp Lernregel (int MaxTrainingszyklen, double Lernrate, double LernrateGrosser,double LernrateKleiner, double Moment, int Schrittweite, double alpha1, double alpha2,double alpha3, double beta, int RegFlag)

RProp-Lernregel zur Gewichtsanpassung.

• vector< double > SVD LM (double Lernrate, int Reihenfolge)• void LM Lernregel (int MaxTrainingszyklen, double Lernrate, double LernrateGrosser, dou-

ble LernrateKleiner, int Schrittweite)Ermittelung der Veranderung der Gewichte mit dem Levenberg-Marquardt-Verfahren. Die Inversion wirduber die Singularwertzerlegung berechnet.

• void stochLM Lernregel (int MaxTrainingszyklen, double Lernrate, double LernrateGrosser,double Moment, int Schrittweite, double alpha1, double alpha2, double alpha3, double beta,int RegFlag)

Stochastisches LM-Verfahren, was die Diagonale der Hesse-Matrix zur Bestimmung der Lernrate verwen-det.

Offentliche Attribute

• vector< double > itsElektronTrainingsMittelwertVektor• vector< double > itsProtonTrainingsMittelwertVektor• vector< double > itsElektronTrainingsSigmaVektor• vector< double > itsProtonTrainingsSigmaVektor• vector< double > itsTrainingsFehlerVektor• vector< double > itsElektronValidationsMittelwertVektor• vector< double > itsProtonValidationsMittelwertVektor• vector< double > itsElektronValidationsSigmaVektor• vector< double > itsProtonValidationsSigmaVektor• vector< double > itsValidationsFehlerVektor

109

Page 116: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.4 Cluster Klassenreferenz

Klasse fur das Cluster-Counting.

#include <Cluster.hpp >

Offentliche Methoden

• Cluster (const vector< vector< double > > &ElektronDaten, const vector< vector< dou-ble > > &ProtonDaten, int EingabeNeuronenAnzahl, int ElektronEinzelevents, int Proton-Einzelevents, int HitCut, double ECut, int Subsamples, char Versionsnummer[200], charPfad[300])

Konstruktor.

• ∼Cluster ()Dekonstruktor.

• void ClusterCounting ()Rejection berechnen.

• vector< double > GetElektronenUeberECut ()Anzahl der Elektronen uber ECut fur jedes Ereignis.

• vector< double > GetProtonenUeberECut ()Anzahl der Protonen uber ECut fur jedes Ereignis.

• double GetElektronEffizienz ()Ausgabe der Effizienz.

• double GetElektronEffizienzFehler ()Ausgabe des Fehlers der Effizienz.

• double GetProtonRejection ()Ausgabe der Rejection.

• double GetProtonRejectionFehler ()Ausgabe des Rejectionfehlers.

• void PlotSpeichern ()Plot speichern.

110

Page 117: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.5 Fisher Klassenreferenz

Klasse fur die Analyse mit der Fisher-Diskriminante.

#include <Fisher.hpp >

Offentliche Methoden

• Fisher (const vector< vector< double > > &ElektronDaten, const vector< vector< double> > &ProtonDaten, int Lagenzahl, int ElektronEinzelevents, int ProtonEinzelevents, doubleSollEffizienz, int Subsamples, char Versionsnummer[200], char Pfad[300])

Konstruktor.

• ∼Fisher ()Dekonstruktor.

• void Kovarianzmatrix ()Schatzung der Kovarianzmatrix berechnen.

• void ErgebnisseBerechnen ()Ergebnisse berechnen.

• void RejectionBerechnen ()Rejection berechnen.

• vector< double > SchwellenArray (double SollEffizienz, int Subsamples)Schwellen fur mehrere Subsample berechnen.

• double GetSchwelle ()Schwelle fur ein Subsample ausgeben.

• double GetSchwelleFehler ()Fehler der Schwelle.

• double GetEffizienz ()Ausgabe der Effizienz.

• double GetRejection ()• double GetRejectionFehler ()• void PlotSpeichern ()

Plot speichern.

• double Minimum ()• double Maximum ()• vector< double > GetElektronFisher ()

Fisher-Werte ausgeben.

• vector< double > GetProtonFisher ()Fisher-Werte ausgeben.

111

Page 118: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.6 Likelihood Klassenreferenz

Klasse fur die Likelihood-Analyse.

#include <Likelihood.hpp >

Offentliche Methoden

• Likelihood (const vector< vector< double > > &ElektronDaten, const vector< vector<double > > &ProtonDaten, int EingabeNeuronenAnzahl, int ElektronEinzelevents, int Proton-Einzelevents, int Subsamples, double SollEffizienz, double BinSize, int Datentyp, doubleElektronWinkel, int ElektronEnergie, double ProtonWinkel, int ProtonEnergie, char Versi-onsnummer[200], char Pfad[300])

Konstruktor.

• Likelihood (const vector< vector< double > > &ElektronDaten, const vector< vector<double > > &ProtonDaten, const vector< vector< double > > &ProtonUebergaenge, intEingabeNeuronenAnzahl, int ElektronEinzelevents, int ProtonEinzelevents, int Subsamp-les, double SollEffizienz, double BinSize, int Datentyp, double ElektronWinkel, int Elektron-Energie, double ProtonWinkel, int ProtonEnergie, char Versionsnummer[200], char Pfad[300])

Konstructor fur alle Datensaetze. Die Likelihood-Verteilung wird an die entsprechende Energie angepasst.

• ∼Likelihood ()Dekonstruktor.

• void DetectorResponse ()• void Rejection (int Datentyp, double ElektronWinkel, int ElektronEnergie, double Proton-

Winkel, int ProtonEnergie)Rejection berechnen.

• vector< double > SchwellenArray (double SollEffizienz, int Subsamples)Array von Schwellen fur eine Anzahl von Subsamples.

• void PlotSpeichern ()Plot der Likelihood-Verteilung speichern.

• double GetSchwelle ()Die Schwelle, die durch die Effizienz bestimmt wird, ausgeben.

• double GetSchwelleFehler ()• double GetEffizienz ()

Effizienz ausgeben.

• double GetRejection ()• double GetRejectionFehler ()• vector< double > GetElektronLikelihood ()

Likelihood-Werte ausgeben.

• vector< double > GetProtonLikelihood ()Likelihood-Werte ausgeben.

112

Page 119: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.7 MCSchleife Klassenreferenz

Einlesen der Monte Carlo-Daten.

#include <MCSchleife.hpp >

Offentliche Methoden

• MCSchleife (char Datensatz[200])Konstruktor.

• ∼MCSchleife ()Dekonstruktor.

• void Loop ()Einlesen des root-files.

• double GetDaten (int Eventnummer, int Lage)Daten ausgeben.

• int GetEventanzahl ()Ausgabe der Gesamtereigniszahl.

• int GetAnzahlEinzelevents ()Ausgabe der Einzelereignisanzahl.

• void PlotSpeichern (char Dateiname[200])Verteilung der Energiedepositionen plotten.

113

Page 120: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.8 Netz Klassenreferenz

Klasse um ein Netz aus Neuronen und Verbindungen zu erstellen. Netz wird mit der Anzahlder Neuronen pro Schicht (Eingabe, Mitte, Ausgabe) initialisiert. Zwischen den Schichten (Ein-gabe - Mitte, Mitte - Ausgabe) wird eine Matrix aus den Gewichten initialisiert.

#include <Netz.hpp >

Offentliche Methoden

• Netz (int EingabeNeuronenAnzahl, int MitteNeuronenAnzahl, int AusgabeNeuronenAnzahl,int GewichtsFlag, int ElektronProtonFlag, char Versionsnummer[200], double Eventanteil,int Datentyp, int ElektronEnergie, double ElektronWinkel, int ProtonEnergie, double Proton-Winkel, int NormierungsFlag, int LHFlag, char Pfad[300], int seed)

Konstruktor fur gemischte Datensatze. Es wird die Skalierung berechnet.

• Netz (int EingabeNeuronenAnzahl, int MitteNeuronenAnzahl, int AusgabeNeuronenAnzahl,int GewichtsFlag, int ElektronProtonFlag, char Versionsnummer[200], double Eventanteil,int Datentyp, int Energie, double Winkel, int NormierungsFlag, char Pfad[300], int seed)

Konstruktor fur einzelne Datensatze. Es wird die Skalierung berechnet.

• Netz (int EingabeNeuronenAnzahl, int MitteNeuronenAnzahl, int AusgabeNeuronenAnzahl,int ElektronProtonFlag, char Versionsnummer[200], int Datentyp, int ElektronEnergie, dou-ble ElektronWinkel, int ProtonEnergie, double ProtonWinkel, const vector< vector< dou-ble > > &ElektronDaten, const vector< vector< double > > &ProtonDaten, const vector<vector< double > > &SkalierteElektronDaten, const vector< vector< double > > &Skalierte-ProtonDaten, int ElektronEvents, int ProtonEvents, char Pfad[300])

Konstruktor fur gemischte Datensatze. Es wird die Skalierung ubergeben und es werden keine Gewichts-werte erzeugt.

• Netz (int EingabeNeuronenAnzahl, int MitteNeuronenAnzahl, int AusgabeNeuronenAnzahl,int ElektronProtonFlag, char Versionsnummer[200], int Datentyp, int Energie, double Win-kel, const vector< vector< double > > &Daten, const vector< vector< double > > &Skalierte-Daten, int Events, char Pfad[300])

Konstruktor fur einzelne Datensatze. Es wird die Skalierung ubergeben und es werden keine Gewichtswerteerzeugt.

• Netz (int EingabeNeuronenAnzahl, int MitteNeuronenAnzahl, int AusgabeNeuronenAnzahl,int GewichtsFlag, int ElektronProtonFlag, char Versionsnummer[200], double Eventanteil,const vector< vector< double > > &ElektronMittelwerte, const vector< vector< double> > &, const vector< double > &ElektronNN, const vector< double > &ProtonNN, constvector< double > &ElektronLH, const vector< double > &ProtonLH, const vector< double> &ElektronFisher, const vector< double > &ProtonFisher, int ElektronEvents, int Proton-Events, int Datentyp, int ElektronEnergie, double ElektronWinkel, int ProtonEnergie, doubleProtonWinkel, int NormierungsFlag, int LHFlag, char Pfad[300], int seed)

Konstruktor fur Netz mit Eingaben aus allen Analysemethoden (Energiemittelwerte, neuronales Netz,Cluster-Counting, Likelihood, Fisher-Diskriminante).

• Netz (int EingabeNeuronenAnzahl, int MitteNeuronenAnzahl, int AusgabeNeuronenAnzahl,int GewichtsFlag, int ElektronProtonFlag, char Versionsnummer[200], double Eventanteil,const vector< vector< double > > &ElektronMittelwerte, const vector< vector< double

114

Page 121: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

> > &ProtonMittelwerte, const vector< double > &ElektronNN, const vector< double >&ProtonNN, const vector< double > &ElektronLH, const vector< double > &ProtonLH,const vector< double > &ElektronFisher, const vector< double > &ProtonFisher, const vector<vector< double > > &ProtonUebergaenge, int ElektronEvents, int ProtonEvents, int Daten-typ, int ElektronEnergie, double ElektronWinkel, int ProtonEnergie, double ProtonWinkel,int NormierungsFlag, int LHFlag, char Pfad[300], int seed)

Konstruktor fur Netz mit Eingaben aus allen Analysemethoden (Energiemittelwerte, neuronales Netz,Cluster-Counting, Likelihood, Fisher-Diskriminante, Teilchenenergie).

• ∼Netz ()Dekonstruktor.

• void GewichteEingabeMitteErzeugen ()• Verbindung GewichtsmatrixEingabeMitte (int i, int j)

Gewichte werden als Matrix angeordnet.

• void SetGewichtEingabeMitte (int i, int j, double Gewicht)Setzen der Gewichte zwischen Eingabe und Mitte ausserhalb von Netz der Netz-Klasse.

• void GewichteMitteAusgabeErzeugen ()Erzeugung von Gewichten zwischen den Mitte- und Ausgabeneuronen.

• Verbindung GewichtsmatrixMitteAusgabe (int i, int j)Gewichte werden als Matrix angeordnet.

• void SetGewichtMitteAusgabe (int i, int j, double Gewicht)Setzen der Gewichte zwischen Mitte und Ausgabe ausserhalb von Netz der Netz-Klasse.

• void GaussGewichte (int seed=0)Erzeugen von Gauss-verteilten Gewichtswerten.

• void GleichverteilungGewichte (int seed=0)Erzeugen von gleichverteilten Gewichten.

• void SchichtenErzeugen ()Erzeugung der Schichten.

• void ElektronDatenZusammenfassen (char Datensatz1[120])Datensatze zusammenfassen.

• void ElektronDatenZusammenfassen (char Datensatz1[120], char Datensatz2[120])Datensatze zusammenfassen.

• void ElektronDatenZusammenfassen (char Datensatz1[120], char Datensatz2[120], char Da-tensatz3[120])

Datensatze zusammenfassen.

• void ProtonDatenZusammenfassen (char Datensatz1[120])Datensatze zusammenfassen.

115

Page 122: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

• void ProtonDatenZusammenfassen (char Datensatz1[120], char Datensatz2[120])Datensatze zusammenfassen.

• void ProtonDatenZusammenfassen (char Datensatz1[120], char Datensatz2[120], char Da-tensatz3[120])

Datensatze zusammenfassen.

• void MCElektronDatenZusammenfassen (char Datensatz1[120])Einlesen der MC-Elektrondaten.

• void MCElektronDatenZusammenfassen (char Datensatz1[120], char Datensatz2[120])Einlesen der MC-Elektrondaten.

• void MCProtonDatenZusammenfassen (char Datensatz1[120])Einlesen der MC-Protondaten.

• void MCProtonDatenZusammenfassen (char Datensatz1[120], char Datensatz2[120])Einlesen der MC-Protondaten.

• void ElektronDatenEinlesen (int Datentyp, int Elektronenergie, double Winkel)Elektrondaten einlesen.

• void ProtonDatenEinlesen (int Datentyp, int Elektronenergie, double Winkel)Protondaten einlesen.

• void AlleProtonDatenEinlesen ()Einlesen der Protondaten aller Energien.

• void AlleElektronDatenEinlesen ()Einlesen der Elektrondaten aller Energien.

• vector< vector< double > > GetProtonDatenuebergang ()Indizes des Ereignisse, wenn die Teilchenenergie wechselt, z.B. von 20 auf 40 GeV.

• vector< vector< double > > GetElektronDatenuebergang ()• void LH Ratio Elektron (int Datentyp, int ElektronEnergie, double ElektronWinkel, int Proton-

Energie, double ProtonWinkel)Eingabe von Likelihood-Raten fur die Elektronen.

• void LH Ratio Proton (int Datentyp, int ElektronEnergie, double ElektronWinkel, int Proton-Energie, double ProtonWinkel)

Eingabe von Likelihood-Raten fur die Protonen.

• void EnergieNormierung (double Eventanteil, int Flag)Normierung der Eingabewerte. 0 = Abzug des Mittelwertes, Normierung der Varianz; 1 = Rotation derKovarianzmatrix auf Einheitsmatrix; 2 = Abzug des Mittelwertes aus allen Lagen und Normierung auf diegesamte Varianz.

116

Page 123: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

• void EnergieNormierungLaden (char Versionsnummer[200], double Eventanteil, int Flag)Normierung laden.

• vector< vector< double > > GetElektronMittelwerte (double ECut)Ruckgabe von Mittelwert und Anzahl von Hits uber ECut fur alle Events.

• vector< vector< double > > GetProtonMittelwerte (double ECut)Ruckgabe von Mittelwert und Anzahl von Hits uber ECut fur alle Events.

• void UmgekehrteReihenfolge (char Versionsnummer[200], double Eventanteil, int Flag)Umgekehrte Reihenfolge der Daten

• void RandomReihenfolge (char Versionsnummer[200], double Eventanteil, int Flag)Zufallige Reihenfolge der Daten.

• void EnergienVerschmieren (char Versionsnummer[200], double ProzentVerschmierung,double Eventanteil, int Flag)

Energien verschmieren.

• void NullLagenEinfuegen (vector< int > NullLagen, char Versionsnummer[200], doubleEventanteil, int Flag)

Lagen mit 0 initialisieren.

• void ElektronEingabeNeuronaktivierung (int Eventnummer)Aktivierung der Eingabeneuronen.

• void ProtonEingabeNeuronaktivierung (int Eventnummer)Aktivierung der Eingabeneuronen.

• vector< vector< double > > GetEnergieDaten ()Ausgabe der Energiedaten.

• vector< vector< double > > GetEnergieDaten (int Flag)Ausgabe der Energiedaten. 1 = Elektron; 2 = Proton.

• int GetEventanzahl ()Ausgabe der Gesamtereigniszahl.

• int GetEventanzahl (int Flag)Ausgabe der Gesamtereigniszahl. 1 = Elektron; 2 = Proton.

• int GetElektronEnergie ()Ausgabe der Energie.

• int GetProtonEnergie ()Ausgabe der Energie.

• int GetAnzahlEinzelevents ()Ausgabe der Anzahl der Einzelspurereignisse.

117

Page 124: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

• int GetAnzahlEinzelevents (int Flag)Ausgabe der Anzahl der Einzelspurereignisse. 1 = Elektron; 2 = Proton.

• void ElektronEingabeNeuronenSpeichern ()• void ProtonEingabeNeuronenSpeichern ()• Neuron Neuronmatrix (int i, int j)

Zugriff auf die einzelnen Neuronen des Netzes.

• int GetEingabeAnzahl ()Ausgabe der Anzahl der Neuronen in der Eingabeschicht.

• int GetMitteAnzahl ()Ausgabe der Anzahl der Neuronen in der Mitteschicht.

• int GetAusgabeAnzahl ()Ausgabe der Anzahl der Neuronen in der Ausgabeschicht.

• void VersionsnummerWechseln (char VersionsnummerNeu[200])Wechseln der Versionsnummer.

• void Berechnen ()Ausgabe des Netzes berechnen.

• double GetErgebnis ()Eregbnis eines Ereignisses ausgeben.

• double Validation (double ElektronAusgabeErwartungswert, double ProtonAusgabeErwartungswert)• vector< vector< double > > GetSkalierteElektronDaten ()

Ausgabe der skalierten Elektrondaten.

• vector< vector< double > > GetSkalierteProtonDaten ()Ausgabe der skalierten Protondaten.

• vector< double > GewichtAbfahren (double Events, int GewichtsLage, int GewichtsPosition-Links, int GewichtsPositionRechts, double Anfang, double Ende, int Schrittzahl, doubleElektronAusgabeErwartungswert, double ProtonAusgabeErwartungswert)

Variation eines Gewichtes zwischen zwei Werten mit Berechnung des mittleren quadratischen Fehlers.

• void Speichern ()Gewichte speichern.

• void Laden ()• void Laden (char Versionsnummer[200])

Gewichte mit bestimmter Versionsnummer laden.

• void SkalierteEnergiePlot ()Plot der skalierten Energien speichern.

118

Page 125: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.9 Neuron Klassenreferenz

Klasse zur Beschreibung eines Neurons.

#include <Neuron.hpp >

Offentliche Methoden

• Neuron ()Konstruktor.

• ∼Neuron ()Dekonstruktor.

• void SetAktivierung (double Aktivierung)Setzen der Aktivierung.

• void AddAktivierung (double Aktivierung neu)Addition eines Wertes zur bestehenden Aktivierung.

• double GetAktivierung () constAusgabe der Aktivierung.

• double OutputSigmoid () constAusgabe der Aktivierung mit sigmoider Funktion.

• double Ableitung () constAusgabe der der sigmoiden Ausgabe.

119

Page 126: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.10 Schicht Klassenreferenz

Klasse, die Neuronen in Schichten zusammenfasst.

#include <Schicht.hpp >

Offentliche Methoden

• Schicht (int Anzahl)Konstruktor.

• ∼Schicht ()Dekonstruktor.

• int GetAnzahl () constAusgabe der Anzahl von Neuronen in einer Schicht.

• Neuron NeuronNummer (int i)Zugriff auf das i-te Neuron in der Schicht.

• void NeuronAddAktivierung (int i, double Aktivierung)Addition eines Wertes zur bestehenden Aktivierung.

• void NeuronSetAktivierung (int i, double Aktivierung)Setzen der Aktivierung.

120

Page 127: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.11 Schleife Klassenreferenz

Einlesen der Datensatze.

#include <Schleife.hpp >

Offentliche Methoden

• Schleife (TTree ∗tree, char Dateiname[120])• Int t Cut (Int t entry)• Int t GetEntry (Int t entry)• Int t LoadTree (Int t entry)• void Init (TTree ∗tree)• void Loop ()

Daten werden in ein dreidimensionales Array eingelesen. Es werden nur Hits auf der Spur geladen.

• void DatenEinladen ()• double GetDaten (int Eventnummer, int Lage, int Roehrchen)

Ausgabe des Datenarrays.

• int GetEventanzahl ()Ausgabe der gesamten Ereigniszahl.

• int GetAnzahlEinzelevents ()Ausgabe der Anzahl der sauberen Einzelspurereignisse.

• Bool t Notify ()• void Show (Int t entry=-1)• void Speichern (char Dateiname[120])

Speichern der Einzelspurenergiedepositionen in einer ascii-Datei.

121

Page 128: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

A ANNA - AMS Neural Network Analysis

A.12 Verbindung Klassenreferenz

Klasse fur die Gewichte zwischen den Neuronen.

#include <Verbindung.hpp >

Offentliche Methoden

• Verbindung ()Konstruktor.

• ∼Verbindung ()Dekonstruktor.

• void SetGewicht (double Gewicht)Setzen des Gewichtes auf einen bestimmten Wert.

• double GetGewicht () constAusgabe des Gewichtswertes.

122

Page 129: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Abbildungsverzeichnis

2.1 Strangeletmodell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.2 Vereinigung der Kopplungskonstanten im MSSM . . . . . . . . . . . . . . . . . . 72.3 Veranschaulichung der Geometrie des Raumes . . . . . . . . . . . . . . . . . . . . 82.4 WMAP-Anisotropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.5 Spiralgalaxie M100 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.6 Rotationskurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.7 Z-Resonanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.8 Messung der kosmologischen Dichteparameter ΩΛ, Ωm . . . . . . . . . . . . . . . 16

3.1 AMS-02 auf der ISS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2 He/He-Spektrum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203.3 Photonspektrum mit moglicher Uberhohung . . . . . . . . . . . . . . . . . . . . . 213.4 Positronspektrum mit moglicher Uberhohung . . . . . . . . . . . . . . . . . . . . 213.5 Neutralino-Annihilationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223.6 Flusse der Komponenten der kosmischen Strahlung . . . . . . . . . . . . . . . . . 233.7 Fluss von Strangelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.8 AMS-02-Detektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.9 Ubergangsstrahlungsdetektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.10 Silizium Spurdetektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.11 Supraleitender Magnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.12 Flugzeitmessung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.13 Anti-Coincidence Veto Zahler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.14 Ring-Imaging Cerenkov Detektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.15 Elektromagnetisches Kalorimeter . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4.1 Modellvorstellung zur Ubergangsstrahlung . . . . . . . . . . . . . . . . . . . . . . 314.2 Prinzip der Ubergangsstrahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324.3 Ubergangsstrahlung an Folienstapel . . . . . . . . . . . . . . . . . . . . . . . . . . 344.4 Interferenzen an einem Folienstapel und Sattigung der TR-Photonanzahl . . . . . 354.5 Absorptionskoeffizient aller Prozesse fur Xe . . . . . . . . . . . . . . . . . . . . . . 374.6 Prinzip eines Zahlrohrs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384.7 Betriebsarten eines Zahlrohrs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394.8 Ubergangsstrahlungsdetektor auf dem Magneten, aus [26] . . . . . . . . . . . . . 404.9 Proportionalzahlrohrmodul aus 16 Einzelrohren, aus [47] . . . . . . . . . . . . . . 404.10 Achteckige Tragestruktur fur die Proportionalkammern, aus [47] . . . . . . . . . 414.11 20 lagiger Ubergangsstrahlungsdetektorprototyp . . . . . . . . . . . . . . . . . . . 434.12 Aufbau der Lagenstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.13 Linearitat der VA-Chips . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5.1 Veranschaulichung der unterschiedlichen Hit-Arten . . . . . . . . . . . . . . . . . 465.2 20 GeV-Elektron, Winkel: -1,5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475.3 20 GeV-Elektron, Winkel: 9,3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475.4 Energiedeposition fur 20 GeV Elektronen und 100 GeV Protonen aus allen Lagen 47

123

Page 130: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Abbildungsverzeichnis

5.5 Wirkungsquerschnitt von Photonen und einem Xe/CO2-Gemisch (80:20) . . . . . 485.6 Verteilung der Energiedeposition der 20 GeV Elektronen in Lage 1 . . . . . . . . . 495.7 Verteilung der Energiedeposition der 20 GeV Elektronen in Lage 20 . . . . . . . . 495.8 Verteilung der Energiedeposition der 100 GeV Protonen in Lage 1 . . . . . . . . . 495.9 Verteilung der Energiedeposition der 100 GeV Protonen in Lage 20 . . . . . . . . 495.10 Mittlere Energien pro Lage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505.11 Anpassung der 20 GeV-Elektrondaten jeder Lage mit analytischer Funktion . . . 525.12 Abweichungen der Anpassung bei den Elektronen . . . . . . . . . . . . . . . . . . 525.13 Verteilung der Abweichungen bei den Elektronen . . . . . . . . . . . . . . . . . . 525.14 Anpassung der 100 GeV-Protondaten jeder Lage mit analytischer Funktion . . . . 535.15 Abweichungen der Anpassung bei den Protonen . . . . . . . . . . . . . . . . . . . 535.16 Verteilung der Abweichungen bei den Protonen . . . . . . . . . . . . . . . . . . . 535.17 20 GeV-Elektronen und 100 GeV-Protonen bei der Cluster-Counting-Methode . . 545.18 20 GeV-Elektronen und 100 GeV-Protonen mit der Likelihood-Methode . . . . . . 555.19 20 GeV-Elektronen und 100 GeV-Protonen mit der Fisher-Diskriminante . . . . . 565.20 Rejektion fur alle klassischen Methoden in Abhangigkeit der Protonenergie . . . 575.21 Toy-MC: Likelihood mit nur einer Energieverteilung . . . . . . . . . . . . . . . . . 585.22 Toy-MC: Likelihood mit abw. Verteilung fur Lagen 5 und 6 . . . . . . . . . . . . . 585.23 Toy-MC: Fit pro Lage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585.24 Toy-MC: teilweise gemittelte Fits . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585.25 Toy-MC: gemittelte Fits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

6.1 Nervenzelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616.2 Modellneuron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 626.3 Feedforward Netz mit einer versteckten Lage . . . . . . . . . . . . . . . . . . . . . 636.4 Beispiel einer Fehleroberflache . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656.5 Gradientenabstieg bei verschiedenen Lernraten . . . . . . . . . . . . . . . . . . . 676.6 Trainings- und Validationsfehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . 686.7 Tangens Hyperbolicus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 696.8 Datentransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

7.1 Schema des Analyseprozesses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 767.2 RPROP-Lernregel, 30 mittlere Neuronen, Normierung (1), Energieeingabe . . . . 787.3 RPROP-Lernregel, 30 mittlere Neuronen, Normierung (2), Energieeingabe . . . . 787.4 RPROP-Lernregel, 30 mittlere Neuronen, Normierung (1), Likelihood-Eingabe . 787.5 δ-δ-Lernregel, 30 mittlere Neuronen, Normierung (1), Energieeingabe . . . . . . . 797.6 δ-δ-Lernregel, 30 mittlere Neuronen, Normierung (2), Energieeingabe . . . . . . . 797.7 δ-δ-Lernregel, 30 mittlere Neuronen, Normierung (1), Likelihood-Eingabe . . . . 797.8 Rejektion: Training mit allen Energien/100 GeV-Protonen . . . . . . . . . . . . . . 797.9 Verhaltnis der Rejektionen: Training mit allen Energien/100 GeV-Protonen . . . . 797.10 Rejektion bei 60 mittleren Neuronen und einem Moment von α = 0, 6 . . . . . . . 817.11 Mittlere Rejektion bei 100 - 250 GeV bei 60 mittleren Neuronen . . . . . . . . . . . 817.12 Zahl der Trainingszyklen bei 60 mittleren Neuronen und einem Moment α = 0, 6 817.13 Maximale Rejektion des jeweiligen Momentes und der mittleren Neuronenanzahl 827.14 Variation des Anfangswertes der Gewichtszufallsverteilung . . . . . . . . . . . . 827.15 Verlauf der Mittelwerte fur Elektronen und Protonen wahrend des Trainings . . 827.16 Verlauf der Standardabw. fur Elektronen und Protonen wahrend des Trainings . 827.17 Verlauf des MSE fur Trainings- und Validationsereignisse. Abbruch bei 35 Zyklen. 827.18 Ausgabe fur Elektronen und Protonen nach dem Training . . . . . . . . . . . . . . 827.19 Struktur des trainierten neuronalen Netzes . . . . . . . . . . . . . . . . . . . . . . 847.20 Verteilung der Gewichtsstarken zwischen der Eingabe- und der Mittelschicht . . 847.21 Verteilung der Gewichtsstarken zwischen der Mittel- und der Ausgabeschicht . . 84

124

Page 131: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Abbildungsverzeichnis

7.22 Verlauf der Rejektion wahrend des Trainings . . . . . . . . . . . . . . . . . . . . . 857.23 Signal-Background-Verhaltnis des trainierten Netzes . . . . . . . . . . . . . . . . 857.24 Anderung der Rejektion bei Variation der Effizienz . . . . . . . . . . . . . . . . . 857.25 Rejektion fur alle Methoden in Abhangigkeit der Protonenergie . . . . . . . . . . 867.26 Korrelation: Cluster-Counting - Fisher-Diskriminante . . . . . . . . . . . . . . . . 887.27 Korrelation: Cluster-Counting - Likelihood . . . . . . . . . . . . . . . . . . . . . . 887.28 Korrelation: Cluster-Counting - Neuronales Netz . . . . . . . . . . . . . . . . . . . 887.29 Korrelation: Likelihood - Fisher-Diskriminante . . . . . . . . . . . . . . . . . . . . 887.30 Korrelation: Likelihood - Neuronales Netz . . . . . . . . . . . . . . . . . . . . . . . 887.31 Korrelation: Energiemittelwert - Cluster-Counting . . . . . . . . . . . . . . . . . . 887.32 Korrelation: Energiemittelwert - Fisher-Diskriminante . . . . . . . . . . . . . . . . 887.33 Korrelation: Energiemittelwert - Likelihood . . . . . . . . . . . . . . . . . . . . . . 887.34 Korrelation: Energiemittelwert - Neuronales Netz . . . . . . . . . . . . . . . . . . 887.35 Korrelation: Neuronales Netz - Fisher-Diskriminante . . . . . . . . . . . . . . . . 887.36 Rejektion bei 20 mittleren Neuronen und einem Moment α = 0, 9 . . . . . . . . . 897.37 Mittlere Rejektion bei 100 - 250 GeV bei 20 mittleren Neuronen . . . . . . . . . . . 897.38 Zahl der Trainingszyklen bei 20 mittleren Neuronen und einem Moment α = 0, 9 897.39 Maximale Rejektion fur das zusammenfasssende neuronale Netz . . . . . . . . . 897.40 Variation der Gewichtszufallsverteilung fur das zusammenf. neuronale Netz . . 897.41 MSE fur Trainings- und Validationsereignisse fur das zusammenf. neuronale Netz 907.42 Ausgabe des zusammenfasssenden neuronalen Netzes . . . . . . . . . . . . . . . 907.43 Signal-Background-Verhaltnis des trainierten zusammenfassenden Netzes . . . . 907.44 Variation der Effizienz fur das zusammenfasssende neuronale Netz . . . . . . . . 907.45 Struktur des trainierten zusammenfasssenden neuronalen Netzes . . . . . . . . . 917.46 Gewichte zwischen Eingabe und der Mitte fur zusammenf. neuronales Netz . . . 917.47 Gewichte zwischen Mitte und der Ausgabe fur zusammenf. neuronales Netz . . 917.48 Rejektion fur alle Methoden in Abhangigkeit der Protonenergie . . . . . . . . . . 927.49 Differenz der Rejektion des zusammenf. Netzes und der Likelihood-Methode . . 937.50 Einfluss der unterschiedlichen Lagen auf die Rejektion . . . . . . . . . . . . . . . 947.51 Anderung der Eingabereihenfolge . . . . . . . . . . . . . . . . . . . . . . . . . . . 957.52 Simulation: elektronisches Rauschen (prozentual) . . . . . . . . . . . . . . . . . . 967.53 Simulation: elektronisches Rauschen (Energie) . . . . . . . . . . . . . . . . . . . . 967.54 Simulation: Abweichungen in der Gasverstarkung . . . . . . . . . . . . . . . . . . 967.55 Kunstl. Gauß-formige Verschm. der Energiedep., gleichm. Verschmierung . . . . 967.56 Falsch erkanntes 20 GeV-Elektron . . . . . . . . . . . . . . . . . . . . . . . . . . . . 987.57 Falsch erkanntes 100 GeV-Proton . . . . . . . . . . . . . . . . . . . . . . . . . . . . 987.58 Energiedepostionen von Elektronen, Protonen, Myonen und Pionen . . . . . . . 987.59 Ausgabe des neuronalen Netzes bei Myonen . . . . . . . . . . . . . . . . . . . . . 997.60 Ausgabe des neuronalen Netzes bei 100 GeV-Pionen . . . . . . . . . . . . . . . . . 997.61 Ausgabe des neuronalen Netzes bei 60 GeV-Myonen . . . . . . . . . . . . . . . . . 99

125

Page 132: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Abbildungsverzeichnis

126

Page 133: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Tabellenverzeichnis

2.1 Ubersicht der Teilchen des Standardmodells . . . . . . . . . . . . . . . . . . . . . 42.2 Neutrino Massengrenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.3 Anteile am Dichteparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4.1 Daten fur die Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5.1 Kriterien fur Einzelspuren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465.2 Mittlere Residuen der Fits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

127

Page 134: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Tabellenverzeichnis

128

Page 135: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Literaturverzeichnis

[1] BERGER, Ch.: Elementarteilchenphysik. Springer, 2002

[2] EIDELMAN, S. et al.: Review of Particle Physics. In: Physics Letters B 592 (2004)

[3] SAKHAROV, A. D.: Violation of CP invariance, C asymmetry, and baryon asymmetry ofthe universe. In: Pisma Zh. Eksp. Teor. Fiz. 5 (1967), S. 32–35

[4] FINCH, E. AMS at YALE.http://hepwww.physics.yale.edu/yaleams/#SQM. September 2002

[5] BATTISTON, R.: Astro particle physics with AMS on the International Space Station. In:Journal of Physics G: Nuclear and Particle Physics (2003), April, Nr. 29, S. 891–902

[6] DE BOER, W.: Grand Unified Theories and Supersymmetry in Particle Physics and Cos-mology. In: IEKP-KA/94-01 (1994). – http://arxiv.org/abs/hep-ph/9402266

[7] DE BOER, W.: Is Dark Matter Supersymmetric? / Particles and Cosmology: the Interface.Cargese, August 2003. – Talk

[8] GONDOLO, P. ; EDSJO, J. ; ULLIO, P. ; BERGSTROM, L. ; SCHELKE, M. ; BALTZ, E.A.: Dark-SUSY: Computing Supersymmetric Dark Matter Properties Numerically

[9] MASIERO, A. ; VIVES, O.: Flavour and CP violation in supersymmetry. In: New Journal ofPhysics 4 (2002)

[10] DE BOER, W. Wim de Boer Home Page.http://www-ekp.physik.uni-karlsruhe.de/˜deboer/

[11] DE BOER, W. ; HEROLD, M. ; SANDER, C. ; ZHUKOV, V.: Indirect Evidence for the Su-persymmetric Nature of Dark Matter from the Combined Data on Galactic Positrons, An-tiprotons and Gamma Rays. In: IEKP-KA/2003-17 (2003). – http://arxiv.org/abs/hep-ph/0309029

[12] GOENNER, H.: Einfuhrung in die Kosmologie. Heidelberg : Spektrum, 1994

[13] WMAP SCIENCE TEAM. Foundations of Big Bang Cosmology.http://map.gsfc.nasa.gov/m uni/uni 101bb2.html. 2003

[14] WMAP SCIENCE TEAM. LAMBDA - MAP Images.http://lambda.gsfc.nasa.gov/product/map/m images.cfm

[15] BENNETT, C. L. et al.: Wilkinson Microwave Anisotropy Probe (WMAP) Observations:Preliminary Maps and Basic Results. In: Astrophysical Journal (2003)

[16] PADMANABHAN, T.: Structure formation in the universe. Cambridge : Cambridge Press,1993

[17] ZEILIK, M. ; GREGORY, S.: Introductory Astronomy & Astrophysics. Orlando : HarcourtBrace, 1997

129

Page 136: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Literaturverzeichnis

[18] GRUPEN, C.: Astroteilchenphysik. Braunschweig, Wiesbaden : Vieweg Verlag, 2000

[19] M100, eine typische Spiralgalaxie.http://www.avgoe.de/StarChild/DOCS/STARCH00/UNIVER01/M100.HTM

[20] FUCHS ASTRONOMISCHES RECHEN-INSTITUT. NGC 2613, 3198, 6503, 7184: Case studiesagainst ‘maximum’ disks.http://citeseer.ist.psu.edu/269652.html

[21] KLAPDOR-KLEINGROTHAUS, H.V. ; ZUBER, K.: Teilchenastrophysik. Stuttgart : TeubnerVerlag, 1997

[22] GROOM, D.E. et al.: Review of Particle Physics. In: The European Physical Journal C15 (2000)

[23] KNOP, R. A. ET AL: New Constraints on Omega M, Omega Lambda, and w from an Inde-pendent Set of Eleven High-Redshift Supernovae Observed with HST. In: The AstrophysicalJournal (2003), November, Nr. 598, S. 102–137

[24] SPERGEL, D. N. et al.: First Year Wilkinson Microwave Anisotropy Probe (WMAP) Obser-vations: Determination of Cosmological Parameters. In: Astrophysics Journal 148 (2003),Nr. 175

[25] ALLEN, S.W. ; SCHMIDT, R.W. ; FABIAN, A.C.: Cosmological constraints from the X-raygas mass fraction in relaxed lensing clusters observed with Chandra. In: Monthly Noticesof the Royal Astronomical Society 334 (2002), Nr. L11

[26] BECKER, R. AMS II Mechanical Integration Homepage.http://rbecker.home.cern.ch/rbecker/AMSII.html. 2003

[27] STRAULINO, S. ET AL.: The PAMELA Experiment on Satellite and its Capability in CosmicRays Measurements. In: Nucl. Inst. and Meth. 478 (2002), Nr. 114

[28] AMS-KOLLABORATION: The Alpha Magnetic Spectrometer (AMS) on the InternationalSpace Station, Part I, Results from the test flight on the Space Shuttle. In: Physics Reports366 (2002), August, Nr. 6, S. 331–404

[29] MALININ, A. on behalf of AMS Collaboration: Astroparticle Physics with AMS-02 / IVINTERNATIONAL CONFERENCE on NON-ACCELERATOR NEW PHYSICS. Dubna,Russia, June 2003. – Talk

[30] MONREAL, B. et al. Tour of the AMS Experiment.http://cyclo.mit.edu/˜bmonreal/frames.what.html. 2002

[31] DE BOER, W. ; HEROLD, M. ; SANDER, C. ; ZHUKOV, V. ; GLADYSHEV, A.V. ; KAZAKOV,D.I.: Excess of EGRET Galactic Gamma Ray Data interpreted as Dark Matter Annihilation.In: IEKP-KA/2004-19 (2004). – http://www.arxiv.org/abs/astro-ph/0408272

[32] DE BOER, W. ; HORN, M. ; SANDER, Ch. ; KAZAKOV, D.: Positron Fraction in the CMSSM.Stockholm, May 2002. – Seminar

[33] DE BOER, W. ; SANDER, Ch. ; HORN, M.: Positron fraction from dark matter annihilationin the CMSSM. In: Nuclear Physics B - Proceedings Supplements Bd. 113, 2002, S. 221 – 228

[34] V.BEREZINSKY ; V.DOKUCHAEV ; EROSHENKO, Yu.: Small-scale clumps in the ga-lactic halo and dark matter annihilation. In: Phys.Rev. D68 (2003), Nr. 103003. –http://arxiv.org/abs/astro-ph/0301551

130

Page 137: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Literaturverzeichnis

[35] SCHAEL, S.: Review on Particle Astrophysics - Search for Dark Matter. / InternationalEurophysics Conference On High-Energy Physics (HEP2003). Aachen, July 2003. – Talk

[36] CHIKANIAN, A. ; FINCH, E. ; MADSEN, J. ; MAJKA, R. ; SANDWEISS, J.: Detecting Strange-lets with AMS-02. 2002. – AMS note 2002-02-01

[37] WALLRAFF, W.: The Si Tracker for the AMS-02 experiment on the Space Station. In: Nucl.Inst. and Methods in Physics Research A (2003), Nr. 511, S. 76–81

[38] BATTISTON, R.: The AMS Silicon Tracker / AMS Internal TIM-Meeting. Houston, Oktober2002. – Talk

[39] BLAU, B. et al.: The Superconducting Magnet System of the Alpha Magnetic SpectrometerAMS-02 / 9th Pisa Meeting On Advanced Detectors: Frontier Detectors For Frontier. 2003.– Talk

[40] SBARRA, C. AMS TOF web page.http://ams.bo.infn.it/TOF.html

[41] FOPP, S. et al.: The Anti Coincidence Counter System of the AMS02 Experiment / 1.Physik. Institut der RWTH Aachen. 2001. – Statusreport

[42] BUENERD, M.: The AMS-02 RICH Imager Prototype In-Beam Tests 20 GeV/c per NukleonIons / The 28th Int. Cosmic Ray Conf. Japan, 2003. – Proceedings

[43] LELUC, C.: AMS a Particle Spectrometer in Space / LEAP 03, International Conference onLow Energy Antiproton Physics. Yokohama, Japan, March 2003. – Talk

[44] KOSSAKOWSKI, M.: Electromagnetic Calorimeter for the AMS-02 Experiment / Calor2002. Pasadena, CA, USA, March 2002. – Talk

[45] GINZBURG, W. ; FRANK, I.: In: Journal Phys. USSR Vol. 9 (1945), S. 353

[46] GOLDSMITH, P. ; JELLY, V.: In: Phil. Mag. Vol. 4 (1959), S. 836

[47] FOPP, S.: Entwicklung und Bau eines auf Proportionalkammern basierenden Ubergangsstrahl-ungsdetektors fur das AMS-02-Weltraumexperiment, RWTH Aachen, Diss., 2004

[48] STRUCZINSKI, W.: Identifizierung hochenergetischer Teilchen durch Ubergangsstrahlung/ RWTH Aachen. 1986. – Habilitation

[49] JACKSON, J.D.: Klassische Elektrodynamik. Berlin; New York : Walter de Gruyter, 1981

[50] BAIER, V. N. ; KATKOV, V. M. ; STRAKHOVENKO, V.M.: Electromagnetic Processes at HighEnergies in Oriented Single Crystals. Singapore : World Scientific Publishing Co, 1998

[51] BAIER, V. N. ; KATKOV, V. M.: Quantum theory of transition radiation and transition paircreation. In: Preprint Budker INP 98-82 (1998), November. – http://arxiv.org/pdf/hep-ph/9811302

[52] LEO, W. R.: Techniques for Nuclear and Particle Physics Experiments. A How-to Approach.Springer Verlag, 2000

[53] SIEGBAHN, K.: Alpha-, Beta-, and Gamma-Ray Spectroscopy. 1. North-Holland PublishingCompany Amsterdam, 1965

[54] HUBBELL, J. H. ; SELTZER, S. M.: Tables of X-Ray Mass Attenuation Coefficients and MassEnergy-Absorption Coefficients / U.S. Department of Commerce. 1996. – NISTIR 5632

131

Page 138: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Literaturverzeichnis

[55] OTTER, G. ; HONECKER, R.: Atome, Molekule, Kerne, Bd.1, Atomphysik. Teubner Verlag, 1998

[56] ORBOECK, J.: The Final 20-Layer-Prototype for the AMS Transition Radiation Detector: Beam-tests, Data-Analysis, MC-Studies, RWTH Aachen, Diss., 2003

[57] AMS Homepage - AMS02 TRD Page.http://accms04.physik.rwth-aachen.de/˜ams/ams02/Electronics/index.html

[58] SIEDENBURG, Th. private Mitteilung

[59] BERGER, M.J. ; HUBBELL, J.H. ; SELTZER, S.M. ; COURSEY, J. S. ; ZUCKER, D. S.: XCOM:Photon Cross Sections Database / U.S. Department of Commerce. – NBSIR 87-3597

[60] LANDAU, L.: In: J. Physics (USSR) 8 (1944), Nr. 201

[61] BLOBEL, V. ; LOHRMANN, E.: Statistische und numerische Methoden der Datenanalyse. Stutt-gart; Leipzig : B.G. Teubner, 1998

[62] COWAN, G.: Statistical Data Analysis. Oxford University Press, 1998

[63] BRANDT, S.: Statistical and Computational Methods in Data Analysis. Springer Verlag, 1999

[64] BISHOP, C. M.: Neural Networks for Pattern Recognition. Clarendon Press, 1995

[65] CAMPBELL, N. A. ; REECE, J. B. ; MARKL, J.: Biologie. Spektrum Akademischer Verlag, 2003

[66] MOLLER, B. ; DANEKAS, A. Einfuhrung in Neuronale Netze.http://wwwmath.uni-muenster.de/informatik/Professoren/Lippe/lehre/skripte/wwwnnscript/.1999

[67] LECUN, Y. ; BOTTOU, L. ; ORR, G. ; MULLER, K.-R.: Efficient BackProp. In: ORR, G. (Hrsg.); MULLER, K.-R. (Hrsg.): Neural Networks: tricks of the trade. Springer Heidelberg, 1998

[68] RUMELHART, D. E. ; MCCLELLAND, J. L.: Parallel Distributed Processing. Bd. 1. MIT Press,1986

[69] HAMMER, B. Neuronale Netze Vorlesung im WS 99/00.http://www-lehre.informatik.uni-osnabrueck.de/%7Enn/. 2000

[70] FEINDT, M.: A Neural Bayesian Estimator for Conditional Probability Densities. In: IEKP-KA/04-05 (2004). – http://www.arxiv.org/ps/physics/0402093

132

Page 139: Separation von Leptonen und Hadronen mit Hilfe von neuronalen …philipvd/Diplomarbeit.pdf · 2013-09-04 · Materie genannt. Eines der weiteren großen Ratsel der modernen Kosmologie

Danksagung

Ich mochte diese Gelegenheit nutzen, um allen Leuten zu danken, die mich wahrend dieserArbeit und auf dem Weg dorthin, unterstutzt haben.Zunachst mochte ich mich bei den Professoren Dr. Frank Raupach und Dr. Stefan Schael fur diefreie Gestaltung dieser interessanten Aufgabenstellung und die Hilfsbereitschaft bei Fragenzum weiteren Vorgehen bedanken. Auch Dr. Thorsten Siedenburg hat nicht unerheblich mitAnmerkungen zum Gelingen dieser Arbeit beigetragen. Dafur bedanke ich mich.Ein besonderer Dank geht an Dr. Thorsten Siedenburg, Henning Gast und meiner Mutter Ger-linde von Doetinchem fur die kritische Durchsicht dieser Arbeit.Da ich am Anfang der Arbeit quasi 0-Computerkenntnisse besaß, danke ich insbesondere JanOlzem, dem C++-Meister, und Arno Heister, dem Condor-Gott, fur die geduldigen Erklarun-gen von C++, ROOT und dem Condor-System. Ich danke auch Dr. Thomas Kress, dessen Com-puter-Cluster die meisten meiner Berechnungen gut und zuverlassig durchgefuhrt hat. Auchder Gedankenaustausch mit Henning Gast hat mir nicht nur einmal weitergeholfen. Danke.Ich danke ebenfalls der gesamten Mensa-11:45-Gruppe fur freundschaftliche oder fachliche Ge-sprache auf dem Weg zur oder in der Mensa. Die Zusammensetzung unterlag einigen Fluktua-tionen, aber die folgenden Damen und Herren waren des ofteren mit dabei: Roman Adolphi,Richard Brauer, Prof. Dr. Lutz Feld, Henning Gast, Dr. Katja Klein, Thomas Krynicki, Dr. StefanKonig, Dieter Oellers, Jan Olzem, Jorg Orboeck und Rolf Scheben.Ein weiterer Dank geht an meine anfanglichen und jetzigen Burogenossen Dr. Stefan Fopp, Dr.Thomas Kirn und Dr. Thorsten Siedenburg, Frank Doemmecke, Jan Hattenbach, Tobias Ruheund Jens Gießelmann fur die freundschaftliche Atmosphare.Auch einigen guten Studienfreunden, mit denen so manche Gerstenkaltschale, aber auch Prufungbezwungen wurde, mochte ich hier danken: Philipp Biallaß, Henning Gast, Patrik Grychtol,Andreas Janssen, Thomas Krynicki, Jorg Mauler, Thomas Richter, Adrian Vogel und Lotte Wil-ke.Ein Dank geht auch an meine WG-Partner Arno Schulte genannt Kellermann und Verena vonDoetinchem. Hat Spaß gemacht!Ein ganz großer Dank geht an meine Familie Gerlinde, Magnus, Verena und Moritz von Doe-tinchem fur die moralische und finanzielle Unterstutzung meiner Vorstellungen im Leben1.Ohne Euch hatte ich es nicht geschafft.Der letzte Dank geht an meine liebe Superfreundin Saskia Reibe, die meine Launen wahrenddes Tippens, so gut es ging, ausgehalten hat und mir sogar ab und zu mal ein Brot geschmierthat ,. Meine Gefuhle ihr gegenuber werden vielleicht am besten durch ein Zitat von Goetheaus dem Faust beschrieben:

”Ein Blick von dir, ein Wort mehr unterhaltAls alle Weisheit dieser Welt.“

In diesem Sinne:

Keep on the sunny side!1bis auf die Tatowierungen ,

133