HADES - dfn.de · 49. Betriebstagung – DFN Dr. Stephan Kraft 2 Historie Theorie und Technik...
Transcript of HADES - dfn.de · 49. Betriebstagung – DFN Dr. Stephan Kraft 2 Historie Theorie und Technik...
HADES
Laufzeitmessungen (nicht nur) im XWiN
49. Betriebstagung – DFN Dr. Stephan Kraft
2
HistorieTheorie und TechnikAusbaustandMessungen und DatenanalyseHADES Alarmierung
49. Betriebstagung – DFN Dr. Stephan Kraft
3
Historie
49. Betriebstagung – DFN Dr. Stephan Kraft
4
• Das WiNLabor– 14 Jahre am RRZE in Erlangen– BWiN > GWiN > XWiN– Klassische Aufgaben
• Qualitäts und Dienstgüteüberwachung• Verkehrsflussmessungen• Hardwaretests
• IPPM– Entwicklung seit 1998– Aktuell in 7 Netzen im Einsatz– Ca. 100 Messstationen– Als „HADES“ seit 2006
49. Betriebstagung – DFN Dr. Stephan Kraft
5
Theorie und Technik
49. Betriebstagung – DFN Dr. Stephan Kraft
6
• IP Performance Metrics– OneWay Packet Delay
• OWD: Verzögerung, die ein Paket vom Quell zum Zielrechner erfährt
– OneWay Packet Loss• OWPL: Anteil der verloren gegangenen Pakete in
einem bestimmten Zeitraum– IP Delay Variation
• IPDV Differenz der OWDs aufeinander folgender Pakete
– (Connectivity)– (Packet Reordering)
49. Betriebstagung – DFN Dr. Stephan Kraft
7
• One Way Delay– Parameter
• SRC IPAdresse des Hosts• DST IPAdresse des Hosts
– Einheit• Reelle oder nicht definierte (unendliche) Zahl dT
in Sekunden– Bedeutung
• OWD from SRC to DST @ T = dT. SRC hat das erste Bit zum Zeitpunkt T an DST gesendet und DST hat das letzte Bit zum Zeitpunkt (T +dT) erhalten
• OWD from SRC to DST @ T = undefined: DST hat das von SRC zum Zeitpunkt T gesendete Paket nicht empfangen
49. Betriebstagung – DFN Dr. Stephan Kraft
8
• One Way Delay vs. Round Trip Time (RTT)– Der Pfad SRC – DST kann sich vom Pfad DST – SRC
unterscheiden– Auch bei gleichem Pfad können Hin und Rückweg
unterschiedliches Verhalten zeigen (unterschiedliche Ausgangswarteschlangen, unterschiedliche Verkehrsmengen)
– Anwendungsspezifische Verzögerung (z.B.: TCPStrom mit großen Datenpaketen, kleinen Acknowledgement, UDP als unidirektionaler Multimediastrom)
49. Betriebstagung – DFN Dr. Stephan Kraft
9
• Zeit– Die Qualität der Messungen des OWD hängt von der
Genauigkeit der Uhren ab.– ntp alleine nicht ausreichend– optimale Lösung: genaue Hardware Uhr vor Ort– Realisierbar über GPS– Stratum1 an den Messstationen– Genauigkeit < 10 µs
49. Betriebstagung – DFN Dr. Stephan Kraft
10
• Messungen– PCbasierte Messboxen– Aktive Messungen– jede Messung hat einen Sender – Receiver Prozess– vollvermaschte Messung– nahezu an allen Standorten GPS Uhren
#qos_mi_instance data file: /data/2008/10/13/Kassel_DFN.Aachen_DFN.0.dat#data file number : 18#qos_mi_sender address : 188.1.98.50:52136 (Kassel_DFN) #qos_mi_receiver address : 188.1.43.210:52136 (Aachen_DFN) #packet size : 41#precedence : 0x0#interval length : 60#packet group size : 9#date & time : Mon Oct 13 00:00:17 2008 UTC
49. Betriebstagung – DFN Dr. Stephan Kraft
11
Ausbaustand
49. Betriebstagung – DFN Dr. Stephan Kraft
12
49. Betriebstagung – DFN Dr. Stephan Kraft
13
• XWiN– 46 Standorte mit Messboxen bestückt– vollvermascht– teilweise Messung durch Anwendernetz über zweites
Interface– ca 3000 kontinuierliche Messungen pro Minute
• GEANT– 35 Standorte im GEANT2 Netz und angeschlossenen
Netzen– 23 Standorte in NRENs im „Multi Domain Monitoring” Pilot– teilvermascht– ca. 2500 kontinuierliche Messungen pro Minute
49. Betriebstagung – DFN Dr. Stephan Kraft
14
Messungen und Datenanlayse
49. Betriebstagung – DFN Dr. Stephan Kraft
15
• Messungen – wie sehen die Daten aus
49. Betriebstagung – DFN Dr. Stephan Kraft
16
• Intrinsic Delay – Routing Delay
49. Betriebstagung – DFN Dr. Stephan Kraft
17
• Route Change
49. Betriebstagung – DFN Dr. Stephan Kraft
18
• Einzelne Ausreisser
49. Betriebstagung – DFN Dr. Stephan Kraft
19
HADES Alarmierung
49. Betriebstagung – DFN Dr. Stephan Kraft
20
• Auslastung Überlastsituationen
• keine
• leichte
• starke
49. Betriebstagung – DFN Dr. Stephan Kraft
21
• Langzeitbeobachtungen
• Dauerhafte Topologieänderungen
• Kürzere Routingänderungen
• Kategorisierung der Messdaten in Cluster
49. Betriebstagung – DFN Dr. Stephan Kraft
22
• Algorithmus
49. Betriebstagung – DFN Dr. Stephan Kraft
23
• Schritte– Preprocessing
• Systemische Fehler werden erkannt (z.B. Uhrenfehler)• Clustern der Daten
• rerouting Erkennung• Bestimmung des intrinsischen Delays (min OWD)
– Analyse• Subtraktion des intrinsischen Delays von den Daten• Statistische Analyse und Bewertung des routing delays
49. Betriebstagung – DFN Dr. Stephan Kraft
24
• Analyse
49. Betriebstagung – DFN Dr. Stephan Kraft
25
• Ziele– Kurzzeit Alarme > schnelle Reaktion
• PerformanceKlassen:• Excellent• Fair• Poor• Bad
– Leitungsklassifizierung (top/worst 10) > Optimierung– Langzeitanalyse der Leitungsqualität >
Qualitätsmanagement
49. Betriebstagung – DFN Dr. Stephan Kraft
26
Vielen Dank!
WiNLaborRegionales Rechenzentrum derFriedrichAlexander Universität ErlangenNürnbergMartensstraße 191058 Erlangen
win[email protected]8528800