Haltet den (Daten-) Dieb! Echtzeiterkennung von Anomalien in Computernetzwerken mit maschinellen...

Haltet den (Daten-) Dieb!

Echtzeiterkennung von Anomalien in Computernetzwerken mit maschinellen Lernverfahren

Julian Keppel Offenburg, 08.03.2017

Student an der Hochschule Karlsruhe

Themen: Spark, Stream Processing, Machine Learning

Betreuer: Prof. Dr. Christian Zirpins

Julian Keppel

› Erkennung ungewöhnlicher Netzwerkaktivitäten

› Signaturbasierte Systeme wie SNORT

› Neue Angriffsmuster, für die noch keine Signaturen vorliegen? à Machine Learning

EinführungAnwendungsfall Intrusion Detection

{"port_src": 46812,"ip_src": "0.0.16.120","ip_dst": "0.0.112.252","tcp_flags": "30","port_dst": 80,"ip_proto": "tcp","timestamp_end": "2016-12-07 09:22:17.0","tos": 0,"timestamp_start": "2016-12-07 09:22:17.0","packets": 7,"bytes": 869

Einführung

› In der Praxis fehlen häufig Labels

› Unsupervised Algorithmen wie Clustering schaffen Abhilfe

› Einfach und weit verbreitet: k-means

Einführung

KonzeptFeature-Extraktion: Categorials

…,tcp,……,udp,……,udp,……,icmp,……,udp,……,tcp,…

String-Indexing

…,1.0,……,0.0,……,0.0,……,2.0,……,0.0,……,1.0,…

…,0.0,1.0,0.0,……,1.0,0.0,0.0,……,1.0,0.0,0.0,……,0.0,0.0,1.0,……,1.0,0.0,0.0,……,0.0,1.0,0.0,…

One-Hot-Encoding

KonzeptFeature-Extraktion: Verschiedene Skalierungen

…,421,4,……,2021,8,……,768,16,……,3122,10,……,139,2,…

…,2845,10,…

Standard-Scaling

…,0.328,0.805,……,1.574,1.611,……,0.598,3.222,……,2.431,2.013,……,0.108,0.403,……,2.215,2.013,…

KonzeptAnsätze für Anomaly Detection

PrototypArchitektur

Storage

Alarme

Trace Trace

Trainingsdaten

Modell

› Spark bietet breite Auswahl an Bibliotheken› Einheitliche API für Batch- und Stream-Processing

› Dataframe/Dataset-API (SQL)

› Machine Learning-Workflows

› Alles nötige aus einer Hand› Model Selection

› Feature-Engineering und Vorverarbeitung

› Echtzeiterkennung

PrototypSpark, Streaming & MLlib

PrototypSpark Pipeline-Konzept

String-Indexing

One-Hot-Encoding

Standard-Scaling

k-means Clustering

Modell

PrototypEchtzeiterkennung mit Spark Streaming

Modell

{"port_src": 0,"ip_src": "0.0.16.120","ip_dst": "0.0.112.252","tcp_flags": "0","port_dst": 0,"ip_proto": "ipv6-crypt","tos": 0,"packets": 130599,"bytes": 103103700

cluster: 16, distance: 13.72

distance > 12.0 ?

Alarm!

{"port_src": 0,"port_dst": 0,"ip_src": "0.0.159.234","ip_dst": "0.0.23.180","ip_proto": "ipv6-crypt","tos": 0,"packets": 130599,"bytes": 103103700,"timestamp_start": "2017-01-03 16:15:11.0","timestamp_end": "2017-01-03 16:15:21.0","tcp_flags": 0

EvaluationBeispiele für Anomalien Punkt-

anomalie

EvaluationBeispiele für Anomalien

{"port_src": 53,"port_dst": 37095,"ip_src": "0.0.83.30","ip_dst": "0.0.159.234","ip_proto": "udp","tos": 0,"packets": 1,"bytes": 698,"timestamp_start": "2017-01-08 05:16:19.0","timestamp_end": "2017-01-08 05:16:19.0","tcp_flags": 0

Kollektive Anomalie

› Klassischerweise werden Modelle einmalig trainiert (Offline)

› Bei Bedarf periodisch neues Training des Modells

› Manchmal kontinuierliche Anpassung des Modells an die Gegebenheiten wünschenswert (Online)

› Online-Implementierung für k-means in Spark

Online-Learning?

› Clusterzentren werden für jeden Micro-Batch aktualisiert

› „Vergesslichkeit“ des Modells konfigurierbar

› Vorteil: Adaption von sich ändernden Gegebenheiten

› Nachteil: Auch Adaption etwaiger Anomalien?

Online k-means in Spark

Online- vs. Offline-LearningVersuchsaufbau

Training Test

Online-Modell

Update 1 Update 2 Update n…

Vorhersagen

Receiver Operating CharacteristicSchwellwert- & Gütebestimmung

Online- vs. Offline-LearningEvaluation mit synthetischen Daten

0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100

Zeitpunkt

Grenze Online-Modell Offline-Modell

› Sinkende Performance: Es zeigt sich deutlich die Adaption des Modells

› Ohne weitere Logik zu wenig Kontrolle über das Verhalten des Modells

› Für Intrusion Detection: Empfehlung tendenziell zu Offline-Modell

Online- vs. Offline-Learning

› Evaluation mit Fachabteilung: Bei geeigneter Feature-Auswahl korrekte Mustererkennung

› Skalierbare Echtzeiterkennung durch Apache Spark

› Als sinnvolle Ergänzung zu regelbasiertem System

› Online-Learning nur bei gezielten Updates (Adaption von Angriffen vermeiden)

Abschluss

› Andere Clusteringverfahren und Distanzmetriken?

› Gelabelte Trainingsdaten eröffnen neue Möglichkeiten (supervised Learning)

› Updatezeiten Offline- vs. Online-Modell?

Ausblick

Vielen Dank

Julian Keppel

inovex GmbH

Ludwig-Erhard-Allee 6

76131 Karlsruhe

julian.keppel@inovex.de

Haltet den (Daten-) Dieb! Echtzeiterkennung von Anomalien in Computernetzwerken mit maschinellen...

Software

Transcript of Haltet den (Daten-) Dieb! Echtzeiterkennung von Anomalien in Computernetzwerken mit maschinellen...

VoIP – Voice over IP Von Bernd Heilinger. Was ist VoIP? Telefonieren über Computernetzwerken Was wird gebraucht? Computernetz Daten und Sprache über ein.

Trends für die Künstliche Intelligenz...7 Neuronale Netzte (Deep Learning) Künstliche neuronale Netze sind eine Basis für maschinelle Lernverfahren nach dem Vorbild der Nervenzellenvernetzung

Fortbildungsveranstaltungen · 11.2. – 1 • Die Balkenagenesie und assoziierte 14.00 bis 15.00 Uhr Anomalien. Fortbildung. Fortbildung – – ...

Möglichkeiten der pränatalen Diagnostik bei ZNS Anomalien · Basisuntersuchung Nach Mutterschaftsrichtlinie sind in der Schwanger-schaft 3Ultraschalluntersuchungenvorgesehen, eineje

Vergleich von Lernverfahren für Netzstrukturen mit radialen Basisfunktionen

Psychophysiologische Anomalien? Einsichten über die ...geb.uni-giessen.de/geb/volltexte/2012/8921/pdf/SchoenwetterTim_2012_08_14.pdf · 3 Vorbemerkungen In dieser Arbeit berichte

Von Behavioral Finance zu Cognitive Finance · Theory “ „Disposition ... Cognitive Finance analysiert die neuronalen Auslöser hinter bekannten Phänomenen und Anomalien Vor dem

Anomalien der rationalen Entscheidungstheorie€¦ · Das Allais-Paradox ist mit einem oft zitierten "historischen Kuriosum" verknüpft, an dem sich einige grundlegende Überlegungen

Neuronale Lernverfahren für Klassifikationwind.in.tum.de/lehre/neuro/SS2003/vl7.pdf · PD Dr. Martin Stetter, Siemens AG Klassifikation: Perceptron 3 •Perceptron-Lernregel: Gradientenabstieg

Inhaltsverzeichnis · Material und Methoden kommt es zu Temperaturanomalien im Oberflächenwasser. Diese Anomalien nennt man Kaltwasserfilamente, die von ihrer anfänglichen Größe

Anomalien der rationalen Entscheidungstheorie · Anomalien der rationalen Entscheidungstheorie Unveröffentlichtes Manuskript*) Klaus Manhart mail@klaus-manhart.de München, Juli

2. Grenzen und Gefahren des ökonomischen Verhaltensmodells Psycholog Grundlagen... · • Spielen Anomalien im Aggregat eine Rolle? – Ökonomisches Verhaltensmodell modelliert

KANSKIs Klinische Ophthalmologie - shop.elsevier.de · 6.19 Kongenitale Anomalien von Kornea und Bulbus . . 231 ... 14.10 Idiopathische Makula tele angiektasie . . . . . . . . . .

Gravimetrie - geobasis-bb.de · südlichen Phyllitzone können gravimetrisch nicht ausgehalten werden. Der Schwereanomalie sind die lokalen magnetischen Anomalien von Hillmersdorf,

UE Titelseite Kopfzeile - bewegunglesen.ch · • Teamführung Lernverfahren (LV): • Lernstufen „Erwerben und Festigen“ (Flügelwurf) bis „Anwenden und Variieren“ (taktisches

Moderne Therapieverfahren der Patellaluxation · Trochlea Groove – Mess-Strecke zur Erkennung von knöchernen Anomalien. MPFL - Lig.patellofemorale mediale • Entdeckung durch

Fetale Holoprosenzephalie: Assoziierte Fehlbildungen und ...hss.ulb.uni-bonn.de/2007/1040/1040.pdf · Fetale Holoprosenzephalie: Assoziierte Fehlbildungen und Chromosomale Anomalien

Anomalien der Gerinnung bei Tonsillektomie-Nachblutungen ...geb.uni-giessen.de/geb/volltexte/2018/13722/pdf/SadriSaemiraRoxana... · Anomalien der Gerinnung bei Tonsillektomie-Nachblutungen

Wo stehen wir? Lernverfahren: Top Down Induction of Decision Trees Begriffslernen kNN SVM Least general generalization Generalisierte -Subsumtion –RDT,

Einschätzung der Hämodynamik nach korrigierender Operation ... · kann häufig nur eine Verbesserung der Hämodynamik unter Verbleib anatomischer und hämodynamischer Anomalien