Big Data Referenzarchitektur im agilen und digitalen Wandel · Tweets, RSS- und Newsmeldungen im...
Transcript of Big Data Referenzarchitektur im agilen und digitalen Wandel · Tweets, RSS- und Newsmeldungen im...
Für externe Präsentationen bitte immer eine Titelfolie mit der Ressort-Farbe verwenden.
Big Data Referenzarchitektur im agilen und digitalen Wandel
Data Analytics 2019, Phantasialand Brühl
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.2019
Agenda
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.20192
1.
2.
3.
4.
DB Systel – Wer wir sind und wohin wir gehen
Agilisierung der IT-Governance, Referenzarchitektur und des Vorgehens im Projekt
Entwicklung der Datawarehouse & Big Data Architekturpattern
Praxisbeispiel: SD4M & Early-Bird
Wer wir sind: Fakten
DB Systel - Digital bewegen. Gemeinsam.
3800 Mitarbeiter, 25% Frauenanteil,
über 70 verschiedene Nationalitäten
Über 600 IT-Verfahren im Betrieb
100.000 digitale Arbeitsplätze
13.000 Security-Events pro Sekunde
40.000 Systeme im monatlichen
Schwachstellen-Scan
Über 80% der IT-Verfahren
werden in die Cloud migriert
Über 45 neue digitale Geschäftsideen,
entwickelt in unseren Innovation-Labs
1.500 Besucher monatlich in den Labs
Beteiligung an mehreren vom Bund
geförderten Forschungsprojekten
zur Zukunft von Verkehr und Logistik
Personenverkehr, Güterverkehr,
Logistik, Infrastruktur, Konzernleitung
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.20193
Wohin wir gehen: Agiler, digitaler Wandel
Einzelmaßnahmen dienen dem unternehmensweiten Kulturwandel
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.20194
Architektur &
TechnologieOrganisation
InnovationMethoden
Agilität
DevOpsSAFe
„Two Deliferies a
Day“
Agiles BI-
Vorgehensmodell
Scrum
Team,
Productowner,
Agility-Master
Selbst-
organisation
Team-
verantwortung
CommunitiesGilden
Skydeck
Innovation-Room Pitch-Day
Accelerator-
Programm
Hackertrons
Brown-Bags
Cloud
Business-Hub
(API first)
Security-ScansContainer
Micro-
Services
Data-
Lakes
GitLab
Kooperationen (Uni,
Bund, Partner) Ausbildung
(Bachelor & Master
Arbeiten)
Mitarbeiter-
Enablement
Analysten
/ ext. Labs
Start-Ups
(intern)
Fail Fast
CI, CT, CD
User-
Centricity
Self-
Service
Open Data
KI
„Zero.One.Data“
Big Data Projekte
Netzwerke
Beispiel: Innovationsförderung im Accelerator-Programm
https://www.dbsystel.de/dbsystel/digitalisierung/innovationen/skydeck-uebersicht/accelerator-programm
Early-Bird
Extrahiert Mobilitätsinformationen aus
Social-Media in Echtzeit.
Entstand aus Forschungsprojekt SD4M.
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.20195
Agenda
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.20196
1.
2.
3.
4.
DB Systel – Wer wir sind und wohin wir gehen
Agilisierung der IT-Governance, Referenzarchitektur und des Vorgehens im Projekt
Entwicklung der Datawarehouse & Big Data Architekturpattern
Praxisbeispiel: SD4M & Early-Bird
IT-Architekturmanagement im DB-Konzern und DB Systel
Etablierte Methoden greifen ineinander
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.20197
Abkürzungen, Quellen, Links:
COBIT = Control Objectives for Information and Related Technology, http://de.wikipedia.org/wiki/Cobit
TOGAF = The Open Group Architecture Framework, http://de.wikipedia.org/wiki/TOGAF
CMMi = Capability Maturity Model Integration, http://de.wikipedia.org/wiki/CMMI
ITIL = IT Infrastructure Library, http://de.wikipedia.org/wiki/ITIL
Sichten und Komponenten = DB-Systel Architekturbeschreibung, siehe z.B. http://de.wikipedia.org/wiki/4%2B1_Sichten, http://www.arc42.de/
UML = Unified Modeling Language (Vereinheitlichte Modellierungssprache), http://de.wikipedia.org/wiki/Unified_Modeling_Language
COBIT
IT-Governance DB Konzern
TOGAF
IT-Bebauung (Enterprise-Architecture-Management)
Architektursichten und Komponenten mit UML
IT-Architektur von Systemen bei DB-Systel
Referenzarchitekturen und Baupläne
CMMi
IT-Projekte bei DB-Systel, Level 3 zertifiziert
Proces-Library
ITIL
RZ-Betrieb bei DB-Systel, zertifiziert
RZ Portfolio & Plattformen
System „Referenzarchitektur“ bei DB-Systel
Standardisierung schafft Qualität, Effizienz, Nachhaltigkeit
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.20198
Big
Picture
Referenzarchitekturen
Referenzplattformen
Referenzbaupläne
Referenzarchitekturenstrukturieren den fachlichen
Anwendungsbereich, beschreiben die
technische Lösung produktunabhängig (!)
mittels geeigneter Architektur-Pattern,
beschreiben dann welche Produkte und
Technologien in Frage kommen und welche
im „Standard“ der DB gesetzt sind und
bieten Auswahlkriterien für
Referenzbaupläne.
Big Pictureunterstützt den Entwurf einer angemessenen
technischen Software-Architektur für ein
einzelnes IT System bis zu einer komplexen IT
Systemlandschaft
Referenzplattformensind Plattformleistungen, die
optimal auf die Referenz-
baupläne und den Betrieb
abgestimmt sind
Referenzbauplänebeschreiben produktabhängig wie
und in welchen Ausprägungen die
Lösung realisiert werden kann,
setzen Vorgaben im Design, der
Implementierung und im Betrieb
und zeigen auf, wie nicht-
funktionale Anforderungen
umgesetzt werden.
Architektur- & Portfoliosteuerung „Top-Down“ - Stand 2012
Vorlaufzeiten, Gremien, Personalstand erschweren Agilität
(
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.20199
Die Weiterentwicklung des IT-Lösungsportfolios erfolgt im Technologiemanagement-Prozess (TecM)
Das Technologiemanagement-Board stellt die Ausrichtung des Portfolios mit IT-Vision der Deutschen Bahn sicher
Die Entwicklung der Referenzarchitekturen, Baupläne, Plattformen erfolgt bedarfsgerecht
Kontrolle der Einhaltung der Referenzarchitektur-Vorgaben erfolgt via CMMi-Prozesse durch Chief- & Lead-Architect
GF
Geschäftsführung
taktischer Rahmen
technologische Schlüsselthemen
taktischer Rahmen und Schlüssel-
themen des Geschäftsbereich
Technologie Programm
Langfrist Technologie
Strategie
TechnologieBusiness
Unternehmensstrategie
Bereichsstrategie
taktischer Rahmen
(Operative) Programme
Langfriststrategie
GBL
FBL
Progr. Mgmt.
CTO
TM
EA
CA
Markt
Kunden-
bedarf/
Kunden-
bedarf
Abnahme Vo
rgab
eErstellungErg
eb
nis Input
Vorgabe
Projekt-
bedarfe
(Fachbereich)
Interne
Projekte RA
>4 Jahre
18 – 24 Monate
12 Monate
3+ Monate
Projekte
(Anforderer, Auftraggber)
DB
Projekte
(Umsetzung, Auftragnehmer)
LA (DB-Systel)
Kontrolle der
Standards über
Chief Architekt,
Lead Architect
Agilisierung der IT-Governance im Projektkontext
Agile Teams erhalten mehr Freiraum und Verantwortung
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201910
IT-Governance
Projekt-Team
Wenig
Freiraum &
Verantwortung
IT-Governance
Agiles-Team
Mehr
Freiraum &
Verantwortung
Früher Heute
Reduktion auf
wesentliche
Vorgaben,
erarbeitet in
Gilden (CTO)
Mehr Freiraum für
Innovation
Mehr Verantwortung
für
Qualität, Effizients,
Nachhaltigkeit
Moderation der Vorgaben,
Beobachtung der Best-
Practice in Communities,
Fördern von
Innovationsideen
„Diktat“ der Vorgaben,
„Harte“ Steuerung,
häufig „Nein“ zu
Innovationsideen
Tiefreichende
Vorgabenhirarchie,
erarbeitet in
aufwändigen internen
Programmen
Vorgaben oft als
Störfaktor /
„Spaßbremse“ ?!
Agilisierung des „BI-Vorgehensmodell“
Fundierte Systemstrategie ist auch im agilen Vorgehen wichtig
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201911
Building BlockSystem-Strategie Building Block
Building Block
Rea
lisie
rungs-
Roa
dm
ap
System-Strategie auf Basis
Ziele & Grundsatzanforderungen
Architektur & Kostentreiber
Domänen und fachl. Kernentitäten
Festlegung der technischen
Basisarchitektur / Plattform
Roadmap auf Flughöhe „Epic“
Umsetzung von KleinstanforderungenSprint 1 Sprint n Deployment…
Bei bestehender technischer Architektur / InfrastrukturR
escopin
g&
Fa
chlic
hes D
esig
n
Scopin
g
Technisches
Prototyping
B.-Block-
Architektur
Test- und Abnahmeplanung
Daten-Profiling
Implemen-
tierung
SystemtestAbnahme-
test
Deploy-
ment
Umsetzung von technischen & fachlichen Features in Sprints
Referenzarchitektur
hilft bei der
Systemstrategie
Referenzbauplan &
Plattform
hilft bei der Realisierung
Grundsatzanforderungen
Domänen / fachl.
Kernentitäten
Technis
che
Arc
hitektu
r
Architektur- & Kostentreiber
Vergleiche z.B. auch SAFe:https://www.scaledagileframework.com/what-is-safe/
Agenda
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201912
1.
2.
3.
4.
DB Systel – Wer wir sind und wohin wir gehen
Agilisierung der IT-Governance, Referenzarchitektur und des Vorgehens im Projekt
Entwicklung der Datawarehouse & Big Data Architekturpattern
Praxisbeispiel: SD4M & Early-Bird
Entwicklung der Referenzarchitektur BI, DWH, Big Data
Wachsende Anzahl innovativer Themen & Technologien
Themen der letzten Jahre:
Evolution des klassischen
DWHs, Data-Vault-Modell,
Agilisierung, Self-Service BI,
Gartners Logical DWH,
Predictiv Analytics R!,
Hadoop, Spark, Kafka …,
Lambda- /Kappa Architektur,
Open-Data, Data Lake, KI &
Deep Learning …
Anzahl Kern-Technologien:
– 2010 ca. 5 stabil
– 2018 ca. 30 wachsend
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201913
Hadoop
Entwicklung der DWH & Big Data Architektur
Immer mehr NF-Anforderungen können erfüllt werden
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201914
RDBMS
Cube(s)
DIM-Modell
Core
ER-Modell
„Single
Point of
Truht“
File-System
Stage
(temp.)
RDBMS
Cube(s)
DIM-Modell
Core
DV-Modell
„Single
Point of
Facts“
File-System
Stage
(temp.)
RDBMS
Cube(s)
DIM-Modell
File-System
Stage
(temp.)
RDBMS
Cube(s)
DIM-Modell
Hadoop
Stage
(dauerhaft)
Core
ER-, DV-,
?-Modell
Kimball Core-DWH
ER-Modell
Core-DWH
Data-Vault
DWH-Offloading
/ div. Data LakesHybride & Erweiterte
Architekturansätze
Query
Ingestion
Batch
(Facts)
HIVE,
HDFS
Speed
NoSQL
Serving
(Cube)NoSQL/
RDBMS
Lambda-Arch. /
Kappa-Arch.
Bemerkung: Hadoop meint das gesamte Ökosystem, incl. NoSQL, alternative Filesysteme …
Innovationsdruck:
- Self-Service BI / Data-
Integration
- Data Virtualisierung /
Enterprise Inf.-Mgmt
- „KI guided BI“
- Integration KI Systeme
- Fast-Data
- OLAP virtuell
- Adaptives Tuning &
Data-Mgmt (KI)
- Hardware Innovationen
- …
+ + + + =/- + OLAP
- - + + + + Agilität
- + + + + + Flexibilität
- - = = + + Robustheit
+ = = + +/= + Kostengünstig
- - - +/= + + Big Data (3Vs)
Integration von KI-Modellen in transaktionale Anwendungen
Systemumgebung für KI-Modelle vom PoC bis Produktion
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201915
Eigenschaften:
Lose Kopplung zw.
„Nutzendes System“
und „Modell-Execution“
Modell-Deployment unab-
hängig vom Release des
nutzenden Systems
Versionierung und auto-
matisches Deployment
Elastisches Skalieren der
Modell-Execution möglich
Monitoring des Modells
Abnahme des Modell
Rekalibrierung des
Modells
PoC-Umgebung gibt dem
Data-Scientisten die
nötige Freiheit
Data-Lake PoC-
Umgebung
Modell
Nutzendes
System
Model-
Building
Test- &
Abnahme
Modell
Expl. Testdaten
je Szenario
Versionierung & CI / CD
ModellModellversionierung
& Deployment
Datenfluss
Adaption neuer
Tools & Datenflüsse
Monitoring
PoC
Modelle
123
4
1. Verprobung der KI- / Modell-Idee im PoC
2. Entwickeln und Verbessern des produktiven Modells
3. Abnahme des produktiven Modells
4. Ausführung im nutzenden System
Daten für die Modellerstellung Externe Daten
Portfolio von Oracle im Bild der Referenzarchitektur
Umfassender Technologie-Stack für BI, DWH, Big-Data
Oracle Datenbank
– RDBMS
– RDBMS (Security, Audit)
– BigData SQL
– BigData Connectors
Oracle Big-Data
– Hadoop Distribution
(HDFS, Hive, Spark, Kafka)
Oracle NoSQL
Oracle Advanced Analytics
– R, Spark, RDBMS-Native
– GUI, R-Studio, Zeppelin
Oracle ODI
– ETL / ELT Code
Oracle Golden-Gate
– Quellen / Ziel-Unabhängig
Oracle EMM (Enterprise-
Metadata-Mgmt)
Oracle EDQ (Enterprise-
Data-Quality)
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201916
RDBMS
BigData SQL
BigData
HadoopBD-C
NoSQLAdv.Ana EMM
EDQ
Golden Gate
RDBMS
Security
ODI
Oracle Komponenten und Features
Features bestimmen die Qualität der Lösungen
Oracle RDBMS
– Compression
– Partitioning
– In-Memory Option
– Automatic Data Optimization (Data Temperature)
– Automatic Degree of Parallelisme
– SQL Optimizer
– External Table (z.B. auch AWS S3)
– BigData SQL mit div. Connectoren
– Security & Audit
Oracle ODI
– GUI / ETL-Case-Tool
– ETL und ELT (Code Generierung für div. Umgebungen)
– Repository
– Div. Quellen und Ziele
Oracle Advanced Analytics / ML
– GUI / Zeppelin Notebooks
– R, Spark MLlib und native Algorithmen (In-Database-Execution)
– PMML
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201917
Oracle Golden Gate
– Div. Quellen und Ziele
– CDC (Change-Data-Capture)
– Lesen von Transaktionslogs
– Batch & Realtime
Oracle Exadata & Big Data Appliance
– Optimierte Hardware
– SQL Ausführung dort wo die Daten liegen
– HDFS, Hive, Spark
Oracle Cloud
– Autonomous DWH (Self-Patching, -Tuning,
Adaptive Caching …)
– Hadoop (hdfs, Hive, Spark, Kafka)
– Elastizität
– Paas, SaaS
– Pay per use
Agenda
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201918
1.
2.
3.
4.
DB Systel – Wer wir sind und wohin wir gehen
Agilisierung der IT-Governance, Referenzarchitektur und des Vorgehens im Projekt
Entwicklung der Datawarehouse & Big Data Architekturpattern
Praxisbeispiel: SD4M & Early-Bird
Beispiel: SD4M – Smart Data for Mobility
Konsortialprojekt führte zu DB-interner Lösung Early-Bird
Projektpartner im Smart Data Projekt:– DB Systel GmbH (Konsortialführung)
– Deutsches Forschungszentrum für Künstliche Intelligenz GmbH
– idalab GmbH
– ]init[ AG für digitale Kommunikation
– PS-Team Deutschland GmbH & Co. KG
Big-Data-Analytik-Plattform für multimodale Smart Mobility Services
Links: https://www.sd4m.net/#html , https://www.digitale-technologien.de/DT/Navigation/DE/Foerderprogramme/Smart_Data/smart_data.html ,
http://www.smartdata-blog.de/2017/05/04/big-data-praxis-smart-data-projekt-sd4m-verarbeitet-139-000-meldungen-taeglich-mobilitaet/
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201919
Beispiel: EarlyBird – Real Time Insights
…verbessert Abläufe, erhöht Kundenzufriedenheit
DB Systel GmbH | Werner Schönau | T.IPB 1 | 27.03.201920
Echtzeit Verarbeitung von
Tweets, RSS- und
Newsmeldungen im Kontext
Mobilität
Klassifikation der Daten nach
z.B. Unfall, Zugausfall, etc.
Geo-Referenzierung anhand
Textinhalt
Visualisierung als Web
Applikation mit einer Live-
Karte
Auf Basis der SD4M-Plattform
„Vielen Dank für Ihre Aufmerksamkeit“ kann auch durch ein anderes Abschlusszitat oder eine Botschaft ersetzt werden.
Vielen Dank für Ihre Aufmerksamkeit
Mobil 0160 97435825
werner.schoenau
@deutschebahn.com
DB Systel GmbH
Jürgen-Ponto-Platz 1
60329 Frankfurt am Main
www.dbsystel.de
Diplom Physiker
Werner Schönau
Chief Architect
BI, Data-Warehousing, Big Data
Application Development & Integration
T.IPB 1