Big Data und Predictive Analytics...Prozesse und Strukturen einer "vom Markt her" geführten...
Transcript of Big Data und Predictive Analytics...Prozesse und Strukturen einer "vom Markt her" geführten...
Big Data und Predictive Analytics
Digitalisierungam Beispiel der Steuer- und Zollverwaltung
27. Februar 2018
Hermann Madlberger MBA MPA seit 1/2018 Alleingesellschafter-Geschäftsführer
der madlberger digitalisierungsberatung gmbh
seit 6/2016 Leiter des Predictive Analytics Competence Centersim Bundesministerium für Finanzen
seit 4/2010 Fachprojektmanager "POS – Prozessorientierte Sicht" und "Datamining“
4/2009 einjährige Karenzierung
2007 - 2009 Vorstand der Steuerfahndung Österreich
2004 - 2007 Regionalmanager für Wien
1999 - 2004 Leiter der Organisationsabteilung BMF („Bundessteuerinspektor“)
1993 - 1999 Leiter der Prüfungsabteilung im Finanzamt für Körperschaften
Masterthesis 2008: Marketing in der öffentlichen Verwaltung - Strategie, Märkte,Prozesse und Strukturen einer "vom Markt her" geführten Steuerverwaltung erschienen im VDM Verlag Dr. Müller - ISBN-10: 3639106381
WKO Club IT - Madlberger©2018 27. 2. 2018
2
Big Data und Predictive Analytics
Umsetzung in 3 Projekten
3 Projekte
Prozessorientierte Sicht (auf die Daten) – PoS Gesamtüberblick für das Topmanagement und Detailsicht für dieTeamleiterInnen
Data MiningIn den Daten geprüfter und ungeprüfter Fälle Muster finden, die aufMaßnahmenrelevanz schließen lassen
Predictive Analytics Competence CenterAnwendungsmöglichkeiten verbreitern und Nachhaltigkeit sichern
WKO Club IT - Madlberger©2018 27. 2. 2018
4
Projekt Prozessorientierte Sicht – PoS
Anforderung: Den Inhalt des Steuer-Data Warehouse sichtbar zu machen
Ziel: Entwicklung eines Reports mit 4 DimensionenZeit / Abgabenprozesse / Organisationseinheiten / Steuersubjekte
Weg:Vom Core-DWH zum Dimensions-/Fakten-DWH
WKO Club IT - Madlberger©2018 27. 2. 2018
5VO
M B
USI
NESS
(FA
CH
BEREIC
H) Z
U
ENTW
ICK
ELN
Daten am Beispiel Umsatzsteuererklärung
WKO Club IT - Madlberger©2018 27. 2. 2018
6
Reporting als Voraussetzung für Qualität
WKO Club IT - Madlberger©2018 27. 2. 2018
7Datenverständnis schaffen für 245 Spalten (=Metadaten)
Projekt Data Mining
Anforderung:Die vorhandenen Daten besser nutzbar machen
Ziel: Ergebnisse durch analytische Methoden optimieren
Weg: Proof of Concept - Auswahl von 4.000 Prüfungsfällen
bei gleichzeitiger Entwicklung des CRISP-DM-Prozesses
mit einem interdisziplinärem Team (Fach/Analyse/IT)WKO Club IT - Madlberger©2018 27. 2. 2018
8
Methodik und Prozesse (CRISP-DM )
WKO Club IT - Madlberger©2018 27. 2. 2018
9
1. Übersetzung der Problemstellung
2. Datenextraktion
3. Datenexploration
4. Datenbereinigung
5. Datenaufbereitung
6. Modelldatenerstellung
10. Beurteilung der Ergebnisse
9. Einsatz der Modelle
8. Beurteilung der Modelle
7. Modeling
Cross Industry Standard Process for Data Mining
Fachliche Aufgabe
Technische Aufgabe
Projekt Predictive Analytics (1)
Anforderung:Die Nutzung der Daten institutionalisieren und optimieren
Ziel: Nachhaltiger Einsatz moderner Analytics Methoden in allen Bereichenund deren Integration in die Geschäftsprozesse
Weg: Schaffung der organisatorischen, personellen, prozessualen undtechnischen Voraussetzungen zur nachhaltigen Nutzung innovativerAnalytics-Methoden
WKO Club IT - Madlberger©2018 27. 2. 2018
10
Projekt Predictive Analytics (2)
WKO Club IT - Madlberger©2018 27. 2. 2018
11
Projekt Predictive Analytics (3)
WKO Club IT - Madlberger©2018 27. 2. 2018
12
Projekt Predictive Analytics (4)
WKO Club IT - Madlberger©2018 27. 2. 2018
13Quelle: https://www.egeli-informatik.ch/the-agile-scrum-framework/
Projekt Predictive Analytics (5)
WKO Club IT - Madlberger©2018 27. 2. 2018
14Quelle: https://www.sas.com/en_us/software/fraud-management.html
Machine Learningaus den Ergebnissen bisher geprüfter Jahre seit 2006
WKO Club IT - Madlberger©2018 27. 2. 2018
15
5.065 2,25%
219.746 97,75%
224.811 100,00%
Gut-Fälle 0Schlecht-Fälle 1
Gesucht: Unterschiede zwischen den Gruppen 0 und 1 =>Unterschiedliche Daten-Muster erkennen
Modeling
WKO Club IT - Madlberger©2018 27. 2. 2018
16
Einfacher Entscheidungsbaumvon 20% zu 70% Trefferanteil
WKO Club IT - Madlberger©2018 27. 2. 2018
17
Gesamter Entscheidungsbaum
WKO Club IT - Madlberger©2018 27. 2. 2018
18
Methode und Test
WKO Club IT - Madlberger©2018 27. 2. 2018
19
TRAIN 104.362 102.267 2.095 60 %
VALIDATE 34.787 34.133 654 20 %
TEST 34.788 34.105 683 20 %
173.937 170.505 3432
Mehrergebnisse Lohnabgaben 2014je Prüfung im Schnitt für Zentrale 99% (– 0,5% Fälle unten und oben)
WKO Club IT - Madlberger©2018 27. 2. 2018
20
Mehrergebnisse Lohnabgaben 2014 / 2016je Prüfung im Schnitt für Zentrale 99% (– 0,5% Fälle unten und oben)
WKO Club IT - Madlberger©2018 27. 2. 2018
21
Prozessintegration
WKO Club IT - Madlberger©2018 27. 2. 2018
22
Tax Compliance
Effektivität – Effizienz
Verwaltungskosten
End – to - End
Kultur – Customer Journey
Danke für die Aufmerksamkeit!
WKO Club IT - Madlberger©2018 27. 2. 2018
23