20131015 Data Analytics & Data warehousingFin - · PDF fileData Analytics& Data warehousing im...
Transcript of 20131015 Data Analytics & Data warehousingFin - · PDF fileData Analytics& Data warehousing im...
Data Analytics & Data warehousingim GKV-Spitzenverband
Jürgen KellermannAbteilungsleiter Zentrale Dienste
GKV-Spitzenverband/National Association of Statutory Health Insurance FundsBerlin
Frankfurt, 15. Oktober 2013Frankfurt, 15. Oktober 2013Frankfurt, 15. Oktober 2013Frankfurt, 15. Oktober 2013
2
Agenda
� Kennzahlen des deutschen Gesundheitswesens
� Der GKV-Spitzenverband
� Übersicht zu Datenströmen und Datenmengen
� Umsetzung
� Fazit
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
3
Kennzahlen des deutschen Gesundheitswesens
� Rd. 4,3 Mio. Arbeitnehmer in mehr als 800 Branchen
� 2,3 Mio. Beschäftigte in sogenannten traditionellen Berufen des
Gesundheitswesens, 311.000 Ärzte, 66.000 Zahnärzte, 57.000
Apotheker, 940.000 Beschäftigte innerhalb der Krankenpflege, 344.000
in Pflegeberufen, z. B. der Altenpflege
� Rd. 2.100 Krankenhäuser mit 1 Mio. Arbeitnehmern
� Die Gesamtausgaben des deutschen Gesundheitswesens belaufen sich
2010 auf € 287 Mrd., ca. 11,6 % des deutschen Bruttoinlandsprodukts
� Der größte Anteil der Gesundheitsausgaben erfolgt in der gesetzlichen
Krankenversicherung mit rd. € 165 Mrd. in 2010
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
4
5
6GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013 Seite 7
8
Agenda
� Kennzahlen der gesetzlichen Krankenversicherung (GKV)
� Der GKV-Spitzenverband
� Übersicht zu Datenströmen und Datenmengen
� Umsetzung
� Fazit
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
9
Veränderungen von geschichtlicher Dimension
� Große Koalition
� 2008: 125. Geburtstag der Gesetzlichen Krankenversicherung
� Einheitlicher Beitragssatz und „Gesundheitsfonds„Gesundheitsfonds„Gesundheitsfonds„Gesundheitsfonds““““
� MorbiditätsorientierterMorbiditätsorientierterMorbiditätsorientierterMorbiditätsorientierter Risikostrukturausgleich
– Erweiterung der Berechnungsparamenter von 4 auf 80
� 4 Krankenkassenverbände (gegründet 1894, 1907 usw.) verlieren den Status einer Körperschaft des öffentlichen Rechts und werden Servicegesellschaften für ihre Kassenart
� Kassenartenübergreifende Fusionen
– Kassen unterschiedlicher Kassenarten können miteinander fusionieren
� Der neue „GKVDer neue „GKVDer neue „GKVDer neue „GKV----SpitzenverbandSpitzenverbandSpitzenverbandSpitzenverband““““ wurde errichtet als Körperschaft des wurde errichtet als Körperschaft des wurde errichtet als Körperschaft des wurde errichtet als Körperschaft des öffentlichen Rechtsöffentlichen Rechtsöffentlichen Rechtsöffentlichen Rechts
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
10
Aufgaben des GKV-SVBeispiele:
� Öffentliche und politische Vertretung der GKV-Interessen
� Aufgabenwahrnehmung in Parlament, Regierung, Ministerien usw.
� Unterstützung der Krankenkassen und Landesverbände bei der Aufgabenerfüllung und Interessenwahrnehmung, insbesondere durch
– Entwicklung von und Abstimmung zu Datendefinitionen (Formate, Strukturen und Inhalte) und
– Prozessoptimierungen (Vernetzung der Abläufe) für den elektronischen Datenaustausch in der GKV und mit den Arbeitgebern
� Vertragsverhandlungen/-abschluss und Vergütungsvereinbarungen mit Leistungserbringern
� Festlegung von Festbeträgen, z. b. für Arzneimittel
� Abgeschlossene Verträge und sonstige Entscheidungen des GKV-SV gelten für alle seine Mitgliedskassen, die Landesverbände der Krankenkassen und die 70 Mio. Versicherten
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
11
� 05/2007 Selbstverwaltung
� 10/2007 Vorstand
� 11/2007 Abteilungsleiter und erste Mitarbeiter
� 02/2008 Mitarbeiter Nr. 4
� 03/2008 IT-Konzept in Bezug auf die Aufgaben
– 168 gesetzliche Aufgaben
– 50 mit IT-Anforderungen
� 07/2008 Aufgabenübernahme von den 7 Kassenverbänden
� seit 01.07.2008 Wahrnehmung der gesetzlichen Aufgaben
nach nach nach nach 14 14 14 14 MonMonMonMon....
StartStartStartStart
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
12
Voraussetzungen für einen völlig neuen Verband und seine IT
� Aufbau eines Rechenzentrums
– Gebäude, Sicherheit usw.
– HW-BK, DV, DWH
– SW ordnungsgemäße, ingenieurmäßige Softwareentwicklung
– Netz inkl. Datenschutz/Sozialdatenschutzmaßnahmen
– Personal
– Verträge
– Geld
� Ziel: Wahrnehmung der umfangreichen IT-Aufgaben.
Innerhalb von 5 Monaten von 0 100
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
13
Agenda
� Kennzahlen der gesetzlichen Krankenversicherung (GKV)
� Der GKV-Spitzenverband
� Datenströme und Datenmengen
� Umsetzung
� Fazit
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
14
Übersicht Datenströme� Datenaustausch der gesetzlichen Krankenkassen mit Leistungserbringern
z. B. Apothekenabrechnungen + Rabattmeldeverfahrenz. B. Apothekenabrechnungen + Rabattmeldeverfahrenz. B. Apothekenabrechnungen + Rabattmeldeverfahrenz. B. Apothekenabrechnungen + Rabattmeldeverfahren
� Datenaustausch der gesetzlichen Krankenkassen mit Arbeitgebern
z. B. DEÜV alle Beschäftigungsverhältnisse und Änderungenz. B. DEÜV alle Beschäftigungsverhältnisse und Änderungenz. B. DEÜV alle Beschäftigungsverhältnisse und Änderungenz. B. DEÜV alle Beschäftigungsverhältnisse und Änderungen
� Datenaustausch der gesetzlichen Krankenkassen mit Aufsichten
z. B. Risikostrukturausgleichz. B. Risikostrukturausgleichz. B. Risikostrukturausgleichz. B. Risikostrukturausgleich
� Datenaustausch der gesetzlichen Krankenkassen mit anderen Institutionen
z. B. DÜBAKz. B. DÜBAKz. B. DÜBAKz. B. DÜBAK
� Datenprozesse im Umfeld der Telematik/eGK
z. B. elektronische Gesundheitskarte und Infrastruktur
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
Statistisches Bundesamt
KRANKENKASSEN
LEISTUNGSERBRINGER
RZ / KOPFSTELLEN DER KK
ABRECHNUNGSZENTRENInBA
SOFTWARE-HERSTELLER
ARBEITGEBER
Datenströme: Datenströme: Datenströme: Datenströme: Beteiligte Institutionen und Datenwege (grob)Beteiligte Institutionen und Datenwege (grob)Beteiligte Institutionen und Datenwege (grob)Beteiligte Institutionen und Datenwege (grob)
16
jährlich erwartete Datenmengen, z. B. nur für den Morbi-RSA:
� 73.000.000 Pseudonymisierter Versichertenbestand (Stammdaten)
� 700.000.000 Arzneimittelverordnungen (verschriebene Medikamentenverpackungen)
� 100.000.000 Diagnoseinformationen aus dem stationären Bereich
� 1.925.000.000 Diagnoseinformationen aus dem ambulanten Bereich
� 73.000.000 Informationen zu Leistungsausgaben (Vollerhebung)
� 73.000.000 Landesbezogene Versicherteninformationen
� 2.912.000.000 Sätze pro Berichtsjahr
� 5.824.000.000 Sätze pro Jahr bei zwei Erhebungen p.a.
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
17
Agenda
� Kennzahlen der gesetzlichen Krankenversicherung (GKV)
� Der GKV-Spitzenverband
� Datenströme und Datenmengen
� Umsetzung
� Fazit
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
18
Rechnerkapazität für Verarbeitungder Daten von 70 Mio. Versicherten
� woher?
� wohin?
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
19
Wolken-Computing
� Nutzung der IT einer Beteiligungsgesellschaft (ITSG GmbH)
� Erweiterung der IT-Komponenten für unsere Volumina
� Mitnutzung von bereits vorhandenen Komponenten,
z. B. Firewall usw.
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
20
HousingHousingHousingHousing
Wolkenwechsel
21
Wie verarbeite ich Daten aus88 Verfahren mit 15 Mrd.
Datensätzen p.a.?
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
22
Protokollierung / Datenzugriffsschicht
Daten-annahme- Annahme- Entschlüsseln- Entpacken- Archivieren
E-MailFTAM(s)FTPHTTP(s)Datenträger
Verfahrens-prüfung
- Formalprüf.- Fachprüfung
FachverFachverFachverFachver----arbeitungarbeitungarbeitungarbeitung- DatenaufDatenaufDatenaufDatenauf----
bereitungbereitungbereitungbereitung---- AblageAblageAblageAblage----
servicesservicesservicesservices
Datenweiter-leitung- Packen- Verschlüsseln- Versand- Archivieren
Versand-vorbereitung
- Entladen oder- Erstellen Versanddateien
Kassenstamm
Protokollierung
Konfiguration
Ggf Fachdaten
Fehler-Hinweislisten
Monitoring / Konfiguration Fachverfahren / Analysen
Anwendungssteuerung
DWHDWHDWHDWH
E-MailFTAM(s)FTPHTTP(s)Datenträger
E-MailFAXBRIEF
Fachverfahren/FachanwendungDatenannahme- und Weiterleitungsstelle
Output-management
Universelle Datenannahme- und Weiterleitungsstelle
23
Wie analysiere ich 15 Mrd. Datensätze des Gesundheitswesens p.a.für Verhandlungen?
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
24
Besondere Anforderungen DWH:Leistung, Qualität und Quantität
� Berechneter Bedarf: 14.1 Terabyte14.1 Terabyte14.1 Terabyte14.1 Terabyte Daten in der ersten Ausbaustufe (Tendenz steigend)
� Schnelle VerfügbarkeitVerfügbarkeitVerfügbarkeitVerfügbarkeit des Systems
� Möglichkeit der SkalierungSkalierungSkalierungSkalierung des Systems
� Schnelle VerfügbarkeitVerfügbarkeitVerfügbarkeitVerfügbarkeit von Entwicklern
� Schnelle Verfügbarkeit Verfügbarkeit Verfügbarkeit Verfügbarkeit von neuen Datenkreisen
� Hohe PerformancePerformancePerformancePerformance
� Hohe QualitätQualitätQualitätQualität gefordert (‚revisionssicher‘)
� Knappe personelle Ressourcenpersonelle Ressourcenpersonelle Ressourcenpersonelle Ressourcen (weil GKV-SV im Aufbau)
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
DWH für flexible Analysen
25
� Erweiterung undErweiterung undErweiterung undErweiterung und
NutzungNutzungNutzungNutzung des DWH-Systems der ITSG!!
� Vorteile dieser Lösung:
– Ausbau es vorhandenen Systems
� schnellerschnellerschnellerschneller als Neuanschaffung
� sehr wirtschaftlichwirtschaftlichwirtschaftlichwirtschaftlich – kurz- und langfristig gesehen
– skalierbarskalierbarskalierbarskalierbar und nachweislich nachweislich nachweislich nachweislich performantperformantperformantperformant!!!!
– Übernahme von Ladestrecken Übernahme von Ladestrecken Übernahme von Ladestrecken Übernahme von Ladestrecken bzw. ETL-Know-How
teilweise von den alten Verbänden
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
26
Herausforderung: ‚Need for Speed‘
� Politisches Tagesgeschäft erfordert schnelle Reaktion unserer ‚Task Force Datenanalyse‘
– schnelle,
– flexible,
– unabhängige Verfügbarkeit neuer Daten und Datentypen mit der Verknüpfung zu den Inhalten des DWH
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
27
Lösung:Analytical Sandbox
� Organisierte Unabhängigkeit
� Eigener Datenbankbereich je Fachbereich
� Eigener Administrator zur Rechtevergabe, Indizierung,
Import, Makros, Anlegen von Views und Datenbanken
� Bereitstellung der Teradata Utilities (TTU: insbesondere
SQL-Assistent, Administrator, BTEQ, FASTLOAD,
OLELOAD, FASTEXPORT)
� direkter Datei-Upload in die Sandbox
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
28
00:49:55
00:07:35
00:20:00
00:07:57
00:14:01
00:25:15
00:49:55
00:57:30
01:17:30
01:25:27
01:39:28
02:04:43
00:00:00
00:15:00
00:30:00
00:45:00
01:00:00
01:15:00
01:30:00
01:45:00
02:00:00
02:15:00
02:30:00
Übernahme Stageing Area formale Prüfungen gem.Prüfkatalog
Datenübernahme inKerntabellen
Füllen Metadaten + Fehler Dublettentest RI-Check
Laden und Prüfen von MorbiLaden und Prüfen von MorbiLaden und Prüfen von MorbiLaden und Prüfen von Morbi----RSARSARSARSA----Diagnosedaten (SA600)Diagnosedaten (SA600)Diagnosedaten (SA600)Diagnosedaten (SA600)am Beispiel eines am Beispiel eines am Beispiel eines am Beispiel eines LadejobsLadejobsLadejobsLadejobs mit 680 Mio. Datensätzen und 44 mit 680 Mio. Datensätzen und 44 mit 680 Mio. Datensätzen und 44 mit 680 Mio. Datensätzen und 44 Gigabyte DateigrößeGigabyte DateigrößeGigabyte DateigrößeGigabyte Dateigröße
227.000 Datensätzen bzw. 15 Megabytepro Sekunde
GKVGKVGKVGKV----ArzneimittelArzneimittelArzneimittelArzneimittel----Schnellinformation Schnellinformation Schnellinformation Schnellinformation (GAmSi)
� Monatliche Schnellinformation über Arzneimittel-Verordnungen, mit der Verordnungsstrukturen in den Kassenärztlichen Vereinigungen transparent gemacht, Trendinformationen über Arzneimittelausgaben vermittelt und Kennzahlen für regionale Vergleichsmöglichkeiten gegeben werden
� Bereitstellung der Berichte rund 6-8 Wochen nach Ende des Verordnungsmonats (Beginn der Auswertungen am 15. Werktag, Auslieferung am 21. Werktag nach Ende des VO-Monats)
14.10.2013 29
Apothekenrechenzentren
- Annahme monatlicher
Daten der
Rezeptabrechnung
Datenstellen innerhalb
der Kassensysteme
- Technische
Vorprüfung
ITSG als Relaisstelle
-Zusammenführung zu
GKV-Datenbestand
- Nach Validität und
Aktualität laufend gesichert
GKV-SV und WIdO
Monatliche Berichte arzt-
und KV-bezogen
GKVGKVGKVGKV----ArzneimittelArzneimittelArzneimittelArzneimittel----Schnellinformation Schnellinformation Schnellinformation Schnellinformation (GAmSi)� Monatliche Lieferung :
– Ca. 39.000.000 Rezepte (460 Mio. im Jahr)
– Ca. 58.000.000 Einzelverordnungen (700 Mio. im Jahr)
– Berichte für ca. 110.000 Ärzte
� Berichtsinhalte GAmSi-Arzt– Absolute und kumulierte Umsätze und Verordnungen Umsätze und Verordnungen Umsätze und Verordnungen Umsätze und Verordnungen nach
� Mitglieder/Familienmitglieder, Rentner
� Fertigarzneimittel, Rezepturen, Sonstige Produkte
– Umsätze und Verordnungen im Vergleich zur FachgruppeFachgruppeFachgruppeFachgruppe
– Umsatz- und Verordnungsanteile einzelner MarktsegmenteMarktsegmenteMarktsegmenteMarktsegmente (Generika im generikafähigen Markt, Festbetragsarzneimittel, Reimporte im reimportfähigen Markt, Analogpräparate, Spezialpräparate) kumuliert
– Die Wirkstoffe der 20 verordnungsstärksten 20 verordnungsstärksten 20 verordnungsstärksten 20 verordnungsstärksten Analogpräparate Analogpräparate Analogpräparate Analogpräparate und generikafähigen Wirkstoffe kumuliert
– Die 20 umsatzstärksten generikafähigengenerikafähigengenerikafähigengenerikafähigen Wirkstoffe kumuliert
14.10.2013 30
GKVGKVGKVGKV----ArzneimittelArzneimittelArzneimittelArzneimittel----Schnellinformation Schnellinformation Schnellinformation Schnellinformation (GAmSi)
14.10.2013 31
Krankenhausdaten nach § 21 KHEntgG
� Zweck: Weiterentwicklung des DRG-Vergütungssystems sowie Entwicklung und Weiterentwicklung des Psychiatrieentgeltsystems und der Investitionsbewertungsrelationen
� Inhalt:
– Diagnosen
– Abgerechnete Entgelte
– Prozeduren
– Verweildauer, Aufnahme- und Entlassungsgrund, Alter, Beatmungsdauer, Fachabteilungen etc.
� Datenmengen (500 GB) seit 2005 im Zugriff
– 140 Mio. Fälle
– 670 Mio. Diagnosen
– 850 Mio. Entgelte
14.10.2013 32
Krankenhausdaten: Beispielanalysen
14.10.2013 33
Verlaufsanalysen: Verweildauer Verlaufsanalysen: Verweildauer Verlaufsanalysen: Verweildauer Verlaufsanalysen: Verweildauer nach Jahrnach Jahrnach Jahrnach Jahr
Regionalanalysen: Vollstationäre Regionalanalysen: Vollstationäre Regionalanalysen: Vollstationäre Regionalanalysen: Vollstationäre Fälle mit der Prozedur Fälle mit der Prozedur Fälle mit der Prozedur Fälle mit der Prozedur 8552 (Neurologisch8552 (Neurologisch8552 (Neurologisch8552 (Neurologisch----neurochirurgische neurochirurgische neurochirurgische neurochirurgische Frührehabilitation) Frührehabilitation) Frührehabilitation) Frührehabilitation) je je je je 10.000 Einwohner10.000 Einwohner10.000 Einwohner10.000 Einwohner
34
Faszination Daten
42 Mio SQL-Statements innerhalb eines Jahres
155.000 SQL-Statements täglich
56 user
8 power-user
77,7 % CPU-time
DienstagDienstagDienstagDienstag30.04.201330.04.201330.04.201330.04.2013
12 power-user
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
Ohne Administration, Ladestrecken, Entwicklung: d.h. nur User + Fachanwendungen!
35
Agenda
� Kennzahlen der gesetzlichen Krankenversicherung (GKV)
� Der GKV-Spitzenverband
� Datenströme und Datenmengen
� Umsetzung
� Fazit
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
36
Masterplan Time / Budget
� Überlapptes Konzipieren und Handeln
� Make or buy – Entscheidungen
� Verzicht auf eigenes Rechenzentrum
� Produktionskern in vorhandener geschützter Umgebung
� Verzicht auf SW-Entwicklung zu Gunsten der Steuerung der
SW-Entwicklung
� Rahmenverträge und Miniwettbewerbe
� Entwicklung / Ausbau der DAW - Idee
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
37
� DWH für flexible Analysen
� Sandbox-Idee / Admin-Rechte an User
� Bewährtes unter neuen Anforderungen geprüft
� Vertrauensstelle
� Datenclearing
� 20 Jahre alte Verfahren umgestellt auf heutige Tools und
Möglichkeiten
– Unglaubliche Effekte!
GKV-SV: Jürgen Kellermann, Data Analytics & Data warehousing, 15.10.2013
Vielen Dank für Ihre Aufmerksamkeit.