Folien CARESS Workshop - krebsregister · PDF fileDatentransformation,...
date post
18-Sep-2018Category
Documents
view
214download
0
Embed Size (px)
Transcript of Folien CARESS Workshop - krebsregister · PDF fileDatentransformation,...
1 CARESS WorkshopAnalytische Informationssysteme fr epidemiologische Krebsregister
Agenda
Yvette Teiken, Martin Rohde
2
25.11.2010
Pause (15 Minuten)
CARESS berblick (30 Minuten)
Architektur, Historie, Konzepte
CARESS Demo - Die alte Version (15 Minuten)
Beispiele fr die Definition von Untersuchungsregionen, Rumliche Auswertungen
Beispiele fr die Gesundheitsberichterstattung
CARESS Demo - Die neuen Version (20 Minuten)
Ad-Hoc-Datenanalysen
berlebenszeitanalyse als Beispiel fr R Anbindung
CARESS Neue Version - Stand und Planung (5 Minuten)
Forschung & Entwicklung und Raum fr Diskussionen (60 Minuten)
Aktuelle CARESS Entwicklungen: Statistik, Facettenklassifikation, Verzerrte Karten,
Aktuelle CARESS Forschungsthemen: AutoMais, Visuelle Analyse
CARESS - CARLOS Epidemiological and Statistical Data Analysis Engine
3
25.11.2010
CARESS Ziele
Ziel: Umfangreiche Analyseuntersttzung
Ad-Hoc-Anfragen
Explorativen Datenanalysen
Qualittssicherung
Monitoring
Gesundheitsberichterstattung
Bsp. Entdeckung von Einflussfaktoren auf Erkrankungen
Ziel: Analytisches Informationssystem fr Krebsepidemiologie
Integrierter Datenbestnde
Flexible Aggregation der Daten
Analyse mit Hilfe komplexer statistischer Verfahren
Analyse unter Bercksichtigung des Raumbezugs
Analyseszenarien in Epidemiologischen Krebsregistern
Yvette Teiken, Martin Rohde
Analytische Anwendungen und Verfahren
Organisato-risches und Rechtliches
Infrastruktur fr Daten und Informations-logistik
Wissen
Information
Daten
4
25.11.2010
CARESS Lsungsansatz
Integration verschiedener Daten
Datentransformation, Datenqualittsmanagement
Flle, Melder, Soziodemografische und Umweltdaten
Integration verschiedener Datenanalysetechniken
OLAP (Online Analytical Processing)
Fast Analysis of Shared Multidimensional Information
Statistik
Epidemiologische & rumlich-statistische Verfahren
Explorative Datenanalyse
Annahmen (Hypothesen) bildend, Visualisierungen
Integration Geografische Daten
Konzepte fr die Berichterstellung
Konfiguration von Berichten
Cross Media Publishing
Datenanalysetechniken
Yvette Teiken, Martin Rohde
5
25.11.2010
CARESS Multidimensionales Datenmodell
12440-59
60-69
70+ 8/989/98
Data Cube
... Nds. HH HB
Flchenstaat Stadtstaat
Gesamt Dimensionen
(Klassifikationshierarchien)
60+
6
25.11.2010
CARESS Historie
Historie
Ab 1993 CARESS (1. Generation)
Eigener Geoserver InterGIS
UNIX, EKN-Schema, feste Analyseschemata
Ab 1999 CARESS (2. Generation)
Multidimensionales Datenmodell MADEIRA
NT/Windows 2000 Portierung
Ab 2003 CARESS (3. Generation)
Neue Windows-Oberflche
Excel-Anbindung, flexible konfigurierbare Auswertungen
Datenmodell fr Statistik auf Data Cubes
Ab 2008 Neuentwicklung CARESS (4. Generation)
Standardkomponenten, Standardschnittstellen
Serviceorientierte Architektur
Von 1994 bis Heute
Yvette Teiken, Martin Rohde
Einer der zentralen Grnde fr die Neuentwicklung
Bessere Integration von statistischen Verfahren
Unabhngige Entwicklung der statistischen Verfahren vom analytischen Informationssystem
Verwendung vorhandener R-Packages, z.B. periodR
R-Package Cancer Krebsepidemiologie (Eigenentwicklung)
SDR, SMR/SIR, Kumulative Rate, rohes relatives Risiko,
CMF/CIF, Erwartete Fallzahlen bzw. Raten
Indirekt standardisierte Raten,
Simulation der Konstanzmethode (nach Schler und Bopp)
25.11.2010
7 CARESS HistorieAktueller Stand
Yvette Teiken, Martin Rohde
0 1 2 3 4
01
000
02
000
03
00
004
00
005
00
00
600
00
700
00
0
0.71
1.41
2.12
2.83
3.53
4.24
4.95
5.65
1 1.5 2 2.5 3 3.5
0 10 20 30 40 50
-10
12
3
8
25.11.2010
CARESS Analyseverfahren
R Package ClusterGeo (auf Basis des Packages spdep)
Morans I und Gearys c
R Package SurvivalAnalysis (auf Basis des Packages periodR)
Verwendung der Methoden der Periodenanalyse basierend auf dem Ansatz zur Berechnung der Sterbetafeln
Kohortenbasierte Analyse mglich
Ederer II- oder Hakulinen-Methode fr relatives berleben
absolute und relative berlebensraten (beides bedingt oder kumulativ) und Standardfehler
Graphische und tabellarische Darstellung der Ergebnisse
R Package Diagram fr spezielle Diagramme (Eigenentwicklung)
Z.B. Zeitverlauf von Infektionskrankheiten
Beispiele
0 1 2 3 4 5
020
40
6080
100
Survival estimation
year of follow-up
cum
ulat
ive
rela
tive
sur
viva
l at e
nd
of fo
llow
-up
year
0 1 2 3 4 5
cumulative relativerelative follow-up-year specific
cumulative absoluteabsolute follow-up-year specific
Yvette Teiken, Martin Rohde
Technische Realisierung
Data Warehouse: Einheitliche, auswertungsorientierte, qualittsgesicherte und historisierte Datenbank als Datenbasis (Single Point of Truth)
On-line Analytical Processing (OLAP): Performance durch Anbindung eines OLAP-Serversber standardisierte XML/A- bzw. MDX-Schnittstelle
Statistik: Umfassende und erweiterbare Statistik-Funktionalitt durch Anbindung der Statistik-Software R Project
Raumbezug: Anbindung eines geografischen Informationssystems zur engen Verknpfung statistischer und raumbezogener Daten
Usability: Windows Presentation Foundation (WPF) zur Realisierung von Benutzungsoberflchen
Integrationsfhigkeit: Schnittstellen zu MS-Office-Produkten und Web-Service-Programmierschnittstellen
Internetfhigkeit: Zugriff ber Internet durch Smart-Client-Technologie
Mandantenfhigkeit: Nutzung einer Software-Instanz durch mehrere Mandanten durch flexibles, konfigurierbares Datenmodell
25.11.2010
9Aktuelle Entwicklungsschwerpunkte
Yvette Teiken, Martin Rohde
Untersttzung von Standardschnittstellen
Multidimensional Expressions (MDX)
XML for Analysis (XMLA)
Open GIS Simple Feature Access (OGC Standards)
R als Lingua Franca der Statistik
Systeme, welche die Schnittstellen untersttzen:
PostgreSQL, MS SQL Server als RDBMS
Pentaho Mondrian oder SQL Server Analysis Services als OLAP-Server
PostgreSQL (spter SQL Server 8) als Geodatenbank
R Project als Statistiksoftware
25.11.2010
10 CARESS Technologien
Yvette Teiken, Martin Rohde
Standardschnittstellen und -anfragesprachen
11
25.11.2010
CARESSArchitektur der neuen Version
OLAP-ServerPentaho/MondrianMS SQL-Server
CARESS-Services.NET 3.5 WCF
StatistikR Project
CARESS.NET 3.5 WPF
Data Warehouseinkl. Star-/Snowflake
Server
Client
GeodatenbankPostGIS
Yvette Teiken, Martin Rohde
12 MUSTANG/CARESS Innovationsmodell
Anwendungsorientierte ForschungProjekte und Plattformentwicklung
MUSTANG
- Agile Softwareentwicklung - Testgetriebene Entwicklung- Continuous Integration- Modellgetriebene Entwicklung- Interne .NET-Schulungen
Diss.-Thema Intelligente
Datenanalyse
IP Karten mit Virtual Earth
Diss.-Thema Software
Produktlinien
Diss.-Thema Analytisches PM
DA berwachung Annotierter
Strategy Maps
OFFIS e.V., Bereich Gesundheit, Themenfeld Datenmanagement und -analyse
InfoAnalytics AG (Spin-off)
CARESS (Krebsregister)
INITIAL (LIGA)
Gesundheit NRW
(LIGA)
DA Metamodell fr Reporting
PG Visual Analytics
Diss.-Thema Modellgetriebene
Bereitstellung
Yvette Teiken, Martin Rohde
13
25.11.2010
CARESS Raumbezug bei der DatenanalyseDrei Ebenen
Auswahl zu betrachtender Regionen
Dynamische Klassifizierung (Ad-Hoc-Kategorien)
Auswahl von Regionen anhand geografischer Merkmale
Z.B. Abstand von Emissionsquellen
Auswahl von Regionen in einer Karte
Prdikatbasierte Auswahl (Versorgungsstrukturen, )
Statistische Verfahren
Clusterindizes Nachbarschaft fr Berechnung
Rumliche Regression
Interpolationsverfahren
Ergebnisdarstellung
Thematisch eingefrbte Karten
Punktdarstellungen
Diagramme in Karten
Auswahl von Regionen und Ergebnisdarstellung
Yvette Teiken, Martin Rohde
14
25.11.2010
CARESS Berichtswesen
Zusammenfassung von Ergebnissen zu Berichtsmappen
Konfigurationsmglichkeiten
Visualisierungen (und Layouteinstellungen)
Auswertungsreihen fr gleichartige Ergebnisse
Zusatzinformationen fr die Berichtsgenerierung
Cross Media Publishing
MUSTANG XML-Export
Formatierung der Berichte (XSLT)
fr Verffentlichungen im Internet (HTML)
fr Verffentlichungen als PDF-Dateien
fr ein Portal (mit Ad-Hoc-Anfragen)
Management-Cockpits / Management-Mappen
Yvette Teiken, Martin Rohde
CARESS und SurvA DEMO15
25.11.2010
Zeitplan Neuentwicklung
6.12.2010: Testinstallation einer kleinen Version im EKN