Folien CARESS Workshop - krebsregister · PDF fileDatentransformation,...

Click here to load reader

  • date post

    18-Sep-2018
  • Category

    Documents

  • view

    214
  • download

    0

Embed Size (px)

Transcript of Folien CARESS Workshop - krebsregister · PDF fileDatentransformation,...

  • 1 CARESS WorkshopAnalytische Informationssysteme fr epidemiologische Krebsregister

  • Agenda

    Yvette Teiken, Martin Rohde

    2

    25.11.2010

    Pause (15 Minuten)

    CARESS berblick (30 Minuten)

    Architektur, Historie, Konzepte

    CARESS Demo - Die alte Version (15 Minuten)

    Beispiele fr die Definition von Untersuchungsregionen, Rumliche Auswertungen

    Beispiele fr die Gesundheitsberichterstattung

    CARESS Demo - Die neuen Version (20 Minuten)

    Ad-Hoc-Datenanalysen

    berlebenszeitanalyse als Beispiel fr R Anbindung

    CARESS Neue Version - Stand und Planung (5 Minuten)

    Forschung & Entwicklung und Raum fr Diskussionen (60 Minuten)

    Aktuelle CARESS Entwicklungen: Statistik, Facettenklassifikation, Verzerrte Karten,

    Aktuelle CARESS Forschungsthemen: AutoMais, Visuelle Analyse

    CARESS - CARLOS Epidemiological and Statistical Data Analysis Engine

  • 3

    25.11.2010

    CARESS Ziele

    Ziel: Umfangreiche Analyseuntersttzung

    Ad-Hoc-Anfragen

    Explorativen Datenanalysen

    Qualittssicherung

    Monitoring

    Gesundheitsberichterstattung

    Bsp. Entdeckung von Einflussfaktoren auf Erkrankungen

    Ziel: Analytisches Informationssystem fr Krebsepidemiologie

    Integrierter Datenbestnde

    Flexible Aggregation der Daten

    Analyse mit Hilfe komplexer statistischer Verfahren

    Analyse unter Bercksichtigung des Raumbezugs

    Analyseszenarien in Epidemiologischen Krebsregistern

    Yvette Teiken, Martin Rohde

    Analytische Anwendungen und Verfahren

    Organisato-risches und Rechtliches

    Infrastruktur fr Daten und Informations-logistik

    Wissen

    Information

    Daten

  • 4

    25.11.2010

    CARESS Lsungsansatz

    Integration verschiedener Daten

    Datentransformation, Datenqualittsmanagement

    Flle, Melder, Soziodemografische und Umweltdaten

    Integration verschiedener Datenanalysetechniken

    OLAP (Online Analytical Processing)

    Fast Analysis of Shared Multidimensional Information

    Statistik

    Epidemiologische & rumlich-statistische Verfahren

    Explorative Datenanalyse

    Annahmen (Hypothesen) bildend, Visualisierungen

    Integration Geografische Daten

    Konzepte fr die Berichterstellung

    Konfiguration von Berichten

    Cross Media Publishing

    Datenanalysetechniken

    Yvette Teiken, Martin Rohde

  • 5

    25.11.2010

    CARESS Multidimensionales Datenmodell

    12440-59

    60-69

    70+ 8/989/98

    Data Cube

    ... Nds. HH HB

    Flchenstaat Stadtstaat

    Gesamt Dimensionen

    (Klassifikationshierarchien)

    60+

  • 6

    25.11.2010

    CARESS Historie

    Historie

    Ab 1993 CARESS (1. Generation)

    Eigener Geoserver InterGIS

    UNIX, EKN-Schema, feste Analyseschemata

    Ab 1999 CARESS (2. Generation)

    Multidimensionales Datenmodell MADEIRA

    NT/Windows 2000 Portierung

    Ab 2003 CARESS (3. Generation)

    Neue Windows-Oberflche

    Excel-Anbindung, flexible konfigurierbare Auswertungen

    Datenmodell fr Statistik auf Data Cubes

    Ab 2008 Neuentwicklung CARESS (4. Generation)

    Standardkomponenten, Standardschnittstellen

    Serviceorientierte Architektur

    Von 1994 bis Heute

    Yvette Teiken, Martin Rohde

  • Einer der zentralen Grnde fr die Neuentwicklung

    Bessere Integration von statistischen Verfahren

    Unabhngige Entwicklung der statistischen Verfahren vom analytischen Informationssystem

    Verwendung vorhandener R-Packages, z.B. periodR

    R-Package Cancer Krebsepidemiologie (Eigenentwicklung)

    SDR, SMR/SIR, Kumulative Rate, rohes relatives Risiko,

    CMF/CIF, Erwartete Fallzahlen bzw. Raten

    Indirekt standardisierte Raten,

    Simulation der Konstanzmethode (nach Schler und Bopp)

    25.11.2010

    7 CARESS HistorieAktueller Stand

    Yvette Teiken, Martin Rohde

    0 1 2 3 4

    01

    000

    02

    000

    03

    00

    004

    00

    005

    00

    00

    600

    00

    700

    00

    0

    0.71

    1.41

    2.12

    2.83

    3.53

    4.24

    4.95

    5.65

    1 1.5 2 2.5 3 3.5

    0 10 20 30 40 50

    -10

    12

    3

  • 8

    25.11.2010

    CARESS Analyseverfahren

    R Package ClusterGeo (auf Basis des Packages spdep)

    Morans I und Gearys c

    R Package SurvivalAnalysis (auf Basis des Packages periodR)

    Verwendung der Methoden der Periodenanalyse basierend auf dem Ansatz zur Berechnung der Sterbetafeln

    Kohortenbasierte Analyse mglich

    Ederer II- oder Hakulinen-Methode fr relatives berleben

    absolute und relative berlebensraten (beides bedingt oder kumulativ) und Standardfehler

    Graphische und tabellarische Darstellung der Ergebnisse

    R Package Diagram fr spezielle Diagramme (Eigenentwicklung)

    Z.B. Zeitverlauf von Infektionskrankheiten

    Beispiele

    0 1 2 3 4 5

    020

    40

    6080

    100

    Survival estimation

    year of follow-up

    cum

    ulat

    ive

    rela

    tive

    sur

    viva

    l at e

    nd

    of fo

    llow

    -up

    year

    0 1 2 3 4 5

    cumulative relativerelative follow-up-year specific

    cumulative absoluteabsolute follow-up-year specific

    Yvette Teiken, Martin Rohde

  • Technische Realisierung

    Data Warehouse: Einheitliche, auswertungsorientierte, qualittsgesicherte und historisierte Datenbank als Datenbasis (Single Point of Truth)

    On-line Analytical Processing (OLAP): Performance durch Anbindung eines OLAP-Serversber standardisierte XML/A- bzw. MDX-Schnittstelle

    Statistik: Umfassende und erweiterbare Statistik-Funktionalitt durch Anbindung der Statistik-Software R Project

    Raumbezug: Anbindung eines geografischen Informationssystems zur engen Verknpfung statistischer und raumbezogener Daten

    Usability: Windows Presentation Foundation (WPF) zur Realisierung von Benutzungsoberflchen

    Integrationsfhigkeit: Schnittstellen zu MS-Office-Produkten und Web-Service-Programmierschnittstellen

    Internetfhigkeit: Zugriff ber Internet durch Smart-Client-Technologie

    Mandantenfhigkeit: Nutzung einer Software-Instanz durch mehrere Mandanten durch flexibles, konfigurierbares Datenmodell

    25.11.2010

    9Aktuelle Entwicklungsschwerpunkte

    Yvette Teiken, Martin Rohde

  • Untersttzung von Standardschnittstellen

    Multidimensional Expressions (MDX)

    XML for Analysis (XMLA)

    Open GIS Simple Feature Access (OGC Standards)

    R als Lingua Franca der Statistik

    Systeme, welche die Schnittstellen untersttzen:

    PostgreSQL, MS SQL Server als RDBMS

    Pentaho Mondrian oder SQL Server Analysis Services als OLAP-Server

    PostgreSQL (spter SQL Server 8) als Geodatenbank

    R Project als Statistiksoftware

    25.11.2010

    10 CARESS Technologien

    Yvette Teiken, Martin Rohde

    Standardschnittstellen und -anfragesprachen

  • 11

    25.11.2010

    CARESSArchitektur der neuen Version

    OLAP-ServerPentaho/MondrianMS SQL-Server

    CARESS-Services.NET 3.5 WCF

    StatistikR Project

    CARESS.NET 3.5 WPF

    Data Warehouseinkl. Star-/Snowflake

    Server

    Client

    GeodatenbankPostGIS

    Yvette Teiken, Martin Rohde

  • 12 MUSTANG/CARESS Innovationsmodell

    Anwendungsorientierte ForschungProjekte und Plattformentwicklung

    MUSTANG

    - Agile Softwareentwicklung - Testgetriebene Entwicklung- Continuous Integration- Modellgetriebene Entwicklung- Interne .NET-Schulungen

    Diss.-Thema Intelligente

    Datenanalyse

    IP Karten mit Virtual Earth

    Diss.-Thema Software

    Produktlinien

    Diss.-Thema Analytisches PM

    DA berwachung Annotierter

    Strategy Maps

    OFFIS e.V., Bereich Gesundheit, Themenfeld Datenmanagement und -analyse

    InfoAnalytics AG (Spin-off)

    CARESS (Krebsregister)

    INITIAL (LIGA)

    Gesundheit NRW

    (LIGA)

    DA Metamodell fr Reporting

    PG Visual Analytics

    Diss.-Thema Modellgetriebene

    Bereitstellung

    Yvette Teiken, Martin Rohde

  • 13

    25.11.2010

    CARESS Raumbezug bei der DatenanalyseDrei Ebenen

    Auswahl zu betrachtender Regionen

    Dynamische Klassifizierung (Ad-Hoc-Kategorien)

    Auswahl von Regionen anhand geografischer Merkmale

    Z.B. Abstand von Emissionsquellen

    Auswahl von Regionen in einer Karte

    Prdikatbasierte Auswahl (Versorgungsstrukturen, )

    Statistische Verfahren

    Clusterindizes Nachbarschaft fr Berechnung

    Rumliche Regression

    Interpolationsverfahren

    Ergebnisdarstellung

    Thematisch eingefrbte Karten

    Punktdarstellungen

    Diagramme in Karten

    Auswahl von Regionen und Ergebnisdarstellung

    Yvette Teiken, Martin Rohde

  • 14

    25.11.2010

    CARESS Berichtswesen

    Zusammenfassung von Ergebnissen zu Berichtsmappen

    Konfigurationsmglichkeiten

    Visualisierungen (und Layouteinstellungen)

    Auswertungsreihen fr gleichartige Ergebnisse

    Zusatzinformationen fr die Berichtsgenerierung

    Cross Media Publishing

    MUSTANG XML-Export

    Formatierung der Berichte (XSLT)

    fr Verffentlichungen im Internet (HTML)

    fr Verffentlichungen als PDF-Dateien

    fr ein Portal (mit Ad-Hoc-Anfragen)

    Management-Cockpits / Management-Mappen

    Yvette Teiken, Martin Rohde

  • CARESS und SurvA DEMO15

    25.11.2010

  • Zeitplan Neuentwicklung

    6.12.2010: Testinstallation einer kleinen Version im EKN