Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie,...

40
Medizinische Statistik Medizinische Statistik und und Informationsverarbeitung Informationsverarbeitung Quade Quade Institut für Medizinische Biometrie, Institut für Medizinische Biometrie, Informatik und Epidemiologie Informatik und Epidemiologie Quade Quade

Transcript of Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie,...

Page 1: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Medizinische Statistik und Medizinische Statistik und InformationsverarbeitungInformationsverarbeitung

QuadeQuade

Institut für Medizinische Biometrie, Institut für Medizinische Biometrie, Informatik und EpidemiologieInformatik und Epidemiologie

QuadeQuade

Page 2: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Moderne EDVModerne EDV

QuadeQuade

Server mit mehreren Prozessoren und Raid 6 Server mit mehreren Prozessoren und Raid 6 PlattensystemPlattensystem

DOM 0 mit Virtualisierungsmöglichkeit für virtuelle DOM 0 mit Virtualisierungsmöglichkeit für virtuelle Rechner (Linux, Vmware)Rechner (Linux, Vmware)

DRBD zur Echtzeitspiegelung von Platteninhalten DRBD zur Echtzeitspiegelung von Platteninhalten auf einen Ersatzserverauf einen Ersatzserver

Virtuelle Server mit KryptofilesystemVirtuelle Server mit Kryptofilesystem

Page 3: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

AnwendungsprogramAnwendungsprogrammeme

QuadeQuade

Anwendungsprogramme lassen sich in der Regel in Anwendungsprogramme lassen sich in der Regel in 3 Ebenen einteilen:3 Ebenen einteilen:

1: 1: DatenDaten

2:2: AnwendungAnwendung

3:3: PräsentationPräsentation

Diese Ebenen lassen sich auf verschiedenen Rechnern Diese Ebenen lassen sich auf verschiedenen Rechnern unterbringen (Client - Server).unterbringen (Client - Server).

Page 4: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

ErfassungssystemeErfassungssysteme

QuadeQuade

Erfassungssysteme können typische Anwendungs-Erfassungssysteme können typische Anwendungs-programme sein. Über Masken werden Daten programme sein. Über Masken werden Daten eingegeben, vom Programm geprüft und dann in einer eingegeben, vom Programm geprüft und dann in einer Datei oder Datenbank gespeichert. Schon gespeicherte Datei oder Datenbank gespeichert. Schon gespeicherte Daten lassen sich jederzeit ändern oder ergänzen. Daten lassen sich jederzeit ändern oder ergänzen. Änderungen werden gegebenenfalls dokumentiert. Änderungen werden gegebenenfalls dokumentiert.

Beispiel:Beispiel: Patientenaufnahme, Erfassung von Patientenaufnahme, Erfassung von Untersuchungsbefunden.Untersuchungsbefunden.

Page 5: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

ErfassungssystemeErfassungssysteme

QuadeQuade

In der Medizin gibt es besondere Anforderungen In der Medizin gibt es besondere Anforderungen an Erfassungssysteme. So muß z.B. bei der an Erfassungssysteme. So muß z.B. bei der Patientenaufnahme der Patient re-identifiziert Patientenaufnahme der Patient re-identifiziert werden. Erfaßte Daten eines Patienten müssen werden. Erfaßte Daten eines Patienten müssen diesem eineindeutig zugeordnet werden können.diesem eineindeutig zugeordnet werden können.

Page 6: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

ErfassungssystemeErfassungssysteme

QuadeQuade

Wichtig ist die vollständige, vollzählige und fehlerfreie Wichtig ist die vollständige, vollzählige und fehlerfreie Erfassung. Ein Erfassungsbogen wird häufig in der Erfassung. Ein Erfassungsbogen wird häufig in der primären Datenerfassung eingesetzt. Geeignete primären Datenerfassung eingesetzt. Geeignete Formulare (Markierungsbelege) können auch online Formulare (Markierungsbelege) können auch online eingelesen werden (Markierungsbeleg mit Barcode eingelesen werden (Markierungsbeleg mit Barcode oder OCR-Schrift).oder OCR-Schrift).

Page 7: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Datei, DatenbankDatei, Datenbank

QuadeQuade

Die einfachste Form, Daten zu speichern, ist die Die einfachste Form, Daten zu speichern, ist die Ablage in einer Datei (File). Dateien werden in Ablage in einer Datei (File). Dateien werden in Verzeichnissen (Directories) abgelegt. Die Verzeichnissen (Directories) abgelegt. Die Dateinamen werden in Abhängigkeit vom Dateinamen werden in Abhängigkeit vom Betriebssystem gewählt. Betriebssystem gewählt.

Daten werden in Dateien in ein oder mehreren Daten werden in Dateien in ein oder mehreren Zeilen (Records) mit fester (fixed) oder variabler Zeilen (Records) mit fester (fixed) oder variabler Länge abgelegt. Die Reihenfolge der Daten, die Länge abgelegt. Die Reihenfolge der Daten, die Form ihrer digitalen Repräsentation und ihre Form ihrer digitalen Repräsentation und ihre Position in der Datei müssen vereinbart sein.Position in der Datei müssen vereinbart sein.

Page 8: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Datei, DatenbankDatei, Datenbank

QuadeQuade

Auch Datenbanken speichern Daten in Dateien. Auch Datenbanken speichern Daten in Dateien. Sie führen zusätzlich Informationen über die Sie führen zusätzlich Informationen über die gespeicherten Daten (Bezeichnung, Format, gespeicherten Daten (Bezeichnung, Format, Länge) mit.Länge) mit.

Bei echten Datenbanken verwaltet ein Bei echten Datenbanken verwaltet ein Datenbankmanager die Daten und organisiert Datenbankmanager die Daten und organisiert den Zugriff. Damit werden Datenzugriff und den Zugriff. Damit werden Datenzugriff und Datenintegrität besser gewährleistet als durch Datenintegrität besser gewährleistet als durch Record locking bei Dateien. Record locking bei Dateien.

Page 9: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Datei, DatenbankDatei, Datenbank

QuadeQuade

hierarchischhierarchisch relationalrelational objektorientiertobjektorientiert

Dateibasiert:Dateibasiert: dBase, ClipperdBase, ClipperAccessAccess

Datenbank:Datenbank: OracleOracle MysqlMysql

SQLSQL InformixInformixSybaseSybase

Page 10: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Structured Query Structured Query LanguageLanguage

QuadeQuade

Select name, vname from studenten.stammdaten Select name, vname from studenten.stammdaten where matrnr = 1234567;where matrnr = 1234567;

Testmann RobertoßTestmann Robertoß

Page 11: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

60000-10000 AC 60000-10000 AC Gesellschaft der Jäger Gesellschaft der Jäger und Sammler und Sammler

- 18. Jahrhundert- 18. Jahrhundert Ackerbau und Ackerbau und ViehzuchtViehzucht

- heute- heute IndustriegesellschaftIndustriegesellschaft

heute - ?heute - ?InformationsgesellschaftInformationsgesellschaft

zukünftigzukünftig ? ? Freizeitgesellschaft?Freizeitgesellschaft?

GesellschaftenGesellschaften

Oncology Meeting CuritibaOncology Meeting Curitiba

Page 12: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Alle Produkte müssen produziert Alle Produkte müssen produziert werden.werden.

Das „Produkt“ “Information / Wissen” Das „Produkt“ “Information / Wissen” kann leicht kopiert werden!kann leicht kopiert werden!

Unser Problem ist nicht so sehr Unser Problem ist nicht so sehr “producing knowledge”, sondern der“producing knowledge”, sondern der

Zugang zu vorhandenem WissenZugang zu vorhandenem Wissen

Information SocietyInformation Society

QuadeQuade

Page 13: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

19571957 SputnikSputnik

19581958 Advanced Research Projects Advanced Research Projects AgencyAgency

19691969 Arpanet(Network Control Arpanet(Network Control Protocol) erster Request For Protocol) erster Request For CommentsComments

19721972 ftp e-mailftp e-mail

Geschichte des Geschichte des Internet Internet

Oncology Meeting CuritibaOncology Meeting Curitiba

Page 14: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

19721972 5 verschiedene Netzwerke 5 verschiedene Netzwerke (inkompatibel)(inkompatibel)

RFC #318 telnet (Jon Postel)RFC #318 telnet (Jon Postel)

19731973 Name „Internet“ and Name „Internet“ and Definition Definition von TCP/IPvon TCP/IP

19821982 TCP/IP wird „Standard“TCP/IP wird „Standard“

19831983 TCP/IP als Source-Code frei TCP/IP als Source-Code frei zugänglich (Berkeley System zugänglich (Berkeley System Distribution)Distribution)

Geschichte des Geschichte des Internet Internet

Oncology Meeting CuritibaOncology Meeting Curitiba

Page 15: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

19831983 Arpanet wechselt von NCP zu Arpanet wechselt von NCP zu TCPTCP

Domain Name ServiceDomain Name Service

19861986 Perl von Larry WallPerl von Larry Wall

19881988 Internet Wurm von R. Morris Jr.Internet Wurm von R. Morris Jr.

19891989 Clifford Stoll und die HackerClifford Stoll und die HackerWeb Vorschlag von Tim Berners-Web Vorschlag von Tim Berners-

LeeLee

Geschichte des Geschichte des Internet Internet

Oncology Meeting CuritibaOncology Meeting Curitiba

Page 16: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

19891989 Tim Berners-Lee erstellt die Tim Berners-Lee erstellt die erste erste WWW SoftwareWWW Software

19911991 WAIS wird erfundenWAIS wird erfundenGopher wird freigegebenGopher wird freigegebenPretty Good Privacy von Philip Pretty Good Privacy von Philip Zimmerman wird freigegebenZimmerman wird freigegebenLinux wird von Linus Torvald Linux wird von Linus Torvald

vorgestelltvorgestellt

Geschichte des Geschichte des Internet Internet

Oncology Meeting CuritibaOncology Meeting Curitiba

Page 17: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Tim Berners-Lee Tim Berners-Lee (1990)(1990)

Page 18: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

19911991 VeronicaVeronica

19931993 Mosaic (Browser)Mosaic (Browser)WWW Verkehr steigert sich vonWWW Verkehr steigert sich von

0.1% auf 1%. Es gibt 500 0.1% auf 1%. Es gibt 500 WWW WWW ServerServer

19941994 WWW wächst um 341,634%WWW wächst um 341,634%WWW wechselt von CERN zur WWW wechselt von CERN zur INRIAINRIA

Geschichte des Geschichte des Internet Internet

Oncology Meeting CuritibaOncology Meeting Curitiba

Page 19: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

QuadeQuade

Page 20: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

World Wide WebWorld Wide Web

Oncology Meeting Curitiba Oncology Meeting Curitiba

Page 21: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

19941994 Lycos startet eine Lycos startet eine Suchmaschine Suchmaschine im Internet. im Internet. Die deutsche Die deutsche Bundestagswahl wird im Internet Bundestagswahl wird im Internet übertragen.übertragen.

19951995 HTTP Pakete bilden das größte HTTP Pakete bilden das größte Kontingent im Internet Verkehr.Kontingent im Internet Verkehr.Apache Web Server Projekt.Apache Web Server Projekt.Java wird eingeführt.Java wird eingeführt.

Geschichte des Geschichte des Internet Internet

Oncology Meeting CuritibaOncology Meeting Curitiba

Page 22: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

19961996 Blue Ribbon Campain als Blue Ribbon Campain als Antwort auf den Antwort auf den Communications

Decency Act

19981998 ClintonClinton

Geschichte des Geschichte des Internet Internet

Oncology Meeting CuritibaOncology Meeting Curitiba

Page 23: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Einige FaktenEinige Fakten

• Der Bereich Medizin ist der zweitgrößte im Der Bereich Medizin ist der zweitgrößte im InternetInternet

• Es gibt mehrere Milliarden DokumenteEs gibt mehrere Milliarden Dokumente

• Maximal 10% bis 20% des Internet werden Maximal 10% bis 20% des Internet werden von einer Suchmaschine indexiert.von einer Suchmaschine indexiert.

• Es gibt Listserver und SuchmaschinenEs gibt Listserver und Suchmaschinen

Page 24: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Wie kann die Qualität der Wie kann die Qualität der Patienten-versorgung verbessert Patienten-versorgung verbessert werden?werden?

Kann das Internet als Kann das Internet als Transportmedium für Informationen Transportmedium für Informationen genutzt werden (Funktionalität)?genutzt werden (Funktionalität)?

Welche Informationsquelle ist Welche Informationsquelle ist geeignet?geeignet?

Drei Fragen (1993): Drei Fragen (1993):

Page 25: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Kann das Internet als Kann das Internet als Transportmedium für Informationen Transportmedium für Informationen genutzt werden (Funktionalität)?genutzt werden (Funktionalität)?

Welche Informationsquelle ist Welche Informationsquelle ist geeignet?geeignet?

Drei Antworten Drei Antworten (1994):(1994):

Durch Zugang zu aktuellen Leitlinien Durch Zugang zu aktuellen Leitlinien für Ärzte und darauf abgestimmte für Ärzte und darauf abgestimmte Patienteninformationen in Patienteninformationen in Laiensprache.Laiensprache.

Page 26: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Durch Zugang zu aktuellen Leitlinien Durch Zugang zu aktuellen Leitlinien für Ärzte und darauf abgestimmte für Ärzte und darauf abgestimmte Patienteninformationen in Patienteninformationen in Laiensprache.Laiensprache.

Welche Informationsquelle ist Welche Informationsquelle ist geeignet?geeignet?

Drei Antworten Drei Antworten (1994):(1994):

WWWWWW

Page 27: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Durch Zugang zu aktuellen Leitlinien Durch Zugang zu aktuellen Leitlinien für Ärzte und darauf abgestimmte für Ärzte und darauf abgestimmte Patienteninformationen in Patienteninformationen in Laiensprache.Laiensprache.

WWWWWW

Drei Antworten Drei Antworten (1994):(1994):

CancerNet vom National Cancer CancerNet vom National Cancer Institute (NCI) der USA.Institute (NCI) der USA.

Page 28: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

CancerNetCancerNet

Übersichtliche Leitlinien für Ärzte Übersichtliche Leitlinien für Ärzte bezüglich Prognose, Staging und bezüglich Prognose, Staging und Behandlung von mehr als 80 Behandlung von mehr als 80 Tumorarten.Tumorarten.

Entsprechende Informationen in Entsprechende Informationen in Laiensprache für Patienten. Laiensprache für Patienten.

Übersichtsarbeiten zu Übersichtsarbeiten zu unterstützenden Therapien.unterstützenden Therapien.

QuadeQuade

Page 29: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

CancerNetCancerNet

Übersichten bezüglich Vorsorgeunter-Übersichten bezüglich Vorsorgeunter-suchungen und Vorbeugung. suchungen und Vorbeugung.

Datenbank mit Informationen über Datenbank mit Informationen über aktive und abgeschlossene klinische aktive und abgeschlossene klinische Studien. Studien.

Literaturdatenbank (Cancerlit).Literaturdatenbank (Cancerlit).

Monatlich aktualisiert.Monatlich aktualisiert.QuadeQuade

Page 30: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Die Leitlinien für Ärzte enthalten Die Leitlinien für Ärzte enthalten über 8000 Links zu Abstrakts. Die über 8000 Links zu Abstrakts. Die Evidenz wird angegeben. Fast alle Evidenz wird angegeben. Fast alle Abstrakts haben einen Link zu Abstrakts haben einen Link zu MEDLINE.MEDLINE.

Für einige Journals werden Links Für einige Journals werden Links zur Originalarbeit generiert.zur Originalarbeit generiert.

CancernetCancernet

QuadeQuade

Page 31: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Seit 1994 ca. 2,5 Million KundenSeit 1994 ca. 2,5 Million Kundendarunter ca. 250000 Ärztedarunter ca. 250000 Ärzte

Jeden Monat werden 90000 bis Jeden Monat werden 90000 bis über 100000 Dokumente von ca. über 100000 Dokumente von ca. 60000 Nutzern abgerufen. 60000 Nutzern abgerufen.

Die abgerufene Informationsmenge Die abgerufene Informationsmenge entspricht über 2 Millionen Seiten entspricht über 2 Millionen Seiten Text (1998 Platz 48 in Text (1998 Platz 48 in Deutschland).Deutschland).

Cancernet 2001Cancernet 2001

QuadeQuade

Page 32: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

QuadeQuade

Page 33: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Universität BonnUniversität BonnVermittlung zu CancerNet Vermittlung zu CancerNet

Host=WebCrawlerHost=WebCrawler

Januar März Mai Januar März Mai 19971997

303025252020151510105500

Page 34: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

LinkLinkzuzu

CancerNetCancerNet

Page 35: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Universität BonnUniversität BonnVermittlung zu CancerNet Vermittlung zu CancerNet

Host=CNNHost=CNN

Januar März Mai Januar März Mai 19971997

303025252020151510105500

Page 36: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Vermittler, 1997Vermittler, 1997n=794n=794

Suchmaschine .................. Suchmaschine .................. 59.6%59.6%

Liste ............................. 9.9%Liste ............................. 9.9%

Kollege ........................... 5.0%Kollege ........................... 5.0%

Freund ........................... 4.7%Freund ........................... 4.7%

Arzt ............................. 3.5%Arzt ............................. 3.5%

Zeitung .......................... 2.5%Zeitung .......................... 2.5%

Familie ........................... 3.0% Familie ........................... 3.0%

Pflegekraft ...................... 0.9%Pflegekraft ...................... 0.9%

TV ................................0.6%TV ................................0.6%

Page 37: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

CancerNet Statistik CancerNet Statistik (1998)(1998)

AltersverteilungAltersverteilungn=1,268n=1,268

10 15 20 25 30 35 40 45 50 55 60 65 70 75 8010 15 20 25 30 35 40 45 50 55 60 65 70 75 80

114 4 113 3 112 2 1111110099887766554433221100

Prozent

Alter

männlimännlichch

weiblicweiblichh

Page 38: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

ÄrztinnenÄrztinnen

19961996 1997 199719981998

Deutschland 12% (n=8)Deutschland 12% (n=8) 5% (n=39)5% (n=39) 2.3%2.3%(n=43)(n=43)

USAUSA 16% (n=32) 14% (n=29) 12% 16% (n=32) 14% (n=29) 12% (n=25)(n=25)

Page 39: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Warum nutzen Ärzte Warum nutzen Ärzte Cancernet? 1997 Cancernet? 1997 (n=163)(n=163)

Patienten-Patienten-information information

12.912.9

ForschunForschung g

27.027.0WeiterbilduWeiterbildu

ng 22.1ng 22.1InformationInformations- suche 3.7s- suche 3.7

Rest 0.6Rest 0.6Präsen-Präsen-

tation 9.2tation 9.2Allg.Interesse Allg.Interesse

2.52.5

Literatur Literatur 19.619.6

Krebs Krebs 1.81.8

Page 40: Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie.

Grund für die Nutzung, Grund für die Nutzung, 19971997

ArbeitnehmeArbeitnehmerrHausfrauHausfrauAngestellterAngestellter

~70% ~70% KrebsKrebs

Wissen-Wissen-schaftlerschaftler

~70% ~70% LiteraturLiteratur