Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch...

70
Medizinische Dokumentenrecherche mit MorphoSaurus ─── Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke Medizinische Informatik, Universitätsklinikum Freiburg

Transcript of Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch...

Page 1: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Medizinische Dokumentenrecherche mit MorphoSaurus

───Sprachübergreifend und benutzerfreundlich

durch semantische Indexierung

Kornél Markó, Philipp DaumkeMedizinische Informatik,

Universitätsklinikum Freiburg

Page 2: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Übersicht

1. Kurze Vorstellung der Medizinischen Informatik in Freiburg

2. Ebenen der Suche (Laien, Experten, Sprachen)

3. Vorstellung der Technologie

4. Evaluation

5. Anwendungen

• SOMED-Studie

• ICD-Suche

6. Perspektiven / Einsatzmöglichkeiten im DIMDI Zeitbedarf ca. 60

Minuten

Page 3: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

MI in Freiburg

• Medizinische Informatik Direktor Prof. Dr. Klar

• Wissenschaftliche Schwerpunkte– Patientenbezogene Dienste: MIRA-Plus (KIS)

– Patientenunabhängige Auskunfts- und Wissensdienste: InfoServer

– Grundlagen zur Modellierung medizinischer Konzepte mittels terminologischer Logik

– Begriffliche Ordnungssysteme in der Medizin

– Konzepte zur Integration von Elektronischer Patientenakte und medizinischen Wissensdiensten

– MorphoSaurus / Text-Retrieval / Cross-Language Retrieval

Page 4: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

MorphoSaurus - Entwicklung

• 1998: Entwicklung der ersten Version im Rahmen einer Promotion (Medizin)

• Seit 2000: Kooperation mit der Catholic University of Paraná, Brasilien (BMBF-Förderungen)

• Seit 2003: DFG-Projekt morphologisches Indexieren

• Seit 2004: EU Network of Excellence Semantic Mining (WP multi-lingual lexicon, ontologies, text mining)

Page 5: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

MorphoSaurus

Page 6: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Suchmaschine

Einsprachige Textrecherche

Page 7: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Laien

„hoher Blutdruck“

Page 8: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Laien

„hoher Blutdruck“

Suchmaschine:Abgleich von Zeichenketten

Page 9: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Laien

„hoher Blutdruck“

Suchmaschine:Abgleich von Zeichenketten

Page 10: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Laien

„hoher Blutdruck“

Suchmaschine:Abgleich von Zeichenketten

Page 11: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Laien

„hoher Blutdruck“

Suchmaschine:Abgleich von Zeichenketten

Page 12: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten

„Risiken beiBluthochdruck“

Page 13: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten

„Risiken beiBluthochdruck“

Suchmaschine:Abgleich von Zeichenketten

Page 14: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten

Suchmaschine:Abgleich von Zeichenketten

„Risiken beiBluthochdruck“

Page 15: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten

Suchmaschine:Abgleich von Zeichenketten

„Risiken beiBluthochdruck“

Page 16: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten

„Risiken beiBluthochdruck“

Suchmaschine:Abgleich von Zeichenketten

Page 17: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Morphologie der Wörter

Linguistische Phänomene erschweren die medizinische Textrecherche !

– Flexion: Erkrankungen, Bluthochdrucks, Risiken

– Derivation: Krankheit, diastolisch, leukozytär

– Komposition: Gemeinde|krank|en|pflege|station|en

– Akronyme: AIDS, SARS, OECD

– Orthografische Varianten: • Kolonkarzinom, Colonkarzinom, • Ösophagus, Oesophagus, • ulzerierend, ulcerierend

– Synonyme: • Bluthochdruck – Hypertonie, • Prophylaxe – Vorbeugung

– Eigennamen: Aspirin, ASS, ...

Page 18: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten II

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

Page 19: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten II

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

„Correlation of high blood pressure and lesion of the white

substance“

Page 20: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten II

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

Suchmaschine

„Correlation of high blood pressure and lesion of the white

substance“

Page 21: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten II

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

Suchmaschine

„Correlation of high blood pressure and lesion of the white

substance“

Page 22: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten II

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

Suchmaschine

„Correlation of high blood pressure and lesion of the white

substance“

Page 23: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Triviale Suche: Experten II

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

Suchmaschine

„Correlation of high blood pressure and lesion of the white

substance“

Page 24: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Mehrsprachige Textrecherche

Suchmaschine

Page 25: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Ansätze

B

• Übersetzung der Dokumente

A BA

• Übersetzung in eine Interlingua

A BIL IL

• Übersetzung der Benutzeranfrage

BA

Page 26: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Lösungsansatz

• Subwörter sind atomare konzeptuelle oder linguistische Einheiten:– Stämme: verletz, entzünd, magen, schleimhaut

– Präfixe: ab-, an-, anti-, ge-, hervor-, hyper-

– Suffixe: -abel, -bar, -haft, -ion, -itis

– Infixe: -o-, -s-

• Synonyme Subwörter werden (sprachübergreifend) in Äquivalenzklassen gruppiert:#derma = { derm, cutis, skin, haut, kutis, pele, cutis, piel, … }

#inflamm = { inflam, -itic, -itis, entzuend, -itis, -itisch, inflam, flog, inflam, flog, -iolitis, ... }

• Empirische Kriterien:– hypertonie = {#hyper #tens #blood}

Page 27: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Ressourcen

• Subwort-Lexikon:– Organisiert Subwörter (atomare

Bedeutungseinheiten) in mehreren Sprachen

• Subwort-Thesaurus: – Gruppiert synonyme Lexikoneinträge

(auch sprachübergreifend)

• Zerlegungsalgorithmus:– Extraktion von Subwörtern und

Zuweisung von Äquivalenzklassen

MorphoSaurus

Page 28: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Subwort: Lexikon & Thesaurus

Subwort Lexikon:

gastr

stomach

magen

ventric

chamber

hepat,hepar

liver

leber

-itis, inflamm,

entzünd

nephr

ren

kidney

niere

Subwort Thesaurus:Gruppierung von synonymen Subwörtern zu Äquivalenzklassen

#GASTR

#CHAMBER

#HEPAR

#NEPHR

#INFLAMM

Page 29: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Beispiel

high tsh value s suggest the diagnos is of primar y hypo thyroid ismer hoeh te tsh wert e erlaub en die diagnos e einer primaer en schilddruese n unter funktion

ZerlegungsalgorithmusSubwort-Lexikon

High TSH values suggest the diagnosis of primary hypo-thyroidism ...

Original

Erhöhte TSH-Werte erlauben die Diagnose einer primären Schilddrüsenunterfunktion ...

high tsh values suggest the diagnosis of primary hypo-thyroidism ...

erhoehte tsh werte erlauben die diagnose einer primaeren schilddruesenunterfunktion ...

Orthografische Regeln

Orthografische Normalisierung

#up tsh #value #suggest #diagnost #primar #hypo #thyre

Interlingua

#up tsh #value #permit #diagnost #primar #thyre #hypo #function

Subwort-Thesaurus

Semantische Normalisierung

Page 30: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Beispiel

high tsh value s suggest the diagnos is of primar y hypo thyroid ismer hoeh te tsh wert e erlaub en die diagnos e einer primaer en schilddruese n unter funktion

ZerlegungsalgorithmusSubwort-Lexikon

High TSH values suggest the diagnosis of primary hypo-thyroidism ...

Original

Erhöhte TSH-Werte erlauben die Diagnose einer primären Schilddrüsenunterfunktion ...

high tsh values suggest the diagnosis of primary hypo-thyroidism ...

erhoehte tsh werte erlauben die diagnose einer primaeren schilddruesenunterfunktion ...

Orthografische Regeln

Orthografische Normalisierung

#up tsh #value #suggest #diagnost #primar #hypo #thyre

Interlingua

#up tsh #value #permit #diagnost #primar #thyre #hypo #function

Subwort-Thesaurus

Semantische Normalisierung

Page 31: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Suche mit MorphoSaurus

Page 32: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Suche mit MorphoSaurus

Page 33: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Suche mit MorphoSaurus

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

Page 34: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Suche mit MorphoSaurus

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

„#correl #hyper #tens #lesion #whit

#matter“

Page 35: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Suche mit MorphoSaurus

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

„#correl #hyper #tens #lesion #whit

#matter“

Suchmaschine:Abgleich von Zeichenketten

Page 36: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Suche mit MorphoSaurus

„Korrelation von Hypertonie und

Läsion der Weißen Substanz“

Suchmaschine:Abgleich von Zeichenketten

„#correl #hyper #tens #lesion #whit

#matter“

Page 37: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Studie

Page 38: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Studie: Google

Page 39: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Studie: Google

Page 40: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Studie: PubMed

Page 41: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Studie: PubMed

Page 42: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Studie: DIMDI

Page 43: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Studie: DIMDI

Page 44: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Studie: MorphoSaurus

Page 45: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Studie: MorphoSaurus

Page 46: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Sprachübergreifende Suche

Page 47: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Evaluation

Page 48: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Evaluationsszenarien

• Baseline: einsprachige Textrecherche– Englische Benutzeranfragen– Englische Texte

• Übersetzung der Benutzeranfrage– Google Übersetzer– Mehrsprachiges Medizinlexikon aus UMLS

• MorphoSaurus– Interlingua-Repräsentation der Anfragen und der

Dokumente

Page 49: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Experimente

OHSUMED-Corpus (Hersh et al., 1994)– Untermenge von MEDLINE

– ~233,000 englische Dokumente

– 106 englische Benutzeranfragen, von Experten übersetzt ins Deutsche und Portugiesische

– Relevanz der Dokumente manuell markiert

Suchmaschine: – Open-Source der Apache-Foundation: Lucene

– http://lucene.apache.org/

Page 50: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Resultate

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Recall

Pre

cisi

on

Baseline

Morphosaurus

Übersetzung

BaselineMorphoSaurusÜbersetzung der Anfrage

Deutsch PortugiesischTop 200

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Recall

Baseline

Morphosaurus

Übersetzung

0 0,1 0,1 0,20,2 00,3 0,3 0,40,4 0,5 0,50,6 0,6 0,70,7 0,8 0,8 0,90,9 1,01,0

Page 51: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Resultate

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Recall

Pre

cisi

on

Baseline

Morphosaurus

Übersetzung

BaselineMorphoSaurusÜbersetzung der Anfrage

Deutsch PortugiesischTop 200

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Recall

Baseline

Morphosaurus

Übersetzung

0 0,1 0,1 0,20,2 00,3 0,3 0,40,4 0,5 0,50,6 0,6 0,70,7 0,8 0,8 0,90,9 1,01,0

68% der Baseline

54% der Baseline

Page 52: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Resultate

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Recall

Pre

cisi

on

Baseline

Morphosaurus

Übersetzung

BaselineMorphoSaurusÜbersetzung der Anfrage

Deutsch PortugiesischTop 200

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Recall

Baseline

Morphosaurus

Übersetzung

0 0,1 0,1 0,20,2 00,3 0,3 0,40,4 0,5 0,50,6 0,6 0,70,7 0,8 0,8 0,90,9 1,01,0

68% der Baseline

54% der Baseline

93% der Baseline

62% der Baseline

Page 53: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

• Innovatives und erfolgreiches Suchverfahren– Komposita – Suche– Synonym – Suche– Sprachübergreifende Suche (EN, DE, PT, FR, SP, SV)– Ergebnisse nach Relevanz sortiert

• Sprachübergreifende Suche– erreicht bis zu 93% gegenüber einsprachiger Suche

(Meth Inf Med, 2005)

• Semantische Indexierung und Suche– ist einsetzbar mit allen Suchmaschinen

• Einfache Pflege (Kostenersparnis)– Pflege des Subwortlexikons im Vergleich zur Pflege eines Vollformensynonymlexikons

überschaubar

• SOMED Prototyp:– http://morphine.coling.uni-freiburg.de/somed/search.php

Zusammenfassung

Page 54: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Anwendungen

Page 55: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Proof-of-Concept: SOMED

336.250 Dokumente (543MB XML) wurden– nach Sprachen kategorisiert (TextCat):

• ~3000/Minute = 2 Stunden

– mit MorphoSaurus bearbeitet

• ~3000/Minute = 2 Stunden

• 1.7 GB XML (nur für Highlighting der Treffer)

Suchmaschine: Lucene • ~9000/Minute = 40 Minuten

• 940 MB für 2 Indices (Original + MorphoSaurus)

• 340 MB für 1 Index (MorphoSaurus)

Page 56: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Proof-of-Concept: SOMED

Dekomposition der Suchanfragen• „Darmkrebsrisikoreduzierung“• #enteral #neoplas #malign #risk #reduc

Formulierung der Suchanfrage• 1. Suche mit „UND“• 2. Falls keine Treffer: Suche mit „ODER“

Es wurden 2 Indizes erstellt:#enteral AND #neoplas AND #malign AND #risk AND #reduc OR (original:darmkrebsrisikoreduzierung)

Besseres Ranking, gleiche Ergebnismenge, höherer Speicherbedarf

Page 57: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Proof-of-Concept: SOMED

Page 58: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Diagnosenkodierung nach ICD

• Suche in 15,278 ICD-Codes

• Erste Tests durch Uniklinik Freiburg erfolgreich, vor allem im Vergleich zu

– ICD-Browser des Zentralinstituts für die kassenärztliche Versorgung in der BRD (http://www.zi-berlin.de/)

– Kodierbrowser der Uniklinik Münster (http://drg.uni-muenster.de/de/webgroup/m.brdiagnosen.php)

• Anwendbar auf andere Klassifikationen: OPS, …

Page 59: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Universitätsklinikum Münster

Page 60: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Zentralinstitut Berlin (3M)

Page 61: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

MorphoSaurus ICD-Suche

Page 62: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

ICD verbunden mit MEDLINE

Page 63: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

ICD verbunden mit MEDLINE

Page 64: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Forschungsbezogene Nutzung

• Texte in klinischen DB (Uniklinik Freiburg)

• Sprachübergreifende Suche im Web (HON)

• Suche in Bilddatenbanken (mit Uni Münster)

• Mapping von Terminologien (Ukl Freiburg)

Page 65: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

MorphoSaurus - Zukunft

Projekte, in denen MorphoSaurus zum Einsatz kommt:

• 2006: ZBMED: Integration in MedPilot 2 Jahre

• 2006: EU BOOTStrep (Bootstrapping of Ontologies and Terminologies Strategic Research Project) 3 Jahre

• 2006: @neurIST (Integrated Biomedical Informatics for the Management of Cerebral Aneurysm) 4 Jahre

Page 66: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

www.morphosaurus.net

Page 67: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

MorphoEdit WEB

Page 68: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Suchmaschinen-Indices

• Liest Dokumente ein und generiert einen Index mit gewichteten Indextermen (für Ranking).

– „Wort x kommt in Dokumenten ID1,ID2,ID6,… vor“

• Normalerweise sind Indexterme Wörter der Dokumentenkollektion

• MorphoSaurus: Äquivalenzklassen bilden Indexterme

Page 69: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Lucene: Indexerstellung

Indexterm

(Original)

ID

Bluthochdruck #1

Hypertonie #1

Erhöhung #1

Blutdruckes #1

Erhöhten #1

Blutdruckwerte #1

Blutdruckmessung #1

Indexterm

(MorphoSaurus)

ID

#blood #1

#high #1

#tense #1

#value #1

#measure #1

Page 70: Medizinische Dokumentenrecherche mit MorphoSaurus Sprachübergreifend und benutzerfreundlich durch semantische Indexierung Kornél Markó, Philipp Daumke.

Lucene: Indexerstellung

Indexterm

(Original)

ID

Bluthochdruck #1

Hypertonie #1 #2

Erhöhung #1

Blutdruckes #1

Erhöhten #1

Blutdruckwerte #1

Blutdruckmessung #1

Hypertension #2

Blutdruck #2

Risiko #2

Hypertonikers #2

Belastungsblutdruck #2

Ruheblutdruck #2

Risikofaktor #2

Risiko #2

Risikofaktoren #2

Risikoevaluation #2

Indexterm

(MorphoSaurus)

ID

#blood #1 #2

#high #1 #2

#tense #1 #2

#value #1

#measure #1

#risk #2

#factor #2

#eval #2