9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent:...

51
9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz

Transcript of 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent:...

Page 1: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

9. Information Retrieval und Medizinische Literaturdatenbanken

Wintersemester 2010/11Dozent: Univ.-Prof. Dr. med. Stefan Schulz

Page 2: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Sucher-gebnisse

Kollektion von Dokumenten(Dokumentationseinheiten)

Anfrage (Query) ?

Dokumentenretrieval

Page 3: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Problem 1: eindeutige Formulierung der Suchanfrage

Page 4: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Mehrdeutige Begriffe

• Ein Patient kennt das Wort "Ventrikel" nicht und

gibt das Wort in eine Suchmaschine ein

• Wo liegt das Problem?

Page 5: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Ventrikel

Page 6: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Zwei Sprachphänomene, die die Textrecherche erschweren

• Synoymie: Ein Gegenstand lässt sich durch

unterschiedliche sprachliche Zeichen ausdrücken

• Homonymie (Ambiguität) : Unterschiedliche

Gegenstände werden mit demselben sprachlichen

Ausdruck belegt

Page 7: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Relevante Dokumente

Page 8: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.
Page 9: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Suchanfrage

Page 10: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Suchanfrage

RelevanteDokumente

Page 11: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Suchanfrage

RelevanteDokumente

Suchmaschine

Page 12: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Suchanfrage

RelevanteDokumente

Page 13: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Eine Suchanfrage…

• Teilt den Dokumentenraum in– Relevante– Nicht relevante Dokumente

• Eine Suchmaschine (IR-System)– Findet relevante, aber auch nichtrelevante– Verfehlt relevante, schließt nichtrelevante aus

Page 14: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

RelevanteDokumente

NichtrelevanteDokumente

GefundeneDokumente

NichtgefundeneDokumente

Page 15: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

RelevanteDokumente

NichtrelevanteDokumente

GefundeneDokumente

NichtgefundeneDokumente

Precision (Genauigkeit):Anteil der relevanten an den gefundenen

Dokumenten

Page 16: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

RelevanteDokumente

NichtrelevanteDokumente

GefundeneDokumente

NichtgefundeneDokumente

Recall (Ausbeute, Sensitivität):Anteil der gefundenen relevanten an allen

relevanten Dokumenten

Page 17: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Übung zu Precision / Recall

• Ein Lehrbuch enthält Krankheitsbeschreibungen zu :Pneumonie, Pankreatitis, Hepatitis, Arthritis, Diabetes mellitus, Thyreoiditis, Gonarthrose, M. Crohn, Appendizitis, Rachitis.

• Ziel: Selektiere alle Dokumente über entzündliche Erkrankungen• Methode: Jeder Titel, der den Teilstring "itis" enthält, wird als

relevant betrachtet.• Wie ist die Precision, wie der Recall dieser Methode ?• Gegeben eine große (n > 1000) Dokumentenkollektion, was ist

einfacher zu messen, Precision oder Recall ?

Page 18: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Übung zu Precision / Recall

• Ein Lehrbuch enthält Krankheitsbeschreibungen zu :Pneumonie, Pankreatitis, Hepatitis, Arthritis, Diabetes mellitus, Thyreoiditis, Gonarthrose, M. Crohn, Appendizitis, Rachitis.

• Ziel: Selektiere alle Dokumente über entzündliche Erkrankungen• Methode: Jeder Titel, der den Teilstring "itis" enthält, wird als

relevant betrachtet.• Wie ist die Precision, wie der Recall dieser Methode ?• Gegeben eine große (n > 1000) Dokumentenkollektion, was ist

einfacher zu messen, Precision oder Recall ?

Page 19: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Indexierung

• Feststellen und Kennzeichnen des Inhalts einer Dokumentationseinheit mit Hilfe sogenannter Deskriptoren

• Zuordnung von Deskriptoren zu Dokumentationseinheiten: Indexieren

• Manuelles Indexieren: Zuweisung von Deskriptoren aus einem vorgegebenen Vokabular durch Experten

Page 20: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Manuelles Indexieren

• Beispiel:MEDLINE

• Fachkräfte weisen jedem Dokument Deskriptoren aus einem Indexierungsvokabular zu.

• Indexierungsvokabular: MeSH(Medical Subject Headings)Multihierarchisches Schlagwortsystem

Page 21: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Automatisches Indexieren

• Beispiel: GOOGLE • "Crawler" bewegen sich automatisch /

zufallsgesteuert durch das World Wide Web und erstellen / aktualisieren Index

• Indexierungsvokabular: sämtliche Textwörter minus Stoppwörter

Page 22: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.
Page 23: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Suchmaschinen• Gleichen Anfrage ab mit (asynchron erstelltem) Index• Auswahl und Verknüpfung der Indexterms bedingt die

Dokumentenselektion

Schilddrüsen-krankheiten

Radioaktivität Schilddrüsen-krankheiten

Radioaktivität

Page 24: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Suchmaschinen• Gleichen Anfrage ab mit (asynchron erstelltem) Index• Auswahl und Verknüpfung der Indexterms bedingt die

Dokumentenselektion

AND OR

Page 25: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.
Page 26: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.
Page 27: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Anfragesyntax

• Vorsicht: Jede Suchmaschine hat ihre eigene Syntax

• Typische Operatoren• Boolesche Operatoren: AND OR NOT• Trunkierung, z.B. magen*• Phrasen: "sick sinus syndrome"• Synonyme: ~Kidney (z.B. Google,

aber Vorsicht! )

Page 28: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Medline-Datenbank

• Inhalt: Bibliographische Angaben zu biomedizinischen Publikation in (ausgewählten) wissenschaftlichen Fachzeitschriften und Sammelbänden.

• Anbieter: National Library of Medicine (USA)• 5300 Journals• 37 Sprachen• Referenzen von 1949 bis heute• 2000 – 4000 neue Referenzen täglich

Page 29: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

PubMed Suchoberfläche

• Anbieter: National Library of Medicine• Freier Zugang zur Medline Datenbank

– http://pubmed.gov

Page 30: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

http://www.ncbi.nlm.nih.gov/About/tools/restable_stat_pubmed.html

x 1000

Page 31: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

18.317.256

368.521

417.200

609.632

473.244

Medline

in process

supplied by publisher

Other [PubMed]

OldMedline

Umfang in PubMed Aktualität

Medline in processSupplied by Publisher,Other:

nicht oder unvollständigverschlagwortet

nicht mit MeSH suchbar

Medline:

Verschlagwortung nach einigen Tagen bis zu einigen Monaten

~ 5.300 Medline Journals

20.185.853 Zitate

Am 21.09.2010

Oldmedline wird sukzessive in Medline integriert

Page 32: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

MEDLINE - Datenbankeintrag

Page 33: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

MEDLINE - Datenbankeintrag

Page 34: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Medical Subject Headings (MeSH)

• Ca. 25.000 MeSH-Deskriptoren• 160.000 Entry Terms (Synonyme und

spezifischere Terms)• 76 Subheadings (“Qualifier”)

– “Therapy”, “Prevention and Control”• Definitionen• Indexierungszeitraum

http://www.nlm.nih.gov/pubs/factsheets/mesh.html

Page 35: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

MeSH

• Poly-hierarchische Struktur (ein Term kann mehrere Eltern haben)

All

Diseases Category

Diseases Category

Pathological Conditions, Signs and Symptoms

Digestive System Diseases

Gastrointestinal Diseases

Hemorrhage

Gastrointestinal Hemorrhage

Hematemesis MelenaPeptic Ulcer Hemorrhage

Page 36: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.
Page 37: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Welche Wörter sollen in einer Textwortsuche verwendet werden?

• Prävention von Ösophagus-varizen-blutungen

Page 38: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Suche nach Primärprophylaxe von Ösophagusvarizenblutungen

1. Beta-blocker plus nitrate for primary prophylaxis of variceal bleeding.

2. Efficacy of prophylactic sclerotherapy for prevention of a first variceal hemorrhage.

3. Beta-blockers for the prevention of variceal haemorrhage in patients with cirrhosis.

4. Primary prevention of bleeding from esophageal varices.

Page 39: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Prevention of variceal bleeding (Textwortsuche)

• Bleeding• Hemorrhage(s)• Haemorrhage(s)

• Variceal• Varices• Varix

• Prophylaxis• Prevention

Page 40: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Prevention of variceal bleeding (Textwortsuche, Trunkierung)

• Bleed*• Hemorrhag*• Haemorrhag*

• Varic*

• Prohyla*• Prevent*

Page 41: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Prevention of variceal bleeding (Textwortsuche, log. Operatoren)

• Bleed*• Hemorrhag*• Haemorrhag*

• Varic*

• Prophyla*• Prevent*

OR

OR

AND

(bleed* OR hemorrhag* OR haemorrhag*) AND varic* AND (prophyla* OR prevent*)

Page 42: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Vorteile:

Synonyme und versch. Schreibweisen werden automatisch berücksichtigt.

Bei hierarchischem Aufbau Suche nach Ober- und Unterbegriffen in einem Schritt.

Inhaltliche Zusammenhänge sind suchbardurch MeSH/Subheading-Kombination.Bsp.: Gastrointestinal Hemorrhage/prevention & control

Artikel durch Fachpersonal verschlagwortetvergebenes Schlagwort ist Gegenstand der Arbeit.

Vor- und Nachteile der Suche mit MeSH

Nachteile:

Uneinheitliche Verschlagwortung(Indexierung)

Zutreffendes wird nicht gefunden.

Aktuelle, noch nicht verschlagwortete Artikel werden nicht gefunden (Komponente Premedline).

Für neue Substanznamen oder neue medizinische Termeexistiert noch kein MeSH.

Page 43: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Suche einschränken

Page 44: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Suche weiter einschränken

Page 45: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Search history

Page 46: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Automatic term mapping

• Naive Suche

• Automatischer Abgleich mit Indexen– MeSH, Journal, Author

Page 47: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.
Page 48: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Expansion von Trunkierungen

Page 49: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

SuchstrategienAnalyse der Fragestellung - PICO - Blöcke bilden (Aspekte)

Suchbegriffe - zu jedem Block

Schlagwortsuche - MeSH - explode (erweitern) - subheadings (eingrenzen)

Textwortsuche - Synonyme - verwandte Begriffe - sprachliche Vielfalt (Trunkierung) E

insc

hrän

kung

(lim

its, f

ilter

)

Kom

bin

atio

n (O

R, A

ND

)

Page 50: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.

Frage in Blöcke zerlegen(PICO)

Suchbegriffe finden

MeSH-Term(s) - Explode:

erweitern- Subheadings: eingrenzen

Textwörter (verwandte Begriffe, Synonyme, Trunkierung)

Begriffe kombinieren OR

Textwörter (verwandte Begriffe, Synonyme, Trunkierung)

OR

AND

Aspekt 1 Aspekt 2Evtl. weitereAspekte

Suchfilter

z.B. Cochrane highly sensitive search filter for randomized controlled trials.

Aspekte kombinieren

AND

MeSH-Term(s) - Explode:

erweitern- Subheadings: eingrenzen

Page 51: 9. Information Retrieval und Medizinische Literaturdatenbanken Wintersemester 2010/11 Dozent: Univ.-Prof. Dr. med. Stefan Schulz.