Maschinelles Lernen in der Medizintechnik · Maschinelles Lernen in der Medizintechnik Was ist...

79
Maschinelles Lernen in der Medizintechnik Was ist möglich? ASTRUM IT GmbH Am Wolfsmantel 2 91058 Erlangen Dr. Jan Paulus Tel.: +49 9131 9408 339 [email protected] Dr. Matthias Weidler Tel.: +49 9131 9408 354 [email protected]

Transcript of Maschinelles Lernen in der Medizintechnik · Maschinelles Lernen in der Medizintechnik Was ist...

Maschinelles Lernen in der MedizintechnikWas ist möglich?

ASTRUM IT GmbH

Am Wolfsmantel 2

91058 Erlangen

Dr. Jan PaulusTel.: +49 9131 9408 339

[email protected]

Dr. Matthias WeidlerTel.: +49 9131 9408 354

[email protected]

Google beantwortet Fragen

21.11.2018CC0 https://pixabay.com/de/kopf-mann-profil-silhouette-3225946/

CC-BY InteFreePress https://www.flickr.com/photos/intelfreepress/6675870523/sizes/o/in/photostream/ 2

Skype übersetzt live von Spanisch nach Englisch

321.11.2018

Microsoft Cognitive Services beschreibt Bilder

21.11.2018 4https://de.wikipedia.org/wiki/Datei:Nuremberg,_Hauptmarkt_and_Frauenkirche_4662.jpg

© Hubertl / Wikimedia Commons / CC BY-SA 4.0

Microsoft Cognitive Services beschreibt Bilder

21.11.2018

a group of people

at a fruit stand

5https://de.wikipedia.org/wiki/Datei:Nuremberg,_Hauptmarkt_and_Frauenkirche_4662.jpg

© Hubertl / Wikimedia Commons / CC BY-SA 4.0

Smarte medizinische Geräte

CCBY Andri Koolme https://www.flickr.com/photos/andrikoolme/28266998101

CC-BY-SA 4.0 Sjö https://de.wikipedia.org/wiki/Datei:BGM_twopart.JPG

CC-BY www.forthwithlife.co.uk https://www.flickr.com/photos/forthwithlife/373690955966

Fitness Tracker Funk-Blutzuckersensoren Gesundheits-Apps

21.11.2018

Populäre Anwendungsfelder für Künstliche Intelligenz

Vorhersage

• Maschinenausfälle

• Kaufverhalten

• Auslastung

• Marktpreise

Erkennung

• Bildinhalte

• Datenkategorien

• Ereignisse

• Produktionsfehler

Analyse

• Messdaten

• Unbekannte

Zusammenhänge

• Ursachen und

Entwicklungen

21.11.2018 7

Warum ist KI heute so populär?

Hintergrund

• ImageNet

• Große Bild-Datenbank für Computer Vision

• Über 14 000 000 manuell annotierte Bilder

• Über 20 000 Kategorien für Bildinhalte

• ImageNet Large Scale Visual Recognition Challenge (ILSVRC)

• Bekannte Trainingsbilder

• Unbekannte Testbilder

• Automatische Erkennung von 1000 verschiedenen Objektklassen

21.11.2018 9CC0 https://pixabay.com/de/bilder-fotos-fotosammlung-fotoalbum-382007/

Ergebnisse der ILSVRC

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

2010 2011 2012 2013 2014 2015 2016 2017

Fehlerrate

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

40,00%

45,00%

50,00%

2010 2011 2012 2013 2014 2015 2016 2017

Verbesserung zum Vorjahr

21.11.2018 10

Menschliche Leistung*

*O. Russakovsky et al. „Imagenet large scale visual recognition challenge“, arXiv:1409.0575, 2014

Ergebnisse der ILSVRC

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

2010 2011 2012 2013 2014 2015 2016 2017

Fehlerrate

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

40,00%

45,00%

50,00%

2010 2011 2012 2013 2014 2015 2016 2017

Verbesserung zum Vorjahr

21.11.2018 11

Deep Learning

Menschliche Leistung*

*O. Russakovsky et al. „Imagenet large scale visual recognition challenge“, arXiv:1409.0575, 2014

Entwicklung Neuronaler Netze

1940

21.11.2018

1950 1960 1970 1980

1990 2000

12

Entwicklung Neuronaler Netze

1940

21.11.2018

1950 1960 1970 1980

1990 2000

13

Entwicklung Neuronaler Netze

1940

21.11.2018

1950 1960 1970 1980

1990 20002010

14

Ausbaustufen der Künstlichen Intelligenz

Begriffsübersicht

21.11.2018

Künstliche Intelligenz

16

Begriffsübersicht

21.11.2018

WahrnehmungKünstliche Intelligenz

17

Begriffsübersicht

21.11.2018

Wahrnehmung

Maschinelles Lernen

Künstliche Intelligenz

18

Experten-

systeme

Begriffsübersicht

21.11.2018

Wahrnehmung

Maschinelles Lernen

Künstliche Intelligenz

Deep Learning /

Neuronale Netze

19

Experten-

systeme

Ausbaustufen der Künstlichen Intelligenz Wahrnehmung

Expertensystem

21.11.2018

Kennzahlen-

BerechnungKennzahlen-

Bewertung

21

Expertensystem

• Know-How des Experten als Regeln in Programm-Code

• Sehr statisch

• Hauptsächlich Abdeckung von Standardfällen

• Bedachte Fälle werden erkannt, wie erwartet

• Hohe Nachvollziehbarkeit des Systems per Definition

21.11.2018 22

Training bei Maschinellem Lernen

2321.11.2018

Training bei Maschinellem Lernen

2421.11.2018

Training bei Maschinellem Lernen

2521.11.2018

Training bei Maschinellem Lernen

2621.11.2018

Training bei Maschinellem Lernen

2721.11.2018

Training bei Maschinellem Lernen

2821.11.2018

Training bei Maschinellem Lernen

2921.11.2018

Verbesserung des Verfahrens

Training bei Maschinellem Lernen

3021.11.2018

Verbesserung des Verfahrens

Klassische Mustererkennung

21.11.2018

Kennzahlen-

BerechnungKennzahlen-

Bewertung

31

Klassische Mustererkennung

• Kennzahlen meist statisch, Interpretation dynamisch

• Gute Generalisierung

• Kennzahlen meist komplex

• Gute Nachvollziehbarkeit mit entsprechendem Know-How

21.11.2018 32

Deep Learning

21.11.2018

Kennzahlen-

BerechnungKennzahlen-

Bewertung

33

Deep Learning

• Dynamisch

• Gute Generalisierung (bei entsprechender Datenmenge)

• Aktuell beste Ergebnisse bei vielen prominenten Problemstellungen

• Niedrige bis keine Nachvollziehbarkeit

21.11.2018 34

ExpertensystemKlassische

MustererkennungDeep Learning

Direkter Vergleich

21.11.2018CC0 https://pixabay.com/de/plausibel-stempel-qualit%C3%A4t-470086/, CC0 https://pixabay.com/de/schild-blechschild-metall-offen-2685503/,

CC0 https://pixabay.com/de/stempel-zeichen-label-informant-143799/ 35

Genauigkeit

ExpertensystemKlassische

MustererkennungDeep Learning

Direkter Vergleich

21.11.2018CC0 https://pixabay.com/de/plausibel-stempel-qualit%C3%A4t-470086/, CC0 https://pixabay.com/de/schild-blechschild-metall-offen-2685503/,

CC0 https://pixabay.com/de/stempel-zeichen-label-informant-143799/ 36

Genauigkeit

ExpertensystemKlassische

MustererkennungDeep Learning

Direkter Vergleich

21.11.2018CC0 https://pixabay.com/de/plausibel-stempel-qualit%C3%A4t-470086/, CC0 https://pixabay.com/de/schild-blechschild-metall-offen-2685503/,

CC0 https://pixabay.com/de/stempel-zeichen-label-informant-143799/ 37

Genauigkeit

Einfluss der Daten

Auswirkung der Datenmenge

0

10

20

30

40

50

60

70

80

90

100

234 469 937 1875 3750 7500 15000 30000 60000

Gen

au

igkeit

in

%

Datenmenge in Anzahl an Instanzen

Komplexerer Datensatz mit Neuronalen Netzen

21.11.2018 39

Auswirkung der Datenmenge

0

10

20

30

40

50

60

70

80

90

100

234 469 937 1875 3750 7500 15000 30000 60000

Gen

au

igkeit

in

%

Datenmenge in Anzahl an Instanzen

Komplexerer Datensatz mit Neuronalen Netzen MNIST mit Neuronalen Netzen

21.11.2018 40

Auswirkung der Datenmenge

0

10

20

30

40

50

60

70

80

90

100

234 469 937 1875 3750 7500 15000 30000 60000

Gen

au

igkeit

in

%

Datenmenge in Anzahl an Instanzen

Komplexerer Datensatz mit Neuronalen Netzen MNIST mit Neuronalen Netzen MNIST mit klassicher Mustererkennung

21.11.2018 41

Auswirkung der Datenqualität

50

55

60

65

70

75

80

Datensatz 1 Datensatz 2 Datensatz 3

Rohdaten Bereinigte Daten

21.11.2018 42

Deep Learning in der Medizintechnik

eGaIT als konkretes Beispiel

• Abgeschlossenes Forschungsprojekt

(u.a. bei ASTRUM IT)

• Diagnoseunterstützung für Erkrankungen

wie Parkinson

• Automatische Berechnung von Gang-

parametern

• Schrittlänge als ein wichtiger Parameter

44CC0 https://pixabay.com/de/symbol-schritte-schuhe-symbol-schuhe-1991839/21.11.2018

Verbesserung durch Deep Learning

21.11.2018 45

0

1

2

3

4

5

6

Klassischer Ansatz (2015) Deep Learning (2018)

Absoluter Fehler der ermittelten Schrittlänge in cm

Verbesserung um 36 %

Rampp et al., IEEE Transactions on Biomedical Engineering, 2015 Hannink et al., IEEE Journal of Biomedical and Health Informatics, 2018

Verbesserung durch Deep Learning

21.11.2018 46

0

1

2

3

4

5

6

Klassischer Ansatz (2015) Deep Learning (2018)

Absoluter Fehler der ermittelten Schrittlänge in cm

Verbesserung um 36 %

Rampp et al., IEEE Transactions on Biomedical Engineering, 2015 Hannink et al., IEEE Journal of Biomedical and Health Informatics, 2018

Datenmenge/

-qualität?

Verbesserung durch Deep Learning

21.11.2018 47

0

1

2

3

4

5

6

Klassischer Ansatz (2015) Deep Learning (2018)

Absoluter Fehler der ermittelten Schrittlänge in cm

Verbesserung um 36 %

Rampp et al., IEEE Transactions on Biomedical Engineering, 2015 Hannink et al., IEEE Journal of Biomedical and Health Informatics, 2018

Datenmenge/

-qualität?

Verbesserung durch Deep Learning

21.11.2018 48

0

1

2

3

4

5

6

Klassischer Ansatz (2015) Deep Learning (2018)

Absoluter Fehler der ermittelten Schrittlänge in cm

Verbesserung um 36 %

Rampp et al., IEEE Transactions on Biomedical Engineering, 2015 Hannink et al., IEEE Journal of Biomedical and Health Informatics, 2018

Datenmenge/

-qualität?

Nachvollzieh-

barkeit?

Produktivbeispiel: Haut-Screening

SkinVision™

• App zur Erkennung von Hautkrebs

• Automatisierte Risikokategorie pro Bild

• Hohes Risiko: Check eines Dermatologen

• Erinnerungsfunktion für nächsten Check

21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/

CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 49

Produktivbeispiel: Haut-Screening

SkinVision™

• App zur Erkennung von Hautkrebs

• Automatisierte Risikokategorie pro Bild

• Hohes Risiko: Check eines Dermatologen

• Erinnerungsfunktion für nächsten Check

21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/

CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 50

Datenmenge/

-qualität?

Produktivbeispiel: Haut-Screening

SkinVision™

• App zur Erkennung von Hautkrebs

• Automatisierte Risikokategorie pro Bild

• Hohes Risiko: Check eines Dermatologen

• Erinnerungsfunktion für nächsten Check

• Genauigkeit für Melanomerkennung

vergleichbar mit Hautarzt

21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/

CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 51

Datenmenge/

-qualität?

Produktivbeispiel: Haut-Screening

SkinVision™

• App zur Erkennung von Hautkrebs

• Automatisierte Risikokategorie pro Bild

• Hohes Risiko: Check eines Dermatologen

• Erinnerungsfunktion für nächsten Check

• Genauigkeit für Melanomerkennung

vergleichbar mit Hautarzt

21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/

CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 52

Datenmenge/

-qualität?

Nachvollzieh-

barkeit?

Produktivbeispiel: Haut-Screening

SkinVision™

• App zur Erkennung von Hautkrebs

• Automatisierte Risikokategorie pro Bild

• Hohes Risiko: Check eines Dermatologen

• Erinnerungsfunktion für nächsten Check

• Genauigkeit für Melanomerkennung

vergleichbar mit Hautarzt

Unterstützung anstatt Ersetzung

Schlüsse werden nicht gezogen

21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/

CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 53

Datenmenge/

-qualität?

Nachvollzieh-

barkeit?

Validierung

Validierung von Maschinellem Lernen

5521.11.2018

Hinweise auf

interessante Daten

Messungen

Empfehlungen

Handlungen

Validierung von Maschinellem Lernen

5621.11.2018

Hinweise auf

interessante Daten

Messungen

Empfehlungen

Handlungen

Relevanzbewertung

durch Menschen

Verbesserung gegenüber

Vergleichsmethode

Konservative Empfehlungen

Bereich mit geringem Schadens-

potential oder hohe Genauigkeit

Validierung von Maschinellem Lernen

5721.11.2018

Hinweise auf

interessante Daten

Messungen

Empfehlungen

Handlungen

Relevanzbewertung

durch Menschen

Verbesserung gegenüber

Vergleichsmethode

Konservative Empfehlungen

Bereich mit geringem Schadens-

potential oder hohe Genauigkeit

Validierung von Maschinellem Lernen

5821.11.2018

Validierung von Maschinellem Lernen

5921.11.2018

Anderer, für das System unbekannter (!!!) Datensatz

Grenzen und Ausblick

Grenzen der KI

• Netz lernt, dass

Winkelsumme in

sehr vielen Dreiecken

~180° ist

• Das „Warum“ wird

nicht erkannt

21.11.2018 61

Grenzen der KI

• Netz lernt, dass

Winkelsumme in

sehr vielen Dreiecken

~180° ist

• Das „Warum“ wird

nicht erkannt

21.11.2018 62

Grenzen der KI

• Netz lernt, dass

Winkelsumme in

sehr vielen Dreiecken

~180° ist

• Das „Warum“ wird

nicht erkannt

21.11.2018 63

Grenzen der KI

• Netz lernt, dass

Winkelsumme in

sehr vielen Dreiecken

~180° ist

• Das „Warum“ wird

nicht erkannt

21.11.2018 64

Grenzen der KI

• Netz lernt, dass

Winkelsumme in

sehr vielen Dreiecken

~180° ist

• Das „Warum“ wird

nicht erkannt

21.11.2018 65

Grenzen der KI

• Netz lernt, dass

Winkelsumme in

sehr vielen Dreiecken

~180° ist

• Das „Warum“ wird

nicht erkannt

21.11.2018 66

Grenzen der KI

• Netz lernt, dass

Winkelsumme in

sehr vielen Dreiecken

~180° ist

• Das „Warum“ wird

nicht erkannt

21.11.2018 67

Grenzen der KI

• Netz lernt, dass

Winkelsumme in

sehr vielen Dreiecken

~180° ist

• Das „Warum“ wird

nicht erkannt

21.11.2018 68

Grenzen der KI

Selbstständiger Transfer

von gelerntem nicht

möglich

21.11.2018 69

Grenzen der KI

Selbstständiger Transfer

von gelerntem nicht

möglich

21.11.2018 70

Grenzen der KI - Out of Scope

21.11.2018

Selbstständiges

Lernen

71

Grenzen der KI - Out of Scope

21.11.2018

Selbstständiges

Lernen

Schlüsse ziehen

72

Grenzen der KI - Out of Scope

21.11.2018

Selbstständiges

Lernen

Schlüsse ziehen Vollständig

menschliches

Verhalten

73

Grenzen der KI - Out of Scope

21.11.2018

Selbstständiges

Lernen

Schlüsse ziehen Vollständig

menschliches

Verhalten

Eigenes

Bewusstsein

74

Unterstützung der Menschen

• Verbesserung der Wahrnehmung

• Steigerung der Effizienz durch

geeignete Vorschläge

• Hinweise auf interessante Daten

Übernahme repetitiver Aufgaben

• Keine Ermüdung

• Höhere Genauigkeit

• Schaffung neuer Einsatzfelder

für Menschen

21.11.2018

„Ideale Problemstellungen“ für KI

75

Ausblick

Heute

• Gute Ergebnisse in

eng umgrenzten

Anwendungen

• Komplexe Umsetzung

• Vereinzelte

Anwendungen in

bestimmten Fällen

Morgen

• Nahtlose Integration

in den Alltag

• Werkzeug für

Standardprobleme

• Ausnutzen des

vollen KI-Potentials

21.11.2018 76

Fazit

Fazit

• Genauigkeit von KI-Lösungen ist abhängig von• Problem

• Datenmenge

• Datenqualität

• Deep Learning bietet meistens die besten Ergebnisse bei• Entsprechenden Datenmengen

• Kaum Nachvollziehbarkeit

• KI bestens geeignet zur Unterstützung, nicht zur Ersetzung von Menschen

21.11.2018 78

hank ou!

[email protected]

[email protected]

power point template designed by Showeet.com