Maschinelles Lernen in der Medizintechnik · Maschinelles Lernen in der Medizintechnik Was ist...
Transcript of Maschinelles Lernen in der Medizintechnik · Maschinelles Lernen in der Medizintechnik Was ist...
Maschinelles Lernen in der MedizintechnikWas ist möglich?
ASTRUM IT GmbH
Am Wolfsmantel 2
91058 Erlangen
Dr. Jan PaulusTel.: +49 9131 9408 339
Dr. Matthias WeidlerTel.: +49 9131 9408 354
Google beantwortet Fragen
21.11.2018CC0 https://pixabay.com/de/kopf-mann-profil-silhouette-3225946/
CC-BY InteFreePress https://www.flickr.com/photos/intelfreepress/6675870523/sizes/o/in/photostream/ 2
Microsoft Cognitive Services beschreibt Bilder
21.11.2018 4https://de.wikipedia.org/wiki/Datei:Nuremberg,_Hauptmarkt_and_Frauenkirche_4662.jpg
© Hubertl / Wikimedia Commons / CC BY-SA 4.0
Microsoft Cognitive Services beschreibt Bilder
21.11.2018
a group of people
at a fruit stand
5https://de.wikipedia.org/wiki/Datei:Nuremberg,_Hauptmarkt_and_Frauenkirche_4662.jpg
© Hubertl / Wikimedia Commons / CC BY-SA 4.0
Smarte medizinische Geräte
CCBY Andri Koolme https://www.flickr.com/photos/andrikoolme/28266998101
CC-BY-SA 4.0 Sjö https://de.wikipedia.org/wiki/Datei:BGM_twopart.JPG
CC-BY www.forthwithlife.co.uk https://www.flickr.com/photos/forthwithlife/373690955966
Fitness Tracker Funk-Blutzuckersensoren Gesundheits-Apps
21.11.2018
Populäre Anwendungsfelder für Künstliche Intelligenz
Vorhersage
• Maschinenausfälle
• Kaufverhalten
• Auslastung
• Marktpreise
Erkennung
• Bildinhalte
• Datenkategorien
• Ereignisse
• Produktionsfehler
Analyse
• Messdaten
• Unbekannte
Zusammenhänge
• Ursachen und
Entwicklungen
21.11.2018 7
Hintergrund
• ImageNet
• Große Bild-Datenbank für Computer Vision
• Über 14 000 000 manuell annotierte Bilder
• Über 20 000 Kategorien für Bildinhalte
• ImageNet Large Scale Visual Recognition Challenge (ILSVRC)
• Bekannte Trainingsbilder
• Unbekannte Testbilder
• Automatische Erkennung von 1000 verschiedenen Objektklassen
21.11.2018 9CC0 https://pixabay.com/de/bilder-fotos-fotosammlung-fotoalbum-382007/
Ergebnisse der ILSVRC
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
2010 2011 2012 2013 2014 2015 2016 2017
Fehlerrate
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
35,00%
40,00%
45,00%
50,00%
2010 2011 2012 2013 2014 2015 2016 2017
Verbesserung zum Vorjahr
21.11.2018 10
Menschliche Leistung*
*O. Russakovsky et al. „Imagenet large scale visual recognition challenge“, arXiv:1409.0575, 2014
Ergebnisse der ILSVRC
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
2010 2011 2012 2013 2014 2015 2016 2017
Fehlerrate
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
35,00%
40,00%
45,00%
50,00%
2010 2011 2012 2013 2014 2015 2016 2017
Verbesserung zum Vorjahr
21.11.2018 11
Deep Learning
Menschliche Leistung*
*O. Russakovsky et al. „Imagenet large scale visual recognition challenge“, arXiv:1409.0575, 2014
Begriffsübersicht
21.11.2018
Wahrnehmung
Maschinelles Lernen
Künstliche Intelligenz
18
Experten-
systeme
Begriffsübersicht
21.11.2018
Wahrnehmung
Maschinelles Lernen
Künstliche Intelligenz
Deep Learning /
Neuronale Netze
19
Experten-
systeme
Expertensystem
• Know-How des Experten als Regeln in Programm-Code
• Sehr statisch
• Hauptsächlich Abdeckung von Standardfällen
• Bedachte Fälle werden erkannt, wie erwartet
• Hohe Nachvollziehbarkeit des Systems per Definition
21.11.2018 22
Klassische Mustererkennung
• Kennzahlen meist statisch, Interpretation dynamisch
• Gute Generalisierung
• Kennzahlen meist komplex
• Gute Nachvollziehbarkeit mit entsprechendem Know-How
21.11.2018 32
Deep Learning
• Dynamisch
• Gute Generalisierung (bei entsprechender Datenmenge)
• Aktuell beste Ergebnisse bei vielen prominenten Problemstellungen
• Niedrige bis keine Nachvollziehbarkeit
21.11.2018 34
ExpertensystemKlassische
MustererkennungDeep Learning
Direkter Vergleich
21.11.2018CC0 https://pixabay.com/de/plausibel-stempel-qualit%C3%A4t-470086/, CC0 https://pixabay.com/de/schild-blechschild-metall-offen-2685503/,
CC0 https://pixabay.com/de/stempel-zeichen-label-informant-143799/ 35
Genauigkeit
ExpertensystemKlassische
MustererkennungDeep Learning
Direkter Vergleich
21.11.2018CC0 https://pixabay.com/de/plausibel-stempel-qualit%C3%A4t-470086/, CC0 https://pixabay.com/de/schild-blechschild-metall-offen-2685503/,
CC0 https://pixabay.com/de/stempel-zeichen-label-informant-143799/ 36
Genauigkeit
ExpertensystemKlassische
MustererkennungDeep Learning
Direkter Vergleich
21.11.2018CC0 https://pixabay.com/de/plausibel-stempel-qualit%C3%A4t-470086/, CC0 https://pixabay.com/de/schild-blechschild-metall-offen-2685503/,
CC0 https://pixabay.com/de/stempel-zeichen-label-informant-143799/ 37
Genauigkeit
Auswirkung der Datenmenge
0
10
20
30
40
50
60
70
80
90
100
234 469 937 1875 3750 7500 15000 30000 60000
Gen
au
igkeit
in
%
Datenmenge in Anzahl an Instanzen
Komplexerer Datensatz mit Neuronalen Netzen
21.11.2018 39
Auswirkung der Datenmenge
0
10
20
30
40
50
60
70
80
90
100
234 469 937 1875 3750 7500 15000 30000 60000
Gen
au
igkeit
in
%
Datenmenge in Anzahl an Instanzen
Komplexerer Datensatz mit Neuronalen Netzen MNIST mit Neuronalen Netzen
21.11.2018 40
Auswirkung der Datenmenge
0
10
20
30
40
50
60
70
80
90
100
234 469 937 1875 3750 7500 15000 30000 60000
Gen
au
igkeit
in
%
Datenmenge in Anzahl an Instanzen
Komplexerer Datensatz mit Neuronalen Netzen MNIST mit Neuronalen Netzen MNIST mit klassicher Mustererkennung
21.11.2018 41
Auswirkung der Datenqualität
50
55
60
65
70
75
80
Datensatz 1 Datensatz 2 Datensatz 3
Rohdaten Bereinigte Daten
21.11.2018 42
eGaIT als konkretes Beispiel
• Abgeschlossenes Forschungsprojekt
(u.a. bei ASTRUM IT)
• Diagnoseunterstützung für Erkrankungen
wie Parkinson
• Automatische Berechnung von Gang-
parametern
• Schrittlänge als ein wichtiger Parameter
44CC0 https://pixabay.com/de/symbol-schritte-schuhe-symbol-schuhe-1991839/21.11.2018
Verbesserung durch Deep Learning
21.11.2018 45
0
1
2
3
4
5
6
Klassischer Ansatz (2015) Deep Learning (2018)
Absoluter Fehler der ermittelten Schrittlänge in cm
Verbesserung um 36 %
Rampp et al., IEEE Transactions on Biomedical Engineering, 2015 Hannink et al., IEEE Journal of Biomedical and Health Informatics, 2018
Verbesserung durch Deep Learning
21.11.2018 46
0
1
2
3
4
5
6
Klassischer Ansatz (2015) Deep Learning (2018)
Absoluter Fehler der ermittelten Schrittlänge in cm
Verbesserung um 36 %
Rampp et al., IEEE Transactions on Biomedical Engineering, 2015 Hannink et al., IEEE Journal of Biomedical and Health Informatics, 2018
Datenmenge/
-qualität?
Verbesserung durch Deep Learning
21.11.2018 47
0
1
2
3
4
5
6
Klassischer Ansatz (2015) Deep Learning (2018)
Absoluter Fehler der ermittelten Schrittlänge in cm
Verbesserung um 36 %
Rampp et al., IEEE Transactions on Biomedical Engineering, 2015 Hannink et al., IEEE Journal of Biomedical and Health Informatics, 2018
Datenmenge/
-qualität?
Verbesserung durch Deep Learning
21.11.2018 48
0
1
2
3
4
5
6
Klassischer Ansatz (2015) Deep Learning (2018)
Absoluter Fehler der ermittelten Schrittlänge in cm
Verbesserung um 36 %
Rampp et al., IEEE Transactions on Biomedical Engineering, 2015 Hannink et al., IEEE Journal of Biomedical and Health Informatics, 2018
Datenmenge/
-qualität?
Nachvollzieh-
barkeit?
Produktivbeispiel: Haut-Screening
SkinVision™
• App zur Erkennung von Hautkrebs
• Automatisierte Risikokategorie pro Bild
• Hohes Risiko: Check eines Dermatologen
• Erinnerungsfunktion für nächsten Check
21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/
CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 49
Produktivbeispiel: Haut-Screening
SkinVision™
• App zur Erkennung von Hautkrebs
• Automatisierte Risikokategorie pro Bild
• Hohes Risiko: Check eines Dermatologen
• Erinnerungsfunktion für nächsten Check
21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/
CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 50
Datenmenge/
-qualität?
Produktivbeispiel: Haut-Screening
SkinVision™
• App zur Erkennung von Hautkrebs
• Automatisierte Risikokategorie pro Bild
• Hohes Risiko: Check eines Dermatologen
• Erinnerungsfunktion für nächsten Check
• Genauigkeit für Melanomerkennung
vergleichbar mit Hautarzt
21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/
CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 51
Datenmenge/
-qualität?
Produktivbeispiel: Haut-Screening
SkinVision™
• App zur Erkennung von Hautkrebs
• Automatisierte Risikokategorie pro Bild
• Hohes Risiko: Check eines Dermatologen
• Erinnerungsfunktion für nächsten Check
• Genauigkeit für Melanomerkennung
vergleichbar mit Hautarzt
21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/
CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 52
Datenmenge/
-qualität?
Nachvollzieh-
barkeit?
Produktivbeispiel: Haut-Screening
SkinVision™
• App zur Erkennung von Hautkrebs
• Automatisierte Risikokategorie pro Bild
• Hohes Risiko: Check eines Dermatologen
• Erinnerungsfunktion für nächsten Check
• Genauigkeit für Melanomerkennung
vergleichbar mit Hautarzt
Unterstützung anstatt Ersetzung
Schlüsse werden nicht gezogen
21.11.2018CC0 https://pixabay.com/de/haut-ader-braun-hautkrebs-mensch-49325/
CC0 https://pixabay.com/de/haken-h%C3%A4kchen-erledigt-ja-2470296/ 53
Datenmenge/
-qualität?
Nachvollzieh-
barkeit?
Validierung von Maschinellem Lernen
5521.11.2018
Hinweise auf
interessante Daten
Messungen
Empfehlungen
Handlungen
Validierung von Maschinellem Lernen
5621.11.2018
Hinweise auf
interessante Daten
Messungen
Empfehlungen
Handlungen
Relevanzbewertung
durch Menschen
Verbesserung gegenüber
Vergleichsmethode
Konservative Empfehlungen
Bereich mit geringem Schadens-
potential oder hohe Genauigkeit
Validierung von Maschinellem Lernen
5721.11.2018
Hinweise auf
interessante Daten
Messungen
Empfehlungen
Handlungen
Relevanzbewertung
durch Menschen
Verbesserung gegenüber
Vergleichsmethode
Konservative Empfehlungen
Bereich mit geringem Schadens-
potential oder hohe Genauigkeit
Validierung von Maschinellem Lernen
5921.11.2018
Anderer, für das System unbekannter (!!!) Datensatz
Grenzen der KI
• Netz lernt, dass
Winkelsumme in
sehr vielen Dreiecken
~180° ist
• Das „Warum“ wird
nicht erkannt
21.11.2018 61
Grenzen der KI
• Netz lernt, dass
Winkelsumme in
sehr vielen Dreiecken
~180° ist
• Das „Warum“ wird
nicht erkannt
21.11.2018 62
Grenzen der KI
• Netz lernt, dass
Winkelsumme in
sehr vielen Dreiecken
~180° ist
• Das „Warum“ wird
nicht erkannt
21.11.2018 63
Grenzen der KI
• Netz lernt, dass
Winkelsumme in
sehr vielen Dreiecken
~180° ist
• Das „Warum“ wird
nicht erkannt
21.11.2018 64
Grenzen der KI
• Netz lernt, dass
Winkelsumme in
sehr vielen Dreiecken
~180° ist
• Das „Warum“ wird
nicht erkannt
21.11.2018 65
Grenzen der KI
• Netz lernt, dass
Winkelsumme in
sehr vielen Dreiecken
~180° ist
• Das „Warum“ wird
nicht erkannt
21.11.2018 66
Grenzen der KI
• Netz lernt, dass
Winkelsumme in
sehr vielen Dreiecken
~180° ist
• Das „Warum“ wird
nicht erkannt
21.11.2018 67
Grenzen der KI
• Netz lernt, dass
Winkelsumme in
sehr vielen Dreiecken
~180° ist
• Das „Warum“ wird
nicht erkannt
21.11.2018 68
Grenzen der KI - Out of Scope
21.11.2018
Selbstständiges
Lernen
Schlüsse ziehen Vollständig
menschliches
Verhalten
73
Grenzen der KI - Out of Scope
21.11.2018
Selbstständiges
Lernen
Schlüsse ziehen Vollständig
menschliches
Verhalten
Eigenes
Bewusstsein
74
Unterstützung der Menschen
• Verbesserung der Wahrnehmung
• Steigerung der Effizienz durch
geeignete Vorschläge
• Hinweise auf interessante Daten
Übernahme repetitiver Aufgaben
• Keine Ermüdung
• Höhere Genauigkeit
• Schaffung neuer Einsatzfelder
für Menschen
21.11.2018
„Ideale Problemstellungen“ für KI
75
Ausblick
Heute
• Gute Ergebnisse in
eng umgrenzten
Anwendungen
• Komplexe Umsetzung
• Vereinzelte
Anwendungen in
bestimmten Fällen
Morgen
• Nahtlose Integration
in den Alltag
• Werkzeug für
Standardprobleme
• Ausnutzen des
vollen KI-Potentials
21.11.2018 76
Fazit
• Genauigkeit von KI-Lösungen ist abhängig von• Problem
• Datenmenge
• Datenqualität
• Deep Learning bietet meistens die besten Ergebnisse bei• Entsprechenden Datenmengen
• Kaum Nachvollziehbarkeit
• KI bestens geeignet zur Unterstützung, nicht zur Ersetzung von Menschen
21.11.2018 78