Warum Künstliche Intelligenz intelligente Terminologien ... · Robot‐Lawyerwertet in den...

31
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 1 Warum Künstliche Intelligenz intelligente Terminologien (und Terminologen) braucht Prof. Dr. Petra Drewer Dr. François Massion

Transcript of Warum Künstliche Intelligenz intelligente Terminologien ... · Robot‐Lawyerwertet in den...

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 1

Warum Künstliche Intelligenz intelligente Terminologien (und 

Terminologen) braucht

Prof. Dr. Petra DrewerDr. François Massion

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 2

Eine Frage …

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 3

Künstliche Intelligenz (KI)

Haupteigenschaften von KI: Umfeld verstehen Selbständig Ziele verfolgen Lernen Kommunizieren

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 4

KI übernimmt bereits Routineaufgaben

Assistent im Call‐Center Robot‐Lawyer wertet in den USA richterlicheEntscheidungen aus

Analysetools unterstützen Mediziner bei der Diagnostik

Personalabteilungen erhalten Auswertungen von Lebensläufen

Maschinelle Übersetzungsprogramme …

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 5

Was kommt dann (1/2)?

Der smarte Robo‐Redakteur… … extrahiert Wissen aus Firmen‐ und externen Quellen

… fasst den Inhalt von Dokumenten zusammen … generiert Texte, twittert Informationen

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 6

Was kommt dann (2/2)?

Der smarte Robo‐Übersetzer… … wertet Referenzmaterial aus … sucht nach Informationen / Übersetzungen … bereitet Übersetzungen inhaltlich‐semantisch vor

Der smarte Robo‐Terminologe… … unterstützt die Terminologiearbeit mit Definitionen oder Begriffsrelationen

… erkennt Synonyme und Zusammenhänge

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 7

Die nächste KI‐Revolution

Der Mehrwert von Morgen wird aus der Fähigkeit der KI entstehen, natürliche Sprache zu verstehen.

Natürliche Sprache (gesprochen oder geschrieben) ist die wichtigste Schnittstelle zu/von intelligenten Anwendungen.

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 8

Sprache verstehen: Schritt 1

Sprachelemente identifizieren

https://cloud.google.com/natural‐language/

„I arrived at the bank [?] after crossing the river“

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 9

Statistik reicht nicht

Was bedeutet eigentlich „bank“ ? Laut WordNet gibt es (mindestens) 9 mögliche Bedeutungen 

Wie weit hilft Statistik?

1234 Dokumente mit „bank“ = Geldinstitut (24)%567 Dokumente mit „bank“ = Ufer (11)% 89 Dokumente mit „bank“ = Damm (2)% ….

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 10

Sprache verstehen: Schritt 2

Bedeutung mit Hilfe von Wissensquellenerkennen  I arrived at the  bank 1 after crossing the  river 2. 

bridge (Brücke)bank 1 (Ufer)

water (Wasser)

river 2 (Fluß)

has_a

is_made_of

connects

WISSENSBASIS

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 11

Wissensquellen

Es gibt unterschiedliche Arten von Wissensquellen, z. B:  Wörterbücher und Thesauri Annotierte Texte Sammlungen von NamedEntities (Eigennamen)

Ontologien Terminologiebestände…

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 12

Terminologiedatenbank mehrsprachig begriffsorientiert benennungsautonom mehrstufiges Eintragsmodell

Begriffssysteme Systematik  Darstellung der begrifflich‐

systematischen Zusammenhänge

Ergebnisse der Terminologiearbeit

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 13

Beispiel für ein Begriffssystem

Quelle der Abb.: Drewer, Petra / Schmitz, Klaus‐Dirk (2017): Terminologiemanagement : Grundlagen – Methoden – Werkzeuge. Heidelberg: Springer Vieweg, S. 12

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 14

Beispiel für ein Begriffssystem

Quelle der Abb.: Drewer, Petra / Schmitz, Klaus‐Dirk (2017): Terminologiemanagement : Grundlagen – Methoden – Werkzeuge. Heidelberg: Springer Vieweg, S. 13

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 15

Arten von Begriffsbeziehungen bzw. ‐systemen

Hierarchische Begriffsbeziehungen

Abstraktionsbeziehung Bestandsbeziehung

Nicht‐hierarchische Begriffsbeziehungen

Sequentielle Begriffsbeziehung Oppositionelle Begriffsbeziehung Pragmatische Begriffsbeziehung

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 16

Sinn und Zweck von Begriffssystemen

Strukturierung und Systematisierung von Fachwissen (Besseres) Verständnis des Fachgebiets Zusammenhänge statt isolierter Begriffsbetrachtungen, 

dadurch z.B. klare Abgrenzung von Nachbarbegriffen Vollständigkeitsprüfung Äquivalenzprüfung Zugang zu Terminologiesammlungen …

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 17

Stellen Sie sich vor, Sie erarbeiten den Begriff „Druckumformen“

Umformen

Zugdruck‐umformen

Druck‐umformen

Zug‐umformen

Biege‐umformen

Schub‐umformen

Walzen

Freiformen

Gesenkformen

Eindrücken

Durchdrücken

Umformverfahren nach DIN 8582

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 18

BegriffssystemDIN 2331 (1980:2) und DIN 2330 (2013:11)

Ein Begriffssystem ist eine Menge von Begriffen, zwischen denen Beziehungen bestehen oder hergestellt worden sind und die derart ein zusammenhängendes Ganzes darstellen.

Ein Begriffssystem dient der Ordnung des Wissens bildet die Grundlage für eine Vereinheitlichung und Normung der 

Terminologie ermöglicht den Vergleich von Begriffen und Benennungen in 

verschiedenen Sprachen

Die Darstellung von Begriffssystemen ist (teilweise) genormt.

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 19

Abstraktionsbeziehung: Fächerdiagramm

1Horizontalachsen‐Windkraftanlage

1.1Widerstandsläufer

1.2Auftriebsläufer

1.2.2Langsamläufer

1.2.1Schnellläufer

1.2.1.3Anlage mit 

Dreiblattrotor

1.2.1.2Anlage mit 

Zweiblattrotor

1.2.1.1Anlage mit Einblattrotor

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 20

Bestandsbeziehung: Klammerdiagramm

1Windkraftanlage

1‐1Fundament

1‐2Turm

1‐3Turmkopf

1‐3‐1Rotor

1‐3‐2Gondel

1‐3‐3Windnachführung

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 21

Erstellung von Begriffssystemen

Erkennen/Erarbeiten der Begriffsbeziehungen(erfordert umfassendes Produkt‐ bzw. Fachwissen)

Darstellen der Begriffsbeziehungen(Visualisierung je nach vorhandenen Tools und Toolkenntnissen)

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 22

Darstellung von Begriffsbeziehungen mit Terminologiewerkzeugen

Coreon (Coreon GmbH) i‐Term (DANTERM Technologies) LookUp (D.O.G. Dokumentation ohne Grenzen GmbH)

Quickterm (Kaleidoscope Communications Solutions GmbH)

Termweb (Interverbum Technology)

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 23

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 24

Ontologien

Ontologien sind maschinenlesbare Repräsentationen von (einem Ausschnitt aus) der Welt

Benutzen: Klassen und Individuen Eigenschaften Relationen Regeln

Formate: RDF, RDFS (Schema), OWL

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 25

Vor‐ und Nachteile von Ontologien

Sie erlauben intelligente Wissensabfragen mit Inferenz (Schlussfolgern):

"Kann Passolo auch XLIFF‐Dateien bearbeiten?“

Inferenz und Antwort

Tripel aus:  Subjekt – Prädikat (Rel.) ‐ ObjektTripel:            Passolo – Bearbeitet – XML‐DateiTripel:            XLIFF‐Datei – IstEin – XML‐DateiInferenz ( Antwort): Passolo – Bearbeitet – XLIFF‐Datei „Ja“

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 26

Vor‐ und Nachteile von Ontologien

Sie sind oft sprachlich schlecht aufbereitet: Klassenname = Benennung  Einsprachig Wenige terminologische Informationen

Sie sind dadurch schwer kombinierbar: Klassennamen passen nicht zueinander Granularität unterschiedlich (Größe der Klassen) Nicht für den mehrsprachigen Einsatz geeignet

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 27

Ontologien und Terminologen?

Terminologen können von Ontologien profitieren:

Verbesserung/Anreicherung der terminologischen Daten

Mehrwert/Aufwertung der Terminologiearbeit Weitere Anwendungsmöglichkeiten für terminologische Ergebnisse

Terminologen können Ontologien verbessern: Umgang mit (Teil‐)Synonymen Umgang mit (Teil‐)Äquivalenten Begriffsrelationen und ‐systeme

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 28

Ontologie Gibt Beziehungen zwischen 

Begriffen an Strukturiert Wissen Nutzer: Maschinen

Begriffssystem Gibt Beziehungen zwischen 

Begriffen an Strukturiert Wissen Nutzer: Menschen

Gegenüberstellung

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 29

Danke für Ihre Aufmerksamkeit!

Wir haben uns über Ihre (menschliche) Intelligenz gefreut… 

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 30

Literatur

DIN 2330 (2013): Begriffe und Benennungen – Allgemeine Grundsätze. Berlin: Beuth

DIN 2331 (1980): Begriffssysteme und ihre Darstellung. Berlin: Beuth Drewer, Petra / Massion, François / Pulitano, Donatella (2017): „Was haben 

Wissensmodellierung, Wissensstrukturierung, künstliche Intelligenz und Terminologie miteinander zu tun?“ http://dttev.org/terminologie‐und‐künstliche‐intelligenz.html

Drewer, Petra / Schmitz, Klaus‐Dirk (2017): Terminologiemanagement : Grundlagen – Methoden – Werkzeuge. Heidelberg: Springer Vieweg (Kommunikation und Medienmanagement 1)

Tekom Jahrestagung 24. ‐ 26. Oktober 2017 31

Kontakt