Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann...

32
Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung

Transcript of Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann...

Page 1: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

OTL a.D. Dipl.-Ing. Johannes Naumann

Sprachverarbeitungzur

Gesprächsauswertung,

eine Einführung

Page 2: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

OTL a.D. Dipl.-Ing. Johannes Naumann

Verfahren der automatisiertenSprachverarbeitung

zurGesprächsauswertung

Page 3: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Johannes Naumann, OTL (a.D.) Dipl. Ing.

38 Jahre Deutsche Luftwaffe

Verwendungen

EloKa Offz Luftwaffenführungsdienstkommando

Leiter der Erfassung FmSkt F, Kötzting

Leiter ZBA, Trier (GEWOSC)

EloKa St Offz LwA, LFlKdo

Leiter Lw-Anteil BwKdo US/CA

Sachgebietsleiter Elo beim ANBw,Gelsdorf

Streitkräfteamt, Fähigkeitsanalyse NG&A & EloKa

Page 4: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Disclaimer

Dieser Vortrag gibt ausschließlich meine eigene Meinung wieder und stützt sich auf unabhängiges Denken gestützt auf 35 Jahre Erfahrung mit fast allen Spielarten der EloKa (EK) IO und auf die Physik, allgemein zugängliches Wissen und die

verfügbare wissenschaftliche Information.

Page 5: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Motivation (Massendaten)

Sprachen - Problem

Kapazitäten - Problem

Automatisierte Verfahren

Netzwerkaufklärung

Reach Back

Gliederung

Technische Randbedingungen

Klassifikatoren

Demo

Page 6: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Warum, Wieso, Weshalb ?

Massendatenproblem wegen sehr stark gestiegener Funknutzung

• bisher: potentieller Gegner war bekannt

• JEDER kann es sein und alle reden miteinander

• seit Bw im Einsatz: potentieller Gegner zivil

Page 7: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Problem: Wer hört die 50.000 Gespräche / h ab ?

24 Mio Afghanen, die jeder 2 Stundentäglich telefonieren, belegen jeder 1/10Kanäle, also 1,2 Mio gleichzeitige Gespräche täglich, macht 50.000gleichzeitige Gespräche je Stunde

Moderne Aufklärungsmittel hören aber mit !

Problem: Versteht der überhaupt die Sprache ?

Page 8: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Uzbeki

Turkmeni

Nuristani

Pashai

Qirgizi

Persian (Dari)

Pashto

Balochi

In Afghanistan werden etwa 49 Sprachen[und über 200 verschiedene Dialekte gesprochen.

Das Sprachenproblem

Page 9: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Problem: Kleine Kapazitäten für viel Umfang

Problem: Wer findet raus, was relevant ist ?

Wo sind die Auswerter, die 40 Sprachen sprechen ?

Problem: Handelt es sich überhaupt umSprache ?

Page 10: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Page 11: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

1.: Ist das Sprache oder Geräusch ?

Wie kann automatisierte Sprachverarbeitung helfen ?

Page 12: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

1.: Ist das Sprache oder Geräusch ?(Sprachdetection)

Wie kann automatisierte Sprachverarbeitung helfen ?

Page 13: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Stochastische Verfahren, die Sprachlaute von Geräusch unterscheiden können

Treffgenauigkeit ist begrenzt

Es gibt Verfahren, die „trainiert“ werden müssen

In unterschiedlichen Scenarienunterschiedliche Treffgenauigkeit

z.B. durch Computerprogramme:

Page 14: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

1.: Ist das Sprache oder Geräusch ?

2.: Welche Sprache ist das überhaupt ?

Wie kann automatisierte Sprachverarbeitung helfen ?

Page 15: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

zunächst: Lautanalyse

Jede Sprache hat spezielle Lautkombinationen

Sprachmelodie (Frequenzanalyse)

Sprachrhythmus, Pausen

Konsonanten, Vokale, Diphtonge

Phoneme

Welche Sprache ist das überhaupt ?

Page 16: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

1.: Ist das Sprache, oder Geräusch ?

2.: Welche Sprache ist das überhaupt ?

3.: Erkenne ich den Sprecher?

Wie kann automatisierte Sprachverarbeitung helfen ?

Page 17: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Wie erkenne ich den Sprecher ?

• Frequenzspektrum der Stimme

• Eigenheiten bei den verschiedenen Lauten

Explosivlaute, Vokale: Klangfarbe

Tonfall, Rhythmus Verschleifungen

weitere Eigenheiten

• Sprachraum der Stimme

Page 18: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Es gilt, irrelevante Gespräche zu ignorieren,

um wichtige Hinweise zu finden.

Stichworte können ähnlich Sprechern als Bild, Signatur abgelegt werden

Page 19: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

1.: Ist das Sprache oder Geräusch ?

2.: Welche Sprache ist das überhaupt ?

3.: Erkenne ich den Sprecher ?

4.: Erkenne ich Stichworte ?

Wie kann automatisierte Sprachverarbeitung helfen ?

Page 20: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Stichworterkennung durch Vergleichen

Erstellen von Mustern

Vergleich der Muster mit dem Sprachmaterial

Aufwendig.

Spezielle Software, die nur charakteristischeTeilmuster verwendet ist schneller

Page 21: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

1.: Ist das Sprache oder Geräusch ?

2.: Welche Sprache ist das überhaupt ?

3.: Erkenne ich den Sprecher ?

4.: Erkenne ich Stichworte ?

5.: Erkenne ich Zusammenhänge ?

Wie kann automatisierte Sprachverarbeitung helfen ?

Page 22: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Wie erkenne ich Zusammenhänge ?

• Kombination aus Stichworten und Ereignissen oder Daten

• Zusammenhang ergibt sich aus mehreren Stichworten

Keywordspotting

Page 23: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

1.: Ist das Sprache oder Geräusch ?

2.: Welche Sprache ist das überhaupt ?

3.: Erkenne ich den Sprecher ?

4.: Erkenne ich Stichworte ?

5.: Erkenne ich Zusammenhänge ?

6.: Erkenne ich ein geplantes Ereignis ?

Wie kann automatisierte Sprachverarbeitung helfen ?

Page 24: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Sprecher, Stichworte und Zusammenhängekönnen zu geplanten Ereignissen führen

Dabei helfen Informationen aus anderenDiensten, wie z.B. Netzwerkaufklärung

Erkenne ich ein geplantes Ereignis ?

Page 25: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Wie findet man heraus, was relevant ist ?

IMSI-Catcher liefert ID, Standort, und gestattetdas Mithören

„ IMSI-Catcher für 1500 Euro im Eigenbau.“

Heise-online, 1. August 2010.

Netzwerkaufklärung

Page 26: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

IMSI-Catcher:

„Das Gerät arbeitet dazu gegenüber dem Mobiltelefon wie eine Funkzelle (Basisstation) und gegenüber dem Netzwerk wie ein Mobiltelefon; alle Mobiltelefone in einem gewissen Umkreis buchen sich bei dieser Funkzelle mit dem stärksten Signal, also dem IMSI-Catcher, ein. Der IMSI-Catcher simuliert also ein Mobilfunknetzwerk.“

(Wikipedia)

Page 27: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Datenstrom

Statistische Verfahren zur Massendaten-Auswertung

Netzwerkaufklärung

Ich erfahre:

Wer, Wann, Wo, mit Wem, Wie lange, Wie oft telefoniert (kommuniziert) hat.

Page 28: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Sprecher, Stichworte und Zusammenhängekönnen zu geplanten Ereignissen führen

Dabei helfen Informationen aus anderenAktivitäten, wie z.B. Netzüberwachung

Gewonnene Informationen dienen demgezielten Einsatz der Linguisten

Erkenne ich ein geplantes Ereignis ?

Page 29: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Problem: 40 versch. Sprachen im Einsatzgebiet

- Aufkommen schwankt

- Kapazitäts-Engpässe

- Bedrohung, Streß

In der Heimat Pool an (ausgeruhten) Linguisten

Daten erfassen – ableiten – Ergebnisse zurückschicken

Reach Back

Page 30: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

1.: Quelle: Funk, Mobilfunk, Glasfaser

2.: Funk: Frequenz beliebig, Zeit unsicher

3.: Mobilfunk: ständiger Datenstrom

4.: Inhalt: unbestimmt, meist wertlos

5.: Charakter: überraschend: manchmal Merkel

6.: Ernüchternd: Normalbürger stört nur

Technische Randbedingungen

Page 31: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Beispiel Boger

Beispiel Medav

Klassifikatoren

Verschriftungssoftware (nicht OCR)

Page 32: Unauthorized Views only Red Baron Roost, Bonn OTL a.D. Dipl.-Ing. Johannes Naumann Sprachverarbeitung zur Gesprächsauswertung, eine Einführung.

Unauthorized Views only

Red Baron Roost, Bonn

Vielen Dank für Ihre

Aufmerksamkeit