M5, rudolf bauer, paradigma

23
IBM Watson Foundation & Untersuchungsausschüsse Hamburg, 12. Mai 2015 PARADIGMA Unternehmensberatung Gmbh Mariahilfer Straße 47/1/3, A – 1060 Wien, Tel. ++43-1-585 49 72 FN 134564 p, Sitz Wien

Transcript of M5, rudolf bauer, paradigma

Page 1: M5, rudolf bauer, paradigma

IBM Watson Foundation & Untersuchungsausschüsse

Hamburg, 12. Mai 2015

PARADIGMA Unternehmensberatung Gmbh

Mariahilfer Straße 47/1/3, A – 1060 Wien, Tel. ++43-1-585 49 72

FN 134564 p, Sitz Wien

Page 2: M5, rudolf bauer, paradigma

Untersuchungsausschuss

Page 2

Foto: APA/GEORG HOCHMUTH: http://www.krone.at/Oesterreich

Page 3: M5, rudolf bauer, paradigma

„Beweismengen steigen ins Unermessliche“

Page 3

Untersuchungsbeauftragte müssen eine

Unmenge an Dokumenten lesen und daraus

Zusammenhänge ableiten

Untersuchungsbehörden generieren

Arbeitshypothesen und versuchen, diese

aufgrund der Beweislage zu belegen

Neue Belege und Informationen sind zeitnahe in

die Untersuchungen aufzunehmen

Page 4: M5, rudolf bauer, paradigma

Herausforderungen

Page 4

Es bedarf adäquater IT Verfahren um heterogene

Quellen einer gemeinsamen Analyse zuzuführen

Klassische Suche („Google“) ist nicht allein

hinreichend. Texterschließungsmöglichkeiten

sind („Discovery“) notwendig

Inhalte müssen in den Textkorpora erkannt und

extrahiert werden

Vertraulichkeit der einzelnen Dokumente muss

gewährleistet bleiben

Page 5: M5, rudolf bauer, paradigma

Proof of Concept mit IBM Watson Foundation

Ist eine effiziente, qualitativ anspruchsvolle

Erschließung großer Textkörper möglich ?

Wie hoch ist der Entwicklungsaufwand für semantische

Modelle ?

Können bestehende Modelle für neue Sachverhalte

zeitnah erweitert werden?

Einsatzmöglichkeit der Technologie im

parlamentarischen Umfeld

Page 5

Semantische Analyse von Protokollen eines

Untersuchungsausschusses mit IBM Watson Foundation & i2

Page 6: M5, rudolf bauer, paradigma

Watson Foundation & i2 Technologien

Page 6

IBM® i2® Analyst’s Notebook IBM® InfoSphere® Data Explorer

Entdecken / Discover

•Zusammenhänge erkennen,

darstellen bzw. aufdecken

•Aus dem Zusammenhang

Zusatzfragen stellen um bessere

Ergebnisse zu erhalten

Suchen

•Suchen nach Textstellen mit

bestimmten Inhalten

•Verbesserung der Präzision

mit extrahierten Begriffen

Named Entity Recognition

•Sprachunabhängige

Textmusterkennung mit AQL

• Optimizer mit hoher Skalierbarkeit

(mapReduce)

• Hohe Erkennungsraten

(Recall/Precision)

IBM® BigInsights™ for Apache™ Hadoop® v4

Page 7: M5, rudolf bauer, paradigma

Aufgaben des Proof-Of-Concept

Aufbereitung und Zusammenführung des Schriftguts, welches im

Rahmen von Untersuchungsaussschüssen zur Verfügung gestellt wird

(BigInsights/IBM Watson Explorer)

Anreicherung mit Konzepten und Beziehungen mittels deklarativer

Verfahren (BigInsights/AQL); iteratives Anpassen und Verbesserungen

der AQL Annotatoren

Indizierung von Dokumenten und Unterstützung bei der Suche nach

Dokumenten mit Taxonomien und Metadaten (IBM Watson Explorer)

("Search")

Aufbau und kontinuierliche Aktualisierung des aus den Dokumenten

entnommenen Beziehungsnetzwerks (i2 Notebook) ("discovery")

Page 7

Page 8: M5, rudolf bauer, paradigma

Page 8

Page 9: M5, rudolf bauer, paradigma

Annotieren von Texten

Page 9

Page 10: M5, rudolf bauer, paradigma

Page 10

Page 11: M5, rudolf bauer, paradigma

Textstelle als „Beleg“ für Verbindungen

Page 11

Page 12: M5, rudolf bauer, paradigma

Page 12

Page 13: M5, rudolf bauer, paradigma

Textstelle als „Beleg“ für Verbindungen

Page 13

Page 15: M5, rudolf bauer, paradigma

Textmuster Erkennung mit AQL

Page 15

Page 16: M5, rudolf bauer, paradigma

Erkannte Textstellen im Zusammenhang

Page 16

Page 17: M5, rudolf bauer, paradigma

Themen in den Texten erkennen

Page 17

Bild: http://images04.kurier.at/46-63314973.jpg/77.259.039

Page 18: M5, rudolf bauer, paradigma

Thema „Jagdgesellschaften“

Page 18

Page 19: M5, rudolf bauer, paradigma

Erkenntnisse & Erfahrungen

Positive Erfahrungen

Der gesamte Entwicklungs- und

Erschließungsprozess war in 4

Wochen machbar

Iterative Vorgehensweise bei der

Entwicklung von AQL Modellen

„Annotatoren“ bewährt

Klare Vorteile gegenüber

linguistischen und statistischen

Verfahren

Lösung bei der Vorbereitung von

Ausschusssitzungen einsetzbar:

Bestätigung, Präzisierung von

erkannten Beziehungen verlangen

Fragen zu nicht direkt aus dem

Graphen erkennbaren aber

vermuteten Beziehungen stellen

Page 19

Weniger aufregende

Erkenntnisse

Integrationsfähigkeit von i2 mit

Watson Explorer nicht trivial

Einzelmodelle sind rasch

entwickelt; Wiederverwendbarkeit

setzt Disziplin und Normen voraus

(Nomenklatur, Dokumentation, … )

Nicht zufriedenstellend ist die ad

hoc Aufteilung umfangreicher

Dokumente

Ungelöst ist der Umgang mit der

unterschiedlichen Interessenslage

der politischen Parteien

Page 20: M5, rudolf bauer, paradigma

Unschärfen bei der Auswahl der Textstellen

Page 20

Page 22: M5, rudolf bauer, paradigma

Hypo-U-Ausschuss - VfGH um rasche Klärung bemüht

Page 22

veröffentlicht am 6. 5. 2015 von APA

Der Verfassungsgerichtshof (VfGH) will in der Frage der

geschwärzten Akten für den Hypo-Untersuchungsausschuss rasch

entscheiden. Laut Auskunft eines Sprechers gegenüber der APA am

Mittwoch ist das Höchstgericht bestrebt, die angeregte Frist von vier

Wochen einzuhalten. Im Laufe des Tages erwartet der VfGH den

formalen Antrag des Finanzministeriums mit allen Unterlagen.

Diese werden dann gesichtet. Streng genommen kann man dem

VfGH nicht vorschreiben, wie lang er sich für eine Entscheidung Zeit

lassen darf, laut Gesetz soll er aber "tunlichst" innerhalb von vier

Wochen zu einem Entschluss kommen. Da das Gericht diese Frist

auch einhalten will, ist damit zu rechnen, dass der Fall nicht im

Rahmen der Juni-Session, sondern bei einer außertourlich

einberufenen Session behandelt wird.

http://www.format.at/newsticker/hypo-u-ausschuss-vfgh-klaerung-5634878

Page 23: M5, rudolf bauer, paradigma

Page 23

Entwicklung von Prototypen

Anpassung der Methoden an aufgabenspezifische Merkmale und

kundeneigene Daten

Reduktion des beiderseitigen Machbarkeitsrisiko‘s und Demonstration des

Kundennutzens

Einführung & Wissenstransfer bei neuen Verfahren/Produkten

Auswahlunterstützung probater Methoden & Werkzeuge

Integration in betriebsinterne Abläufe & vorhandene Systeme

Einbindung von betriebsinternen Datenquellen

Erfahrenes Team mit langjähriger Erfahrung

Analytische Methoden, Entscheidungsfindung, relevante

Geschäftsprozesse , IT Architekturen

IBM Business Partner

Zugang zu neuen Technologien, IBM Assets und Supportstrukturen

PARADIGMA BI Leistungen & Mehrwert