Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele...

44
Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002), Forensic Speaker Identification. Kap. 4 und 11

Transcript of Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele...

Page 1: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik

Jonathan Harrington

Viele Beispiele in diesem Vortrag basieren auf Rose (2002), Forensic Speaker Identification. Kap. 4 und 11

Page 2: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Untersuchungen in der forensischen Phonetik basieren auf Wahrscheinlichkeiten.

Wie werden, und wie sollten, in forensischen phonetischen Analysen Wahrscheinlichkeiten eingesetzt werden?

Page 3: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Die Erwartung von vielen Rechtanwälten

'Aufgrund Ihrer Analyse der beiden Aufnahmen im Stimmvergleich, wie hoch ist die Wahrscheinlichkeit, dass die beiden Stimmen vom selben Sprecher stammen?'

'Meine Analyse zeigte eine sehr große Ähnlichkeit zwischen den Aufnahmen, sodass eine hohe Wahrscheinlichkeit (90%) vorliegt, dass die beiden Aufnahmen vom selben Sprecher stammen'

Und ein Beispiel einer für das Gericht akzeptierbaren Antwort

Die Frage vom Rechtsanwalt*

*Beispiel aus A.Butcher (2002), Forensic Phonetics, Issues in speaker identification evidence, http://www.flinders.edu.au/speechpath/Prato.pdf

Page 4: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Jedoch sollte eine solche Aussage aus logischen und eigentlich aus legalen Gründen nicht zulässig sein, da die Beweise (evidence) dazu verwendet werden, um die Wahrscheinlichkeit der Hypothese (hypothesis) einzuschätzen. Dies ist ein Beispiel von 'transposing the conditional'

Page 5: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

E (Evidence): diese Aufnahmen sind sehr ähnlich

H (Hypothesis): diese Aufnahmen sind vom selben Sprecher

"Es gibt eine hohe Wahrscheinlichkeit (90%), dass die beiden Aufnahmen vom selben Sprecher stammen, da meine Analyse eine sehr große Ähnlichkeit zwischen den Aufnahmen zeigt"

Transposing the conditional: was ist das?

p(H|E)

Wahrscheinlichkeit der Hypothese unter der Voraussetzung der Beweise

oder

'Meine Analyse zeigte eine sehr große Ähnlichkeit zwischen den Aufnahmen, sodass eine hohe Wahrscheinlichkeit (90%) vorliegt, dass die beiden Aufnahmen vom selben Sprecher stammen'

=

Page 6: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Evidence: das Tier hat vier Beine

Hypothesis: das Tier ist eine Katze

p(H|E): Wahrscheinlichkeit der Hypothese u.d.V. der Beweise

Wieso ist 'transposing the conditional' logisch falsch?

Es gibt eine hohe Wahrscheinlichkeit (90%), dass das Tier eine Katze ist, da meine Analyse vom Tier vier Beine festgestellt hat.

logisch inkorrekt: was ist mit den Vierbeinigen, die nicht Katzen sind?

Page 7: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Transposing the conditional: noch ein Beispiel

Hypothesis: Das Kind ist missbraucht worden

Evidence: Das Kind kaut die Nägel

p(H|E): Es gibt eine 90% Wahrscheinlichkeit, dass das Kind missbraucht wurde, da das Kind die Nägel kaut.

(logisch inkorrekt, weil sie die Statistik nicht einschließt: wieviele Kinder es gibt, die Nägel kauen, und die nicht missbraucht worden sind?)

Page 8: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

p(E|H) statt p(H|E)

Hypothesis: Das Kind ist missbraucht worden

Evidence: Das Kind kaut Nägel

p(E|H): Wahrscheinlichkeit der Beweise, u.d.V. der Hypothese

p(E|H): Die Wahrscheinlichkeit, dass ein Kind Nägel kaut, ist 4 Mal so hoch, bei missbrauchten im Vergleich zu nicht-missbrauchten Kindern.

p(H|E): Es gibt eine 90% Wahrscheinlichkeit, dass das Kind missbraucht wurde, da das Kind Nägel kaut.

Page 9: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Wenn wir 4 Beine bei einem Tier beobachten, dann ist es 10 Mal wahrscheinlicher, dass wir mit einem anderen vierbeinigen Tier (Hund, Kuh, Schaf…) als mit einer Katze zu tun haben.

p(E|H)

p(H|E)

Es gibt eine hohe Wahrscheinlichkeit (90%), dass das Tier eine Katze ist, da meine Analyse vom Tier vier Beine festgestellt hat.

p(E|H) statt p(H|E)

Page 10: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

p(H|E)

Es gibt eine hohe Wahrscheinlichkeit (90%), dass die beiden Aufnahmen vom selben Sprecher stammen, da meine Analyse eine sehr große Ähnlichkeit zwischen den Stichproben steigt.

p(E|H)

Die Wahrscheinlichkeit, dass diese beiden Aufnahmen diesen Grad der Ähnlichkeit zeigen, ist 10 Mal so hoch, wenn die Aufnahmen vom selben als wenn sie von unterschiedlichen Sprechern stammen.

p(E|H) statt p(H|E)

Page 11: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Drei Unterschiede bei p(E|H) im Vgl. zu p(H|E)…

1. Die Wahrscheinlichkeiten berücksichtigen nicht nur Hp sondern auch Hd

Hp (Hypothesis for the prosecution/den Anklager).

Das viebeinige Tier ist eine Katze

Die Stimmen sind vom selben Sprecher

Nägelkauen ist typisch bei missbrauchten Kindern

von unterschiedlichen Sprechern

auch bei anderen Kindern.

ein anderes Tier

Hd (Hypothesis for the defence/die Verteidiung).

Page 12: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

2. Ein Wahrscheinlichkeits-Verhältnis

Die Wahrscheinlichkeit, dass diese beiden Aufnahmen diesen Grad der Ähnlichkeit zeigen, ist 10 Mal so hoch [statt z.B. 90%] wenn die Aufnahmen vom selben als wenn sie von unterschiedlichen Sprechern stammen.

Die Wahrscheinlichkeit für die Anklage

Die Wahrscheinlichkeit für die Verteidiung

LR = p(E|Hp)

p(E|Hd)

=

LR oder Likelihood Ratio

Page 13: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

3. Die Analyse basiert notwendigerweise auf Daten, die für die Bevölkerung typisch sind.

d.h. wir benötigen eine Sprachdatenbank von anderen ähnlichen Sprechern…

Die Wahrscheinlichkeit, dass diese beiden Aufnahmen diesen Grad der Ähnlichkeit zeigen, ist 10 Mal so hoch, wenn die Aufnahmen vom selben als wenn sie von unterschiedlichen Sprechern stammen.

Page 14: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Beispiel I. Der kategoriale Fall

Eine Aufnahme von einemTäter hat festgestellt, dass in initialer Position /p/ statt /b/ verwendet wurde

'Pank' statt 'Bank', 'pleiben' statt 'bleiben' …

Die Aufnahme vom Verdächtigten zeigt das gleiche

Page 15: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

HypothesenWas ist die Wahrscheinlichkeit, dass die beiden Aufnahmen vom selben Sprecher stammen?

Falsch!! p(H|E)

Hypothesis for the prosecution

Hypothesis for the defence

Unter der Annahme, dass die Aufnahmen von der selben Person stammen (Hp), was ist die Wahrscheinlichkeit dass in beiden Aufnahmen /p/ statt /b/ silbeninitial produziert wird (E)

Unter der Annahme, dass die Aufnahmen von unterschiedlichen Person stammen (Hd), was ist die Wahrscheinlichkeit dass in beiden Aufnahmen /p/ statt /b/ silbeninitial produziert wird (E)

p(E|Hp)

p(E|Hd)

Page 16: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Wir benötigen eine Sprachdatenbank, um diese Fragen zu beantworten – d.h. um zu beantworten, wie oft, wenn man 2 Aufnahmen hat, es der Fall ist, dass ein /p/ in beiden Aufnahmen vorkommt:

(a) im selben Sprecher (spricht für die Anklage)

(b) in unterschiedlichen Sprechern (spricht für die Verteidigung)

Page 17: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Ich nehme 8 Sprecher vom selbem Geschlecht und Dialekt auf, zwei Mal in einem Abstand von einer Woche.

Ich stelle fest, ob in den ersten und zweiten Aufnahmen /p/ statt /b/ ('Pank' statt 'Bank' usw.) produziert wurde. Die Ergebnisse:

Sprecher

ErsteAufnahme

ZweiteAufnahme

A p pB p bC b bD p pE p pF b pG b bH b p

Page 18: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Für die AnklageWas ist p(E|Hp)? Was ist die Wahrscheinlichkeit, dass wenn ich in beiden Aufnahmen /p/ habe, sie vom selben Sprecher erzeugt wurden?

Sprecher

ErsteAufnahme

ZweiteAufnahme

A p pB p bC b bD p pE p pF b pG b bH b p

p(E|Hp) = 3/8

Page 19: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Ich werfe alle 16 Aufnahmen in einen Topf. Ich ziehe 2 raus. Ich berücksichtige nur paarweise Kombinationen von unterschiedlichen Sprechern

z.B. A1 mit B1 (erste Aufnahme von A + erste Aufnahme B) C2 mit D1

B2 mit H1 usw.

aber nicht A1 mit A2, B1 mit B2…

p(E|Hd): Was ist die Wahrscheinlichkeit, dass wenn ich in beiden Aufnahmen /p/ habe, sie von unterschiedlichen Sprechern erzeugt wurden?

Für die Verteidigung

Page 20: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Sprecher

ErsteAufnahme

ZweiteAufnahme

different-speaker Komb. beide mit [p]

A p p 2 x 7B p [1] b 6C b b 0D p [2] p [4] 2 x 4E p [3] p [5] 2 x 2F b p [6] 1G b b 0H b p [7] 0Summe 33

[1] B1 [2] D1 [3] E1[4] D2 [5] E2 [6] F2 [7] H2

A1 oder A2 mit:

Page 21: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Es kann gezeigt werden, dass bei 8 Sprechern und 2 Aufnahmen 8 x 7 x 2 = 112 paarweise Kombinationen (A1 + B1, A1 + C1 usw.) von unterschiedlichen Sprechern vorliegen.

Daher p(E|Hd) = 33/112

Für die Verteidigung

Page 22: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

LR =

Wahrscheinlichkeit, dass /p/ in beiden Aufnahmen beim selben Sprecher vorkommt

Wahrscheinlichkeit, dass /p/ in beiden Aufnahmen bei unterschiedlichen Sprechern vorkommt

=p(E|Hp)

p(E|Hd)

=3/8

33/112= 1.27

Schlussfolgerung: Es ist 1,27 Mal so wahrscheinlich, dass ein /p/ in beiden Aufnahmen im selben Sprecher als in unterschiedlichen Sprechern vorkommt.

Erwägung: Anklage v. Verteidigung

Page 23: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Interpretation von LR Skalen

LRlog10LR

Interpretation

über 10000 über 4 very strong Evidencein favourof theprosecution

1000 bis10000 3 bis 4 strong

100 bis 1000 2 bis 3 moderately strong

10 bis 100 1 bis 2 moderate

1 bis 10 0 bis 1 limited

1 0 equivocal

0.1 bis 1 -1 bis 0 limited Evidencein favourof thedefence

0.01 bis 0.1 -2 bis -1 moderate

0.001 bis 0.01 -3 bis -2 moderately strong

0.0001 bis 0.001 -4 bis - 3 strong

unter 0.0001 unter -4 very strong

Page 24: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Beispiel 2: Der kontinuierliche Fall

In meinem Stimmvergleich stelle ich fest, dass F2 von [] vom Täter dem F2 [] vom Verdächtigten sehr ähnlich ist.

Dieser Fall ist kontinuierlich, weil wir mit einer numerischen Verteilung statt mit einer binären kategorialen Entscheidung (war es ein /p/ oder ein /b/?) zu tun haben.

Page 25: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Meine Daten: F2 Verteilung von []

1871 Hz 1863 HzAufnahme 1

F2 (Hz)

ufig

keit

1820 1860 1900

05

1015

Aufnahme 2

1820 1860 1900

05

1015

Mittelwerte:

was in die Wahrscheinlichkeit, dass wir diese Unterschiede sehen würden, wenn sie

von derselben Person von unterschiedlichen Personenp(E|Hp) p(E|Hd)

stammen?

Evidence

Hypothesis

Page 26: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Zwei damit verbundene Fragen…

Wie stark weichen diese Mittelwerte voneinander ab? Je geringer der Abstand, umso wahrscheinlicher stammen sie von derselben Person.

Wie typisch sind diese Werte für die Bevölkerung? Je typischer, umso wahrscheinlicher, dass die Werte von unterschiedlichen Personen hätten stammen können. Weil: es könnte sein, dass die meisten Personen (vom selben Geschlecht u. Dialekt) ihre F2 [] Werte in diesem Bereich produzieren.

1. SIMILARITY. (Für die Anklage).

2. TYPICALITY. (Für die Verteidigung).

Page 27: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Ein Würfelspiel

Ein Verkäufer aus der Fa. Verzinkt verkauft Päckchen von 10 Würfeln, die dazu neigen, höhere Zahlen (4, 5, 6) zu zeigen. Im Laden probiere ich sie einmal aus, und bekomme den Mittelwert (über alle 10 Würfel) von 4.8.

Ein Bekannter von mir hat ein Päckchen von 10 Würfeln gekauft. Wir werfen die Würfel ein Mal und bekommen einen Mittelwert von 5.2. Ich (der Ankläger) meine, die 10 Würfel stammen aus der Fa. Verzinkt. Der Bekannte (der Verteidiger) sagt nein – es sind ganz normale Würfel.

Page 28: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Evidence (E)

Hp (Hypothese für die Anklage)

Hd (Hypothese für die Verteidigung)

Wir wollen berechnen,LR = p(E|Hp)

p(E|Hd)

Die beiden Päckchen stammen vom selben Hersteller

Die beiden Päckchen sind von unterschiedlichen Herstellern.

Die beiden 'Aufnahmen': Mittelwerte von 4.8 und 5.2

Page 29: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

(a) SIMILARITY: Wie ähnlich sind 4.8 und 5.2 (je ähnlicher, umso mehr Unterstützung für Hp)

(b) TYPICALITY. Wie typisch sind diese beiden Mittelwerte für ungezinkte (normale) Würfel? (Je typischer, umso mehr Unterstützung für Hd).

Die 2 Fragen

Für (b) benötigen wir eindeutig ein Modell der Verteilungen der Mittelwerte bei ungezinkten (normalen) Würfeln. Wir nennen dies das Bevölkerungsmodell.

Das Bevölkerungsmodell kann genau definiert werden durch zwei Parameter: (mu) der Bevölkerungs-Mittelwert. (sigma) die Bevölkerungs-Standardabweichung.

Page 30: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Eine Frage: Ich werfe 10 Würfel und berechne den Mittelwert. Was ist , der Mittelwert im theoretischen Fall? (Welcher Mittelwert ist der wahrscheinlichste?).

Hier sind 50 Stichproben-Mittelwerte. 10 Würfel werfen, Mittelwert berechnen, 10 Würfel werfen, Mittelwert berechnen… 50 Mal.

3.7 2.9 3.0 4.9 3.9 3.1 2.8 3.4 3.6 3.9 3.4 3.7 3.5 2.9 4.5 3.3 3.4 2.9 4.0 2.8 4.0 3.1 3.7 4.4 3.2 3.3 3.4 3.5 3.3 3.6 3.3 2.8 3.0 3.0 3.1 2.8 3.9 4.0 2.5 2.7 3.2 3.2 3.9 4.23.6 3.5 3.0 3.4 2.9 4.0...

Bevölkerungsmodell-Mittelwert,

Page 31: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

= 3.5

Wir sehen aber, dass wir nicht jedes Mal 3.5 bekommen, sondern Abweichungen davon:

3.7 2.9 3.0 4.9 3.9 3.1 2.8 3.4 3.6 3.9 3.4 3.7 3.5 2.9 4.5 3.3 3.4 2.9 4.0 2.8 4.0 3.1 3.7 4.4 3.2 3.3 3.4 3.5 3.3 3.6 3.3 2.8 3.0 3.0 3.1 2.8 3.9 4.0 2.5 2.7 3.2 3.2 3.9 4.23.6 3.5 3.0 3.4 2.9 4.0...

Page 32: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Wir können aus diesen 50 Stichproben einen Histogramm machen.

1 2 3 4 5 6

01

23

45

6

6/50 Mittelwerte lagen bei 4.

Page 33: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Ich wiederhole den Vorgang, aber diesmal 5000 Mal! (10 Würfel werfen, Mittelwert berechnen, aufschreiben, 10 Würfel werfen, Mittelwert berechnen, aufschreiben…. 5000 Mal). Hier ist ein Histogramm davon:

1 2 3 4 5 6

01

00

20

03

00

40

0

Mittelwert der Zahlen bei 10 Würfeln

Häu

figke

it

Page 34: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Jetzt werde ich aufgefordert, denselben Vorgang unendlich viel Mal zu machen! Wenn das möglich wäre, bekäme ich eine Kurve (statt Balken), die Normalverteilung

Ferner lässt sich die y-Achse bei einer Normalkurve in Wahrscheinlichkeits-dichten umrechnen – dies hat zur Folge, dass man genau ausrechnen kann, Fragen wie:

1 2 3 4 5 6

0.0

0.2

0.4

0.6

: die Standardabweichung. Wie steil ist die Abnahme der Werte

Page 35: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Für diesen Fall subtrahieren wir die Werte (5.2 – 4.8 = 0.4) und berechnen die Wahrscheinlichkeit, dass dieser Wert von 0 abweicht. Je näher an 0, umso wahrscheinlicher ist es, dass die Mittelwerte vom selben Hersteller stammen (umso mehr wird Hp unterstutzt).

Für den zweiten Fall (Hd) berechnen wir den Mittelwert: (5.2 + 4.8)/2 = 5. Je näher am Bevölkerungsmittelwert, 3.5, umso typischer die Zahlen für die Bevölkerung (umso wahrscheinlicher, dass wir die zwei Mittelwerte von ganz normalen Würfeln hätten bekommen können (umso mehr wird Hd unterstutzt).

1. SIMILARITY, Hp (wie ähnlich?)

2. TYPICALITY, Hd (wie typisch für die Bevölkerung?)

Page 36: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Für diesen Fall…

p(E|Hp) = 0.3162926

Die Wahrscheinlichkeit, dass 4.8 und 5.2 von denselben 10 Würfeln stammen = 31.6%

p(E|Hd) = 0.0027393

Die Wahrscheinlichkeit, dass die Mittelwerte 4.8 und 5.2 für die Bevölkerung typisch sind = 0.27%

LR = 0.3162926/ 0.0027393 = 115.4648

"moderately strong evidence for the prosecution"

Page 37: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

"Es ist 115 Mal wahrscheinlicher, dass die beiden Päckchen von 10 Würfeln vom selben als von unterschiedlichen Herstellern stammen".

Schlussfolgerung in meinem Bericht

(Aber ob sie beide aus der Fa. Verzinkt stammen: das ist eine Frage für das Gericht, und nicht für mich als Forensiker).

Page 38: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

1871 Hz 1863 Hz

Wir messen F2 von [] vom Befragten und vom Täter und stellen diese Mittelwerte fest.

Hp: Diese Mittelwerte für [] stammen von derselben Person.

Hd: Diese Mittelwerte für [] stammen von unterschiedlichen Personen. (weil sie für die Bevölkerung typisch sind).

Das Beispiel aus der gesprochenen Sprache

Evidence

Hypothesis

Page 39: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Im Würfelspiel ist uns das Wahrscheinlichkeitsmodell für die Bevölkerung (von normalen Würfeln) aus theoretischen Gründen bekannt.

Im Fall von Sprechdaten müssen wir das W-Modell der Bevölkerung durch eine Stichprobe einschätzen.

Die Stichprobe: n andere Sprecher vom selben Geschlecht und mit einer ähnlichen Aussprache wie der Befragte und der Täter.

Je höher n, umso genauer die Anpassung an die Normalverteilung.

Das Bevölkerungsmodell

Page 40: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Bevölkerungs-Verteilung (n=100 Sprecher) mit angepasster Normalkurve (rechts).

1400 1800 2200 2600

F2 (Hz)

Wa

hrsc

hein

lich

keits

dic

hte

Page 41: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

m1 = 1871 Hz

m2 = 1863 Hz

1400 1800 2200 2600

F2 (Hz)

Wa

hrsc

hein

lich

keits

di

chte

SIMILARITY: Wie ähnlich sind diese Mittelwerte?

TYPICALITY: Wie typisch sind die obigen Mittelwerte für die eingeschätzte Bevölkerung?

= 2009 Hz

Aufnahme 1

Aufnahme 2

Page 42: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Die Berechnungen: Similarity/Typicaltiy

Was ist die Wahrscheinlichkeit dass, 1871-1863 = 8 Hz von 0 Hz abweicht?

Was ist die Wahrscheinlichkeit, dass (1871+1863)/2 = 1867 Hz vom Bevölkerungsmittelwert = 2009 Hz abweicht?

SIMILARITY

TYPICALITY

Page 43: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

LR =(für diesen Fall)

SIMILARITY

TYPICALITY

= 0.4914356=p(Hp|E)

p(Hd|E)

(1/0.49 = 2.04)

Page 44: Wahrscheinlichkeit und 'Likelihood ratios' in der forensischen Phonetik Jonathan Harrington Viele Beispiele in diesem Vortrag basieren auf Rose (2002),

Die Schlussfolgerung meines Berichtes lautet:

(Und daraus mag das Gericht – allerdings nicht ich – zur Schlussfolgerung kommen: der Verdächtigte ist nicht der Täter).

"Es ist knapp über 2 Mal so wahrscheinlich, dass der Unterschied zwischen den beiden Aufnahmen von unterschiedlichen als vom selben Sprecher stammt"

LR = 0.49, 1/LR = 2.04