Aus der Klinik für Hals-, Nasen und Ohrenheilkunde ... · techniques the test can be performed...

Aus der Klinik für Hals-, Nasen und Ohrenheilkunde der

Friedrich-Alexander-Universität Erlangen-Nürnberg Direktor: Prof. Dr. med. Heinrich Iro

Trainingseffekte und Listenäquivalenz des Freiburger Einsilbertests im Störschall

Inaugural-Dissertation zur Erlangung der Doktorwürde

der Medizinischen Fakultät der

Friedrich-Alexander-Universität Erlangen-Nürnberg

vorgelegt von

Eva Mallinger

aus

Nürnberg

Gedruckt mit Erlaubnis der Medizinischen Fakultät der Friedrich-Alexander-Universität

Erlangen-Nürnberg Dekan: Prof. Dr. med. Dr. h.c. J. Schüttler Referent: Prof. Dr.-Ing. Dr. rer. med. Ulrich Hoppe Korreferent: Prof. Dr. med. J. Zenk Tag der mündlichen Prüfung: 06.07.2011 Die Promovendin ist Zahnärztin

Meinen Eltern gewidmet.

Inhaltsverzeichnis

1. Zusammenfassung 1

1.1 Hintergrund und Ziele 1

1.2 Methoden 1

1.3 Ergebnisse und Beobachtungen 2

1.4 Praktische Schlussfolgerungen 2

2. Abstract 3

2.1 Background 3

2.2 Methods 3

2.3 Results 4

2.4 Conclusions 4

3. Einleitung 5

3.1 Bedeutung der Sprachaudiometrie 5

3.2 Anatomische und physiologische Grundlagen des

Hörsystems 6

3.3 Klassische Hörprüfungen 8

3.4 Die Tonaudiometrie 9

3.5 Allgemeine Kennzeichen der Sprachaudiometrie 11

3.6 Mainzer Test und Göttinger Test für Kinder 13

3.7 Göttinger Test 14

3.8 Hochmair-Schulz-Moser Test (HSM-Satztest) 15

3.9 Reimtest nach Sotscheck 16

3.10 Marburger Sprachverständlichkeitstest 16

3.11 Oldenburger Satztest 16

3.12 Freiburger Sprachverständnistest (FST) 18

3.13 Freiburger Sprachtest in der Anwendung 18

4. Material und Methode 22

4.1 Versuchspersonen 22

4.2 Verfahren 22

4.3 Analyse 27

5. Ergebnisse 28

5.1 Mittlere Verständlichkeit 28

5.2 Einzelwortverständlichkeit 29

5.3 Listenbasierte Auswertung 33

6. Diskussion 36

7. Schlussfolgerung 39

8. Literaturverzeichnis 40

9. Abkürzungsverzeichnis 44

10. Anhang 45

11. Danksagung 57

1

1. Zusammenfassung

1.1 Hintergrund und Ziele

Der Freiburger Sprachverständlichkeitstest (FST) wurde vor mehr als 50 Jahren

von Hahlbrock erstmalig vorgestellt. Obwohl der Test in der Zwischenzeit

oftmals kritisiert wurde, gilt er heute als der am meisten angewandte

Sprachverständlichkeitstest in der Praxis. Besonders attraktiv für den Anwender

ist die rasche und einfache Durchführbarkeit. Als wichtigste Nachteile wurden

unzureichende Listenäquivalenz, Ergebnis verfälschende Trainingseffekte und

Probleme bei der Anwendung im Störgeräusch wegen eines fehlenden

Ankündigungssignals genannt [13]. In der aktuellen Studie wurde die

Anwendbarkeit des FST für Sprachverständlichkeitsmessungen im

Störgeräusch untersucht. Hierzu wurde das Sprachverständnis bei

Normalhörigen bei festem Signal-Rausch-Verhältnis für alle Testwörter des

Freiburger Tests bestimmt.

1.2 Methoden

Insgesamt nahmen zwanzig junge gesunde Erwachsene (10 Männer, 10

Frauen) an der Studie teil. Die Einsilber wurden im freien Schallfeld bei einem

Pegel von 65 dB präsentiert. Als Störgeräusch wurde das auf der Test-CD

enthaltene sprachverdeckende Rauschen verwendet. Die Probanden waren

nicht vertraut mit dem Freiburger Test. Der FST wurde in drei unterschiedlichen

Versionen getestet: 1. Einsilber allein (standard), 2. Einsilber in dreifacher

Wiederholung als ‚Dreinsilber-Präsentation’ (dreinsilber) und 3. Einsilber mit

einem kurzen Ankündigungston von 500 Hz (beep). Die Probanden wurden an

zwei Sitzungen mit einem Abstand von einer Woche getestet. Alle Probanden

führten den Test in der Standardversion entweder am ersten oder am zweiten

Termin durch. Am anderen Tag wurde entweder die Version ‚beep’ oder

‚dreinsilber’ getestet. Um Trainingseffekte bei kurzzeitiger Wiederholung zu

überprüfen, wurden an einem Tag jeweils alle 400 Wörter in derselben Version

mit einem Abstand von maximal einer Stunde erneut getestet. Die Reihenfolge

2

der Testwörter war randomisiert. Die Testergebnisse wurden hinsichtlich der

Präsentationsversion, der Trainingseffekte und der Listenäquivalenz analysiert.

1.3 Ergebnisse und Beobachtungen

Die mittleren Erkennungsraten lagen bei 53%±32% für die Standardversion,

66%±31% für die Dreinsilberdarbietung und 49%±33% für die Beep-Version. An

einem Tag erhöhte sich die Erkennungsrate vom ersten zum zweiten Test

zwischen 3,6% und 5,1%. Offline konnte eine listenabhängige Auswertung

durchgeführt werden. Für die Standardversion des FST variieren die mittleren

Erkennungsraten der 20-item-Listen zwischen 45% und 62%. Für die Listen

3,8,15 und 17 lagen die mittleren Erkennungsraten über 60 %. Die Listen 1, 12

und 14 lagen die Erkennungsraten unterhalb von 47%.

1.4 Praktische Schlussfolgerungen

Die Fehler zwischen den unterschiedlichen Listen liegen innerhalb der zu

erwartenden statistischen Fehlergrenzen, die bei 20 item Tests zu erwarten

sind. Obwohl auch in dieser Studie die Listenausgewogenheit unbefriedigend

blieb, unterscheiden sich die Ergebnisse zu früheren Untersuchungen bei

schwerhörigen Probanden. Die beobachteten Trainingseffekte des Tests liegen

unter denen, die in früheren Arbeiten beschrieben wurden.

3

2. Abstract

2.1 Background

The Freiburg Speech Intelligibility Test (FST) was presented more than fifty

years ago by Hahlbrock. Though lots of criticism arose it is still the most

commonly used speech test in german speaking countries. With modern digital

techniques the test can be performed easily within clinical acceptable times. On

the other side a number of disadvantages of this test were identified [13]. In

particular, the list equivalency with respect to intelligibility was called into

question and the practicability for speech perception in noise was criticized.

The aim of this study was to investigate the applicability of the FST for speech

perception measurements in noise and the list equivalency as tested in a

normally hearing collective.

2.2 Methods

Twenty young healthy volunteers (10 male, 10 female) took part in the study.

Freiburg monosyllabics were presented at 65 dB SPL with the presence of

background noise as delivered on the commercially available FST CD-ROM

(SNR = 0dB). Prior to investigation subjects were unfamiliar with the test

material. For each subject four speech recognition trials at two different days

with a distance of one week were performed. The FST was performed in three

different modi: A) monosyllabics (standard), B) monosyllabics repeated three

times according to the ‘Dreinsilber-Test’ (dreinsilber), and C) monosyllabics with

a 500 Hz announcing beep in advance to each word (beep). All subjects had to

perform modus A either at day 1 or day 2 (decided by random). At the other day

they performed either B or C (decided by random). For each trial all of the 400

words were presented once exactly. The order of the words within one trial was

randomly assigned. Data were analyzed according to differences between the

presentation modi, list equivalency and training effects caused by the repeated

presentation.

4

2.3 Results

For the standard, dreinsilber, and beep condition recognition rates were

53±32%, 66±31%, and 49±33%, respectively. From the first presentation to the

second presentation at the same day a mean increase in percentage

recognition was observed for all conditions: 3,6%, 4,0%, and 5,1%,

respectively. The reconstruction of the test item belonging to the same list was

performed post-hoc. When pooling the data over all subjects for the standard

presentation modus recognition rates varied between 45% and 62%. For list no.

3, 8, 15, and 17 recognition rates above 60 % were observed. For list no. 1, 12,

and 14 mean recognition rates below 47% were measured. Similar list were

obtained as ‘best’ and ‘worst’ for the other both presentation modi.

2.4 Conclusions

Measurement errors caused by unbalanced lists are within errors of standard

speech audiometric when only 20 items are used. Compared to earlier studies

in hearing impaired listeners only a part of the best and worst lists were found in

this study. Training effects observed in this study are smaller than earlier

described ones. This may be due to the randomized order of presentation of the

words.

5

3. Einleitung

3.1. Bedeutung der Sprachaudiometrie

Das Gehör ist einer der wichtigste Sinne des Menschen. Schwerhörige und

Gehörlose fühlen sich sehr häufig von der Gesellschaft ausgegrenzt, da das

Hören für die zwischenmenschliche Kommunikation unersetzlich ist. Das

Verstehen von Sprache ist die wichtigste soziale Funktion des Gehörs. Ohne

ein funktionierendes Gehör werden wir in unserer Kommunikationsfähigkeit

stark eingeschränkt, was sich beruflich sowie im Alltagsleben negativ auswirken

kann: „Wer nicht mehr richtig hören kann gerät sehr leicht in ein soziales

Abseits und Isolation, er wird zum Außenseiter der Gesellschaft“ [30]. Im Alltag

führt eine Hörbehinderung nicht nur zu Problemen in der Familie („ Mach doch

den Fernseher nicht immer so laut“), sondern auch zu einem erschwerten oder

gar verhinderten gesellschaftlichen Leben. Ein entscheidende Verbesserung

der Situation Hörgeschädigter stellte Anfang des Zwanzigstens Jahrhunderts

die Entwicklung elektrischer Hörgeräte dar [15]. Da die Menschen in den letzten

Jahrhunderten und Jahrzehnten, und vermutlich auch in der weiteren Zukunft

immer älter werden, hat die Anzahl der Patienten, die auf ein Hörgerät

angewiesen sind zugenommen und wird voraussichtlich auch weiter zunehmen.

Zusätzlich sind bei jedem zehnten Jugendlichen durch Freizeitlärm bedingte

Hörschäden zu befürchten [41]. Leider ist das Bewusstsein für die Wichtigkeit

eines funktionierenden Gehörs in dieser Altersgruppe oftmals noch nicht

vorhanden.

Um das Sprachverstehen quantifiziert erfassen und beurteilen zu können sind

sprachaudiometrischen Methoden unentbehrlich um das Leistungsvermögen

des individuellen „sozialen“ Gehörs beurteilen zu können. Diese Methoden

dienen der Begutachtung des Hörvermögens und der Evaluation von

therapeutischen Maßnahmen bei bestehenden Beeinträchtigungen des Gehörs.

Im deutschen Sprachraum existiert dafür eine Reihe von

sprachaudiometrischen Tests, die für unterschiedliche Zwecke geschaffen

wurden.

6

3.2 Anatomische und physiologische Grundlagen des Hörsystems

Das Hörsystem ist sehr komplex aufgebaut. Es besteht aus einem peripheren

Teil und aus einem zentralen Teil. Zum peripheren Teil zählt das äußeres Ohr,

das Mittelohr und das Innenohr (Pars cochlearis des Nervus

vestibulocochlearis) Zu dem zentralen Teil zählt die zentrale Hörbahn sowie die

subkortikalen und die kortikalen Hörzentren

Das äußere Ohr, bestehend aus Ohrmuschel und äußeren Gehörgang, ist

durch das Trommelfell vom Mittelohr abgegrenzt. Es erfüllt zwei Funktionen:

• Schutz des Trommelfells vor mechanischer Beschädigung

• Eine Schalldrucktransformation von Schall in freiem Feld zu Schall am

Trommelfell, wobei eine Schallpegelerhöhung von bis zu 20 dB auftritt.

Das Mittelohr umfasst die mit Luft gefüllte Paukenhöhle, die mit den

angrenzenden, pneumatischen Zellen in Verbindung steht. Sie enthält die

Gehörknöchelchen Hammer (Malleus), Amboss (Incus) und Steigbügel

(Stapes), die beiden Mittelohrmuskeln, Musculus tensor tympani und Musculus

stapedius sowie verschiedene Ligamente. Die Verbindung zum Innenohr wird

durch bewegliche Strukturen, das ovale und das runde Fenster hergestellt.

Über die Tuba auditiva besteht eine Verbindung des Mittelohres zum

Nasenrachenraum. Die Funktion des Mittelohres ist die Maximierung der

Übertragung des auf das Trommelfell auftreffenden Luftschalls in das mit

Flüssigkeit gefüllte Innenohr (Impedanzanpassung). Das Innenohr besteht aus

einer Anzahl untereinander in Verbindung stehender, flüssigkeitsgefüllter

Hohlräume (Labyrinth) und umfasst die Bogengänge (Verarbeitung von

Linearbeschleunigungen) und die Cochlea, die so genannte Schnecke

(Verarbeitung von akustischen Reizen). Der räumliche Aufbau der Cochlea ist

ein dreistöckiger Schneckengang. Dieser ist in drei Höhlräume unterteilt: Die

Scala vestibuli, die Scala tympani und die Scala media (der Ductus cochlearis).

Die Scala vestibuli öffnet sich gegen den Vorhof. Die Scala tympani schließt mit

dem runden Fenster gegen das Mittelohr ab. Diese beiden mit Perilymphe

gefüllten Scalae stehen an der Schneckenspitze durch das Helicotrema direkt

miteinander in Verbindung. Zwischen den Scalae liegt der mit Endolymphe

7

gefüllte Ductus cochlearis, der von der Scala vestibuli durch die Reissner-

Membran und von der Scala tympani durch die Basilarmembran getrennt ist.

Auf der Basilarmembran befindet sich das eigentliche „Wandlersystem“, das

Cortische Organ. Auf dem Cortischen Organ befindet sich eine Reihe innerer

Haarzellen und drei Reihen äußerer Haarzellen. die von der Tektorialmembran

bedeckt sind.

Wird der Steigbügel durch einfallende Schallwellen in Bewegung gesetzt, so

überträgt er die Schallenergie auf die Flüssigkeitssäule in der Scala vestibuli.

Die Schwingungen in den Flüssigkeitssäulen der Scalae führen zu einer

charakteristischen Schwingungsform der Basilarmembran, die als Wanderwelle

bezeichnet wird. Dabei nimmt die Amplitude der Basilarmembran Auslenkung

von der Basis zur Spitze hin zu, erreicht ein Maximum und geht dann wieder auf

Null zurück. Das Bewegungsmuster der Basilarmembran ist auf Grund der von

der Basis zur Spitze hin abnehmenden Elastizität der Basilarmembran und der

Kanaltiefe frequenzabhängig. Unterschiedliche Frequenzen bewirken daher

eine maximale Amplitude der Wanderwelle an unterschiedlichen Orten der

Basilarmembran. Für die Aufnahme der mechanischen, auditorischen Reize im

Innenohr, der Umwandlung zu elektrischen Signalen und deren Weiterleitung

an den Hörnerv sind die inneren Haarzellen zuständig. Mit der Innervierung des

Cortischen Organs der Cochlea durch den Hörnerv beginnt die Hörbahn, die

einschließlich der Hörzentren und der Hörrinde ein leistungsfähiges

Verarbeitungs-, Kodierungs- und Dekodierungssystem darstellt [3].

Verzweigungen der Hörnervfasern ziehen vom Cortischen Organ zu den

Cochleariskernen und weiter zur oberen Olive und zum Nucleus accessorius. In

diesem werden erstmals auch kontralaterale Impulse empfangen und es kann

somit ein Intensitäts- und Laufzeitvergleich der rechten und der linken Seite

(Richtungshören) erfolgen. Nach weitgehender Kreuzung der Fasern auf die

Gegenseite führt die Hörbahn weiter über den Thalamus und erreicht

schließlich den auditorischen Kortex [28].

8

3.3 Klassische Hörprüfungen

Als klassische Hörprüfungen werden insbesondere die Stimmgabeltests von

Weber und Rinne, sowie die Hörweitenprüfung bezeichnet. Obwohl mittlerweile

vorwiegend elektroakustische Untersuchungsmethoden genutzt werden, haben

die klassischen Hörprüfungen immer noch eine besondere Bedeutung, da sie

eine schnelle und orientierende Aussage über Sitz und Ausmaß einer

Hörstörung liefern [3]. Der Stimmgabeltest dient der primären Differenzierung

zwischen Mittelohr- und Innenohrschwerhörigkeit. Beim Weber-Versuch (1834)

wird die linkseitige und die rechtsseitige Knochenleitung der beiden Ohren

miteinander verglichen. Beim Rinne-Versuch (1855) hingegen wird die

Knochleitung und die Luftleitung der einzelnen Ohren links und rechts separat

miteinander verglichen. Dem Rinne- und dem Weber Versuch kommt im

klinischen Alltag nur ein orientierender Wert zu. Wegen der Einfachheit der

Durchführung sind diese Tests jedoch wichtige Verfahren der Audiometrie. [19].

Die Prüfung der Hörweite für Flüster- und Umgangssprache ist trotz der

modernen Sprachaudiometrie, vor allem für die Begutachtung, auch heute noch

eine zusätzliche Hilfe für die Bewertung der audiometrischen Befunde [3].

Allerdings ist für die Prüfung ein schallgedämpfter Raum mit einer Mindestlänge

von 6 Metern notwendig. Für diese ebenfalls orientierende Hörprüfung, gibt es

viele mögliche Fehlerquellen, die die Vergleichbarkeit der Ergebnisse

erschweren. So wird z.B. bei jedem Test unterschiedliches Prüfmaterial

verwendet, die Tonhöhe und Artikulation der Sprecher variieren und die

Störpegel der verwendeten Raume sind unterschiedlich [3]. Alle genannten

Hörprüfungen werden zur Überprüfung audiometrischer Ergebnisse von vielen

Otologen routinemäßig benutzt [26]. Die Aussagekraft ist allerdings deutlich

unpräziser als die aktueller audiometrischer und otologischer

Diagnoseverfahren [26].

9

3.4 Die Tonaudiometrie

Grundsätzlich werden die Audiometrieverfahren in zwei große Gruppen

aufgeteilt: Die Tonaudiometrie und die Sprachaudiometrie. Dabei ist die

Ermittlung der Hörschwelle mittels eines Tonaudiometers die Grundlage der

audiologischen Diagnostik [3]. Dem Probanden werden Töne von

Sinusschwingungen bestimmter Frequenzen mit wachsender Lautstärke

angeboten. Die Änderung der Lautstärke kann dabei je nach gewünschter

Genauigkeit in 5 dB-Schritten oder in 1-dB-Schritten erfolgen. Dabei wird der

Zeitpunkt bestimmt, an dem der Proband angibt den Prüf-Ton erstmals zu

hören. Der zu untersuchende Frequenzbereich liegt vorwiegend zwischen 125

Hz und 10 kHz, wobei bis 500 Hz meist in Schritten von ganzen Oktaven und

oberhalb in Schritten von halben Oktaven geprüft wird [3]. Die Prüfung wird

monaural durchgeführt, während das andere Ohr gegebenenfalls vertäubt wird,

um ein „überhören“ des Prüf-Tones auf das eventuell besser hörende Ohr zu

vermeiden.

Die Messungen werden sowohl für Luft- als auch für Knochenleitung

durchgeführt. Es kann daher mittels eines Vergleichs beider Ergebnisse eine

Diagnostik betrieben werden. So kann zum Beispiel anhand eines

Audiogramms oft eine Mittelohrschwerhörigkeit von einer

Innenohrschwerhörigkeit oder einer Kombination aus beidem abgegrenzt

werden. Bei cochleären- und bei retrocochleären Schäden sind im Allgemeinen

die Messwerte für Luft- und Knochenleitung identisch. Bei cochleären Schäden

ist der Transduktionsprozess im Innenohr gestört während bei retrocochleären

Schäden die zentrale Verarbeitung nach der Cochlea gestört ist. Bei

Mittelohrschäden hingegen ist nur die Schallübertragung durch das Mittelohr

betroffen. In diesem Fall sind lediglich die Messwerte der Luftleitung

verschlechtert [14] während die Ergebnisse der Knochenleitung immer noch

denen eines Normalhörigen entsprechen.

Bei allen tonaudiometrischen Verfahren muss allerdings stets bedacht werden,

dass ein Mensch mit seinen subjektiven Empfindungen Auskunft über Hören

und Nichthören gibt. Es handelt sich bei den audiometrischen Messungen also

um subjektive Tests bei denen Konzentration und Reaktionsgeschwindigkeit

10

stets auch einen großen Einfluss auf das Ergebnis haben [19]. Weiterhin zu

beachten ist, dass ein Tonaudiogramm zum einen die Grundlage einer jeglicher

audiologischen Diagnostik darstellt, zum anderen jedoch keine Aussagen über

die Verarbeitung der im täglichen Leben auftretenden akustischen Reize,

insbesondere der Sprache, gestattet.

11

3.5 Allgemeine Kennzeichen der Sprachaudiometrie

Das alleinige Wissen um die tonaudiometrisch erhobenen Hörschwellen eines

Patienten reicht nicht aus, um das Ausmaß seiner Hörstörung im Alltag zu

erfassen. Das Verstehen eines gesprochenen Wortes stellt eine komplexe

Anforderung an das Gehör dar. Im Gegensatz zu den im Tonaudiogramm

verwendeten akustischen Reizen (Töne im Schwellenbereich) besteht das

Schallsignal der Sprache aus einem breiten Frequenzspektrum. Die Pegel der

Frequenzen erstrecken sich weit in den überschwelligen Bereich und verändern

sich teilweise sehr deutlich in Zeitabschnitten von Millisekunden [31]. Um

Aussagen über die Sprachverständlichkeit eines Patienten zu erhalten, ist

daher eine Hörprüfung unter Verwendung von Sprache als Prüfmaterial

notwendig: Aussagen über die gesamte Funktion von Hörbahn und

Wahrnehmung erhält man mittels Sprachaudiometrie [38]. An Stelle der

physikalisch definierten Testsignale treten Silben, Wörter, Sätze (einsilbig oder

mehrsilbig), die möglichst repräsentativ für die verwendete Sprache und ihre

Phoneme zusammengestellt sind. Diese werden über CD und Audiometer

vorgespielt und müssen von den Versuchspersonen nachgesprochen werden.

Der Anteil der korrekt nachgesprochenen Wörter in Prozent wird dann als

prozentuales Sprachverstehen bei dem entsprechenden Darbietungspegel

interpretiert. Der Grad der Übereinstimmung wird dann mit Werten einer Gruppe

von Normalhörenden verglichen. Bezugspunkt stellt die so genannte

Sprachverständlichkeitsschwelle dar. Sie ist definiert als der minimale Pegel

des Sprachschalls, bei dem 50% der Testeinheiten (Items) richtig verstanden

werden [3]. In den sprachaudiometrischen Ergebnissen zeigen sich nicht nur

die Leistung des peripheren Gehörs, sondern ebenso die höheren soziativen

Fähigkeiten wider insofern, als dass sich der Proband bemüht, ein Wort zu

verstehen, von dem er vielleicht nur einzelne Sprachlaute erfasst hat [18]. Das

verwendete Sprachmaterial sollte innerhalb einer Testgruppe von gleicher

Lautstärke sein. Das Testmaterial für die Sprachaudiometrie soll außerdem von

Gruppe zu Gruppe gleichwertig sein so dass die einzelnen Gruppen

untereinander phonetisch ausgewogen sind. Die Wortlängen und Vokalstellung

in den Gruppen wären praktisch identisch. Die Sprachaudiometrie mit Sätzen ist

wirklichkeitsgetreuer als mittels Zahlen oder Wörtern, mit denen man die

Sprachverständlichkeitsschwelle ermittelt. Der Satztest gibt eher Auskunft über

12

das Sprachverstehen Schwerhöriger im alltäglichen Leben. Mittels

Sprachaudiometrie können die Auswirkungen der Verstärkung eines Hörgerätes

erfasst werden. Darüber hinaus kann Sprachaudiometrie mit Störschall (mit

Lautsprechern im Freifeld) spezialisierte Funktionen eines Hörgeräts

überprüfen, wie z.B. eine Störgeräuschunterdrückung. Dementsprechend sind

die Hauptanwendungsbereiche der Sprachaudiometrie Fragestellungen, bei

denen die Sprachverständlichkeit im Mittelpunkt steht, wie die Verbesserung

der Sprachverständlichkeit durch eine Hörgeräteversorgung bzw. einen

operativen Eingriff, sowie die quantitative Bewertung von Hörschäden im

Rahmen der Begutachtung. Ein grundlegendes Problem bei der

Sprachaudiometrie ist die hohe Zahl von Variablen, die bei einem bestimmten

Test berücksichtigt werden müssen. Zu diesen Variablen gehört auch die Art

des Tests. Bei den so genannten offenen Tests soll der Proband die ihm

dargebotenen Test Items möglichst korrekt wiederholen. Bei den

geschlossenen Tests bezeichnet der Proband das richtige Test Item aus einer

Liste von möglichen Antworten. Weitere Variablen sind zusammengefasst nach

Kießling und Kollmeier [13, 16]:

• Art und Länge der Test Items

(z.B. einsilbige oder mehrsilbige Wörter oder Sätze)

• Auswertungsmethode

(Bewertung richtig erkannter Phoneme, Silben, Wörter oder Sätze)

• Sinngehalt (sinnleer/sinnhaltig)

• Ankündigung (ohne/mit, Satz akustischer Stimulus, Wortwiederholung)

• Sprecher (männlich/weiblich, geschult/ungeschult, synthetische Sprache)

• Störgeräusch

(ohne/mit, Modulationsgrad, Spektrum, Dauer, Darbietungsrichtung von

Nutzschall und Störschall)

• Automatisiert/computergesteuert durchführbar (ja/nein).

13

Jedes der gebräuchlichen Sprachtestverfahren besitzt eine eigene Kombination

dieser Variablen, so dass sich die Testergebnisse nur schwer miteinander

vergleichen lassen. Zudem ist die Festlegung der Variablen abhängig vom

Einsatzzweck des Tests. Beispielsweise steht bei der Diagnostik von

Hörstörungen die analytische Aussagekraft des Tests im Vordergrund, d.h. die

Möglichkeit aus den auftretenden Phonemverwechslungen Rückschlüsse auf

das gestörte Hörsystem zu ziehen. Bei der Begutachtung stehen dagegen eher

eine hohe Reproduzierbarkeit und Genauigkeit des Tests, sowie eine hohe

Repräsentanz des Sprachmaterials für die alltägliche Kommunikation im

Vordergrund [16]. Die Sprachaudiometrie gehört unbestritten zu den Eckpfeilern

des audiometrischen Instrumentariums und ist integraler Bestandteil der

audiologischen Diagnostik, der Begutachtung sowie der Hörgeräteindikation

und -Evaluation [13].

3.6 Mainzer Test und Göttinger Test für Kinder

Die oben genannten Sprachtests sind für Erwachsene Hörer entwickelt worden

und daher für Kinder im Alter von unter 6 Jahren eher ungeeignet, da deren

verfügbarer Wortschatz noch deutlich kleiner ist. Aufgrund dieser Problematik

wurden spezielle sprachaudiometrische Tests für Kinder entwickelt. Ein Beispiel

dafür ist der Mainzer Kindersprachtest. Er besteht aus drei Teilen zu je fünf

Gruppen mit zehn Wörtern, wobei die Gruppen unterschiedliche

Schwierigkeitsgrade aufweisen. Das akustisch präsentierte Sprachmaterial wird

zusätzlich durch eine Reihe von Bildserien optisch unterstützt. Analog zu

diesem Mainzer Test baut der Göttinger Kindersprachverständnistest auf den

gleichen Prinzipien auf, wobei das „Göttinger“ Sprachmaterial aus Einsilbern

besteht und daher zur Auswertung von Phonemverwechslungen verwendet

werden kann.

14

3.7 Göttinger Satztest

Der Göttinger Satztest nach Wesselkamp et al. ist eine Weiterentwicklung des

Marburger Satztests. Die relativ geringe Zahl an Testlisten und die schnelle

Aufsprache schränken seinen Einsatz bei höhergradigen Hörstörungen jedoch

ein [4]. Der Göttinger Sprachtest besteht aus 20 Listen zu je 10 Sätzen sowie 5

Übungslisten mit je 12 Sätzen und ist computergesteuert durchführbar. Diese

wurden aus dem Marburger Satztest, dem Satztest von Sotscheck und 200

weiteren Sätzen ausgewählt. Ausgehend von einem Inventar von 324 Sätzen

wurde bei der Zusammenstellung der Listen auf eine nahezu identische

Diskriminationsfunktion, gleiche Wort- und Phonemzahl und eine jeweils an die

deutsche Sprache angepasste Phonemverteilung geachtet [39]. Der Ausgang

der Messung ist somit nicht von der Wahl der Testlisten abhängig. Als Nachteil

des Göttinger Satztests führen Wagener, Kühnel und Kollmeier die teilweise

sehr hohe Redundanz der Testsätze an [34]. Müller-Deile bemängelt die zu

geringe Anzahl von Testlisten für vergleichende Messungen in der Cochlea–

Implantat- und Hörgeräteentwicklung [21]. Welzl-Müller nennt als

Anwendungsbereich des Göttinger Sprachtests die quantitative Bewertung

eines Hörerfolges durch eine Hörgeräteversorgung sowie

Sprachverständlichkeitstests mit hochgradig Hörgeschädigten [3]. Die Nutzung

von Sätzen zur Beurteilung einer Hörstörung stellt eine entscheidende

Annäherung an die kommunikative Alltagssituation der Patienten dar. Ein

grundlegendes Element der täglichen Verständigung wurde jedoch auch hier

noch nicht miteinbezogen: Neben der eigentlichen Sprachquelle wird das Gehör

ständig mit Störschall konfrontiert. In der Audiometrie werden daher entweder

bestehende Tests, wie der Freiburger Sprachtest, mittels Störschall modifiziert

oder neuere Testverfahren genutzt, welche Störschall bereits in die Konzeption

mit einbeziehen.

15

3.8 Hochmair-Schulz-Moser Test (HSM Satztest)

Hochmair-Desoyer, Schulz und Moser entwickelten 1996 den HSM-Satztest,

speziell für die wiederholte Messung der Sprachverständlichkeit von hochgradig

Schwerhörigen und Cochlea-Implantierten (CI-Träger). Aufgrund dieser

Bestimmung wird eine langsame Sprechgeschwindigkeit von 3,7 Silben pro

Sekunde und ein Sprecher mit guter Verständlichkeit verwendet [10, 24]. Im

Gegensatz zu den primär analog auf Tonband gespeicherten CD- Kopien des

Marburger Satztests, die immer noch das Bandrauschen des Originals enthielt,

wurde der HSM-Satztest unmittelbar digital aufgezeichnet und direkt auf CD

verfügbar gemacht. Zusätzlich ist auf der CD des HSM-Tests ein genormtes

Störgeräusch verfügbar.

Schon die ersten Untersuchungen wiesen auf unterschiedliche Ergebnisse bei

Tests mit und ohne Störschall hin [20]. Nach verschiedenen Modifikationen

steht er für unsere Untersuchungen in der Computerversion zur Verfügung. Die

Testsätze werden dabei als Wave Datei direkt vom PC eingespielt, eine

automatische Pegelanpassung in Abhängigkeit von der vorangegangenen

Patientenantwort ist ebenfalls möglich. Neben dem vorgegebenen Nutz- und

Störschallpegel kann auch der Test an sich modifiziert werden. So steht neben

dem HSM-Standardtest eine Modifikation nach Bocca und Calearo mit

verschiedenen, so genannten Chopper-Frequenzen zur Verfügung. Das

ausgegebene Nutzsignal wird dabei mit vorgegebener Frequenz zerhackt und

abwechselnd von beiden Lautsprechern eingespielt. Der HSM–Test bietet mit

seinen verschiedenen Varianten neben der Betreuung von Patienten mit

Cochlea-Implantaten weitere Einsatzmöglichkeiten. So ist beispielsweise

sowohl bei der Auswahl als auch bei der Beurteilung der Leistungsfähigkeit

eines Hörgerätes ein Sprachtest mit Störlärm von großer diagnostischer

Bedeutung. Eine steigende Leistungsfähigkeit von Hörgeräten kann nur mit

möglichst alltagsnahen Testmethoden verifiziert werden. Wie langfristige

Nachuntersuchungen zeigten, hängt der Erfolg einer Hörgeräteversorgung

weniger von der maximalen Einsilberverständlichkeit als von der

Satzverständlichkeit bei Störlärm ab [3]. Für eine optimale Anpassung und für

16

die Auswahl eines geeigneten Hörgerätes erscheint ein

Satzverständlichkeitstest mit Störgeräusch heute als unverzichtbar [19].

3.9 Reimtest nach Sotscheck

Eine weitere Sprachverständlichkeitsprüfung mit Wörtern ist der Reimtest nach

Sotscheck [29]. Dieser geschlossene Test wurde ursprünglich für die

Nachrichtentechnik, also zum Beispiel für die Überprüfung von Telefonleitungen

entwickelt. Um eine Anwendung in der Sprachaudiometrie zu ermöglichen,

wurden Modifikationen von Kollmeier et al. [17] durchgeführt. Bestehende

Probleme sind jedoch unter anderem der hohe apparative Aufwand und eine

begrenzte Homogenität des Testmaterials [17].

3.10 Marburger Sprachverständlichkeitstest

Der Marburger Sprachverständlichkeitstest ist neben dem Freiburger

Sprachtest ein weiterer, mit einer DIN-Norm versehene

Sprachverständlichkeitstest (DIN 45621, Teil 2) [7]. Allerdings findet er

zunehmend weniger Verwendung [37]. Er besteht aus 20 Testlisten zu je 10

Sätze [3]. Damit das Wortmaterial der Phonemverteilung der deutschen

Sprache entspricht, wurden im Test teilweise unvollständige Satzkonstruktionen

verwendet. Die Nachbildung einer alltagsnahen Sprachsituation wird damit

verfälscht. Darüber hinaus fällt bei dem Test die überdeutlich artikulierte

Aufsprache des geschulten Sprechers auf [34].

3.11 Oldenburger Satztest

Der Oldenburger Satztest wurde 1999 speziell für die Messung von

Sprachverständnis im Störgeräusch von Wagener, Brand und Kollmeier [33]

entwickelt. Bei diesem Satztest wird bei konstantem Pegel des Störgeräuschs

das Signal-Rausch-Verhältnis (Signal to Noise Ratio, SNR) variiert und somit

die Sprachverständlichkeitsschwelle im Störgeräusch bestimmt. Die

17

Sprachverständlichkeitsschwelle entspricht 50 % Sprachverständlichkeit, wobei

die Anzahl der richtig verstandenen Wörter gezählt wird. Der Oldenburger

Satztest ist ein geschlossener Test und besteht aus einem Wörtervorrat von je

10 Vornamen, Verben, Zahlen, Adjektiven und Objekten. Durch Randomisieren

dieses Wortmaterials entstehen teilweise wenig sinnvolle und daher auch kaum

vorhersagbare Sätze mit identischer Satzstruktur Dies hat den Vorteil, dass die

Listen sich kaum auswendig lernen lassen und daher wiederholt gemessen

werden können [22]. Insbesondere bei den Vornamen gibt es große

Unterschiede in der Verständlichkeit. Durch Optimierung des Sprachmaterials

und Korrektur der Pegelabweichungen konnte jedoch eine hohe Homogenität

der einzelnen Listen erreicht werden. Der OLSA ist besonders gut für

Messungen mit Schwerhörigen und Cochlea Implantierten geeignet. Es wird

auch hier wieder deutlich, dass jede Testanforderung einen entsprechenden

Test erfordert. So ist beispielsweise für eine Verlaufskontrolle die regelmäßig

wiederkehrenden Messungen erfordert, wie sie z.B. bei CI – Patienten

durchgeführt werden, ein besonders umfangreiches Angebot an Testsätzen

nötig um einen Lerneffekt auszuschließen. Dagegen wird es für eine einmalige

Untersuchung in besonderem Maße auf die Ausgewogenheit der Testlisten

ankommen. Weitere Fragestellungen, wie zum Beispiel arbeitsrechtliche

Untersuchungen, werden entsprechend normierte Testsituationen mit

maximaler Vergleichbarkeit besonders in den Mittelpunkt stellen. Tests mit

einsilbigem Sprachmaterial haben den Vorteil einer geringen Redundanz (d.h.

aus einem richtig erkannten Teil eines Wortes kann nicht auf den anderen,

unverständlichen Teil des Wortes geschlossen werden) und bieten eine hohe

analytische Aussagekraft bei den auftretenden Phonem Verwechslungen.

Zweisilber-Tests sind für die deutsche Sprache eher repräsentativ als die

Einsilber-Tests, da Zweisilber im Deutschen häufiger auftreten. Die Sprachtests

mit Sätzen bieten dagegen eine sehr realitätsnahe Kommunikationssituation

[16].

18

3.12 Freiburger Sprachverständlichkeitstest

Unter den bestehenden Tests ist der Freiburger Sprachverständnistest (FST)

nach Hahlbrock (1957) wohl der bekannteste und am häufigsten angewandte

[25]. Er wurde 1973 in einer Industrienorm fixiert (DIN 45621). Der FST findest

sowohl bei Erwachsen als auch bei Schulkindern Verwendung. Im

bundesdeutschen Krankenkassensystem ist das mit dem FST gemessene

Sprachverständnis eine entscheidende Größe für die Indikationsstellung und

die Erfolgskontrolle von Hörgeräteversorgungen. Für diese Zwecke werden die

Einsilberverständlichkeiten sowohl in ruhiger Umgebung als auch in definiertem

Störschall bestimmt. Der Freiburger Sprachverständlichkeitstest besteht aus 10

Gruppen mit je 10 zweistelligen Zahlen (Mehrsilber) und 20 Gruppen mit je 20

einsilbigen Prüfwörtern (Einsilber-Testmaterial, siehe Abbildung 1). Die

Versuchsperson ist angewiesen, das gehörte Wort zu wiederholen und der

Testleiter vermerkt die richtige oder die falsche Erkennung. Der Freiburger

Sprachtest ist nicht automatisiert. Die Erkennungsrate ergibt sich direkt aus der

Anzahl der richtig wiederholten Darbietungen in Prozent. Ein richtiges Wort trägt

also mit 5 Prozent und eine richtige Zahl mit 10 Prozent zur Erkennungsrate

bei.

3.13 Freiburger Sprachverständlichkeitstest in der Anwendung

Obwohl der Test in der Zwischenzeit oftmals kritisiert wurde, gilt er heute immer

noch als der in der Praxis am meisten angewandte Sprachverständlichkeitstest,

was sicherlich auch auf seine leichte Anwendung und Auswertung

zurückzuführen ist. Besonders das Einsilber-Testmaterial wurde häufig kritisiert,

da es nach aktuellen Maßstäben mittlerweile eine Reihe von Schwachstellen

aufweist. Als wichtigste Kritikpunkte werden häufig das begrenzte Testmaterial,

die statistisch begrenzte Aussagekraft und die Unausgewogenheit der

Testlisten genannt [11]. So wurde zum Beispiel in verschiedenen Studien von

19

Alich, Bangert, Kießling und Kollmeier [1, 2, 13, 16] gezeigt, dass die einzelnen

Listen im Hinblick auf ihre Verständlichkeit nicht gleichwertig sondern

unausgewogen sind. Die Erkennungsrate hängt also nicht nur von der

Sprachverständnisleistung des Probanden ab, sonder zusätzlich auch von der

gewählten Liste. Von Wedel [36] untersuchte die Verständlichkeit des FST an

einer Gruppe von Normalhörigen in den beiden Situationen Sprache in Ruhe

bei 30dB und Sprache im Störschall bei 70 dB Sprachpegel und einem SNR

von +10dB. Für beide Testsituationen (Ruhe/Störschall) wurden qualitativ

ähnliche Ergebnisse erhalten: Bei den Testlisten 1, 8 und 15 war das

Sprachverstehen um mehr als eine Standardabweichung besser als der

Gesamtmittelwert. Bei den Testlisten 14, 19 und 20 lag das Verständnis um

mehr als eine Standardabweichung unterhalb des Gesamtmittelwertes. Als

mögliche Ursache für die unterschiedlichen Verständlichkeiten wurde neben

dem unausgewogenen Sprachschallpegel der Einzelwörter auch der

unterschiedliche Bekanntheitsgrad der einzelnen Testwörter sowie die

Wahrscheinlichkeit, ein einzelnes Wort mit einem anderen existierenden Wort

zu verwechseln, diskutiert [9, 13]. Die Bekanntheitsgrade und

Verwechslungswahrscheinlichkeit der Einsilber wurden bei der Erstellung des

FST nicht ins Kalkül mit einbezogen. Ein weiterer Nachteil des Tests ist das

beschränkte Testmaterial: Mit nur zwanzig Listen kommt es im Verlauf von

wiederkehrenden Testsituationen häufig zu einer wiederholten Darbietung einer

Liste. Dieses Training könnte zu einem besseren Testergebnis bei

Wiederholungsmessungen führen.

Zusätzlich ist die Aussagekraft einer einzelnen Messung des

Sprachverständnisses mit nur einer Liste -also zwanzig Testwörtern – aus

statistischen Gründen begrenzt: Erstmals wies Thornten darauf hin, dass eine

Sprachverständlichkeitsmessung mit n Testwörtern und k korrekt verstandenen

Wörtern statistisch als eine Binomialverteilung B (n, p, k) interpretiert werden

kann [32]. Dabei steht p für die tatsächliche Verständlichkeit. Liegt diese bei

z.B. 50%, so liegt das Ergebnis eines Sprachtests mit 20 Testwörtern in 95%

der Fälle zwischen 20% und 80%. Somit kann eine Veränderung im

Testergebnis um 20% auch durch häufig aus rein statistischen Gründen

zustande kommen. Weitere häufig vorgebrachte Kritikpunkte am Freiburger

Einsilber-Test sind das Fehlen eines geeigneten Störschalls, das Fehlen eines

20

Ankündigungssignals, die fest vorgegebene Wortfolgefrequenz, die fehlende

Analyse von Phonemfehlinterpretationen sowie die nicht vorhandene adaptive

Pegelsteuerung [5, 8, 35, 37, 38]. Wegen der offenen Antwortmöglichkeiten ist

ein automatisierter (computergesteuerter) Testablauf ebenso wenig möglich wie

eine Analyse von Phonem-Verwechslungen. Die Aussprache ist veraltet und

weist eine übertriebene Artikulation der Testwörter sowie eine unnatürliche

Pegelnivellierung auf. Die Phonemverteilung entspricht zwar der deutschen

Sprache, aber Phonemübergänge wurden bei der Konzeption der Testlisten

nicht berücksichtigt [1].

Trotz dieser gehäuften Kritik, ist der FST immer noch der Standard in Kliniken,

bei der Hörgeräte Versorgung und in Hals-Nasen-Ohrenärztlichen Praxen [12].

Aus diesem Grund wurde der FST in der vorliegenden Studie erneut auf seine

Praxistauglichkeit hin untersucht. Zwei weitere Studien haben ergeben, dass

die Ausgewogenheit und Vergleichbarkeit zwischen den einzelnen Gruppen

nicht gegeben, oder zumindest fragwürdig ist [1, 2]. Allerdings waren die

Probanden dieser beiden Studien schwerhörige Jugendliche. Eine weiter

umfangreiche Studie mit Normalhörigen (n=16) lieferte ähnliche Ergebnisse

[36]. Allerdings ist der Quelle nicht zu entnehmen, ob die Testwörter

randomisiert dargeboten wurden und ob ein eventuell vorhandener Lerneffekt

bei den zwei verschiedenen Versuchen berücksichtigt wurde [36]. Aufgrund

dieser Unsicherheiten haben wir uns daher entschlossen, eine weitere Studie

mit 20 freiwilligen Normalhörigen durchzuführen. In dieser vorliegenden Studie

soll die Anwendbarkeit des FST für Sprachverständlichkeitsmessungen im

Störgeräusch in Hinblick auf Ermüdungsphänomene, Trainingseffekt und

Listenausgewogenheit untersucht werden. Hierzu wurde das Sprachverständnis

von Normalhörigen bei festem Signal-Rausch-Verhältnis für alle Testwörter

(n=400) des Freiburger Tests bestimmt.

21

Abbildung 1: Der Freiburger Sprachverständlichkeitstest (FST) unterteilt

sich in einen Zahlentest und in einen Wörtertest. Die Mehrsilbigen Zahlen

werden in 10 Gruppen à 10 Zahlen wiedergegeben. Die Einsilbigen

Wörter (Substantive) werden in 20 Gruppen à 20 Wörter präsentiert.

22

4. Material und Methoden

4.1 Versuchspersonen

Zwanzig junge und gesunde erwachsene Freiwillige (10 Frauen, 10 Männer,

jeweils ohne audiologische Krankengeschichte) nahmen als Probanden an

dieser Studie teil. Die Muttersprache aller Teilnehmer war Deutsch und ihr Alter

lag zwischen 21 und 30 Jahren (Durchschnittsalter 24.7 Jahre). Die Probanden

verfügten über ein beidseitig normales Hörvermögen: Die Hörschwellen für Luft-

und Knochenleitung waren bei den Frequenzen 0.125, 0.250, 0.5, 1, 2, 3, 4, 6,

8, 10 Kilohertz stets besser als 20 dB HL. Die Tympanogramme hatten einen

regelrechten Verlauf (Typ A). Die otoakustischen Emissionen (TEOAE) wurden

bei allen Versuchspersonen mit einer Reproduzierbarkeit von mehr als 60%

nachgewiesen. Der OAE-Pegel lag bei allen Probanden über 6 dB. Die

Teilnehmer waren vor der Untersuchung nicht mit dem Freiburger Test vertraut.

4.2 Verfahren

Die kommerziell verfügbaren CD-Versionen des Freiburger

Sprachverständlichkeitstests (CD Westra Nr. 1, Claus Wunderlich) wurden

unter Verwendung eines kalibrierten klinischen Standard-Audiometers (Auritec

AT9000, Kopfhörer Sennheiser HDA200) in einem schalldichten Raum

abgespielt. Der Darbietungspegel der Sprache wurde zu angenehmen 65 dB

SPL (Sound Pressure Level) gewählt. Das aus demselben Lautsprecher

kommende, zusätzliche Störgeräusch hatte einen Pegel von 67 dB (SNR = -

2dB) um mittlere Verständlichkeit von ca. 50 % zu erzielen. Als Störgeräusch

wurde das auf der Test CD enthaltene sprachverdeckte Rauschen verwendet.

Die Stimuli wurden durch eine selbst programmierte Matlab Software

wiedergegeben. Es wurde darauf geachtet, dass das sprachverdeckende

Dauerrauschen mindestens 500 ms vor dem ersten Wort anfing und erst

23

mindestens 500 ms nach dem letzten Wort endete. Die Stimuli wurden den

Testpersonen im freien Schallfeld aus einem Lautsprecher bei 0° Azimut in 1,5

Meter Entfernung präsentiert. Die 400 Wörter stammen aus den 20 Testlisten

zu je 20 Wörtern und wurden zu einer einzigen Liste mit 400 Wörtern

zusammen gefügt. Diese neue Liste wurde bei jeder Präsentation in einer

unterschiedlichen, randomisierten Reihenfolge wiedergegeben. Die Probanden

wurden vor Versuchsbeginn in das Testverfahren eingeführt: Die Aufgabe der

Teilnehmer war es, das jeweils vorgespielte Wort für alle vierhundert Testwörter

zu wiederholen. Die zufällige Reihenfolge der präsentierten Wörter wurde bei

jedem Test neu generiert, das heißt es gab keine Tests mit derselben

Reihenfolge der Wörter. Die Erkennungsrate der einzelnen Wörter ist somit

unabhängig von der Position der Wörter auf der ursprünglichen Test-CD. Der

Versuchsleiter befand sich in demselben schalldichten Raum wie der Proband

und bewertete seine Antworten jeweils als richtig oder falsch und gab diese

Antwort zur weiteren Analyse in eine MATLAB basierte Datenbank ein. Die

Antworten der Testpersonen wurden zusätzlich mit einem digitalen

Audiorecorder (R-4 Festplattenrecorder der Firma Edirol) aufgenommen, um die

Möglichkeit einer nachträglichen Kontrolle zu ermöglichen.

Es wurden insgesamt drei Präsentationsmodi zum Vergleich entworfen

(Standard, Beep und Dreinsilber, siehe Abbildung 2). Jede Testperson

absolvierte die Standard-Präsentation und jeweils eine der anderen beiden

Präsentationsmodi. Die Testpersonen nahmen dabei an insgesamt vier

Sitzungen teil, die auf zwei verschiedenen Tagen zu je zwei Sitzungen

aufgeteilt wurden. Dabei wurden Test und Retest eines Präsentationsmodus

immer am selben Tag durchgeführt, mit einer Pause von maximal einer Stunde.

Der zweite Präsentationsmodus mit Test und Retest wurde ein bis zwei

Wochen später durchgeführt. Die Dauer eines Versuchs mit Test und Retest lag

bei durchschnittlich 60 bis 90 Minuten. Die Aufteilung der Probanden auf die

Präsentationsmodi ist in der folgenden Liste dargestellt:

• Standard (nur Einsilber): 20 Teilnehmer

• Beep (Einsilber mit Ankündigungssignal): 10 Teilnehmer

• Dreinsilber (dreifache Einsilberwiederholung): 10 Teilnehmer

24

Das Ankündigungssignal in dem „Beep“ Präsentationsmodus war eine 100 ms

dauernde Überlagerung zweier Sinustöne mit den Frequenzen 500 Hz und 1

kHz. Um Knackgeräusche zu vermeiden, wurde ein Tangens hyperbolicus als

Hüllkurve verwendet. Der Ankündigungston wurde mit 70 dB vor jedem

Einsilber präsentiert (SNR=+3 dB). Die Einsilber wurden 400 ms nach dem

Ende des Ankündigungssignals gespielt, also exakt 0,5 Sekunden nach dessen

Beginn. Der Präsentationsmodus „Dreinsilber“ ist der Einsilber Test mit einer

dreifachen Wiederholung der einzelnen Wörter, der auch als 'Dreinsilber Test'

[40] bekannt ist. Der Abstand zwischen den Anfängen aufeinander folgender

Einsilber betrug jeweils 1500 ms, d.h. 1500 ms nach Beginn des ersten

Einsilbers folgte die erste Wiederholung des Einsilbers. Nach erneuten 1500 ms

erfolgte die zweite Wiederholung. Bei Probanden gab es zwei Untergruppen.

Die erste Untergruppe à 10 Personen absolvierte die „Präsentationsmodi

„Standard“ und „Beep“. Davon belegten 5 Personen den Standard Modus am

ersten Versuchstag („Standard 1“ im Test und „Standard 2“ im Retest) und

weitere 5 Personen den Beep Modus am ersten Versuchstag („Beep 1“ im Test

und „Beep 2“ im Retest). Die zweite Untergruppe à 10 Personen absolvierten

die Präsentationsmodi „Standard“ und „Dreinsilber“. Auch bei dieser

Untergruppe belegten jeweils 5 Personen den Standard Modus am ersten Tag

(„Standard 1“ im Test und „Standard 2“ im Retest) und jeweils weitere 5

Personen den Dreinsilber Modus („Dreinsilber 1“ im Test und „Dreinsilber 2“ im

Retest). Ein Schema dieses Versuchsablaufs ist in Abbildung 2 dargestellt.

25

Tag 1

1 W

och

e

Tag 2

Standard 1 Standard 2 Dreinsilber 1 Dreinsilber 2

Dreinsilber 1 Dreinsilber 2 Standard 1 Standard 2

Standard 1 Standard 2 Beep 1 Beep 2

Beep 1 Beep 2 Standard 1 Standard 2

ca. 60-90 Minuten ca. 60-90 Minuten

Abbildung 2: Versuchsablauf. Die Tests fanden an Tag 1 und Tag 2 mit

mindestens einer Woche Abstand dazwischen statt. Jeder

Präsentationsmodus (mit Test und Retest) dauerte zwischen 60 und 90

Minuten. Die Retests fanden jeweils an demselben Tag statt, nach einer

Pause von jeweils maximal einer Stunde.

Insgesamt gab es also vier Gruppen à 5 Personen mit folgender Reihenfolge

der Präsentationsmodi:

• Gruppe 1:Standard-->Dreinsilber

• Gruppe 2: Dreinsilber-->Standard

• Gruppe 3: Standard-->Beep

• Gruppe 4: Beep-->Standard

Das Test-Schema ist in Abbildung 2 übersichtlich dargestellt. Alle 20

Teilnehmer absolvierten den Standard Modus im Test und im Retest. Es wurde

per Randomisierung festgelegt, ob der Standard Modus an Tag 1 oder an Tag 2

absolviert wird (Test und Retest = 2 x 400 Wörter). An dem jeweils anderen Tag

wurde dementsprechend entweder der Beep Modus oder der Dreinsilber Modus

durchgeführt (Test und Retest = 2 x 400 Wörter, jeweils 10 Teilnehmer).

Ebenfalls randomisiert wurde, ob der Beep- oder der Dreinsilber Modus

zusätzlich zu den Standard-Tests durchgeführt wurde und welcher von diesen

Tests an dem ersten Tag durchgeführt wurde. Zwischen Test und Retest war

26

eine Pause von maximal einer Stunde, um die Trainingseffekte bei zeitnaher

Wiederholung zu überprüfen. Der Test im Standard Modus und der Test im

Beep Modus dauerten ungefähr 30 Minuten pro Durchgang. Die Durchführung

des Dreinsilber Modus benötigte mit ungefähr 45 Minuten deutlich mehr Zeit.

Der zweite Präsentationsmodus wurde in einem Abstand von ein bis zwei

Wochen durchgeführt (Tag 2). Ebenso wie an Tag 1 erfolgte Test und Retest

nach einer einstündigen Pause an demselben Tag.

27

4.3 Analyse

Vergleich der Präsentationsmodi

Bei jeder Testsituation aus Abbildung 2 wurden die mittleren

Sprachverständlichkeiten für fünf Probanden und jeweils vierhundert Testwörter

gemessen. Die mittleren Gruppenwerte der Testsituationen wurden miteinander

verglichen. Insbesondere wurden die Ergebnisse der unterschiedlichen

Präsentationsmodi, der unterschiedlichen Tage und der ersten und zweiten

Messung an demselben Tag verglichen. Hierzu wurde ein ungepaarter,

zweiseitiger T-Test durchgeführt (α=0,05). Für die Analyse wurde MATLAB™

(V7.14) verwendet. Zur Berücksichtigung der multiplen Testung wurde eine

Bonferroni-Korrektur durchgeführt.

Einzelwortverständlichkeit

Der Präsentationsmodus Standard 1 und Standard 2 wurde für alle der zwanzig

Probanden getestet. Um die Verständlichkeiten der einzelnen Wörter

miteinander zu vergleichen, wurde für alle zwanzig Probanden und jedes Wort

ausgezählt, von wie vielen der zwanzig Probanden die Einzelwörter bei

Standard 1 und bei Standard 2 korrekt verstanden wurden.

Listenbasierte Auswertung

In einer dritten Analyse wurden die ursprünglichen zwanzig Testlisten des

Freiburger Tests rekonstruiert. Für den Präsentationsmodus „Standard 1“ am

Tag 1 (10 Probanden) wurden für alle zwanzig Testlisten die mittleren

Verständlichkeiten berechnet. Diese Mittelwerte wurden mittels T-Test auf eine

statistisch signifikante Abweichung vom Gesamtmittelwert über alle Listen

zweiseitig geprüft.

28

5. Ergebnisse

5.1 Mittlere Verständlichkeit

Abbildung 3 zeigt die mittleren Verständlichkeiten für alle Testkonditionen.

Jeder Balken repräsentiert den Mittelwert über 400 Wortverständlichkeiten an

zehn Probanden für die Präsentationsmodus ‚Standard’ und fünf Probanden für

die Präsentationsmodi ‚Beep’ und ‚Dreinsilber’. Für alle Präsentationsmodi

finden sich in der ersten Messung an Tag 1 die niedrigsten Verständlichkeiten

und für die zweite Messung an Tag 2 die größten Verständlichkeiten. Bei dem

Präsentationsmodus ’Standard’ (std) liegen die Verständlichkeiten zwischen

48% und 57%. Für die Messungen mit Ankündigungssignal (beep) liegen die

Mittelwerte niedriger, zwischen 42% und 55%. Diese Unterschiede haben sich

jedoch nicht als statistisch signifikant erwiesen (p>0,05). Bei dem

Präsentationsmodus ‚Dreinsilber’ liegen die Verständlichkeiten zwischen 60%

und 70% und insgesamt signifikant höher als in der Standardsituation. Vom

ersten zum zweiten Tag verbessert sich die mittlere Verständlichkeit im Mittel

um 6,3%. Dieser Unterschied ist für alle sechs Präsentationen signifikant

(p<0,05). Die Unterschiede zwischen der ersten und der zweiten Präsentation

an demselben Tag liegen zwischen 2,7% und 6,4%. Diese Unterschiede sind

alle signifikant (p<0,05). Sie sind jedoch für den zweiten Tag etwas geringer als

für den ersten Tag.

29

std1 std2 beep1 beep2 drei1 drei20

10

20

30

40

50

60

70

80

90

100

Vers

tändlic

hke

it [%

]

Tag 1

std1 std2 beep1 beep2 drei1 drei20

10

20

30

40

50

60

70

80

90

100

Vers

tändlic

hke

it [%

]

Tag 2

Abbildung 3: Mittlere Verständlichkeit aller Präsentationsmodi (‚Standard’

(std), ‚Beep’ (beep) und ‚Dreinsilber’ (drein)). Bei dem

Präsentationsmodus Standard nahmen alle 20 Probanden teil, bei den

Präsentationsmodi ‚Beep’ bzw. ‚Dreinsilber’ nahmen jeweils 10

Probanden teil.

5.2 Einzelwortverständlichkeit

Alle zwanzig Probanden wurden im Präsentationsmodus ‚Standard’ entweder

an Tag 1 oder an Tag 2 direkt aufeinander folgend getestet. Dies erlaubt einen

direkten Vergleich der Test- mit den Retest Messungen. In Abbildung 4 ist

dargestellt, wie viele Wörter beim Test und beim Retest verstanden wurden.

Die Anzahl der Wörter ist dabei als Größe der Kreise markiert. Die Anzahl der

Probanden, die diese Wörter beim Test (Retest) verstanden haben ist auf der

x-Achse (y-Achse) aufgetragen. Man erkennt z.B. an Punkt „a“, das genau ein

Wort im ersten „Standard1“-Test von keinem Probanden erkannt wurde,

während es im zweiten „Standard2“-Retest von 4 Probanden erkannt wurde.

Da die Dokumentation auf Einzelwortebene erfolgte, konnte eine

Verständlichkeit für Test und Retest (also der identischen Messungen direkt

nacheinander gemessen) durchgeführt werden. Aus Abbildung 4 ist ersichtlich,

dass ein grossteil der 400 Wörter sehr selten und manche auch gar nicht

30

erkannt wurden, egal ob in der ersten oder in der zweiten Durchführung.

Allerdings gab es auch viele Wörter, die sehr häufig, bzw. immer von den

Probanden erkannt wurden. Die restlichen Wörter sind gleichmäßig zwischen

den beiden Extremen verteilt und wurden unterschiedlich häufig erkannt. So

wurden z.B. 12 der 400 Wörter sowohl beim Test als auch beim Retest

verstanden (dargstellt durch den Kreis bei den Koordinaten (20,20). Elf Wörter

wurden beim Test von 19 Probanden verstanden und beim Retest von allen 20

Probanden. Wegen des Trainingseffektes aufgrund der wiederholten Testung

liegen die Daten eher oberhalb der Winkelhalbierenden. Es gibt jedoch auch

ein Wort, das beim Test achtmal verstanden wurde und beim Retest nur

zweimal (Kreis bei den Koordinaten (8,2)). Die Verständlichkeit über die

Einzelworte verteilt sich in etwa gleichmäßig. Man kann jedoch eine deutliche

Clusterung zu den Enden beobachten, die Wörtern entsprechen, die besonders

gut bzw. besonders schlecht zu verstehen sind. Sieben der 400 Testwörter sind

so schwer verständlich, dass sie von allen Probanden weder beim Test noch

beim Retest richtig nachgesprochen wurden (vergleiche Tabelle 1), und 12

Wörter sind wiederum so gut zu verstehen, dass sie immer korrekt

nachgesprochen wurden (vergleiche Tabelle 2). Etwa 50 Wörter in Test und

Retest werden höchstens zweimal verstanden. Auf der anderen Seite gibt es

60 Wörter, die bei Test und Retest mindestens achtzehn Mal verstanden

wurden. Die übrigen 290 Testwörter verteilen sich in etwa gleichmäßig.

31

0 5 10 15 200

5

10

15

20

Anzahl der Verstehenden Test 1 (Test)

Anza

hl d

er

Vers

tehenden T

ers

t 2 (

Rete

st)

12 Wörter

1 Wort

Abbildung 4: Die Abbildung zeigt die Anzahl der verstandenen Wörter

des Präsentationsmodus Standard im Test (Standard 1) sowie im Retest

(Standard 2) bei allen 20 Probanden (x-Achse). Zwölf der 400 Wörter

wurden von allen 20 Probanden sowohl im Test als auch im Retest

verstanden (20/20). Sieben Wörter wurden von keinem der 20

Probanden verstanden, weder im Test noch im Retest, (0/0, vergleiche

Tabelle 1 und 2).

32

Wörter wie „Schlag“, „Erz“ oder „Drang“ waren so schwer zu verstehen, dass

sie von keinem der 20 Probanden, weder im Test noch im Retest, verstanden

wurden. Insgesamt wurden sieben von 400 Wörtern nie verstanden (siehe

Tabelle 1).

Wort Liste

Drang 4

Schlag 5

Erz 7

Grog 9

Gramm 10

Kork 12

Park 20

Tabelle 1: Wörter, die von keinem Probanden verstanden wurden, weder

im Test noch im Retest.

Wörter wie „Stift“, „Fest“ oder „Kind“ waren leicht zu verstehen, dass sie sowohl

beim Test als auch beim Retest von allen 20 Probanden verstanden wurden.

Insgesamt wurden 12 der 400 Wörter immer verstanden. (siehe Tabelle 2)

Wort Liste

Mönch 2

Stift 3

Frist 4

Fest 5

Teich 7

Fels 7

Sitz 8

Sicht 11

Pferd 11

Schwert 12

Meer 13

Kind 15

Tabelle 2: Wörter, die sowohl bei Test als auch bei Retest von allen Probanden verstanden wurden.

33

5.3 Listenbasierte Auswertung

Die Wörter wurden in unserer Studie zwar in zufälliger Reihenfolge präsentiert,

allerdings wurde die Verständlichkeit für jedes einzelne Wort separat gemessen

und festgehalten. Die aufgezeichneten Daten eignen sich daher um in einer

post-hoc Analyse die Verständlichkeit der einzelnen Listen des Freiburger Tests

zu rekonstruieren und zu bewerten. Aufgrund der kleinen, aber statistisch

signifikanten Unterschiede der Präsentationsmodi, wurde diese post-hoc

Analyse nur für den Modus „Standard 1“ am Tag 1 durchgeführt, also der

Präsentation der Wörter im Standardmodus für naive Testpersonen. In unserem

Kollektiv waren dies zehn Probanden (vgl. Abb. 5). Abbildung 5 zeigt die

mittleren Verständlichkeiten für die zwanzig Listen des Tests zusammen mit

den Standardabweichungen. Über alle Listen und Probanden gemittelt liegt die

Verständlichkeit bei 47,8% markiert durch die durchgezogene Linie. Die

Verständlichkeiten der Listen variieren dabei zwischen 38% (Liste 1) und 57,5%

(Liste 17). Für die einzelnen Probanden variieren die Verstehenswerte

zwischen 10% (Proband 4, Liste 20) und 70% (Proband 1, Liste 3) Die

Streuungen für die einzelnen Daten der Probanden liegen zwischen 10% und

70% (vergleiche Tabelle 3).

34

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 200

10

20

30

40

50

60

70

Listennummer

Vers

tändlic

hke

it [%

]

* * * * * *

Abbildung 5: Listenbasierte Auswertung. Liste 1 schloss nur mit einer

mittleren Verständlichkeit von 38% ab, währen Liste 17 mit 57,5% mit zu

den am meist verstehenden Listen gehörte. Die gemittelte

Verständlichkeit der Probanden und Listen lag bei 47,8%.

Mit Hilfe des T-Tests wurde untersucht, ob die mittlere Verständlichkeit einer

Liste signifikant vom Mittelwert über alle zwanzig Listen abweicht. Dabei

erwiesen sich die Verständlichkeit der Listen 1, 12, und 18 als signifikant

(p<0,05) schlechter und die der Listen 8, 15, 17 als signifikant besser als der

Gesamtmittelwert. Für die übrigen Listen war der Unterschied nicht signifikant.

35

Proband 1 2 3 4 5 6 7 8 9 10

Liste 1 45 20 40 35 55 50 35 35 40 25

Liste 2 45 35 35 50 60 70 60 45 50 65

Liste 3 70 45 35 50 70 55 45 70 65 50

Liste 4 45 35 45 60 50 55 50 55 45 45

Liste 5 35 35 25 65 60 70 40 50 50 25

Liste 6 55 45 30 65 50 65 40 65 60 35

Liste 7 30 45 30 50 40 50 40 55 65 40

Liste 8 60 45 45 45 45 60 50 65 65 65

Liste 9 35 55 25 35 55 55 55 45 60 40

Liste 10 50 60 30 35 45 45 40 65 55 50

Liste 11 35 40 45 35 40 50 55 55 60 30

Liste 12 30 35 30 35 50 40 50 45 45 40

Liste 13 50 45 35 55 50 50 50 45 60 40

Liste 14 30 40 25 35 50 65 30 45 45 35

Liste 15 60 60 55 50 45 55 55 70 65 55

Liste 16 65 30 50 55 55 60 60 40 60 45

Liste 17 35 45 55 65 60 65 60 65 70 55

Liste 18 40 30 40 40 45 40 35 40 60 30

Liste 19 50 25 40 55 65 60 50 45 70 50

Liste 20 45 25 50 10 45 60 50 65 60 35

Mittelwert 45,5 39,75 38,25 46,25 51,75 56 47,5 53,25 57,5 42,75

Tabelle 3: 20 Listen, die von 10 Probanden beim Standard 1 Test in

Prozent verstanden wurden.

36

6. Diskussion

Die in dieser Arbeit präsentierte Studie war so entworfen, dass unterschiedliche

Aspekte der Sprachaudiometrie untersucht werden konnten. So 1. wurde der

Einfluss der Darbietungsart (Standard, mit Ankündigungssignal oder dreifache

Wiederholung) analysiert. 2. wurde die Erlernbarkeit der Testwörter bei

wiederholter Testdarbietung dargestellt. 3. wurden die Verständlichkeiten

einzelner Wörter bestimmt und dadurch besonders gut verständliche und

besonders schwer verständliche Wörter identifiziert. 4. wurden die

Verständlichkeiten der im klinischen Alltag verwendeten Testlisten des

Freiburger Tests einzeln dargestellt und miteinander verglichen.

Bei dem Präsentationsmodus ’Standard’ lagen die mittleren Verständlichkeiten

über alle 400 Wörter zwischen 48% und 57%. Die Messungen mit

Ankündigungssignal ergaben niedrigere Mittelwerte von 42% bis 55%. Diese

Unterschiede haben sich jedoch nicht als statistisch signifikant erwiesen. Bei

dem Präsentationsmodus ‚Dreinsilber’ wurden signifikant höhere mittlere

Verständlichkeiten von 60% bis 70% erricht.

Insgesamt gab es vom ersten zum zweiten Tag eine signifikante Verbesserung

der mittleren Verständlichkeit aller Präsentationsmodi von 6,3%. Die

signifikanten Unterschiede zwischen der ersten und der zweiten Präsentation

an jeweils demselben Tag liegen zwischen 2,7% und 6,4% und sind für den

zweiten Tag etwas geringer als für den ersten Tag.

Die Verständlichkeit der einzelnen Testwörter war sehr unterschiedlich, so

wurden einige der 400 Wörter sehr selten bzw. gar nicht erkannt. Allerdings gab

es auch einige Wörter, die sehr häufig, bzw. immer erkannt wurden. Die

meisten Wörter sind gleichmäßig zwischen den beiden Extremen verteilt.

Die listenbasierte Auswertung des Präsentationsmodus „Standard“ (also des

FST nach DIN) ergab bei naiven Testpersonen eine über alle Probanden und

Listen gemittelte Verständlichkeit von 47,8%. Die Verständlichkeiten der

einzelnen Listen variieren dabei zwischen 38% (Liste 1) und 57,5% (Liste 17).

Insgesamt erwiesen sich die Verständlichkeiten der Listen 1, 12, und 18 als

37

signifikant schlechter und die der Listen 8, 15, 17 als signifikant besser als der

Gesamtmittelwert.

Die Variation der Verständlichkeit zwischen den Einzellisten lag im Mittel bei

6,2% (maximal 18,5%) und damit innerhalb der zu erwartenden statistischen

Fehlergrenzen, die bei 20 Item Tests zu erwarten sind. Die Dreinsilber Fassung

erhöhte die mittlere Verständlichkeit um 11% während das Voranstellen eines

Ankündigungssignals keinen signifikanten Einfluss auf die Verständlichkeit hat.

Die Trainingseffekte waren gering (~4%). Sie werden durch die randomisierte

Darbietung reduziert. Die nach Listen aufgeschlüsselten Verständlichkeiten

ergeben uneinheitliche Rangfolgen. Diese decken sich nur teilweise mit den

Ergebnissen früherer Studien [1]. Besonders auffällig ist das vergleichsweise

schlechte Abschneiden der Liste 1 und 2, die in [1] zu den Listen mit höchster

Erkennungsrate gehören. Eventuell hat bei den Probanden dieser Studie ein

besonders ausgeprägter Lerneffekt bei den ersten beiden Listen zu den

überdurchschnittlich guten Erkennungsraten in [1] geführt, da die ersten Listen

des FST in der Routine oft überdurchschnittlich häufig verwendet werden.

Vergleicht man unsere Listen mit denen aus früheren Studien [2], so schnitten

bei Bangert, 1980 die Listen 3, 15 und 20 sehr gut ab, bei uns waren es 8, 15,

und 17. Die Liste 20 lag bei uns eher im schlechteren Drittel. Die Listen 5 und

14 gehörten bei Bangert zu den deutlich schlechtesten, während es bei uns

eher auf Liste 1 und 12 zu traf. Man kann die abweichenden Ergebnisse

dadurch erklären, dass Bangert in seiner Studie schwerhörige Jugendliche als

Probanden hatte und den FST nicht im Störschall testete. Ebenso war die

Reihenfolge der Items in seiner Studie nicht randomisiert.

Für eine Hörgeräteversorgung wird von den Kostenträgern eine Verbesserung

der Verständlichkeit in Ruhe um 20% gefordert. Für die Bewilligung einer

bilateralen Versorgung muss ein Zugewinn von 10% Verständlichkeit im

Störschall nachgewiesen werden. Bei unseren Tests mit Normalhörigen wurde

diese Verbesserung um 10% bei 27% aller Messungen erreicht. Eine

Verbesserung um 20% wurde bei 10% aller Messungen erzielt. Diese

Streuungen waren für alle Präsentationsmodi (Standard, Beep, Dreinsilber)

gleich. Bei einer Zusammenfassung von zwei aufeinander folgenden Listen (40

38

Wörter) reduzieren sich diese Werte auf 18% bzw. 3%. Der von den

Kostenträgern geforderte Nachweis im Rahmen der Hörgeräteversorgung ist

vor dem Hintergrund dieser statistisch begrenzten Aussagekraft des FST

allerdings fragwürdig.

39

7. Schlussfolgerung

Obwohl auch in dieser Studie die Listenausgewogenheit unbefriedigend blieb,

unterscheiden sich die Ergebnisse zu früheren Untersuchungen bei

schwerhörigen Probanden. Die beobachteten Trainingseffekte des Tests liegen

unter denen, die in früheren Arbeiten beschrieben wurden. Im Zusammenhang

mit unserer Methodik kann ein eventuell eintretender Ermüdungseffekt bei 400

Wörtern durchaus kritisch betrachtet werden. Tatsächlich bemängelten die

Probanden die lange Testzeit, insbesondere bei dem Präsentationsmodus

Dreinsilber. Tatsächlich waren aber keinerlei Auswirkungen auf die Ergebnisse

nachweisbar.

Um ein eventuell genaueres und im klinischen Bereich unter Umständen

praxisrelevanteres Ergebnis der Listenäquivalenz zu erhalten, würde sich eine

neue Studie mit derselben Methodik empfehlen, die allerdings mit 20

schwerhörigen Probanden durchzuführen wäre. In diesem Fall wäre auch

denkbar, dass der Präsentationsmodus mit dem Ankündigungssignal

signifikantere Einflüsse auf die Verständlichkeit aufweist, als dies bei den

Normalhörigen offensichtlich der Fall ist.

40

8. Literaturverzeichnis

[1]. Alich G. Anmerkungen zum Freiburger Sprachverständnistest (FST).

Sprache – Stimme – Gehör. Zeitschr. für Kommunikationsstörungen

(1985); 9:1-6

[2]. Bangert H. Probleme der Ermittlung des Diskriminationsverlustes

nach dem Freiburger Sprachverständnistest. Audiologische Akustik

(1980); 19:166-170

[3]. Böhme G, Welzl-Müller K. Hörprüfungen im Erwachsenen- und

Kindesalter. 4. Auflage. Huber, Bern, Göttingen, Toronto, Seattle

(1998)

[4]. Bosman A. Review of speech audiometric tests. In: Kollmeier B.

Moderne Verfahren der Sprachaudiometrie. Median Verlag von

Killisch-Horn GmbH. Heidelberg (1992); 11-34

[5]. Dillier N, Spillmann T. Wahrnehmung akustischer Sprachmerkmale

mit einkanaligen Cochlea- Implantaten und Hörgeräten: Eine

vergleichende Analyse. HNO. Berlin (1988); 335-341

[6]. DIN 45 621, Teil 1. Sätze für Gehörprüfung mit Sprache. Deutsche

Elektrotechnische Kommission. Fachnormenausschuss

Elektrotechnik im DIN und VDE (DKE) (1973)

[7]. DIN 45 621, Teil 2. Sätze für Gehörprüfung mit Sprache. Deutsche

Elektrotechnische Kommission. Fachnormenausschuss

Elektrotechnik im DIN und VDE (DKE) (1980)

[8]. Dreschler WA. Phonemic confusion in quiet and noise for the

hearing-impaired. Audiology (1986); 25:19–28

[9]. Feldmann H. Audiometrie bei Erwachsenen. In: Berendes J, Link R,

Zöllner F. Hals-Nasen-Ohren-Heilkunde. Band 5. Ohr. 2. Auflage.

Thieme Verlag. Stuttgart (1979); 11.1-11.56

[10]. Hochmeier-Desoyer I, Schulz E, Moser L, Schmidt M. The HSM

Sentence Test as a Tool for Evaluating the Speech Understanding in

Noise of Cochlear Implantat Users. The American Journal of Otology

(1997); 18:83

[11]. Holube I, Kollmeier B. Beziehungen zwischen dem Einsilber-Reimtest

in Ruhe und der Ton- und Sprachaudiometrie. Audiologische Akustik

(1994); 2:18-29

41

[12]. Kießling J, Schubert M, Wagner I.

Sprachverständlichkeitsmessungen an Normalhörenden und

Schallempfindungsschwerhörigen – fünf Sprachtests im Vergleich.

Audiologische Akustik (1994); 1:6-19, 2:11-15

[13]. Kießling J. Moderne Verfahren der Sprachaudiometrie. Laryngo-

Rhino-Otol (2000); 79: 633-635

[14]. Klinke R, Silbernagel S. Lehrbuch der Physiologie. 2.Auflage. Georg

Thieme Verlag. Stuttgart (1996)

[15]. König ER. Kurzer Historischer Rückblick auf die Entwicklung der

Hörhilfemittel. 6.Audio-Symposium. Brommer AG. Zürich (1979)

[16]. Kollmeier B. Editorial. In: Kollmeier B. Moderne Verfahren der

Sprachaudiometrie. Median Verlag von Killisch-Horn GmbH.

Heidelberg (1992); 7-10

[17]. Kollmeier B, Müller C, Wesselkamp M, Kliem K. Weiterentwicklung

des Reimtests nach Sotscheck. In: Kollmeier B. Moderne Verfahren

der Sprachaudiometrie. Median Verlag von Killisch-Horn GmbH.

Heidelberg (1992); 216-236

[18]. Lehnhardt E. Praxis der Audiometrie. 6. neubearbeitete und

erweiterte Auflage. Thieme Verlag Stuttgart. New York (1987)

[19]. Lehnhardt E, Laszig R. Praxis der Audiometrie. 8. Auflage. Thieme

Verlag Stuttgart. New York (2001)

[20]. Miller GA, Nicely PE. An analysis of perceptual confusions among

some english consonants. J. Acoust. Soc. of Am. (1955); 27, 338-352

[21]. Müller-Deile J. Erprobung und Validierung von

sprachaudiometrischen und anderen computergesteuerten

Messverfahren für die klinische Audiometrie. In: Abschlußbericht zum

BMBF-Verbundvorhaben Förderkennzeichen 01 VJ 9314. Kiel (1997);

1-40

[22]. Oldenburger Satztest. Handbuch und Hintergrundwissen. Version

(2000)

[23]. Reiß M, Reiß G. Zur Bedeutung orientierender Hörprüfungen. Wiener

Medizinische Wochenschrift (2003); 154: 73

[24]. Schnotz A, Digeser F, Hoppe U. Speech with Gaps: Effects of

Periodic Interruptions on Speech Intelligibility, Folia Phoniatrica et

Logopaedica (2009); 61: 263-268

42

[25]. Schorn, K. Stand der audiologischen Diagnostik. Deutsche

Gesellschaft für Hals-, Nasen-, Ohrenheilkunde. Kopf- und

Halschirurgie. Verhandlungsbericht . Springer. Berlin (1997); 131-176

[26]. Schuh H. Ausgewogenheit des Hochmair-Schulz-Moser-Satztests bei

normalhörenden Personen zwischen 40 und 60 Jahren. Diss.

Universität Würzburg (1999)

[27]. Sendlmeier WF, Wedel von H. Ein Verfahren zur Messung von

Fehlleistungen beim Sprachverstehen - Überlegungen und erste

Ergebnisse. Sprache - Stimme – Gehör (1986); 10: 164-169

[28]. Silbernagel S, Despopoulos A. Taschenatlas der Physiologie.

4.Auflage. Georg Thieme Verlag. Stuttgart (1991)

[29]. Sotscheck J. Sprachqualitätstest aus der Nachrichtentechnik. In:

Kollmeier B. Moderne Verfahren der Sprachaudiometrie. Median

Verlag von Killisch-Horn GmbH. Heidelberg (1992); 35-50

[30]. Spreng M. Auswirkungen des Lärms auf das Hören. Audiol. Akustik

(1982); 21: 66-74

[31]. Spreng M. Diskriminationsentscheidende Bedeutung von

Kurzzeitschallereignissen. Institut Physiologie und experimentelle

Pathophysiologie. AG Biokybernetik. Uni-Erlangen (2000)

[32]. Thornton AR, Raffin MJM. Speech discrimination scores modified as

a binomial variable. Journal of Speech and Hearing Research (1978);

21: 507-518

[33]. Wagener K, Brand T, Kollmeier B. Entwicklung und Evaluation eines

Satztests für die deutsche Sprache. Teil III: Evaluation des

Oldenburger Satztests. Z. Audiol 38 (1999); 3: 86-95

[34]. Wagener K, Kühnel V, Kollmeier B. Entwicklung und Evaluation eines

Satztests für die deutsche Sprache. Teil 1: Design des Oldenburger

Satztests. Z. für Audiologie (2001); 1: 4-15

[35]. Wedel von H. Reichen die heute verfügbaren sprachaudiometrischen

Verfahren zur Hörgeräteanpassung?. Audiol. Akustik 23 (1984); 66-

77: 102-20

[36]. Wedel von H. Entsprechen die sprachaudiometrischen

Untersuchungsverfahren den heutigen Anforderungen in Klinik und

Praxis?. HNO(1986); 34: 71-74

43

[37]. Wedel von H. Fehlermöglichkeiten in der Ton- und

Sprachaudiometrie. HNO (2001); 11: 939-956

[38]. Wendler J, Seidner W, Kittel G, Eysholdt U. Lehrbuch der Phoniatrie

und Pädaudiologie. 3.völlig neu bearbeitete und erweiterte Auflage.

Thieme Verlag (1996)

[39]. Wesselkamp M, Kliem K, Kollmeier B. Erstellung eines optimierten

Satztests in deutscher Sprache. In: Kollmeier B. Moderne Verfahren

der Sprachaudiometrie. Median Verlag von Killisch-Horn GmbH.

Heidelberg (1992); 330-343

[40]. Döring WH, Hamacher W. Neue Sprachverständlichkeitstests in der

Klinik: Aachener Logatomtest und „Dreinsilbertest“ mit Störschall. In:

Kollmeier B. Moderne Verfahren der Sprachaudiometrie. Median

Verlag (1992); 137–168

[41]. Zenner H P, Struwe U, Schuschke G, Speng M, Stange G, Plath P,

Babisch W, Rebentisch E, Plinkert P, Bachmann KD, Ising H, Lehnert

G. Gehörschäden durch Freizeitlärm. HNO (1999); 47: 237

44

9. Abkürzungsverzeichnis

Seite Abkürzung Bedeutung

1,3,11,15,22,23 CD Compact Disc

15,17 CI Cochlea-Implantat

1,3,6,9,19,22,24 dB Dezibel

1,2,3,18,19,20,21,36,37,

38,40

FST Freiburger Sprachverständistest

22 HL Hearing Level

15,40 HSM Hochmair-Schulz-Moser

1,3,9,24 Hz Hertz

9,24 kHz Kilohertz

22 OAE Otoakustische Emissionen

17 OLSA Oldenburger Satztest

3,16,19,22,24 SNR Signal to Noise Ratio

3,22 SPL Sound Pressure Level

22 TEOAE

Transitorisch evozierte otoakustische

Emissionen

45

10. Anhang

Tabelle 4: Listen 1 bis 20 à 20 Wörter (Wort 1 bis Wort 400):

Die folgende Tabelle ist in Liste, Wort (Nummer) und dem jeweiligen Substantiv

aufgeteilt sowie finden sich die Anzahl der Personen wieder (maximal 20), die

dieses Wort im Standard 1 Test (Std1) und im Standard 2 Test (Std2)

verstanden haben.

Genauer ausgewertet wurde der Präsentationsmodus „Standard 1“ (Test) mit

20 Personen. Insgesamt 26 verschiedene Wörter wurden von keinen der 20

Probanden verstanden und insgesamt 23 verschiedene Wörter wurden von

allen 20 Probanden verstanden.

Liste Wort Substantiv Std1 Std2

1 1 Ring 12 6

1 2 Spott 11 11

1 3 Farm 8 10

1 4 Hang 0 2

1 5 Geist 6 5

1 6 Zahl 17 18

1 7 Hund 12 17

1 8 Bach 2 1

1 9 Floh 18 10

1 10 Lärm 17 16

1 11 Durst 9 13

1 12 Teig 1 3

1 13 Prinz 6 8

1 14 Aas 5 7

1 15 Schreck 12 15

1 16 Nuss 7 10

1 17 Wolf 2 3

1 18 Braut 0 1

1 19 Kern 12 15

1 20 Stich 18 18

2 1 Holz 20 18

2 2 Ruß 9 6

46


2 3 Mark 3 4

2 4 Stein 16 14

2 5 Glied 0 1

2 6 Fleck 20 19

2 7 Busch 15 17

2 8 Schloss 18 20

2 9 Bart 6 7

2 10 Ei 2 7

2 11 Werk 6 9

2 12 Dach 4 3

2 13 Knie 14 13

2 14 Traum 10 14

2 15 Pass 4 2

2 16 Kunst 18 17

2 17 Mönch 20 20

2 18 Los 16 15

2 19 Schrift 17 18

2 20 Fall 1 0

3 1 Blatt 12 13

3 2 Stift 20 20

3 3 Hohn 0 2

3 4 Zweck 17 19

3 5 Aal 4 9

3 6 Furcht 20 18

3 7 Leim 2 4

3 8 Dorf 11 9

3 9 Tat 19 19

3 10 Kerl 14 12

3 11 Schutz 18 18

3 12 Wind 18 19

3 13 Maus 1 4

3 14 Reif 11 18

3 15 Bank 1 3

3 16 Klee 15 12

3 17 Stock 10 12

3 18 Wuchs 11 17

47


3 19 Mist 19 19

3 20 Gras 9 10

4 1 Schnee 20 18

4 2 Wurst 15 18

4 3 Zahn 12 14

4 4 Pest 16 16

4 5 Griff 8 9

4 6 Laub 1 3

4 7 Mund 11 12

4 8 Grab 2 2

4 9 Heft 19 19

4 10 Kopf 12 5

4 11 Reiz 7 10

4 12 Frist 20 20

4 13 Drang 0 0

4 14 Fuß 19 20

4 15 Öl 5 4

4 16 Schleim 3 5

4 17 Takt 5 8

4 18 Kinn 15 16

4 19 Stoß 9 20

4 20 Ball 0 4

5 1 Punkt 9 14

5 2 Ziel 19 17

5 3 Fest 20 20

5 4 Darm 2 1

5 5 Schein 8 8

5 6 Torf 17 19

5 7 Lamm 5 10

5 8 Wehr 16 16

5 9 Glas 3 4

5 10 Huf 6 3

5 11 Spind 14 13

5 12 Pfau 9 7

5 13 Block 2 8

5 14 Arm 12 13

48


5 15 Neid 12 10

5 16 Stroh 13 12

5 17 Wurf 11 13

5 18 Rest 12 10

5 19 Blick 13 14

5 20 Schlag 0 0

6 1 Seil 15 15

6 2 Pfand 11 11

6 3 Netz 18 18

6 4 Flur 10 13

6 5 Schild 19 19

6 6 Ochs 4 4

6 7 Draht 2 1

6 8 Hemd 16 18

6 9 Schmutz 19 19

6 10 Rat 8 12

6 11 Tau 17 12

6 12 Milch 9 9

6 13 Rost 4 5

6 14 Kahn 1 1

6 15 Tier 18 19

6 16 Brot 2 3

6 17 Dunst 3 4

6 18 Haar 5 5

6 19 Feld 19 20

6 20 Schein 15 13

7 1 Spiel 11 11

7 2 Moos 15 10

7 3 Lachs 12 15

7 4 Glut 1 1

7 5 Erz 0 0

7 6 Baum 13 11

7 7 Sand 19 15

7 8 Reich 9 6

7 9 Kuh 5 4

7 10 Schiff 17 20

49


7 11 Wort 3 6

7 12 Hecht 15 13

7 13 Mann 5 3

7 14 Bruch 4 6

7 15 Schopf 12 16

7 16 Fels 20 20

7 17 Kranz 0 1

7 18 Teich 20 20

7 19 Dienst 11 8

7 20 Star 5 2

8 1 Luft 20 18

8 2 Band 3 1

8 3 Kost 4 1

8 4 Ski 15 18

8 5 Feind 10 11

8 6 Herr 4 10

8 7 Pflug 9 10

8 8 Tal 18 17

8 9 Gift 14 17

8 10 Raum 7 14

8 11 Ernst 20 19

8 12 Zeug 15 19

8 13 Fach 13 12

8 14 Groll 2 1

8 15 Speck 16 18

8 16 Sitz 20 20

8 17 Moor 12 16

8 18 Last 17 17

8 19 Krach 1 1

8 20 Schwung 12 16

9 1 Schmerz 18 19

9 2 Thron 8 14

9 3 Eis 12 5

9 4 Funk 10 10

9 5 Bass 3 2

9 6 Rind 14 15

50


9 7 Lehm 17 19

9 8 Grog 0 0

9 9 Blei 0 1

9 10 Markt 1 2

9 11 Schilf 17 16

9 12 Hut 14 13

9 13 Zank 6 4

9 14 Korb 2 0

9 15 Lauf 14 15

9 16 Dank 1 2

9 17 Sarg 5 3

9 18 Kies 20 19

9 19 Schnur 17 15

9 20 Pech 15 17

10 1 Horn 3 7

10 2 Pfeil 13 12

10 3 Kamm 0 1

10 4 Turm 19 20

10 5 Spieß 19 20

10 6 Laus 14 14

10 7 Recht 14 15

10 8 Zopf 17 19

10 9 Schall 12 15

10 10 Mais 7 6

10 11 Fell 17 18

10 12 Gramm 0 0

10 13 Ohr 15 13

10 14 Sieb 13 16

10 15 Pracht 0 1

10 16 Lump 8 7

10 17 Gips 12 18

10 18 Bad 4 2

10 19 Sprung 12 12

10 20 Dreck 7 9

11 1 Bild 13 16

11 2 Frosch 12 16

51


11 3 Abt 0 2

11 4 Ruhm 7 4

11 5 Herz 20 19

11 6 Mond 10 10

11 7 Garn 0 1

11 8 Bau 3 6

11 9 Sicht 20 20

11 10 Huhn 7 6

11 11 Lack 6 3

11 12 Kreis 2 0

11 13 Pferd 20 20

11 14 Pelz 10 16

11 15 Schlacht 3 6

11 16 Witz 20 19

11 17 Form 13 18

11 18 Stuhl 10 8

11 19 Teil 7 10

11 20 Rand 3 4

12 1 Brett 4 9

12 2 Schuss 16 14

12 3 Saft 13 13

12 4 Pilz 18 19

12 5 Ort 7 12

12 6 Kraut 0 2

12 7 Schwert 20 20

12 8 Tag 4 5

12 9 Gleis 1 0

12 10 Vieh 17 19

12 11 Spalt 5 6

12 12 Sohn 19 19

12 13 Druck 6 9

12 14 Held 6 11

12 15 Bahn 1 1

12 16 List 13 19

12 17 Flug 8 7

12 18 Narr 2 1

52


12 19 Kork 0 0

12 20 Reis 11 6

13 1 Staub 13 18

13 2 Licht 19 18

13 3 Tracht 2 3

13 4 Herd 18 18

13 5 Not 8 10

13 6 Wein 3 8

13 7 Fluch 8 8

13 8 Kalk 1 0

13 9 Biss 14 18

13 10 Grund 3 2

13 11 Weg 18 18

13 12 Fass 20 17

13 13 Schmied 16 16

13 14 Ross 3 6

13 15 Amt 1 3

13 16 Puls 8 2

13 17 Meer 20 20

13 18 Graf 2 4

13 19 Schweiß 14 12

13 20 Dolch 8 9

14 1 Schrift 14 15

14 2 Ruf 6 8

14 3 Gas 2 0

14 4 Wert 17 14

14 5 Korn 4 7

14 6 Schrei 2 1

14 7 Pfahl 9 14

14 8 Blech 7 8

14 9 Faust 13 15

14 10 Rang 0 1

14 11 Lohn 13 17

14 12 Nest 14 14

14 13 Pult 1 3

14 14 Schicht 20 19

53


14 15 Zoll 6 13

14 16 Heu 0 3

14 17 Angst 7 7

14 18 Brust 5 6

14 19 Dieb 18 18

14 20 Stand 8 13

15 1 Knecht 15 17

15 2 Schaf 18 18

15 3 Lust 17 20

15 4 Berg 12 14

15 5 Docht 14 16

15 6 Zeit 18 19

15 7 Schlamm 6 12

15 8 Kind 20 20

15 9 Preis 0 1

15 10 Uhr 18 15

15 11 Mal 1 2

15 12 Speer 13 11

15 13 Fluss 19 19

15 14 Sinn 19 20

15 15 Rock 1 1

15 16 Haupt 9 7

15 17 Gang 0 1

15 18 Trieb 13 18

15 19 Boot 8 13

15 20 Schmalz 12 14

16 1 Bund 1 1

16 2 Stiel 18 17

16 3 Wachs 13 11

16 4 Reim 2 5

16 5 Geld 5 4

16 6 Tor 12 17

16 7 Duft 14 16

16 8 Stück 14 16

16 9 Arzt 5 2

16 10 Mehl 17 18

54


16 11 Trotz 13 13

16 12 Pfad 13 14

16 13 Heil 3 7

16 14 Brief 15 18

16 15 Sau 17 18

16 16 Fracht 13 15

16 17 Dung 4 5

16 18 Stern 16 20

16 19 Loch 16 14

16 20 Maß 2 3

17 1 Fink 19 20

17 2 Schlauch 7 4

17 3 Reh 11 10

17 4 Grad 1 0

17 5 Floß 18 19

17 6 Hirn 12 16

17 7 Fuchs 19 20

17 8 Bein 1 1

17 9 Napf 12 12

17 10 Teer 18 20

17 11 Stolz 19 20

17 12 Art 7 5

17 13 Wurm 14 17

17 14 Ding 19 19

17 15 Trab 2 5

17 16 Bett 15 18

17 17 Kleid 11 11

17 18 Schatz 19 20

17 19 Wut 8 11

17 20 Pflock 8 9

18 1 Schnitt 7 9

18 2 Frau 13 16

18 3 Land 15 15

18 4 Helm 10 13

18 5 Bock 1 1

18 6 Flucht 16 18

55


18 7 Scherz 16 19

18 8 Keil 0 1

18 9 Rast 5 10

18 10 Gruß 4 3

18 11 Wohl 2 4

18 12 Plan 7 10

18 13 Krieg 6 3

18 14 Ast 8 5

18 15 Pfiff 17 16

18 16 Weib 4 4

18 17 Sturm 18 18

18 18 Fang 0 3

18 19 Tee 19 17

18 20 Mord 17 15

19 1 Frucht 12 12

19 2 Schlitz 11 17

19 3 See 18 19

19 4 Schar 2 0

19 5 Gold 13 14

19 6 Leib 3 6

19 7 Wunsch 3 5

19 8 Fraß 17 15

19 9 Stier 18 19

19 10 Ton 12 12

19 11 Heer 12 16

19 12 Dachs 5 4

19 13 Bauch 8 11

19 14 Kreuz 7 8

19 15 Akt 9 6

19 16 Pfund 7 6

19 17 Sekt 19 20

19 18 Glück 8 7

19 19 Molch 17 15

19 20 Rad 7 9

20 1 Fleisch 8 9

20 2 Welt 16 17

56


20 3 Rohr 0 4

20 4 Park 0 0

20 5 Flut 18 17

20 6 Grieß 4 4

20 7 Saum 12 13

20 8 Krebs 8 6

20 9 Hand 15 13

20 10 Gott 6 11

20 11 Schuh 17 17

20 12 Film 12 15

20 13 Damm 1 2

20 14 Zelt 10 13

20 15 Koch 1 0

20 16 Hanf 12 11

20 17 Leid 15 15

20 18 Bier 7 8

20 19 Spruch 12 13

20 20 Axt 17 16

57

11. Danksagung

Als erstes möchte ich mich bei Prof. Dr. Dr. Ulrich Hoppe für die Möglichkeit

dieser wissenschaftlichen Arbeit an der Hals-Nasen-Ohren-Klinik Erlangen

bedanken. Seine hervorragende Betreuung, seine Hilfsbereitschaft und seine

Geduld bei der Anfertigung dieser Arbeit waren außergewöhnlich.

Besonderer Dank gebührt Dr. Frank Digeser für die zu jeder Zeit großartige

wissenschaftliche Unterstützung. Die stets rasche und unkomplizierte Hilfe

erleichterte die Anfertigung der Arbeit immens und machte die Zusammenarbeit

mit ihm sehr angenehm.

Ebenso gebührt mein Dank den Mitarbeitern der audiologischen Abteilung der

Hals-Nasen-Ohr-Klinik Erlangen für die Hilfe beim Bedienen der Geräte und ihr

stets offenes Ohr bei Fragen.

Ein außerordentlicher Dank gilt den zwanzig freiwilligen Probanden für ihre

Geduld und Teilnahme an den Tests, ohne die diese Arbeit niemals möglich

gewesen wäre.

Meinen Eltern möchte ich dafür danken, dass sie mir das Studium der

Zahnmedizin durch ihre immense Unterstützung ermöglicht haben.

Aus der Klinik für Hals-, Nasen und Ohrenheilkunde ... · techniques the test can be performed...

Documents

Transcript of Aus der Klinik für Hals-, Nasen und Ohrenheilkunde ... · techniques the test can be performed...