Aus der Klinik für Hals-, Nasen und Ohrenheilkunde ... · techniques the test can be performed...
Transcript of Aus der Klinik für Hals-, Nasen und Ohrenheilkunde ... · techniques the test can be performed...
Aus der Klinik für Hals-, Nasen und Ohrenheilkunde der
Friedrich-Alexander-Universität Erlangen-Nürnberg Direktor: Prof. Dr. med. Heinrich Iro
Trainingseffekte und Listenäquivalenz des Freiburger Einsilbertests im Störschall
Inaugural-Dissertation zur Erlangung der Doktorwürde
der Medizinischen Fakultät der
Friedrich-Alexander-Universität Erlangen-Nürnberg
vorgelegt von
Eva Mallinger
aus
Nürnberg
Gedruckt mit Erlaubnis der Medizinischen Fakultät der Friedrich-Alexander-Universität
Erlangen-Nürnberg Dekan: Prof. Dr. med. Dr. h.c. J. Schüttler Referent: Prof. Dr.-Ing. Dr. rer. med. Ulrich Hoppe Korreferent: Prof. Dr. med. J. Zenk Tag der mündlichen Prüfung: 06.07.2011 Die Promovendin ist Zahnärztin
Meinen Eltern gewidmet.
Inhaltsverzeichnis
1. Zusammenfassung 1
1.1 Hintergrund und Ziele 1
1.2 Methoden 1
1.3 Ergebnisse und Beobachtungen 2
1.4 Praktische Schlussfolgerungen 2
2. Abstract 3
2.1 Background 3
2.2 Methods 3
2.3 Results 4
2.4 Conclusions 4
3. Einleitung 5
3.1 Bedeutung der Sprachaudiometrie 5
3.2 Anatomische und physiologische Grundlagen des
Hörsystems 6
3.3 Klassische Hörprüfungen 8
3.4 Die Tonaudiometrie 9
3.5 Allgemeine Kennzeichen der Sprachaudiometrie 11
3.6 Mainzer Test und Göttinger Test für Kinder 13
3.7 Göttinger Test 14
3.8 Hochmair-Schulz-Moser Test (HSM-Satztest) 15
3.9 Reimtest nach Sotscheck 16
3.10 Marburger Sprachverständlichkeitstest 16
3.11 Oldenburger Satztest 16
3.12 Freiburger Sprachverständnistest (FST) 18
3.13 Freiburger Sprachtest in der Anwendung 18
4. Material und Methode 22
4.1 Versuchspersonen 22
4.2 Verfahren 22
4.3 Analyse 27
5. Ergebnisse 28
5.1 Mittlere Verständlichkeit 28
5.2 Einzelwortverständlichkeit 29
5.3 Listenbasierte Auswertung 33
6. Diskussion 36
7. Schlussfolgerung 39
8. Literaturverzeichnis 40
9. Abkürzungsverzeichnis 44
10. Anhang 45
11. Danksagung 57
1
1. Zusammenfassung
1.1 Hintergrund und Ziele
Der Freiburger Sprachverständlichkeitstest (FST) wurde vor mehr als 50 Jahren
von Hahlbrock erstmalig vorgestellt. Obwohl der Test in der Zwischenzeit
oftmals kritisiert wurde, gilt er heute als der am meisten angewandte
Sprachverständlichkeitstest in der Praxis. Besonders attraktiv für den Anwender
ist die rasche und einfache Durchführbarkeit. Als wichtigste Nachteile wurden
unzureichende Listenäquivalenz, Ergebnis verfälschende Trainingseffekte und
Probleme bei der Anwendung im Störgeräusch wegen eines fehlenden
Ankündigungssignals genannt [13]. In der aktuellen Studie wurde die
Anwendbarkeit des FST für Sprachverständlichkeitsmessungen im
Störgeräusch untersucht. Hierzu wurde das Sprachverständnis bei
Normalhörigen bei festem Signal-Rausch-Verhältnis für alle Testwörter des
Freiburger Tests bestimmt.
1.2 Methoden
Insgesamt nahmen zwanzig junge gesunde Erwachsene (10 Männer, 10
Frauen) an der Studie teil. Die Einsilber wurden im freien Schallfeld bei einem
Pegel von 65 dB präsentiert. Als Störgeräusch wurde das auf der Test-CD
enthaltene sprachverdeckende Rauschen verwendet. Die Probanden waren
nicht vertraut mit dem Freiburger Test. Der FST wurde in drei unterschiedlichen
Versionen getestet: 1. Einsilber allein (standard), 2. Einsilber in dreifacher
Wiederholung als ‚Dreinsilber-Präsentation’ (dreinsilber) und 3. Einsilber mit
einem kurzen Ankündigungston von 500 Hz (beep). Die Probanden wurden an
zwei Sitzungen mit einem Abstand von einer Woche getestet. Alle Probanden
führten den Test in der Standardversion entweder am ersten oder am zweiten
Termin durch. Am anderen Tag wurde entweder die Version ‚beep’ oder
‚dreinsilber’ getestet. Um Trainingseffekte bei kurzzeitiger Wiederholung zu
überprüfen, wurden an einem Tag jeweils alle 400 Wörter in derselben Version
mit einem Abstand von maximal einer Stunde erneut getestet. Die Reihenfolge
2
der Testwörter war randomisiert. Die Testergebnisse wurden hinsichtlich der
Präsentationsversion, der Trainingseffekte und der Listenäquivalenz analysiert.
1.3 Ergebnisse und Beobachtungen
Die mittleren Erkennungsraten lagen bei 53%±32% für die Standardversion,
66%±31% für die Dreinsilberdarbietung und 49%±33% für die Beep-Version. An
einem Tag erhöhte sich die Erkennungsrate vom ersten zum zweiten Test
zwischen 3,6% und 5,1%. Offline konnte eine listenabhängige Auswertung
durchgeführt werden. Für die Standardversion des FST variieren die mittleren
Erkennungsraten der 20-item-Listen zwischen 45% und 62%. Für die Listen
3,8,15 und 17 lagen die mittleren Erkennungsraten über 60 %. Die Listen 1, 12
und 14 lagen die Erkennungsraten unterhalb von 47%.
1.4 Praktische Schlussfolgerungen
Die Fehler zwischen den unterschiedlichen Listen liegen innerhalb der zu
erwartenden statistischen Fehlergrenzen, die bei 20 item Tests zu erwarten
sind. Obwohl auch in dieser Studie die Listenausgewogenheit unbefriedigend
blieb, unterscheiden sich die Ergebnisse zu früheren Untersuchungen bei
schwerhörigen Probanden. Die beobachteten Trainingseffekte des Tests liegen
unter denen, die in früheren Arbeiten beschrieben wurden.
3
2. Abstract
2.1 Background
The Freiburg Speech Intelligibility Test (FST) was presented more than fifty
years ago by Hahlbrock. Though lots of criticism arose it is still the most
commonly used speech test in german speaking countries. With modern digital
techniques the test can be performed easily within clinical acceptable times. On
the other side a number of disadvantages of this test were identified [13]. In
particular, the list equivalency with respect to intelligibility was called into
question and the practicability for speech perception in noise was criticized.
The aim of this study was to investigate the applicability of the FST for speech
perception measurements in noise and the list equivalency as tested in a
normally hearing collective.
2.2 Methods
Twenty young healthy volunteers (10 male, 10 female) took part in the study.
Freiburg monosyllabics were presented at 65 dB SPL with the presence of
background noise as delivered on the commercially available FST CD-ROM
(SNR = 0dB). Prior to investigation subjects were unfamiliar with the test
material. For each subject four speech recognition trials at two different days
with a distance of one week were performed. The FST was performed in three
different modi: A) monosyllabics (standard), B) monosyllabics repeated three
times according to the ‘Dreinsilber-Test’ (dreinsilber), and C) monosyllabics with
a 500 Hz announcing beep in advance to each word (beep). All subjects had to
perform modus A either at day 1 or day 2 (decided by random). At the other day
they performed either B or C (decided by random). For each trial all of the 400
words were presented once exactly. The order of the words within one trial was
randomly assigned. Data were analyzed according to differences between the
presentation modi, list equivalency and training effects caused by the repeated
presentation.
4
2.3 Results
For the standard, dreinsilber, and beep condition recognition rates were
53±32%, 66±31%, and 49±33%, respectively. From the first presentation to the
second presentation at the same day a mean increase in percentage
recognition was observed for all conditions: 3,6%, 4,0%, and 5,1%,
respectively. The reconstruction of the test item belonging to the same list was
performed post-hoc. When pooling the data over all subjects for the standard
presentation modus recognition rates varied between 45% and 62%. For list no.
3, 8, 15, and 17 recognition rates above 60 % were observed. For list no. 1, 12,
and 14 mean recognition rates below 47% were measured. Similar list were
obtained as ‘best’ and ‘worst’ for the other both presentation modi.
2.4 Conclusions
Measurement errors caused by unbalanced lists are within errors of standard
speech audiometric when only 20 items are used. Compared to earlier studies
in hearing impaired listeners only a part of the best and worst lists were found in
this study. Training effects observed in this study are smaller than earlier
described ones. This may be due to the randomized order of presentation of the
words.
5
3. Einleitung
3.1. Bedeutung der Sprachaudiometrie
Das Gehör ist einer der wichtigste Sinne des Menschen. Schwerhörige und
Gehörlose fühlen sich sehr häufig von der Gesellschaft ausgegrenzt, da das
Hören für die zwischenmenschliche Kommunikation unersetzlich ist. Das
Verstehen von Sprache ist die wichtigste soziale Funktion des Gehörs. Ohne
ein funktionierendes Gehör werden wir in unserer Kommunikationsfähigkeit
stark eingeschränkt, was sich beruflich sowie im Alltagsleben negativ auswirken
kann: „Wer nicht mehr richtig hören kann gerät sehr leicht in ein soziales
Abseits und Isolation, er wird zum Außenseiter der Gesellschaft“ [30]. Im Alltag
führt eine Hörbehinderung nicht nur zu Problemen in der Familie („ Mach doch
den Fernseher nicht immer so laut“), sondern auch zu einem erschwerten oder
gar verhinderten gesellschaftlichen Leben. Ein entscheidende Verbesserung
der Situation Hörgeschädigter stellte Anfang des Zwanzigstens Jahrhunderts
die Entwicklung elektrischer Hörgeräte dar [15]. Da die Menschen in den letzten
Jahrhunderten und Jahrzehnten, und vermutlich auch in der weiteren Zukunft
immer älter werden, hat die Anzahl der Patienten, die auf ein Hörgerät
angewiesen sind zugenommen und wird voraussichtlich auch weiter zunehmen.
Zusätzlich sind bei jedem zehnten Jugendlichen durch Freizeitlärm bedingte
Hörschäden zu befürchten [41]. Leider ist das Bewusstsein für die Wichtigkeit
eines funktionierenden Gehörs in dieser Altersgruppe oftmals noch nicht
vorhanden.
Um das Sprachverstehen quantifiziert erfassen und beurteilen zu können sind
sprachaudiometrischen Methoden unentbehrlich um das Leistungsvermögen
des individuellen „sozialen“ Gehörs beurteilen zu können. Diese Methoden
dienen der Begutachtung des Hörvermögens und der Evaluation von
therapeutischen Maßnahmen bei bestehenden Beeinträchtigungen des Gehörs.
Im deutschen Sprachraum existiert dafür eine Reihe von
sprachaudiometrischen Tests, die für unterschiedliche Zwecke geschaffen
wurden.
6
3.2 Anatomische und physiologische Grundlagen des Hörsystems
Das Hörsystem ist sehr komplex aufgebaut. Es besteht aus einem peripheren
Teil und aus einem zentralen Teil. Zum peripheren Teil zählt das äußeres Ohr,
das Mittelohr und das Innenohr (Pars cochlearis des Nervus
vestibulocochlearis) Zu dem zentralen Teil zählt die zentrale Hörbahn sowie die
subkortikalen und die kortikalen Hörzentren
Das äußere Ohr, bestehend aus Ohrmuschel und äußeren Gehörgang, ist
durch das Trommelfell vom Mittelohr abgegrenzt. Es erfüllt zwei Funktionen:
• Schutz des Trommelfells vor mechanischer Beschädigung
• Eine Schalldrucktransformation von Schall in freiem Feld zu Schall am
Trommelfell, wobei eine Schallpegelerhöhung von bis zu 20 dB auftritt.
Das Mittelohr umfasst die mit Luft gefüllte Paukenhöhle, die mit den
angrenzenden, pneumatischen Zellen in Verbindung steht. Sie enthält die
Gehörknöchelchen Hammer (Malleus), Amboss (Incus) und Steigbügel
(Stapes), die beiden Mittelohrmuskeln, Musculus tensor tympani und Musculus
stapedius sowie verschiedene Ligamente. Die Verbindung zum Innenohr wird
durch bewegliche Strukturen, das ovale und das runde Fenster hergestellt.
Über die Tuba auditiva besteht eine Verbindung des Mittelohres zum
Nasenrachenraum. Die Funktion des Mittelohres ist die Maximierung der
Übertragung des auf das Trommelfell auftreffenden Luftschalls in das mit
Flüssigkeit gefüllte Innenohr (Impedanzanpassung). Das Innenohr besteht aus
einer Anzahl untereinander in Verbindung stehender, flüssigkeitsgefüllter
Hohlräume (Labyrinth) und umfasst die Bogengänge (Verarbeitung von
Linearbeschleunigungen) und die Cochlea, die so genannte Schnecke
(Verarbeitung von akustischen Reizen). Der räumliche Aufbau der Cochlea ist
ein dreistöckiger Schneckengang. Dieser ist in drei Höhlräume unterteilt: Die
Scala vestibuli, die Scala tympani und die Scala media (der Ductus cochlearis).
Die Scala vestibuli öffnet sich gegen den Vorhof. Die Scala tympani schließt mit
dem runden Fenster gegen das Mittelohr ab. Diese beiden mit Perilymphe
gefüllten Scalae stehen an der Schneckenspitze durch das Helicotrema direkt
miteinander in Verbindung. Zwischen den Scalae liegt der mit Endolymphe
7
gefüllte Ductus cochlearis, der von der Scala vestibuli durch die Reissner-
Membran und von der Scala tympani durch die Basilarmembran getrennt ist.
Auf der Basilarmembran befindet sich das eigentliche „Wandlersystem“, das
Cortische Organ. Auf dem Cortischen Organ befindet sich eine Reihe innerer
Haarzellen und drei Reihen äußerer Haarzellen. die von der Tektorialmembran
bedeckt sind.
Wird der Steigbügel durch einfallende Schallwellen in Bewegung gesetzt, so
überträgt er die Schallenergie auf die Flüssigkeitssäule in der Scala vestibuli.
Die Schwingungen in den Flüssigkeitssäulen der Scalae führen zu einer
charakteristischen Schwingungsform der Basilarmembran, die als Wanderwelle
bezeichnet wird. Dabei nimmt die Amplitude der Basilarmembran Auslenkung
von der Basis zur Spitze hin zu, erreicht ein Maximum und geht dann wieder auf
Null zurück. Das Bewegungsmuster der Basilarmembran ist auf Grund der von
der Basis zur Spitze hin abnehmenden Elastizität der Basilarmembran und der
Kanaltiefe frequenzabhängig. Unterschiedliche Frequenzen bewirken daher
eine maximale Amplitude der Wanderwelle an unterschiedlichen Orten der
Basilarmembran. Für die Aufnahme der mechanischen, auditorischen Reize im
Innenohr, der Umwandlung zu elektrischen Signalen und deren Weiterleitung
an den Hörnerv sind die inneren Haarzellen zuständig. Mit der Innervierung des
Cortischen Organs der Cochlea durch den Hörnerv beginnt die Hörbahn, die
einschließlich der Hörzentren und der Hörrinde ein leistungsfähiges
Verarbeitungs-, Kodierungs- und Dekodierungssystem darstellt [3].
Verzweigungen der Hörnervfasern ziehen vom Cortischen Organ zu den
Cochleariskernen und weiter zur oberen Olive und zum Nucleus accessorius. In
diesem werden erstmals auch kontralaterale Impulse empfangen und es kann
somit ein Intensitäts- und Laufzeitvergleich der rechten und der linken Seite
(Richtungshören) erfolgen. Nach weitgehender Kreuzung der Fasern auf die
Gegenseite führt die Hörbahn weiter über den Thalamus und erreicht
schließlich den auditorischen Kortex [28].
8
3.3 Klassische Hörprüfungen
Als klassische Hörprüfungen werden insbesondere die Stimmgabeltests von
Weber und Rinne, sowie die Hörweitenprüfung bezeichnet. Obwohl mittlerweile
vorwiegend elektroakustische Untersuchungsmethoden genutzt werden, haben
die klassischen Hörprüfungen immer noch eine besondere Bedeutung, da sie
eine schnelle und orientierende Aussage über Sitz und Ausmaß einer
Hörstörung liefern [3]. Der Stimmgabeltest dient der primären Differenzierung
zwischen Mittelohr- und Innenohrschwerhörigkeit. Beim Weber-Versuch (1834)
wird die linkseitige und die rechtsseitige Knochenleitung der beiden Ohren
miteinander verglichen. Beim Rinne-Versuch (1855) hingegen wird die
Knochleitung und die Luftleitung der einzelnen Ohren links und rechts separat
miteinander verglichen. Dem Rinne- und dem Weber Versuch kommt im
klinischen Alltag nur ein orientierender Wert zu. Wegen der Einfachheit der
Durchführung sind diese Tests jedoch wichtige Verfahren der Audiometrie. [19].
Die Prüfung der Hörweite für Flüster- und Umgangssprache ist trotz der
modernen Sprachaudiometrie, vor allem für die Begutachtung, auch heute noch
eine zusätzliche Hilfe für die Bewertung der audiometrischen Befunde [3].
Allerdings ist für die Prüfung ein schallgedämpfter Raum mit einer Mindestlänge
von 6 Metern notwendig. Für diese ebenfalls orientierende Hörprüfung, gibt es
viele mögliche Fehlerquellen, die die Vergleichbarkeit der Ergebnisse
erschweren. So wird z.B. bei jedem Test unterschiedliches Prüfmaterial
verwendet, die Tonhöhe und Artikulation der Sprecher variieren und die
Störpegel der verwendeten Raume sind unterschiedlich [3]. Alle genannten
Hörprüfungen werden zur Überprüfung audiometrischer Ergebnisse von vielen
Otologen routinemäßig benutzt [26]. Die Aussagekraft ist allerdings deutlich
unpräziser als die aktueller audiometrischer und otologischer
Diagnoseverfahren [26].
9
3.4 Die Tonaudiometrie
Grundsätzlich werden die Audiometrieverfahren in zwei große Gruppen
aufgeteilt: Die Tonaudiometrie und die Sprachaudiometrie. Dabei ist die
Ermittlung der Hörschwelle mittels eines Tonaudiometers die Grundlage der
audiologischen Diagnostik [3]. Dem Probanden werden Töne von
Sinusschwingungen bestimmter Frequenzen mit wachsender Lautstärke
angeboten. Die Änderung der Lautstärke kann dabei je nach gewünschter
Genauigkeit in 5 dB-Schritten oder in 1-dB-Schritten erfolgen. Dabei wird der
Zeitpunkt bestimmt, an dem der Proband angibt den Prüf-Ton erstmals zu
hören. Der zu untersuchende Frequenzbereich liegt vorwiegend zwischen 125
Hz und 10 kHz, wobei bis 500 Hz meist in Schritten von ganzen Oktaven und
oberhalb in Schritten von halben Oktaven geprüft wird [3]. Die Prüfung wird
monaural durchgeführt, während das andere Ohr gegebenenfalls vertäubt wird,
um ein „überhören“ des Prüf-Tones auf das eventuell besser hörende Ohr zu
vermeiden.
Die Messungen werden sowohl für Luft- als auch für Knochenleitung
durchgeführt. Es kann daher mittels eines Vergleichs beider Ergebnisse eine
Diagnostik betrieben werden. So kann zum Beispiel anhand eines
Audiogramms oft eine Mittelohrschwerhörigkeit von einer
Innenohrschwerhörigkeit oder einer Kombination aus beidem abgegrenzt
werden. Bei cochleären- und bei retrocochleären Schäden sind im Allgemeinen
die Messwerte für Luft- und Knochenleitung identisch. Bei cochleären Schäden
ist der Transduktionsprozess im Innenohr gestört während bei retrocochleären
Schäden die zentrale Verarbeitung nach der Cochlea gestört ist. Bei
Mittelohrschäden hingegen ist nur die Schallübertragung durch das Mittelohr
betroffen. In diesem Fall sind lediglich die Messwerte der Luftleitung
verschlechtert [14] während die Ergebnisse der Knochenleitung immer noch
denen eines Normalhörigen entsprechen.
Bei allen tonaudiometrischen Verfahren muss allerdings stets bedacht werden,
dass ein Mensch mit seinen subjektiven Empfindungen Auskunft über Hören
und Nichthören gibt. Es handelt sich bei den audiometrischen Messungen also
um subjektive Tests bei denen Konzentration und Reaktionsgeschwindigkeit
10
stets auch einen großen Einfluss auf das Ergebnis haben [19]. Weiterhin zu
beachten ist, dass ein Tonaudiogramm zum einen die Grundlage einer jeglicher
audiologischen Diagnostik darstellt, zum anderen jedoch keine Aussagen über
die Verarbeitung der im täglichen Leben auftretenden akustischen Reize,
insbesondere der Sprache, gestattet.
11
3.5 Allgemeine Kennzeichen der Sprachaudiometrie
Das alleinige Wissen um die tonaudiometrisch erhobenen Hörschwellen eines
Patienten reicht nicht aus, um das Ausmaß seiner Hörstörung im Alltag zu
erfassen. Das Verstehen eines gesprochenen Wortes stellt eine komplexe
Anforderung an das Gehör dar. Im Gegensatz zu den im Tonaudiogramm
verwendeten akustischen Reizen (Töne im Schwellenbereich) besteht das
Schallsignal der Sprache aus einem breiten Frequenzspektrum. Die Pegel der
Frequenzen erstrecken sich weit in den überschwelligen Bereich und verändern
sich teilweise sehr deutlich in Zeitabschnitten von Millisekunden [31]. Um
Aussagen über die Sprachverständlichkeit eines Patienten zu erhalten, ist
daher eine Hörprüfung unter Verwendung von Sprache als Prüfmaterial
notwendig: Aussagen über die gesamte Funktion von Hörbahn und
Wahrnehmung erhält man mittels Sprachaudiometrie [38]. An Stelle der
physikalisch definierten Testsignale treten Silben, Wörter, Sätze (einsilbig oder
mehrsilbig), die möglichst repräsentativ für die verwendete Sprache und ihre
Phoneme zusammengestellt sind. Diese werden über CD und Audiometer
vorgespielt und müssen von den Versuchspersonen nachgesprochen werden.
Der Anteil der korrekt nachgesprochenen Wörter in Prozent wird dann als
prozentuales Sprachverstehen bei dem entsprechenden Darbietungspegel
interpretiert. Der Grad der Übereinstimmung wird dann mit Werten einer Gruppe
von Normalhörenden verglichen. Bezugspunkt stellt die so genannte
Sprachverständlichkeitsschwelle dar. Sie ist definiert als der minimale Pegel
des Sprachschalls, bei dem 50% der Testeinheiten (Items) richtig verstanden
werden [3]. In den sprachaudiometrischen Ergebnissen zeigen sich nicht nur
die Leistung des peripheren Gehörs, sondern ebenso die höheren soziativen
Fähigkeiten wider insofern, als dass sich der Proband bemüht, ein Wort zu
verstehen, von dem er vielleicht nur einzelne Sprachlaute erfasst hat [18]. Das
verwendete Sprachmaterial sollte innerhalb einer Testgruppe von gleicher
Lautstärke sein. Das Testmaterial für die Sprachaudiometrie soll außerdem von
Gruppe zu Gruppe gleichwertig sein so dass die einzelnen Gruppen
untereinander phonetisch ausgewogen sind. Die Wortlängen und Vokalstellung
in den Gruppen wären praktisch identisch. Die Sprachaudiometrie mit Sätzen ist
wirklichkeitsgetreuer als mittels Zahlen oder Wörtern, mit denen man die
Sprachverständlichkeitsschwelle ermittelt. Der Satztest gibt eher Auskunft über
12
das Sprachverstehen Schwerhöriger im alltäglichen Leben. Mittels
Sprachaudiometrie können die Auswirkungen der Verstärkung eines Hörgerätes
erfasst werden. Darüber hinaus kann Sprachaudiometrie mit Störschall (mit
Lautsprechern im Freifeld) spezialisierte Funktionen eines Hörgeräts
überprüfen, wie z.B. eine Störgeräuschunterdrückung. Dementsprechend sind
die Hauptanwendungsbereiche der Sprachaudiometrie Fragestellungen, bei
denen die Sprachverständlichkeit im Mittelpunkt steht, wie die Verbesserung
der Sprachverständlichkeit durch eine Hörgeräteversorgung bzw. einen
operativen Eingriff, sowie die quantitative Bewertung von Hörschäden im
Rahmen der Begutachtung. Ein grundlegendes Problem bei der
Sprachaudiometrie ist die hohe Zahl von Variablen, die bei einem bestimmten
Test berücksichtigt werden müssen. Zu diesen Variablen gehört auch die Art
des Tests. Bei den so genannten offenen Tests soll der Proband die ihm
dargebotenen Test Items möglichst korrekt wiederholen. Bei den
geschlossenen Tests bezeichnet der Proband das richtige Test Item aus einer
Liste von möglichen Antworten. Weitere Variablen sind zusammengefasst nach
Kießling und Kollmeier [13, 16]:
• Art und Länge der Test Items
(z.B. einsilbige oder mehrsilbige Wörter oder Sätze)
• Auswertungsmethode
(Bewertung richtig erkannter Phoneme, Silben, Wörter oder Sätze)
• Sinngehalt (sinnleer/sinnhaltig)
• Ankündigung (ohne/mit, Satz akustischer Stimulus, Wortwiederholung)
• Sprecher (männlich/weiblich, geschult/ungeschult, synthetische Sprache)
• Störgeräusch
(ohne/mit, Modulationsgrad, Spektrum, Dauer, Darbietungsrichtung von
Nutzschall und Störschall)
• Automatisiert/computergesteuert durchführbar (ja/nein).
13
Jedes der gebräuchlichen Sprachtestverfahren besitzt eine eigene Kombination
dieser Variablen, so dass sich die Testergebnisse nur schwer miteinander
vergleichen lassen. Zudem ist die Festlegung der Variablen abhängig vom
Einsatzzweck des Tests. Beispielsweise steht bei der Diagnostik von
Hörstörungen die analytische Aussagekraft des Tests im Vordergrund, d.h. die
Möglichkeit aus den auftretenden Phonemverwechslungen Rückschlüsse auf
das gestörte Hörsystem zu ziehen. Bei der Begutachtung stehen dagegen eher
eine hohe Reproduzierbarkeit und Genauigkeit des Tests, sowie eine hohe
Repräsentanz des Sprachmaterials für die alltägliche Kommunikation im
Vordergrund [16]. Die Sprachaudiometrie gehört unbestritten zu den Eckpfeilern
des audiometrischen Instrumentariums und ist integraler Bestandteil der
audiologischen Diagnostik, der Begutachtung sowie der Hörgeräteindikation
und -Evaluation [13].
3.6 Mainzer Test und Göttinger Test für Kinder
Die oben genannten Sprachtests sind für Erwachsene Hörer entwickelt worden
und daher für Kinder im Alter von unter 6 Jahren eher ungeeignet, da deren
verfügbarer Wortschatz noch deutlich kleiner ist. Aufgrund dieser Problematik
wurden spezielle sprachaudiometrische Tests für Kinder entwickelt. Ein Beispiel
dafür ist der Mainzer Kindersprachtest. Er besteht aus drei Teilen zu je fünf
Gruppen mit zehn Wörtern, wobei die Gruppen unterschiedliche
Schwierigkeitsgrade aufweisen. Das akustisch präsentierte Sprachmaterial wird
zusätzlich durch eine Reihe von Bildserien optisch unterstützt. Analog zu
diesem Mainzer Test baut der Göttinger Kindersprachverständnistest auf den
gleichen Prinzipien auf, wobei das „Göttinger“ Sprachmaterial aus Einsilbern
besteht und daher zur Auswertung von Phonemverwechslungen verwendet
werden kann.
14
3.7 Göttinger Satztest
Der Göttinger Satztest nach Wesselkamp et al. ist eine Weiterentwicklung des
Marburger Satztests. Die relativ geringe Zahl an Testlisten und die schnelle
Aufsprache schränken seinen Einsatz bei höhergradigen Hörstörungen jedoch
ein [4]. Der Göttinger Sprachtest besteht aus 20 Listen zu je 10 Sätzen sowie 5
Übungslisten mit je 12 Sätzen und ist computergesteuert durchführbar. Diese
wurden aus dem Marburger Satztest, dem Satztest von Sotscheck und 200
weiteren Sätzen ausgewählt. Ausgehend von einem Inventar von 324 Sätzen
wurde bei der Zusammenstellung der Listen auf eine nahezu identische
Diskriminationsfunktion, gleiche Wort- und Phonemzahl und eine jeweils an die
deutsche Sprache angepasste Phonemverteilung geachtet [39]. Der Ausgang
der Messung ist somit nicht von der Wahl der Testlisten abhängig. Als Nachteil
des Göttinger Satztests führen Wagener, Kühnel und Kollmeier die teilweise
sehr hohe Redundanz der Testsätze an [34]. Müller-Deile bemängelt die zu
geringe Anzahl von Testlisten für vergleichende Messungen in der Cochlea–
Implantat- und Hörgeräteentwicklung [21]. Welzl-Müller nennt als
Anwendungsbereich des Göttinger Sprachtests die quantitative Bewertung
eines Hörerfolges durch eine Hörgeräteversorgung sowie
Sprachverständlichkeitstests mit hochgradig Hörgeschädigten [3]. Die Nutzung
von Sätzen zur Beurteilung einer Hörstörung stellt eine entscheidende
Annäherung an die kommunikative Alltagssituation der Patienten dar. Ein
grundlegendes Element der täglichen Verständigung wurde jedoch auch hier
noch nicht miteinbezogen: Neben der eigentlichen Sprachquelle wird das Gehör
ständig mit Störschall konfrontiert. In der Audiometrie werden daher entweder
bestehende Tests, wie der Freiburger Sprachtest, mittels Störschall modifiziert
oder neuere Testverfahren genutzt, welche Störschall bereits in die Konzeption
mit einbeziehen.
15
3.8 Hochmair-Schulz-Moser Test (HSM Satztest)
Hochmair-Desoyer, Schulz und Moser entwickelten 1996 den HSM-Satztest,
speziell für die wiederholte Messung der Sprachverständlichkeit von hochgradig
Schwerhörigen und Cochlea-Implantierten (CI-Träger). Aufgrund dieser
Bestimmung wird eine langsame Sprechgeschwindigkeit von 3,7 Silben pro
Sekunde und ein Sprecher mit guter Verständlichkeit verwendet [10, 24]. Im
Gegensatz zu den primär analog auf Tonband gespeicherten CD- Kopien des
Marburger Satztests, die immer noch das Bandrauschen des Originals enthielt,
wurde der HSM-Satztest unmittelbar digital aufgezeichnet und direkt auf CD
verfügbar gemacht. Zusätzlich ist auf der CD des HSM-Tests ein genormtes
Störgeräusch verfügbar.
Schon die ersten Untersuchungen wiesen auf unterschiedliche Ergebnisse bei
Tests mit und ohne Störschall hin [20]. Nach verschiedenen Modifikationen
steht er für unsere Untersuchungen in der Computerversion zur Verfügung. Die
Testsätze werden dabei als Wave Datei direkt vom PC eingespielt, eine
automatische Pegelanpassung in Abhängigkeit von der vorangegangenen
Patientenantwort ist ebenfalls möglich. Neben dem vorgegebenen Nutz- und
Störschallpegel kann auch der Test an sich modifiziert werden. So steht neben
dem HSM-Standardtest eine Modifikation nach Bocca und Calearo mit
verschiedenen, so genannten Chopper-Frequenzen zur Verfügung. Das
ausgegebene Nutzsignal wird dabei mit vorgegebener Frequenz zerhackt und
abwechselnd von beiden Lautsprechern eingespielt. Der HSM–Test bietet mit
seinen verschiedenen Varianten neben der Betreuung von Patienten mit
Cochlea-Implantaten weitere Einsatzmöglichkeiten. So ist beispielsweise
sowohl bei der Auswahl als auch bei der Beurteilung der Leistungsfähigkeit
eines Hörgerätes ein Sprachtest mit Störlärm von großer diagnostischer
Bedeutung. Eine steigende Leistungsfähigkeit von Hörgeräten kann nur mit
möglichst alltagsnahen Testmethoden verifiziert werden. Wie langfristige
Nachuntersuchungen zeigten, hängt der Erfolg einer Hörgeräteversorgung
weniger von der maximalen Einsilberverständlichkeit als von der
Satzverständlichkeit bei Störlärm ab [3]. Für eine optimale Anpassung und für
16
die Auswahl eines geeigneten Hörgerätes erscheint ein
Satzverständlichkeitstest mit Störgeräusch heute als unverzichtbar [19].
3.9 Reimtest nach Sotscheck
Eine weitere Sprachverständlichkeitsprüfung mit Wörtern ist der Reimtest nach
Sotscheck [29]. Dieser geschlossene Test wurde ursprünglich für die
Nachrichtentechnik, also zum Beispiel für die Überprüfung von Telefonleitungen
entwickelt. Um eine Anwendung in der Sprachaudiometrie zu ermöglichen,
wurden Modifikationen von Kollmeier et al. [17] durchgeführt. Bestehende
Probleme sind jedoch unter anderem der hohe apparative Aufwand und eine
begrenzte Homogenität des Testmaterials [17].
3.10 Marburger Sprachverständlichkeitstest
Der Marburger Sprachverständlichkeitstest ist neben dem Freiburger
Sprachtest ein weiterer, mit einer DIN-Norm versehene
Sprachverständlichkeitstest (DIN 45621, Teil 2) [7]. Allerdings findet er
zunehmend weniger Verwendung [37]. Er besteht aus 20 Testlisten zu je 10
Sätze [3]. Damit das Wortmaterial der Phonemverteilung der deutschen
Sprache entspricht, wurden im Test teilweise unvollständige Satzkonstruktionen
verwendet. Die Nachbildung einer alltagsnahen Sprachsituation wird damit
verfälscht. Darüber hinaus fällt bei dem Test die überdeutlich artikulierte
Aufsprache des geschulten Sprechers auf [34].
3.11 Oldenburger Satztest
Der Oldenburger Satztest wurde 1999 speziell für die Messung von
Sprachverständnis im Störgeräusch von Wagener, Brand und Kollmeier [33]
entwickelt. Bei diesem Satztest wird bei konstantem Pegel des Störgeräuschs
das Signal-Rausch-Verhältnis (Signal to Noise Ratio, SNR) variiert und somit
die Sprachverständlichkeitsschwelle im Störgeräusch bestimmt. Die
17
Sprachverständlichkeitsschwelle entspricht 50 % Sprachverständlichkeit, wobei
die Anzahl der richtig verstandenen Wörter gezählt wird. Der Oldenburger
Satztest ist ein geschlossener Test und besteht aus einem Wörtervorrat von je
10 Vornamen, Verben, Zahlen, Adjektiven und Objekten. Durch Randomisieren
dieses Wortmaterials entstehen teilweise wenig sinnvolle und daher auch kaum
vorhersagbare Sätze mit identischer Satzstruktur Dies hat den Vorteil, dass die
Listen sich kaum auswendig lernen lassen und daher wiederholt gemessen
werden können [22]. Insbesondere bei den Vornamen gibt es große
Unterschiede in der Verständlichkeit. Durch Optimierung des Sprachmaterials
und Korrektur der Pegelabweichungen konnte jedoch eine hohe Homogenität
der einzelnen Listen erreicht werden. Der OLSA ist besonders gut für
Messungen mit Schwerhörigen und Cochlea Implantierten geeignet. Es wird
auch hier wieder deutlich, dass jede Testanforderung einen entsprechenden
Test erfordert. So ist beispielsweise für eine Verlaufskontrolle die regelmäßig
wiederkehrenden Messungen erfordert, wie sie z.B. bei CI – Patienten
durchgeführt werden, ein besonders umfangreiches Angebot an Testsätzen
nötig um einen Lerneffekt auszuschließen. Dagegen wird es für eine einmalige
Untersuchung in besonderem Maße auf die Ausgewogenheit der Testlisten
ankommen. Weitere Fragestellungen, wie zum Beispiel arbeitsrechtliche
Untersuchungen, werden entsprechend normierte Testsituationen mit
maximaler Vergleichbarkeit besonders in den Mittelpunkt stellen. Tests mit
einsilbigem Sprachmaterial haben den Vorteil einer geringen Redundanz (d.h.
aus einem richtig erkannten Teil eines Wortes kann nicht auf den anderen,
unverständlichen Teil des Wortes geschlossen werden) und bieten eine hohe
analytische Aussagekraft bei den auftretenden Phonem Verwechslungen.
Zweisilber-Tests sind für die deutsche Sprache eher repräsentativ als die
Einsilber-Tests, da Zweisilber im Deutschen häufiger auftreten. Die Sprachtests
mit Sätzen bieten dagegen eine sehr realitätsnahe Kommunikationssituation
[16].
18
3.12 Freiburger Sprachverständlichkeitstest
Unter den bestehenden Tests ist der Freiburger Sprachverständnistest (FST)
nach Hahlbrock (1957) wohl der bekannteste und am häufigsten angewandte
[25]. Er wurde 1973 in einer Industrienorm fixiert (DIN 45621). Der FST findest
sowohl bei Erwachsen als auch bei Schulkindern Verwendung. Im
bundesdeutschen Krankenkassensystem ist das mit dem FST gemessene
Sprachverständnis eine entscheidende Größe für die Indikationsstellung und
die Erfolgskontrolle von Hörgeräteversorgungen. Für diese Zwecke werden die
Einsilberverständlichkeiten sowohl in ruhiger Umgebung als auch in definiertem
Störschall bestimmt. Der Freiburger Sprachverständlichkeitstest besteht aus 10
Gruppen mit je 10 zweistelligen Zahlen (Mehrsilber) und 20 Gruppen mit je 20
einsilbigen Prüfwörtern (Einsilber-Testmaterial, siehe Abbildung 1). Die
Versuchsperson ist angewiesen, das gehörte Wort zu wiederholen und der
Testleiter vermerkt die richtige oder die falsche Erkennung. Der Freiburger
Sprachtest ist nicht automatisiert. Die Erkennungsrate ergibt sich direkt aus der
Anzahl der richtig wiederholten Darbietungen in Prozent. Ein richtiges Wort trägt
also mit 5 Prozent und eine richtige Zahl mit 10 Prozent zur Erkennungsrate
bei.
3.13 Freiburger Sprachverständlichkeitstest in der Anwendung
Obwohl der Test in der Zwischenzeit oftmals kritisiert wurde, gilt er heute immer
noch als der in der Praxis am meisten angewandte Sprachverständlichkeitstest,
was sicherlich auch auf seine leichte Anwendung und Auswertung
zurückzuführen ist. Besonders das Einsilber-Testmaterial wurde häufig kritisiert,
da es nach aktuellen Maßstäben mittlerweile eine Reihe von Schwachstellen
aufweist. Als wichtigste Kritikpunkte werden häufig das begrenzte Testmaterial,
die statistisch begrenzte Aussagekraft und die Unausgewogenheit der
Testlisten genannt [11]. So wurde zum Beispiel in verschiedenen Studien von
19
Alich, Bangert, Kießling und Kollmeier [1, 2, 13, 16] gezeigt, dass die einzelnen
Listen im Hinblick auf ihre Verständlichkeit nicht gleichwertig sondern
unausgewogen sind. Die Erkennungsrate hängt also nicht nur von der
Sprachverständnisleistung des Probanden ab, sonder zusätzlich auch von der
gewählten Liste. Von Wedel [36] untersuchte die Verständlichkeit des FST an
einer Gruppe von Normalhörigen in den beiden Situationen Sprache in Ruhe
bei 30dB und Sprache im Störschall bei 70 dB Sprachpegel und einem SNR
von +10dB. Für beide Testsituationen (Ruhe/Störschall) wurden qualitativ
ähnliche Ergebnisse erhalten: Bei den Testlisten 1, 8 und 15 war das
Sprachverstehen um mehr als eine Standardabweichung besser als der
Gesamtmittelwert. Bei den Testlisten 14, 19 und 20 lag das Verständnis um
mehr als eine Standardabweichung unterhalb des Gesamtmittelwertes. Als
mögliche Ursache für die unterschiedlichen Verständlichkeiten wurde neben
dem unausgewogenen Sprachschallpegel der Einzelwörter auch der
unterschiedliche Bekanntheitsgrad der einzelnen Testwörter sowie die
Wahrscheinlichkeit, ein einzelnes Wort mit einem anderen existierenden Wort
zu verwechseln, diskutiert [9, 13]. Die Bekanntheitsgrade und
Verwechslungswahrscheinlichkeit der Einsilber wurden bei der Erstellung des
FST nicht ins Kalkül mit einbezogen. Ein weiterer Nachteil des Tests ist das
beschränkte Testmaterial: Mit nur zwanzig Listen kommt es im Verlauf von
wiederkehrenden Testsituationen häufig zu einer wiederholten Darbietung einer
Liste. Dieses Training könnte zu einem besseren Testergebnis bei
Wiederholungsmessungen führen.
Zusätzlich ist die Aussagekraft einer einzelnen Messung des
Sprachverständnisses mit nur einer Liste -also zwanzig Testwörtern – aus
statistischen Gründen begrenzt: Erstmals wies Thornten darauf hin, dass eine
Sprachverständlichkeitsmessung mit n Testwörtern und k korrekt verstandenen
Wörtern statistisch als eine Binomialverteilung B (n, p, k) interpretiert werden
kann [32]. Dabei steht p für die tatsächliche Verständlichkeit. Liegt diese bei
z.B. 50%, so liegt das Ergebnis eines Sprachtests mit 20 Testwörtern in 95%
der Fälle zwischen 20% und 80%. Somit kann eine Veränderung im
Testergebnis um 20% auch durch häufig aus rein statistischen Gründen
zustande kommen. Weitere häufig vorgebrachte Kritikpunkte am Freiburger
Einsilber-Test sind das Fehlen eines geeigneten Störschalls, das Fehlen eines
20
Ankündigungssignals, die fest vorgegebene Wortfolgefrequenz, die fehlende
Analyse von Phonemfehlinterpretationen sowie die nicht vorhandene adaptive
Pegelsteuerung [5, 8, 35, 37, 38]. Wegen der offenen Antwortmöglichkeiten ist
ein automatisierter (computergesteuerter) Testablauf ebenso wenig möglich wie
eine Analyse von Phonem-Verwechslungen. Die Aussprache ist veraltet und
weist eine übertriebene Artikulation der Testwörter sowie eine unnatürliche
Pegelnivellierung auf. Die Phonemverteilung entspricht zwar der deutschen
Sprache, aber Phonemübergänge wurden bei der Konzeption der Testlisten
nicht berücksichtigt [1].
Trotz dieser gehäuften Kritik, ist der FST immer noch der Standard in Kliniken,
bei der Hörgeräte Versorgung und in Hals-Nasen-Ohrenärztlichen Praxen [12].
Aus diesem Grund wurde der FST in der vorliegenden Studie erneut auf seine
Praxistauglichkeit hin untersucht. Zwei weitere Studien haben ergeben, dass
die Ausgewogenheit und Vergleichbarkeit zwischen den einzelnen Gruppen
nicht gegeben, oder zumindest fragwürdig ist [1, 2]. Allerdings waren die
Probanden dieser beiden Studien schwerhörige Jugendliche. Eine weiter
umfangreiche Studie mit Normalhörigen (n=16) lieferte ähnliche Ergebnisse
[36]. Allerdings ist der Quelle nicht zu entnehmen, ob die Testwörter
randomisiert dargeboten wurden und ob ein eventuell vorhandener Lerneffekt
bei den zwei verschiedenen Versuchen berücksichtigt wurde [36]. Aufgrund
dieser Unsicherheiten haben wir uns daher entschlossen, eine weitere Studie
mit 20 freiwilligen Normalhörigen durchzuführen. In dieser vorliegenden Studie
soll die Anwendbarkeit des FST für Sprachverständlichkeitsmessungen im
Störgeräusch in Hinblick auf Ermüdungsphänomene, Trainingseffekt und
Listenausgewogenheit untersucht werden. Hierzu wurde das Sprachverständnis
von Normalhörigen bei festem Signal-Rausch-Verhältnis für alle Testwörter
(n=400) des Freiburger Tests bestimmt.
21
Abbildung 1: Der Freiburger Sprachverständlichkeitstest (FST) unterteilt
sich in einen Zahlentest und in einen Wörtertest. Die Mehrsilbigen Zahlen
werden in 10 Gruppen à 10 Zahlen wiedergegeben. Die Einsilbigen
Wörter (Substantive) werden in 20 Gruppen à 20 Wörter präsentiert.
22
4. Material und Methoden
4.1 Versuchspersonen
Zwanzig junge und gesunde erwachsene Freiwillige (10 Frauen, 10 Männer,
jeweils ohne audiologische Krankengeschichte) nahmen als Probanden an
dieser Studie teil. Die Muttersprache aller Teilnehmer war Deutsch und ihr Alter
lag zwischen 21 und 30 Jahren (Durchschnittsalter 24.7 Jahre). Die Probanden
verfügten über ein beidseitig normales Hörvermögen: Die Hörschwellen für Luft-
und Knochenleitung waren bei den Frequenzen 0.125, 0.250, 0.5, 1, 2, 3, 4, 6,
8, 10 Kilohertz stets besser als 20 dB HL. Die Tympanogramme hatten einen
regelrechten Verlauf (Typ A). Die otoakustischen Emissionen (TEOAE) wurden
bei allen Versuchspersonen mit einer Reproduzierbarkeit von mehr als 60%
nachgewiesen. Der OAE-Pegel lag bei allen Probanden über 6 dB. Die
Teilnehmer waren vor der Untersuchung nicht mit dem Freiburger Test vertraut.
4.2 Verfahren
Die kommerziell verfügbaren CD-Versionen des Freiburger
Sprachverständlichkeitstests (CD Westra Nr. 1, Claus Wunderlich) wurden
unter Verwendung eines kalibrierten klinischen Standard-Audiometers (Auritec
AT9000, Kopfhörer Sennheiser HDA200) in einem schalldichten Raum
abgespielt. Der Darbietungspegel der Sprache wurde zu angenehmen 65 dB
SPL (Sound Pressure Level) gewählt. Das aus demselben Lautsprecher
kommende, zusätzliche Störgeräusch hatte einen Pegel von 67 dB (SNR = -
2dB) um mittlere Verständlichkeit von ca. 50 % zu erzielen. Als Störgeräusch
wurde das auf der Test CD enthaltene sprachverdeckte Rauschen verwendet.
Die Stimuli wurden durch eine selbst programmierte Matlab Software
wiedergegeben. Es wurde darauf geachtet, dass das sprachverdeckende
Dauerrauschen mindestens 500 ms vor dem ersten Wort anfing und erst
23
mindestens 500 ms nach dem letzten Wort endete. Die Stimuli wurden den
Testpersonen im freien Schallfeld aus einem Lautsprecher bei 0° Azimut in 1,5
Meter Entfernung präsentiert. Die 400 Wörter stammen aus den 20 Testlisten
zu je 20 Wörtern und wurden zu einer einzigen Liste mit 400 Wörtern
zusammen gefügt. Diese neue Liste wurde bei jeder Präsentation in einer
unterschiedlichen, randomisierten Reihenfolge wiedergegeben. Die Probanden
wurden vor Versuchsbeginn in das Testverfahren eingeführt: Die Aufgabe der
Teilnehmer war es, das jeweils vorgespielte Wort für alle vierhundert Testwörter
zu wiederholen. Die zufällige Reihenfolge der präsentierten Wörter wurde bei
jedem Test neu generiert, das heißt es gab keine Tests mit derselben
Reihenfolge der Wörter. Die Erkennungsrate der einzelnen Wörter ist somit
unabhängig von der Position der Wörter auf der ursprünglichen Test-CD. Der
Versuchsleiter befand sich in demselben schalldichten Raum wie der Proband
und bewertete seine Antworten jeweils als richtig oder falsch und gab diese
Antwort zur weiteren Analyse in eine MATLAB basierte Datenbank ein. Die
Antworten der Testpersonen wurden zusätzlich mit einem digitalen
Audiorecorder (R-4 Festplattenrecorder der Firma Edirol) aufgenommen, um die
Möglichkeit einer nachträglichen Kontrolle zu ermöglichen.
Es wurden insgesamt drei Präsentationsmodi zum Vergleich entworfen
(Standard, Beep und Dreinsilber, siehe Abbildung 2). Jede Testperson
absolvierte die Standard-Präsentation und jeweils eine der anderen beiden
Präsentationsmodi. Die Testpersonen nahmen dabei an insgesamt vier
Sitzungen teil, die auf zwei verschiedenen Tagen zu je zwei Sitzungen
aufgeteilt wurden. Dabei wurden Test und Retest eines Präsentationsmodus
immer am selben Tag durchgeführt, mit einer Pause von maximal einer Stunde.
Der zweite Präsentationsmodus mit Test und Retest wurde ein bis zwei
Wochen später durchgeführt. Die Dauer eines Versuchs mit Test und Retest lag
bei durchschnittlich 60 bis 90 Minuten. Die Aufteilung der Probanden auf die
Präsentationsmodi ist in der folgenden Liste dargestellt:
• Standard (nur Einsilber): 20 Teilnehmer
• Beep (Einsilber mit Ankündigungssignal): 10 Teilnehmer
• Dreinsilber (dreifache Einsilberwiederholung): 10 Teilnehmer
24
Das Ankündigungssignal in dem „Beep“ Präsentationsmodus war eine 100 ms
dauernde Überlagerung zweier Sinustöne mit den Frequenzen 500 Hz und 1
kHz. Um Knackgeräusche zu vermeiden, wurde ein Tangens hyperbolicus als
Hüllkurve verwendet. Der Ankündigungston wurde mit 70 dB vor jedem
Einsilber präsentiert (SNR=+3 dB). Die Einsilber wurden 400 ms nach dem
Ende des Ankündigungssignals gespielt, also exakt 0,5 Sekunden nach dessen
Beginn. Der Präsentationsmodus „Dreinsilber“ ist der Einsilber Test mit einer
dreifachen Wiederholung der einzelnen Wörter, der auch als 'Dreinsilber Test'
[40] bekannt ist. Der Abstand zwischen den Anfängen aufeinander folgender
Einsilber betrug jeweils 1500 ms, d.h. 1500 ms nach Beginn des ersten
Einsilbers folgte die erste Wiederholung des Einsilbers. Nach erneuten 1500 ms
erfolgte die zweite Wiederholung. Bei Probanden gab es zwei Untergruppen.
Die erste Untergruppe à 10 Personen absolvierte die „Präsentationsmodi
„Standard“ und „Beep“. Davon belegten 5 Personen den Standard Modus am
ersten Versuchstag („Standard 1“ im Test und „Standard 2“ im Retest) und
weitere 5 Personen den Beep Modus am ersten Versuchstag („Beep 1“ im Test
und „Beep 2“ im Retest). Die zweite Untergruppe à 10 Personen absolvierten
die Präsentationsmodi „Standard“ und „Dreinsilber“. Auch bei dieser
Untergruppe belegten jeweils 5 Personen den Standard Modus am ersten Tag
(„Standard 1“ im Test und „Standard 2“ im Retest) und jeweils weitere 5
Personen den Dreinsilber Modus („Dreinsilber 1“ im Test und „Dreinsilber 2“ im
Retest). Ein Schema dieses Versuchsablaufs ist in Abbildung 2 dargestellt.
25
Tag 1
1 W
och
e
Tag 2
Standard 1 Standard 2 Dreinsilber 1 Dreinsilber 2
Dreinsilber 1 Dreinsilber 2 Standard 1 Standard 2
Standard 1 Standard 2 Beep 1 Beep 2
Beep 1 Beep 2 Standard 1 Standard 2
ca. 60-90 Minuten ca. 60-90 Minuten
Abbildung 2: Versuchsablauf. Die Tests fanden an Tag 1 und Tag 2 mit
mindestens einer Woche Abstand dazwischen statt. Jeder
Präsentationsmodus (mit Test und Retest) dauerte zwischen 60 und 90
Minuten. Die Retests fanden jeweils an demselben Tag statt, nach einer
Pause von jeweils maximal einer Stunde.
Insgesamt gab es also vier Gruppen à 5 Personen mit folgender Reihenfolge
der Präsentationsmodi:
• Gruppe 1:Standard-->Dreinsilber
• Gruppe 2: Dreinsilber-->Standard
• Gruppe 3: Standard-->Beep
• Gruppe 4: Beep-->Standard
Das Test-Schema ist in Abbildung 2 übersichtlich dargestellt. Alle 20
Teilnehmer absolvierten den Standard Modus im Test und im Retest. Es wurde
per Randomisierung festgelegt, ob der Standard Modus an Tag 1 oder an Tag 2
absolviert wird (Test und Retest = 2 x 400 Wörter). An dem jeweils anderen Tag
wurde dementsprechend entweder der Beep Modus oder der Dreinsilber Modus
durchgeführt (Test und Retest = 2 x 400 Wörter, jeweils 10 Teilnehmer).
Ebenfalls randomisiert wurde, ob der Beep- oder der Dreinsilber Modus
zusätzlich zu den Standard-Tests durchgeführt wurde und welcher von diesen
Tests an dem ersten Tag durchgeführt wurde. Zwischen Test und Retest war
26
eine Pause von maximal einer Stunde, um die Trainingseffekte bei zeitnaher
Wiederholung zu überprüfen. Der Test im Standard Modus und der Test im
Beep Modus dauerten ungefähr 30 Minuten pro Durchgang. Die Durchführung
des Dreinsilber Modus benötigte mit ungefähr 45 Minuten deutlich mehr Zeit.
Der zweite Präsentationsmodus wurde in einem Abstand von ein bis zwei
Wochen durchgeführt (Tag 2). Ebenso wie an Tag 1 erfolgte Test und Retest
nach einer einstündigen Pause an demselben Tag.
27
4.3 Analyse
Vergleich der Präsentationsmodi
Bei jeder Testsituation aus Abbildung 2 wurden die mittleren
Sprachverständlichkeiten für fünf Probanden und jeweils vierhundert Testwörter
gemessen. Die mittleren Gruppenwerte der Testsituationen wurden miteinander
verglichen. Insbesondere wurden die Ergebnisse der unterschiedlichen
Präsentationsmodi, der unterschiedlichen Tage und der ersten und zweiten
Messung an demselben Tag verglichen. Hierzu wurde ein ungepaarter,
zweiseitiger T-Test durchgeführt (α=0,05). Für die Analyse wurde MATLAB™
(V7.14) verwendet. Zur Berücksichtigung der multiplen Testung wurde eine
Bonferroni-Korrektur durchgeführt.
Einzelwortverständlichkeit
Der Präsentationsmodus Standard 1 und Standard 2 wurde für alle der zwanzig
Probanden getestet. Um die Verständlichkeiten der einzelnen Wörter
miteinander zu vergleichen, wurde für alle zwanzig Probanden und jedes Wort
ausgezählt, von wie vielen der zwanzig Probanden die Einzelwörter bei
Standard 1 und bei Standard 2 korrekt verstanden wurden.
Listenbasierte Auswertung
In einer dritten Analyse wurden die ursprünglichen zwanzig Testlisten des
Freiburger Tests rekonstruiert. Für den Präsentationsmodus „Standard 1“ am
Tag 1 (10 Probanden) wurden für alle zwanzig Testlisten die mittleren
Verständlichkeiten berechnet. Diese Mittelwerte wurden mittels T-Test auf eine
statistisch signifikante Abweichung vom Gesamtmittelwert über alle Listen
zweiseitig geprüft.
28
5. Ergebnisse
5.1 Mittlere Verständlichkeit
Abbildung 3 zeigt die mittleren Verständlichkeiten für alle Testkonditionen.
Jeder Balken repräsentiert den Mittelwert über 400 Wortverständlichkeiten an
zehn Probanden für die Präsentationsmodus ‚Standard’ und fünf Probanden für
die Präsentationsmodi ‚Beep’ und ‚Dreinsilber’. Für alle Präsentationsmodi
finden sich in der ersten Messung an Tag 1 die niedrigsten Verständlichkeiten
und für die zweite Messung an Tag 2 die größten Verständlichkeiten. Bei dem
Präsentationsmodus ’Standard’ (std) liegen die Verständlichkeiten zwischen
48% und 57%. Für die Messungen mit Ankündigungssignal (beep) liegen die
Mittelwerte niedriger, zwischen 42% und 55%. Diese Unterschiede haben sich
jedoch nicht als statistisch signifikant erwiesen (p>0,05). Bei dem
Präsentationsmodus ‚Dreinsilber’ liegen die Verständlichkeiten zwischen 60%
und 70% und insgesamt signifikant höher als in der Standardsituation. Vom
ersten zum zweiten Tag verbessert sich die mittlere Verständlichkeit im Mittel
um 6,3%. Dieser Unterschied ist für alle sechs Präsentationen signifikant
(p<0,05). Die Unterschiede zwischen der ersten und der zweiten Präsentation
an demselben Tag liegen zwischen 2,7% und 6,4%. Diese Unterschiede sind
alle signifikant (p<0,05). Sie sind jedoch für den zweiten Tag etwas geringer als
für den ersten Tag.
29
std1 std2 beep1 beep2 drei1 drei20
10
20
30
40
50
60
70
80
90
100
Vers
tändlic
hke
it [%
]
Tag 1
std1 std2 beep1 beep2 drei1 drei20
10
20
30
40
50
60
70
80
90
100
Vers
tändlic
hke
it [%
]
Tag 2
Abbildung 3: Mittlere Verständlichkeit aller Präsentationsmodi (‚Standard’
(std), ‚Beep’ (beep) und ‚Dreinsilber’ (drein)). Bei dem
Präsentationsmodus Standard nahmen alle 20 Probanden teil, bei den
Präsentationsmodi ‚Beep’ bzw. ‚Dreinsilber’ nahmen jeweils 10
Probanden teil.
5.2 Einzelwortverständlichkeit
Alle zwanzig Probanden wurden im Präsentationsmodus ‚Standard’ entweder
an Tag 1 oder an Tag 2 direkt aufeinander folgend getestet. Dies erlaubt einen
direkten Vergleich der Test- mit den Retest Messungen. In Abbildung 4 ist
dargestellt, wie viele Wörter beim Test und beim Retest verstanden wurden.
Die Anzahl der Wörter ist dabei als Größe der Kreise markiert. Die Anzahl der
Probanden, die diese Wörter beim Test (Retest) verstanden haben ist auf der
x-Achse (y-Achse) aufgetragen. Man erkennt z.B. an Punkt „a“, das genau ein
Wort im ersten „Standard1“-Test von keinem Probanden erkannt wurde,
während es im zweiten „Standard2“-Retest von 4 Probanden erkannt wurde.
Da die Dokumentation auf Einzelwortebene erfolgte, konnte eine
Verständlichkeit für Test und Retest (also der identischen Messungen direkt
nacheinander gemessen) durchgeführt werden. Aus Abbildung 4 ist ersichtlich,
dass ein grossteil der 400 Wörter sehr selten und manche auch gar nicht
30
erkannt wurden, egal ob in der ersten oder in der zweiten Durchführung.
Allerdings gab es auch viele Wörter, die sehr häufig, bzw. immer von den
Probanden erkannt wurden. Die restlichen Wörter sind gleichmäßig zwischen
den beiden Extremen verteilt und wurden unterschiedlich häufig erkannt. So
wurden z.B. 12 der 400 Wörter sowohl beim Test als auch beim Retest
verstanden (dargstellt durch den Kreis bei den Koordinaten (20,20). Elf Wörter
wurden beim Test von 19 Probanden verstanden und beim Retest von allen 20
Probanden. Wegen des Trainingseffektes aufgrund der wiederholten Testung
liegen die Daten eher oberhalb der Winkelhalbierenden. Es gibt jedoch auch
ein Wort, das beim Test achtmal verstanden wurde und beim Retest nur
zweimal (Kreis bei den Koordinaten (8,2)). Die Verständlichkeit über die
Einzelworte verteilt sich in etwa gleichmäßig. Man kann jedoch eine deutliche
Clusterung zu den Enden beobachten, die Wörtern entsprechen, die besonders
gut bzw. besonders schlecht zu verstehen sind. Sieben der 400 Testwörter sind
so schwer verständlich, dass sie von allen Probanden weder beim Test noch
beim Retest richtig nachgesprochen wurden (vergleiche Tabelle 1), und 12
Wörter sind wiederum so gut zu verstehen, dass sie immer korrekt
nachgesprochen wurden (vergleiche Tabelle 2). Etwa 50 Wörter in Test und
Retest werden höchstens zweimal verstanden. Auf der anderen Seite gibt es
60 Wörter, die bei Test und Retest mindestens achtzehn Mal verstanden
wurden. Die übrigen 290 Testwörter verteilen sich in etwa gleichmäßig.
31
0 5 10 15 200
5
10
15
20
Anzahl der Verstehenden Test 1 (Test)
Anza
hl d
er
Vers
tehenden T
ers
t 2 (
Rete
st)
12 Wörter
1 Wort
Abbildung 4: Die Abbildung zeigt die Anzahl der verstandenen Wörter
des Präsentationsmodus Standard im Test (Standard 1) sowie im Retest
(Standard 2) bei allen 20 Probanden (x-Achse). Zwölf der 400 Wörter
wurden von allen 20 Probanden sowohl im Test als auch im Retest
verstanden (20/20). Sieben Wörter wurden von keinem der 20
Probanden verstanden, weder im Test noch im Retest, (0/0, vergleiche
Tabelle 1 und 2).
32
Wörter wie „Schlag“, „Erz“ oder „Drang“ waren so schwer zu verstehen, dass
sie von keinem der 20 Probanden, weder im Test noch im Retest, verstanden
wurden. Insgesamt wurden sieben von 400 Wörtern nie verstanden (siehe
Tabelle 1).
Wort Liste
Drang 4
Schlag 5
Erz 7
Grog 9
Gramm 10
Kork 12
Park 20
Tabelle 1: Wörter, die von keinem Probanden verstanden wurden, weder
im Test noch im Retest.
Wörter wie „Stift“, „Fest“ oder „Kind“ waren leicht zu verstehen, dass sie sowohl
beim Test als auch beim Retest von allen 20 Probanden verstanden wurden.
Insgesamt wurden 12 der 400 Wörter immer verstanden. (siehe Tabelle 2)
Wort Liste
Mönch 2
Stift 3
Frist 4
Fest 5
Teich 7
Fels 7
Sitz 8
Sicht 11
Pferd 11
Schwert 12
Meer 13
Kind 15
Tabelle 2: Wörter, die sowohl bei Test als auch bei Retest von allen Probanden verstanden wurden.
33
5.3 Listenbasierte Auswertung
Die Wörter wurden in unserer Studie zwar in zufälliger Reihenfolge präsentiert,
allerdings wurde die Verständlichkeit für jedes einzelne Wort separat gemessen
und festgehalten. Die aufgezeichneten Daten eignen sich daher um in einer
post-hoc Analyse die Verständlichkeit der einzelnen Listen des Freiburger Tests
zu rekonstruieren und zu bewerten. Aufgrund der kleinen, aber statistisch
signifikanten Unterschiede der Präsentationsmodi, wurde diese post-hoc
Analyse nur für den Modus „Standard 1“ am Tag 1 durchgeführt, also der
Präsentation der Wörter im Standardmodus für naive Testpersonen. In unserem
Kollektiv waren dies zehn Probanden (vgl. Abb. 5). Abbildung 5 zeigt die
mittleren Verständlichkeiten für die zwanzig Listen des Tests zusammen mit
den Standardabweichungen. Über alle Listen und Probanden gemittelt liegt die
Verständlichkeit bei 47,8% markiert durch die durchgezogene Linie. Die
Verständlichkeiten der Listen variieren dabei zwischen 38% (Liste 1) und 57,5%
(Liste 17). Für die einzelnen Probanden variieren die Verstehenswerte
zwischen 10% (Proband 4, Liste 20) und 70% (Proband 1, Liste 3) Die
Streuungen für die einzelnen Daten der Probanden liegen zwischen 10% und
70% (vergleiche Tabelle 3).
34
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 200
10
20
30
40
50
60
70
Listennummer
Vers
tändlic
hke
it [%
]
* * * * * *
Abbildung 5: Listenbasierte Auswertung. Liste 1 schloss nur mit einer
mittleren Verständlichkeit von 38% ab, währen Liste 17 mit 57,5% mit zu
den am meist verstehenden Listen gehörte. Die gemittelte
Verständlichkeit der Probanden und Listen lag bei 47,8%.
Mit Hilfe des T-Tests wurde untersucht, ob die mittlere Verständlichkeit einer
Liste signifikant vom Mittelwert über alle zwanzig Listen abweicht. Dabei
erwiesen sich die Verständlichkeit der Listen 1, 12, und 18 als signifikant
(p<0,05) schlechter und die der Listen 8, 15, 17 als signifikant besser als der
Gesamtmittelwert. Für die übrigen Listen war der Unterschied nicht signifikant.
35
Proband 1 2 3 4 5 6 7 8 9 10
Liste 1 45 20 40 35 55 50 35 35 40 25
Liste 2 45 35 35 50 60 70 60 45 50 65
Liste 3 70 45 35 50 70 55 45 70 65 50
Liste 4 45 35 45 60 50 55 50 55 45 45
Liste 5 35 35 25 65 60 70 40 50 50 25
Liste 6 55 45 30 65 50 65 40 65 60 35
Liste 7 30 45 30 50 40 50 40 55 65 40
Liste 8 60 45 45 45 45 60 50 65 65 65
Liste 9 35 55 25 35 55 55 55 45 60 40
Liste 10 50 60 30 35 45 45 40 65 55 50
Liste 11 35 40 45 35 40 50 55 55 60 30
Liste 12 30 35 30 35 50 40 50 45 45 40
Liste 13 50 45 35 55 50 50 50 45 60 40
Liste 14 30 40 25 35 50 65 30 45 45 35
Liste 15 60 60 55 50 45 55 55 70 65 55
Liste 16 65 30 50 55 55 60 60 40 60 45
Liste 17 35 45 55 65 60 65 60 65 70 55
Liste 18 40 30 40 40 45 40 35 40 60 30
Liste 19 50 25 40 55 65 60 50 45 70 50
Liste 20 45 25 50 10 45 60 50 65 60 35
Mittelwert 45,5 39,75 38,25 46,25 51,75 56 47,5 53,25 57,5 42,75
Tabelle 3: 20 Listen, die von 10 Probanden beim Standard 1 Test in
Prozent verstanden wurden.
36
6. Diskussion
Die in dieser Arbeit präsentierte Studie war so entworfen, dass unterschiedliche
Aspekte der Sprachaudiometrie untersucht werden konnten. So 1. wurde der
Einfluss der Darbietungsart (Standard, mit Ankündigungssignal oder dreifache
Wiederholung) analysiert. 2. wurde die Erlernbarkeit der Testwörter bei
wiederholter Testdarbietung dargestellt. 3. wurden die Verständlichkeiten
einzelner Wörter bestimmt und dadurch besonders gut verständliche und
besonders schwer verständliche Wörter identifiziert. 4. wurden die
Verständlichkeiten der im klinischen Alltag verwendeten Testlisten des
Freiburger Tests einzeln dargestellt und miteinander verglichen.
Bei dem Präsentationsmodus ’Standard’ lagen die mittleren Verständlichkeiten
über alle 400 Wörter zwischen 48% und 57%. Die Messungen mit
Ankündigungssignal ergaben niedrigere Mittelwerte von 42% bis 55%. Diese
Unterschiede haben sich jedoch nicht als statistisch signifikant erwiesen. Bei
dem Präsentationsmodus ‚Dreinsilber’ wurden signifikant höhere mittlere
Verständlichkeiten von 60% bis 70% erricht.
Insgesamt gab es vom ersten zum zweiten Tag eine signifikante Verbesserung
der mittleren Verständlichkeit aller Präsentationsmodi von 6,3%. Die
signifikanten Unterschiede zwischen der ersten und der zweiten Präsentation
an jeweils demselben Tag liegen zwischen 2,7% und 6,4% und sind für den
zweiten Tag etwas geringer als für den ersten Tag.
Die Verständlichkeit der einzelnen Testwörter war sehr unterschiedlich, so
wurden einige der 400 Wörter sehr selten bzw. gar nicht erkannt. Allerdings gab
es auch einige Wörter, die sehr häufig, bzw. immer erkannt wurden. Die
meisten Wörter sind gleichmäßig zwischen den beiden Extremen verteilt.
Die listenbasierte Auswertung des Präsentationsmodus „Standard“ (also des
FST nach DIN) ergab bei naiven Testpersonen eine über alle Probanden und
Listen gemittelte Verständlichkeit von 47,8%. Die Verständlichkeiten der
einzelnen Listen variieren dabei zwischen 38% (Liste 1) und 57,5% (Liste 17).
Insgesamt erwiesen sich die Verständlichkeiten der Listen 1, 12, und 18 als
37
signifikant schlechter und die der Listen 8, 15, 17 als signifikant besser als der
Gesamtmittelwert.
Die Variation der Verständlichkeit zwischen den Einzellisten lag im Mittel bei
6,2% (maximal 18,5%) und damit innerhalb der zu erwartenden statistischen
Fehlergrenzen, die bei 20 Item Tests zu erwarten sind. Die Dreinsilber Fassung
erhöhte die mittlere Verständlichkeit um 11% während das Voranstellen eines
Ankündigungssignals keinen signifikanten Einfluss auf die Verständlichkeit hat.
Die Trainingseffekte waren gering (~4%). Sie werden durch die randomisierte
Darbietung reduziert. Die nach Listen aufgeschlüsselten Verständlichkeiten
ergeben uneinheitliche Rangfolgen. Diese decken sich nur teilweise mit den
Ergebnissen früherer Studien [1]. Besonders auffällig ist das vergleichsweise
schlechte Abschneiden der Liste 1 und 2, die in [1] zu den Listen mit höchster
Erkennungsrate gehören. Eventuell hat bei den Probanden dieser Studie ein
besonders ausgeprägter Lerneffekt bei den ersten beiden Listen zu den
überdurchschnittlich guten Erkennungsraten in [1] geführt, da die ersten Listen
des FST in der Routine oft überdurchschnittlich häufig verwendet werden.
Vergleicht man unsere Listen mit denen aus früheren Studien [2], so schnitten
bei Bangert, 1980 die Listen 3, 15 und 20 sehr gut ab, bei uns waren es 8, 15,
und 17. Die Liste 20 lag bei uns eher im schlechteren Drittel. Die Listen 5 und
14 gehörten bei Bangert zu den deutlich schlechtesten, während es bei uns
eher auf Liste 1 und 12 zu traf. Man kann die abweichenden Ergebnisse
dadurch erklären, dass Bangert in seiner Studie schwerhörige Jugendliche als
Probanden hatte und den FST nicht im Störschall testete. Ebenso war die
Reihenfolge der Items in seiner Studie nicht randomisiert.
Für eine Hörgeräteversorgung wird von den Kostenträgern eine Verbesserung
der Verständlichkeit in Ruhe um 20% gefordert. Für die Bewilligung einer
bilateralen Versorgung muss ein Zugewinn von 10% Verständlichkeit im
Störschall nachgewiesen werden. Bei unseren Tests mit Normalhörigen wurde
diese Verbesserung um 10% bei 27% aller Messungen erreicht. Eine
Verbesserung um 20% wurde bei 10% aller Messungen erzielt. Diese
Streuungen waren für alle Präsentationsmodi (Standard, Beep, Dreinsilber)
gleich. Bei einer Zusammenfassung von zwei aufeinander folgenden Listen (40
38
Wörter) reduzieren sich diese Werte auf 18% bzw. 3%. Der von den
Kostenträgern geforderte Nachweis im Rahmen der Hörgeräteversorgung ist
vor dem Hintergrund dieser statistisch begrenzten Aussagekraft des FST
allerdings fragwürdig.
39
7. Schlussfolgerung
Obwohl auch in dieser Studie die Listenausgewogenheit unbefriedigend blieb,
unterscheiden sich die Ergebnisse zu früheren Untersuchungen bei
schwerhörigen Probanden. Die beobachteten Trainingseffekte des Tests liegen
unter denen, die in früheren Arbeiten beschrieben wurden. Im Zusammenhang
mit unserer Methodik kann ein eventuell eintretender Ermüdungseffekt bei 400
Wörtern durchaus kritisch betrachtet werden. Tatsächlich bemängelten die
Probanden die lange Testzeit, insbesondere bei dem Präsentationsmodus
Dreinsilber. Tatsächlich waren aber keinerlei Auswirkungen auf die Ergebnisse
nachweisbar.
Um ein eventuell genaueres und im klinischen Bereich unter Umständen
praxisrelevanteres Ergebnis der Listenäquivalenz zu erhalten, würde sich eine
neue Studie mit derselben Methodik empfehlen, die allerdings mit 20
schwerhörigen Probanden durchzuführen wäre. In diesem Fall wäre auch
denkbar, dass der Präsentationsmodus mit dem Ankündigungssignal
signifikantere Einflüsse auf die Verständlichkeit aufweist, als dies bei den
Normalhörigen offensichtlich der Fall ist.
40
8. Literaturverzeichnis
[1]. Alich G. Anmerkungen zum Freiburger Sprachverständnistest (FST).
Sprache – Stimme – Gehör. Zeitschr. für Kommunikationsstörungen
(1985); 9:1-6
[2]. Bangert H. Probleme der Ermittlung des Diskriminationsverlustes
nach dem Freiburger Sprachverständnistest. Audiologische Akustik
(1980); 19:166-170
[3]. Böhme G, Welzl-Müller K. Hörprüfungen im Erwachsenen- und
Kindesalter. 4. Auflage. Huber, Bern, Göttingen, Toronto, Seattle
(1998)
[4]. Bosman A. Review of speech audiometric tests. In: Kollmeier B.
Moderne Verfahren der Sprachaudiometrie. Median Verlag von
Killisch-Horn GmbH. Heidelberg (1992); 11-34
[5]. Dillier N, Spillmann T. Wahrnehmung akustischer Sprachmerkmale
mit einkanaligen Cochlea- Implantaten und Hörgeräten: Eine
vergleichende Analyse. HNO. Berlin (1988); 335-341
[6]. DIN 45 621, Teil 1. Sätze für Gehörprüfung mit Sprache. Deutsche
Elektrotechnische Kommission. Fachnormenausschuss
Elektrotechnik im DIN und VDE (DKE) (1973)
[7]. DIN 45 621, Teil 2. Sätze für Gehörprüfung mit Sprache. Deutsche
Elektrotechnische Kommission. Fachnormenausschuss
Elektrotechnik im DIN und VDE (DKE) (1980)
[8]. Dreschler WA. Phonemic confusion in quiet and noise for the
hearing-impaired. Audiology (1986); 25:19–28
[9]. Feldmann H. Audiometrie bei Erwachsenen. In: Berendes J, Link R,
Zöllner F. Hals-Nasen-Ohren-Heilkunde. Band 5. Ohr. 2. Auflage.
Thieme Verlag. Stuttgart (1979); 11.1-11.56
[10]. Hochmeier-Desoyer I, Schulz E, Moser L, Schmidt M. The HSM
Sentence Test as a Tool for Evaluating the Speech Understanding in
Noise of Cochlear Implantat Users. The American Journal of Otology
(1997); 18:83
[11]. Holube I, Kollmeier B. Beziehungen zwischen dem Einsilber-Reimtest
in Ruhe und der Ton- und Sprachaudiometrie. Audiologische Akustik
(1994); 2:18-29
41
[12]. Kießling J, Schubert M, Wagner I.
Sprachverständlichkeitsmessungen an Normalhörenden und
Schallempfindungsschwerhörigen – fünf Sprachtests im Vergleich.
Audiologische Akustik (1994); 1:6-19, 2:11-15
[13]. Kießling J. Moderne Verfahren der Sprachaudiometrie. Laryngo-
Rhino-Otol (2000); 79: 633-635
[14]. Klinke R, Silbernagel S. Lehrbuch der Physiologie. 2.Auflage. Georg
Thieme Verlag. Stuttgart (1996)
[15]. König ER. Kurzer Historischer Rückblick auf die Entwicklung der
Hörhilfemittel. 6.Audio-Symposium. Brommer AG. Zürich (1979)
[16]. Kollmeier B. Editorial. In: Kollmeier B. Moderne Verfahren der
Sprachaudiometrie. Median Verlag von Killisch-Horn GmbH.
Heidelberg (1992); 7-10
[17]. Kollmeier B, Müller C, Wesselkamp M, Kliem K. Weiterentwicklung
des Reimtests nach Sotscheck. In: Kollmeier B. Moderne Verfahren
der Sprachaudiometrie. Median Verlag von Killisch-Horn GmbH.
Heidelberg (1992); 216-236
[18]. Lehnhardt E. Praxis der Audiometrie. 6. neubearbeitete und
erweiterte Auflage. Thieme Verlag Stuttgart. New York (1987)
[19]. Lehnhardt E, Laszig R. Praxis der Audiometrie. 8. Auflage. Thieme
Verlag Stuttgart. New York (2001)
[20]. Miller GA, Nicely PE. An analysis of perceptual confusions among
some english consonants. J. Acoust. Soc. of Am. (1955); 27, 338-352
[21]. Müller-Deile J. Erprobung und Validierung von
sprachaudiometrischen und anderen computergesteuerten
Messverfahren für die klinische Audiometrie. In: Abschlußbericht zum
BMBF-Verbundvorhaben Förderkennzeichen 01 VJ 9314. Kiel (1997);
1-40
[22]. Oldenburger Satztest. Handbuch und Hintergrundwissen. Version
(2000)
[23]. Reiß M, Reiß G. Zur Bedeutung orientierender Hörprüfungen. Wiener
Medizinische Wochenschrift (2003); 154: 73
[24]. Schnotz A, Digeser F, Hoppe U. Speech with Gaps: Effects of
Periodic Interruptions on Speech Intelligibility, Folia Phoniatrica et
Logopaedica (2009); 61: 263-268
42
[25]. Schorn, K. Stand der audiologischen Diagnostik. Deutsche
Gesellschaft für Hals-, Nasen-, Ohrenheilkunde. Kopf- und
Halschirurgie. Verhandlungsbericht . Springer. Berlin (1997); 131-176
[26]. Schuh H. Ausgewogenheit des Hochmair-Schulz-Moser-Satztests bei
normalhörenden Personen zwischen 40 und 60 Jahren. Diss.
Universität Würzburg (1999)
[27]. Sendlmeier WF, Wedel von H. Ein Verfahren zur Messung von
Fehlleistungen beim Sprachverstehen - Überlegungen und erste
Ergebnisse. Sprache - Stimme – Gehör (1986); 10: 164-169
[28]. Silbernagel S, Despopoulos A. Taschenatlas der Physiologie.
4.Auflage. Georg Thieme Verlag. Stuttgart (1991)
[29]. Sotscheck J. Sprachqualitätstest aus der Nachrichtentechnik. In:
Kollmeier B. Moderne Verfahren der Sprachaudiometrie. Median
Verlag von Killisch-Horn GmbH. Heidelberg (1992); 35-50
[30]. Spreng M. Auswirkungen des Lärms auf das Hören. Audiol. Akustik
(1982); 21: 66-74
[31]. Spreng M. Diskriminationsentscheidende Bedeutung von
Kurzzeitschallereignissen. Institut Physiologie und experimentelle
Pathophysiologie. AG Biokybernetik. Uni-Erlangen (2000)
[32]. Thornton AR, Raffin MJM. Speech discrimination scores modified as
a binomial variable. Journal of Speech and Hearing Research (1978);
21: 507-518
[33]. Wagener K, Brand T, Kollmeier B. Entwicklung und Evaluation eines
Satztests für die deutsche Sprache. Teil III: Evaluation des
Oldenburger Satztests. Z. Audiol 38 (1999); 3: 86-95
[34]. Wagener K, Kühnel V, Kollmeier B. Entwicklung und Evaluation eines
Satztests für die deutsche Sprache. Teil 1: Design des Oldenburger
Satztests. Z. für Audiologie (2001); 1: 4-15
[35]. Wedel von H. Reichen die heute verfügbaren sprachaudiometrischen
Verfahren zur Hörgeräteanpassung?. Audiol. Akustik 23 (1984); 66-
77: 102-20
[36]. Wedel von H. Entsprechen die sprachaudiometrischen
Untersuchungsverfahren den heutigen Anforderungen in Klinik und
Praxis?. HNO(1986); 34: 71-74
43
[37]. Wedel von H. Fehlermöglichkeiten in der Ton- und
Sprachaudiometrie. HNO (2001); 11: 939-956
[38]. Wendler J, Seidner W, Kittel G, Eysholdt U. Lehrbuch der Phoniatrie
und Pädaudiologie. 3.völlig neu bearbeitete und erweiterte Auflage.
Thieme Verlag (1996)
[39]. Wesselkamp M, Kliem K, Kollmeier B. Erstellung eines optimierten
Satztests in deutscher Sprache. In: Kollmeier B. Moderne Verfahren
der Sprachaudiometrie. Median Verlag von Killisch-Horn GmbH.
Heidelberg (1992); 330-343
[40]. Döring WH, Hamacher W. Neue Sprachverständlichkeitstests in der
Klinik: Aachener Logatomtest und „Dreinsilbertest“ mit Störschall. In:
Kollmeier B. Moderne Verfahren der Sprachaudiometrie. Median
Verlag (1992); 137–168
[41]. Zenner H P, Struwe U, Schuschke G, Speng M, Stange G, Plath P,
Babisch W, Rebentisch E, Plinkert P, Bachmann KD, Ising H, Lehnert
G. Gehörschäden durch Freizeitlärm. HNO (1999); 47: 237
44
9. Abkürzungsverzeichnis
Seite Abkürzung Bedeutung
1,3,11,15,22,23 CD Compact Disc
15,17 CI Cochlea-Implantat
1,3,6,9,19,22,24 dB Dezibel
1,2,3,18,19,20,21,36,37,
38,40
FST Freiburger Sprachverständistest
22 HL Hearing Level
15,40 HSM Hochmair-Schulz-Moser
1,3,9,24 Hz Hertz
9,24 kHz Kilohertz
22 OAE Otoakustische Emissionen
17 OLSA Oldenburger Satztest
3,16,19,22,24 SNR Signal to Noise Ratio
3,22 SPL Sound Pressure Level
22 TEOAE
Transitorisch evozierte otoakustische
Emissionen
45
10. Anhang
Tabelle 4: Listen 1 bis 20 à 20 Wörter (Wort 1 bis Wort 400):
Die folgende Tabelle ist in Liste, Wort (Nummer) und dem jeweiligen Substantiv
aufgeteilt sowie finden sich die Anzahl der Personen wieder (maximal 20), die
dieses Wort im Standard 1 Test (Std1) und im Standard 2 Test (Std2)
verstanden haben.
Genauer ausgewertet wurde der Präsentationsmodus „Standard 1“ (Test) mit
20 Personen. Insgesamt 26 verschiedene Wörter wurden von keinen der 20
Probanden verstanden und insgesamt 23 verschiedene Wörter wurden von
allen 20 Probanden verstanden.
Liste Wort Substantiv Std1 Std2
1 1 Ring 12 6
1 2 Spott 11 11
1 3 Farm 8 10
1 4 Hang 0 2
1 5 Geist 6 5
1 6 Zahl 17 18
1 7 Hund 12 17
1 8 Bach 2 1
1 9 Floh 18 10
1 10 Lärm 17 16
1 11 Durst 9 13
1 12 Teig 1 3
1 13 Prinz 6 8
1 14 Aas 5 7
1 15 Schreck 12 15
1 16 Nuss 7 10
1 17 Wolf 2 3
1 18 Braut 0 1
1 19 Kern 12 15
1 20 Stich 18 18
2 1 Holz 20 18
2 2 Ruß 9 6
46
Liste Wort Substantiv Std1 Std2
2 3 Mark 3 4
2 4 Stein 16 14
2 5 Glied 0 1
2 6 Fleck 20 19
2 7 Busch 15 17
2 8 Schloss 18 20
2 9 Bart 6 7
2 10 Ei 2 7
2 11 Werk 6 9
2 12 Dach 4 3
2 13 Knie 14 13
2 14 Traum 10 14
2 15 Pass 4 2
2 16 Kunst 18 17
2 17 Mönch 20 20
2 18 Los 16 15
2 19 Schrift 17 18
2 20 Fall 1 0
3 1 Blatt 12 13
3 2 Stift 20 20
3 3 Hohn 0 2
3 4 Zweck 17 19
3 5 Aal 4 9
3 6 Furcht 20 18
3 7 Leim 2 4
3 8 Dorf 11 9
3 9 Tat 19 19
3 10 Kerl 14 12
3 11 Schutz 18 18
3 12 Wind 18 19
3 13 Maus 1 4
3 14 Reif 11 18
3 15 Bank 1 3
3 16 Klee 15 12
3 17 Stock 10 12
3 18 Wuchs 11 17
47
Liste Wort Substantiv Std1 Std2
3 19 Mist 19 19
3 20 Gras 9 10
4 1 Schnee 20 18
4 2 Wurst 15 18
4 3 Zahn 12 14
4 4 Pest 16 16
4 5 Griff 8 9
4 6 Laub 1 3
4 7 Mund 11 12
4 8 Grab 2 2
4 9 Heft 19 19
4 10 Kopf 12 5
4 11 Reiz 7 10
4 12 Frist 20 20
4 13 Drang 0 0
4 14 Fuß 19 20
4 15 Öl 5 4
4 16 Schleim 3 5
4 17 Takt 5 8
4 18 Kinn 15 16
4 19 Stoß 9 20
4 20 Ball 0 4
5 1 Punkt 9 14
5 2 Ziel 19 17
5 3 Fest 20 20
5 4 Darm 2 1
5 5 Schein 8 8
5 6 Torf 17 19
5 7 Lamm 5 10
5 8 Wehr 16 16
5 9 Glas 3 4
5 10 Huf 6 3
5 11 Spind 14 13
5 12 Pfau 9 7
5 13 Block 2 8
5 14 Arm 12 13
48
Liste Wort Substantiv Std1 Std2
5 15 Neid 12 10
5 16 Stroh 13 12
5 17 Wurf 11 13
5 18 Rest 12 10
5 19 Blick 13 14
5 20 Schlag 0 0
6 1 Seil 15 15
6 2 Pfand 11 11
6 3 Netz 18 18
6 4 Flur 10 13
6 5 Schild 19 19
6 6 Ochs 4 4
6 7 Draht 2 1
6 8 Hemd 16 18
6 9 Schmutz 19 19
6 10 Rat 8 12
6 11 Tau 17 12
6 12 Milch 9 9
6 13 Rost 4 5
6 14 Kahn 1 1
6 15 Tier 18 19
6 16 Brot 2 3
6 17 Dunst 3 4
6 18 Haar 5 5
6 19 Feld 19 20
6 20 Schein 15 13
7 1 Spiel 11 11
7 2 Moos 15 10
7 3 Lachs 12 15
7 4 Glut 1 1
7 5 Erz 0 0
7 6 Baum 13 11
7 7 Sand 19 15
7 8 Reich 9 6
7 9 Kuh 5 4
7 10 Schiff 17 20
49
Liste Wort Substantiv Std1 Std2
7 11 Wort 3 6
7 12 Hecht 15 13
7 13 Mann 5 3
7 14 Bruch 4 6
7 15 Schopf 12 16
7 16 Fels 20 20
7 17 Kranz 0 1
7 18 Teich 20 20
7 19 Dienst 11 8
7 20 Star 5 2
8 1 Luft 20 18
8 2 Band 3 1
8 3 Kost 4 1
8 4 Ski 15 18
8 5 Feind 10 11
8 6 Herr 4 10
8 7 Pflug 9 10
8 8 Tal 18 17
8 9 Gift 14 17
8 10 Raum 7 14
8 11 Ernst 20 19
8 12 Zeug 15 19
8 13 Fach 13 12
8 14 Groll 2 1
8 15 Speck 16 18
8 16 Sitz 20 20
8 17 Moor 12 16
8 18 Last 17 17
8 19 Krach 1 1
8 20 Schwung 12 16
9 1 Schmerz 18 19
9 2 Thron 8 14
9 3 Eis 12 5
9 4 Funk 10 10
9 5 Bass 3 2
9 6 Rind 14 15
50
Liste Wort Substantiv Std1 Std2
9 7 Lehm 17 19
9 8 Grog 0 0
9 9 Blei 0 1
9 10 Markt 1 2
9 11 Schilf 17 16
9 12 Hut 14 13
9 13 Zank 6 4
9 14 Korb 2 0
9 15 Lauf 14 15
9 16 Dank 1 2
9 17 Sarg 5 3
9 18 Kies 20 19
9 19 Schnur 17 15
9 20 Pech 15 17
10 1 Horn 3 7
10 2 Pfeil 13 12
10 3 Kamm 0 1
10 4 Turm 19 20
10 5 Spieß 19 20
10 6 Laus 14 14
10 7 Recht 14 15
10 8 Zopf 17 19
10 9 Schall 12 15
10 10 Mais 7 6
10 11 Fell 17 18
10 12 Gramm 0 0
10 13 Ohr 15 13
10 14 Sieb 13 16
10 15 Pracht 0 1
10 16 Lump 8 7
10 17 Gips 12 18
10 18 Bad 4 2
10 19 Sprung 12 12
10 20 Dreck 7 9
11 1 Bild 13 16
11 2 Frosch 12 16
51
Liste Wort Substantiv Std1 Std2
11 3 Abt 0 2
11 4 Ruhm 7 4
11 5 Herz 20 19
11 6 Mond 10 10
11 7 Garn 0 1
11 8 Bau 3 6
11 9 Sicht 20 20
11 10 Huhn 7 6
11 11 Lack 6 3
11 12 Kreis 2 0
11 13 Pferd 20 20
11 14 Pelz 10 16
11 15 Schlacht 3 6
11 16 Witz 20 19
11 17 Form 13 18
11 18 Stuhl 10 8
11 19 Teil 7 10
11 20 Rand 3 4
12 1 Brett 4 9
12 2 Schuss 16 14
12 3 Saft 13 13
12 4 Pilz 18 19
12 5 Ort 7 12
12 6 Kraut 0 2
12 7 Schwert 20 20
12 8 Tag 4 5
12 9 Gleis 1 0
12 10 Vieh 17 19
12 11 Spalt 5 6
12 12 Sohn 19 19
12 13 Druck 6 9
12 14 Held 6 11
12 15 Bahn 1 1
12 16 List 13 19
12 17 Flug 8 7
12 18 Narr 2 1
52
Liste Wort Substantiv Std1 Std2
12 19 Kork 0 0
12 20 Reis 11 6
13 1 Staub 13 18
13 2 Licht 19 18
13 3 Tracht 2 3
13 4 Herd 18 18
13 5 Not 8 10
13 6 Wein 3 8
13 7 Fluch 8 8
13 8 Kalk 1 0
13 9 Biss 14 18
13 10 Grund 3 2
13 11 Weg 18 18
13 12 Fass 20 17
13 13 Schmied 16 16
13 14 Ross 3 6
13 15 Amt 1 3
13 16 Puls 8 2
13 17 Meer 20 20
13 18 Graf 2 4
13 19 Schweiß 14 12
13 20 Dolch 8 9
14 1 Schrift 14 15
14 2 Ruf 6 8
14 3 Gas 2 0
14 4 Wert 17 14
14 5 Korn 4 7
14 6 Schrei 2 1
14 7 Pfahl 9 14
14 8 Blech 7 8
14 9 Faust 13 15
14 10 Rang 0 1
14 11 Lohn 13 17
14 12 Nest 14 14
14 13 Pult 1 3
14 14 Schicht 20 19
53
Liste Wort Substantiv Std1 Std2
14 15 Zoll 6 13
14 16 Heu 0 3
14 17 Angst 7 7
14 18 Brust 5 6
14 19 Dieb 18 18
14 20 Stand 8 13
15 1 Knecht 15 17
15 2 Schaf 18 18
15 3 Lust 17 20
15 4 Berg 12 14
15 5 Docht 14 16
15 6 Zeit 18 19
15 7 Schlamm 6 12
15 8 Kind 20 20
15 9 Preis 0 1
15 10 Uhr 18 15
15 11 Mal 1 2
15 12 Speer 13 11
15 13 Fluss 19 19
15 14 Sinn 19 20
15 15 Rock 1 1
15 16 Haupt 9 7
15 17 Gang 0 1
15 18 Trieb 13 18
15 19 Boot 8 13
15 20 Schmalz 12 14
16 1 Bund 1 1
16 2 Stiel 18 17
16 3 Wachs 13 11
16 4 Reim 2 5
16 5 Geld 5 4
16 6 Tor 12 17
16 7 Duft 14 16
16 8 Stück 14 16
16 9 Arzt 5 2
16 10 Mehl 17 18
54
Liste Wort Substantiv Std1 Std2
16 11 Trotz 13 13
16 12 Pfad 13 14
16 13 Heil 3 7
16 14 Brief 15 18
16 15 Sau 17 18
16 16 Fracht 13 15
16 17 Dung 4 5
16 18 Stern 16 20
16 19 Loch 16 14
16 20 Maß 2 3
17 1 Fink 19 20
17 2 Schlauch 7 4
17 3 Reh 11 10
17 4 Grad 1 0
17 5 Floß 18 19
17 6 Hirn 12 16
17 7 Fuchs 19 20
17 8 Bein 1 1
17 9 Napf 12 12
17 10 Teer 18 20
17 11 Stolz 19 20
17 12 Art 7 5
17 13 Wurm 14 17
17 14 Ding 19 19
17 15 Trab 2 5
17 16 Bett 15 18
17 17 Kleid 11 11
17 18 Schatz 19 20
17 19 Wut 8 11
17 20 Pflock 8 9
18 1 Schnitt 7 9
18 2 Frau 13 16
18 3 Land 15 15
18 4 Helm 10 13
18 5 Bock 1 1
18 6 Flucht 16 18
55
Liste Wort Substantiv Std1 Std2
18 7 Scherz 16 19
18 8 Keil 0 1
18 9 Rast 5 10
18 10 Gruß 4 3
18 11 Wohl 2 4
18 12 Plan 7 10
18 13 Krieg 6 3
18 14 Ast 8 5
18 15 Pfiff 17 16
18 16 Weib 4 4
18 17 Sturm 18 18
18 18 Fang 0 3
18 19 Tee 19 17
18 20 Mord 17 15
19 1 Frucht 12 12
19 2 Schlitz 11 17
19 3 See 18 19
19 4 Schar 2 0
19 5 Gold 13 14
19 6 Leib 3 6
19 7 Wunsch 3 5
19 8 Fraß 17 15
19 9 Stier 18 19
19 10 Ton 12 12
19 11 Heer 12 16
19 12 Dachs 5 4
19 13 Bauch 8 11
19 14 Kreuz 7 8
19 15 Akt 9 6
19 16 Pfund 7 6
19 17 Sekt 19 20
19 18 Glück 8 7
19 19 Molch 17 15
19 20 Rad 7 9
20 1 Fleisch 8 9
20 2 Welt 16 17
56
Liste Wort Substantiv Std1 Std2
20 3 Rohr 0 4
20 4 Park 0 0
20 5 Flut 18 17
20 6 Grieß 4 4
20 7 Saum 12 13
20 8 Krebs 8 6
20 9 Hand 15 13
20 10 Gott 6 11
20 11 Schuh 17 17
20 12 Film 12 15
20 13 Damm 1 2
20 14 Zelt 10 13
20 15 Koch 1 0
20 16 Hanf 12 11
20 17 Leid 15 15
20 18 Bier 7 8
20 19 Spruch 12 13
20 20 Axt 17 16
57
11. Danksagung
Als erstes möchte ich mich bei Prof. Dr. Dr. Ulrich Hoppe für die Möglichkeit
dieser wissenschaftlichen Arbeit an der Hals-Nasen-Ohren-Klinik Erlangen
bedanken. Seine hervorragende Betreuung, seine Hilfsbereitschaft und seine
Geduld bei der Anfertigung dieser Arbeit waren außergewöhnlich.
Besonderer Dank gebührt Dr. Frank Digeser für die zu jeder Zeit großartige
wissenschaftliche Unterstützung. Die stets rasche und unkomplizierte Hilfe
erleichterte die Anfertigung der Arbeit immens und machte die Zusammenarbeit
mit ihm sehr angenehm.
Ebenso gebührt mein Dank den Mitarbeitern der audiologischen Abteilung der
Hals-Nasen-Ohr-Klinik Erlangen für die Hilfe beim Bedienen der Geräte und ihr
stets offenes Ohr bei Fragen.
Ein außerordentlicher Dank gilt den zwanzig freiwilligen Probanden für ihre
Geduld und Teilnahme an den Tests, ohne die diese Arbeit niemals möglich
gewesen wäre.
Meinen Eltern möchte ich dafür danken, dass sie mir das Studium der
Zahnmedizin durch ihre immense Unterstützung ermöglicht haben.