Sachverzeichnis - link.springer.com978-3-642-31503-9/1.pdf · Average magnitude difference function...
-
Upload
nguyenkiet -
Category
Documents
-
view
215 -
download
0
Transcript of Sachverzeichnis - link.springer.com978-3-642-31503-9/1.pdf · Average magnitude difference function...
391
Sachverzeichnis
K. Fellbaum, Sprachverarbeitung und Sprachübertragung,DOI 10.1007/978-3-642-31503-9, © Springer-Verlag Berlin Heidelberg 2012
AAbsolute Category Rating Test (ACR-Test), 140Abstandsgesetz, 41Abtastfrequenz, 178Abtasttheorem, 177Adaptive Linear Neuron (ADALINE), 285Adiabatengesetz, 22Algebraic CELP (ACELP), 238Allomorph, 71Allophon, 67Amplitudendichteverteilung (ADV), 95Analogsignal, 174Anaphora, 371Ansatzrohr, 62Articulation Index (AI), 161Artikulation, 62Artikulationstrakt, 75, 214Association Phontique Internationale (API), 69Atmung, 58Audiocodierung, MPEG-basierte, 243Außenohr, 100Autokorrelationskoeffizient, 194Average magnitude difference function
(AMDF), 230
BBackpropagation-Algorithmus, 292Bandpasssprache, 95Bark-Skalierung, 115Bayes-Klassifikation, 260
Entscheidungsregel, 265Maximum-Likelihood-Klassifikator, 266vollständige, 264
Bellcore-Test, 153Berliner Sätze, 156Bewegungsgleichung, 21
Binärzeichen, 13Breitbandspektrogramm, 81Breitbandsprache, 251
CCall Clarity Index (CCI), 168Center clipping, 227Cepstrum, 222, 256CLID-Test, 152Clusteranalyse, 351Code, 11, 382Code-Excited Linear Prediction (CELP), 237
Algebraic (ACELP), 238Decoder, 240
Codebuch, 233, 235Codewörter, 187Codierung, 13, 183
hybride, 232Analyse-durch-Synthese-Prinzip, 236Kurzzeitprädiktion, 233Langzeitprädiktion, 233Vektorquantisierung, 233
Comparison Category Rating (CCR-Test), 143Computional Model for Voice Transmis-
sion Quality from Mouth to Ear (VTQME), 168
Conjugate-Structure Algebraic-Code-Excited Linear Prediction (CS-ACELP)-Verfahren, 240
Cortisches Organ, 103Critical Band Rate, 115
DDecodierung, 13Degradation Category Rating (DCR-Test), 143
392 Sachverzeichnis
Deiktik, 371Diagnostic Acceptability Measure (DAM), 157Diagnostic Rhyme Test (DRT), 151Dialoggestaltung, 374Dialogmanager, 378
Slot-Filling-Methode, 379Dialogphasen, 373Dialogsystem
multimediales, 381, 382MAP21, 386Projekt ARVIKA, 385Projekt EMBASSI, 385Projekt INVITE, 385SmartKom-Dokumentation, 384
multimodales, 377sprachbasiertes, 378
Differenz-Pulscodemodulation (DPCM), 189adaptive (ADPCM), 199, 205
Digitalsignal, 174Diphone, 353, 355Diphthong, 65Diskrete Cosinus-Transformation (DCT), 242Dynamic Time Warping (DTW)-Klassifikator,
295
EE-Modell, 168Einzellaut
Klassifikation, 66Signaleigenschaften, 85
Einzelworterkennung, 312mit neuronalen Netzen, 314
eLearning, 383Elektretmikrofon, 54Elektroakustik, 19, 160ELIZA, 369Endolymphe, 103Entropie, 15Entscheidungsgehalt, 15Euklidisches Abstandsquadrat, 335
gewichtetes, 270Eustachische Röhre, s. auch Ohrtrompete, 101Exponentialtrichter, 45
FFace-to-face-Dialog, 370Fensterung, 77Fernsprechnetz, 168
E-Modell, 168Filter-Bandbreite, 120Filter, digitaler, 75Filterung, inverse, 207Formant, 76, 94
Synthese, 359Vocoder, 360Tracking, 360
Formantfrequenz, 62Formantkarte, 92Fouriertransformation, diskrete (DFT), 254Freiburger Wörtertest, 154Frequenzänderungen, gerade wahrnehmbare
(just noticeable variation in frequency, JNVF), 123
Frequenzbereichscodierung, 241MPEG-basierte Audiocodierung, 243Teilbandcodierung (Subband Coding), 242Transformationscodierung, 241
Frequenzhub, 123Frequenzmodulation, 123Frequenzselektivität, 107
GGehörknöchelchen, 101
Impedanzanpassung, 101Geräuschpegel, 137Glottis, siehe StimmritzeGlottisschläge, 82Grammatik, 7, 322Graphemcluster, 350, 355Graphemik, 6Grundfrequenzanalyse, 222
AMDF-Verfahren, 230Center-Clipping-Verfahren, 227Cepstrum-Verfahren, 222SIFT-Verfahren, 226
Grundperiode, 61, 75, 221
HHaarzellen, 103, 105Halbsilben, 355Hamming-Fenster, 77, 78, 205, 254Haskins Syntactic Sentences, 155Havard Psychoacoustic Sentences, 155Helmholtzsche Resonanztheorie, 62Hidden-Markov-Modell, 273, 275, 313
Links-rechts-Modell, 279
393Sachverzeichnis
Hohlraumresonator, 62Homograf, 352, 353Höranstrengung, 141Hören
Empfindungsgrößen, 107Knochenleitung, 102peripheres, 99Reizgrößen, 107zentrales, 99
Hörfläche, 107, 109Hörhypothesen, 105
Einortshypothese, 105Resonanzhypothese, 105Wanderwellenhypothese, 106
Hörnerv, 104Hörorgan, 57Hörphysiologie, 99Hörqualität, 140Hörschädigung, 108Hörschall, 19, 108Hörschwelle, 100, 104, 108, 136, 244Hörsituation, 159Hörtest, 130, 136, 137
Versuchsablauf, 139
IIn-Service Non-Intrusive Measurement Devices
(INMD), 167Information, 12Informationsgehalt, 15Informationstheorie, 12Infraschall, 108Innenohr, 102
Basilarmembran, 102Haarzellen, 103Paukentreppe, 102Reißnersche Membran, 102
Integrated Services Digital Network (ISDN), 188
International Phonetic Association (IPA), 69Intervallskala, 132ISDN, siehe Integrated Services Digital
Network, 188Isofone, 109
KKanalvocoder, 215Kaskade, 75
Klassifikation, 259Abstandsklassifikatoren, 271entscheidungstheoretische, 260Gaußverteilung, 268lineare Klassifikatoren, 270statistische Klassifikatoren, 268Wahrscheinlichkeitsverteilung, 268
Klassifikatorlinearer, 270statistischer, 268
Klirrfaktormessung, 160Knochenleitung, 102Koartikulationseffekt, 8, 88, 94, 281, 359Kommunikation, 10, 369Kommunikationsmodell, 11Kommunikationsqualität, 246Kommunikationssystem
Kanal, 14Quelle, 12Senke, 14Störeffekte, 16
Kommunizierbarkeit, 130Kondensatormikrofon, 53, 54Konkatenation, 356
parametrische, 358Konsonant, 62, 86
Artikulationsarten, 63Artikulationsort, 63
Kontexthören, 146Kontextanalyse, 352Kontinuitätsgleichung, 22Konversationstest, 130, 156Körperschall, 108Kreuzgliedstruktur, 220Kugelstrahler, 41Kugelwelle, 35
Schallfluss, 41Künstliche Intelligenz, 322
LLangue, 3Langzeitmessung von Sprache, 94Lautbildung, 214Lautelemente-Bibliothek, 348, 354, 359Lautelementeverkettung, 356Lautheit, 107, 111, 124Lautklassifikation, 62Lautschrift, 353Lautschriftsystem, 68
394 Sachverzeichnis
Lautschriftzeichen, 70Lautsprecher, elektrostatischer, 54Lautstärke, 107, 110
Frequenzgruppen, 112Lautstärkebestimmung, 120Lautstärkenpräferenz, 142Lautzeichen (Phone), 7, 9Liftering, 257Linear Predictive Cepstral Coding (LPCC), 253Linguistik, 1
Teilgebiete, 5Listening-opinion test, 130Logatom, 147Logatomliste, 147Logatommessung, 136Logatomtest, 147Logopädie, 58LPCC-Koeffizient, 253Luftmolekül, 20Luftschall, 19Luftstrom, egressiver, 59
MMahalanobis-Abstand, 269Marburger Satztest, 156Markov-Modell, 273Markov-Prozess, 273Maskierungseffekt, 245Mean Opinion Score (MOS), 158Mediummasse, 39Mel-Frequency Cepstral Coefficient (MFCC), 253Melfilterung, 256Mensch-Maschine-Dialog, 372
Dialoggestaltung, 374Dialoginitiative, 372
benutzergesteuerte, 372systemgesteuerte, 372variable, 373
Echtzeitverarbeitung, 375Plausibilitätsprüfung, 376Sprachausgabe, 375
Mensch-Maschine-Kommunikation, 369Mensch-Mensch-Dialog, 370Merkmalextraktion, 251, 252
Linear Predictive Cepstral Coding (LPCC), 253
Perceptual Linear Predictive (PLP)-Analyse, 258
RASTA-Perceptual Linear Predictive (RASTA-PLP)-Verfahren, 258
Merkmalvektor, 260, 310Mikrofon
elektrostatisches, 53Empfindlichkeit, 51piezoelektrisches, 55
Mithörschwelle, 118, 245Mitteilung, 12Mittelohr, 101Mittenfrequenz, 113Mobiltelefonie, 133Modified Rhyme Test (MRT), 151Morph, 70Morphem, 71Morphemik, 6Moving Picture Experts Groups (MPEG), 243Multicodalität, 382Multilayer Perzeptron (MLP), 291
Backpropagation-Verfahren, 292Fehlerbetrachtung, 293
Multimedia, 381Multimodalität, 381
NNachrichtentechnik, 12Nasal, 86Neuron, 282
Feedforward-Netze, 290künstliches, 283Netzstrukturen, 290
Neuronale Netze, 282ADALINE, 285Einzelworterkennung, 314künstliche, 282
Nominalskala, 132Nutz-Schallpegel, 137
OÖffnungsmaß, 46Ohr, 99Ohrmuschel, 100Ohrtrompete, 101Oktave, 124Oldenburger Satztest (olsa), 155Ordinalskala, 132
PParameter Tying, 281PARCOR-Koeffizient, 197, 219
395Sachverzeichnis
Parole, 2Paukenhöhle, 101Percentage Articulation Loss of Consonants
(% ALcons), 160Perceptual Evaluation of Speech Quality
(PESQ), 166Perceptual Linear Predictive (PLP)-Analyse,
258Perceptual Speech Quality Measure (PSQM),
164Perilymphe, 103Permanentmagnet, 49Perzeptron, 289Phon, 67Phonation, 59Phoncluster, 354Phonem, 67, 94Phonemhäufigkeitsverteilung, 139Phonetically Balanced Word List, 154Phonetik, 4, 5, 57Phonologie, 3, 5Phonotaktik, 6Piezopieper, 56Pitch-Synchronous Overlap-and-Add(PSOLA)-
Verfahren, 357Polsterpfeife, 60Polyglott-Sprachsynthese, 366Potenziometer, 74Prädiktion, lineare, 189, 207Prädiktionsvocoder, linearer (LPC-Vocoder),
215, 216Prädiktorkoeffizient, 192, 205, 219
Autokorrelationsmethode, 202Kovarianz-Methode, 200
Pragmatik, 3, 7, 8, 323Prosodie, 349, 356Prosodietest, 156Psychoakustik, 107Pulscodemodulation (PCM), 94, 176
Multiplextechnik, 188Punktquelle, 35
QQuantisierung, 179
ungleichmäßige, 184Quefrency, 223Quellentropie, 16
RRASTA-Perceptual Linear Predictive (RASTA-
PLP)-Verfahren, 258Rauschen, kalibriertes, 144Rauschfrequenz, 88Rede, 2Reflexionskoeffizient, 220Reibelaute, 88Reimtest, 151
modifizierter, 151diagnostischer, 152
Rekruitment-Phänomen, 104Residual Excited Linear Prediction (RELP), 237Resonanzeffekt, 105Resonanzfrequenz, 76Restsignal-Codierung, 237Room Analysis Speech Transmission Index
(RASTI), 161Ruhehörschwelle, 118
SSAM-PA-Zeichen, 71Schall
Antransport, 99Intensitätspegel, 29Leistungspegel, 29
Schallabstrahlung, 42, 76ebene, 25gebündelte, 42kugelförmige, 38
Schallausbreitung, 19, 21Bewegungsgleichung, 21Geschwindigkeitspotential, 24Kontinuitätsgleichung, 22kugelförmige, 35Wellenlänge, 26
Schallbündelung, 42Schalldruck, 19, 26
bewerteter, 110Effektivwerte, 27, 117Pegelrechnung, 29
Schalldruckpegel, 29, 109Schallereignis, 112
Pegelzuwachs, 115zeitliche Maskierung, 245
Schallfeld, 19, 100ebenes, 27
Schallfluss, 28, 33
396 Sachverzeichnis
Schallgeschwindigkeit, 20, 23, 36Schallintensität, 28, 37, 112Schallkennimpedanz, 28, 36Schallleistung, 29, 37Schallpegel, siehe SchalldruckpegelSchallpegelmesser, 111Schallquelle, 30Schallreiz, 99Schallsender, 50Schallwelle, 19Schlüsselworterkennung, 318Schmalbandrauschen, 119Schmalbandspektrogramm, 81Schnecke (Cochlea), 102Schnelle, 20, 22Schriftzeichen, 9Semantik, 6Semiotik (Zeichenlehre), 4, 7
Zeichenbegriff, 8Semiotisches Dreieck, 10Sigmoidfunktion, 285Signal-Geräusch-Verhältnis (SNR), 144, 161,
175, 183Signal-to-Noise Ratio (SNR), siehe
Signal-Geräusch-VerhältnisSignalformcodierung (waveform coding), 175,
176Fehlerrückkopplung, 198parametrische Verfahren, 214Pulscodemodulation (PCM), 176
Signalverarbeitung, 219Silbe, 69Silbenverständlichkeitsmessung, 149Silbenverständlichkeitstest, 130Simplified inverse filtering technique (SIFT),
226SmartKom-Dokumentation, 384Speech Assessment Method (SAM), 69, 153
Phonetic Alphabet, 69Prosodic Form Test, 156Semantically Unpredictable Sentences
(SUS), 155Standard Segmental Test, 153
Speech Intelligibility Index SII, 161Speech Transmission Index (STI), 161
Public Access (STI-PA), 161Spektrogramm, 81Spontansprache, 306, 370Sprachaudiometrie, 131, 134
Sprachausgabe, 343Concept-to-speech-Prinzip, 378Non-Uniform Unit Selection, 343Sprachsyntheseverfahren, 343Sprachwiedergabeverfahren, 343
Sprachbegriff, 2, 3Sprachcodierung, 133Sprachcodierverfahren, 173
Einteilung, 175Frequenzbereichscodierung, 241Grundfrequenzanalyse (GFA), 221
Sprachdialogsystem (Spoken Dialogue System, SDS), 369, 377, 379
Beispiel VERBMOBIL, 380Sprache
als Kommunikationsform, 10als Zeichensystem, 7Struktur, 8
Spracheingabe, 303Spracherkennung, 303, 338
akustisch-phonetische, 315als mathematische Optimierungsaufgabe, 309automatische, 306automatische, 307beim Menschen, 304Erkennung fortlaufender Sprache, 320Formen, 308Klassifikation, 251Maximum-a-posteriori-Regel, 310Merkmalextraktion, 251mit Hidden-Markov-Modellen, 313Out of Vocabulary, 318Wortakkuratheit, 316Wortfehlerrate, 316
Spracherzeugung, 71, 222, 304Artikulationstrakt, 76Röhrenmodell, 73
Sprachfähigkeit, 1Sprachgebilde, 3Sprachgebrauch, 2Sprachgemeinschaft, 2Sprachgrundfrequenz, 61Sprachinterpretation, 323Sprachkommunikation, 10
einseitig gerichtete (Hörsituation), 159Sprachlabor, 131Sprachmodell, 310Sprachproduktion, 58Sprachproduktionssystem, 363
397Sachverzeichnis
Sprachqualität, 127Dimensionen, 128Kommunizierbarkeit, 130Verständlichkeit, 128Verständnis, 130Verstehbarkeit, 129
Sprachqualitätsmessung, 130Absolute Category Rating Test (ACR-Test),
140Antwortformen, 133Anwendungsgebiete, 133auditive Verfahren, 134
diagnostische Qualitätsbewertung, 134, 146
globale Qualitätsbewertung, 134, 139Bellcore-Test, 153CLID-Test, 152Comparison Category Rating (CCR-Test), 143Degradation Category Rating (DCR-Test),
143Einschätzungstest für Störeinflüsse (Quantal
Response Detectability-, QRD-Test), 142
Gehörmodelle, 163instrumentelle Verfahren, 157ITU-T-Standards, 168Logatomtest, 147Paarvergleichstest, 143Prosodietest, 156Reimtest, 151Skalierungsformen, 132spektrale Abstandsmaße, 163Verfahren mit Referenzsignal, 160Verfahren ohne Referenzsignal, 167
Sprachsignal, 57, 76, 321Darstellung, 77
im Frequenzbereich, 81im Zeitbereich, 79
Langzeitmessung, 94Zeitfenster, 77
Sprachsignalübertragung, digitale, 173Sprachsteuerung, 306Sprachsynthese, 347
emotionale, 128, 363Formantsynthese, 359inhaltsgesteuerter, 363korpusbasierte, 362Kostenrechnung, 362linguistisch-phonetische Transkription, 348
multilinguale, 364personalisierte, 364polyglotte, 366Textaufbereitung, 348textgesteuerte, 348Verbesserung der Natürlichkeit, 362
Sprachtheorie, allgemeine, 7Sprachverständlichkeit, 146Sprachverständlichkeitsindex, 161Sprachverstehbarkeit, 146, 148Sprachwiedergabe, 344
Anwendungsbeispiele, 346Sprachwissenschaft, 1Sprachzeichen, 8Sprechakt, 2, 3Sprechen, 57Sprecheradaption, 309Sprechererkennung, 324
automatische, 338forensische, 337
Sprecheridentifizierung, 325, 336Sprecherverifizierung, 325
DET(Detection Error Tradeoff)-Kurve, 331equal error rate, 329Hintergrundmodell, 328Lernstichprobe, 325Likelihood-Entscheidung, 329Receiver Operating Characteristic Curve,
331Sprachschablone, 334statistische Modelle, 326Support Vector Machines (SVMs), 336Toleranzschwelle, 330
Sprechfähigkeit, 1Sprechlaut, 11Sprechsilbengrenze, 355Sprechsituation, 127Sprechtraktmodell, 73Sprechvermögen, s. auch Sprechfähigkeit, 2Sprechwerkzeug, menschliches, 58Stapediusreflex, 101Stimmbänder, 60Stimmimitation, 334Stimmproduktion, 59Stimmritze, 60Störschall, 118Strahler
erster Ordnung, 40nullter Ordnung, 40
398 Sachverzeichnis
Strahlungsimpedanz, 37Strahlungswiderstand, 28, 38Strömungsgeschwindigkeit, 20Symbol, 382Synapsen, 283Syntax, 6Syntax-Analyse, 352
TTeilbandcodierung (Subband Coding), 242Telecommunication Objective Speech Quality
Assessment (TOSQA), 166Telefonkommunikation, 160Terzfilter, 120, 216Test, auditiver, 131Text-to-speech-Synthese, 348Textverstehen, 352Tonheit, 115, 124Tonhöhenwahrnehmung, 121Tonschwelle, 123Trägersätze, 347Transformationscodierung, 241Transinformation, 16Transkription
linguistisch-phonetische, 348korpusbasierte Methoden, 353lexikonbasierte Methoden, 349regelbasierte Methoden, 349
phonetisch-akustische, 353Trichter, konischer, 45Trichterkonstante, 46Trigramm-Modell, 311Trommelfell, 100
UÜbertragungsfaktor, elektroakustischer, 49Übertragungsmaß, elektroakustisches, 49Ultraschall, 108
VVektorquantisierung, 233, 234Verdeckungseffekt, 118, 119Verhältnisskala (Ratioskala), 132Verhältnistonhöhe, 123Verschlusslaute, 87Verständlichkeit, 128
Verständlichkeitstest, 146für Sätze, 154für Wörter, 154
Verständnis, 130Verstehbarkeit, 128Verwechslungs-/Vertauschungsmatrix, 150Vocodersystem, 175, 214Vokal, 64, 89
Artikulationsarten, 64Artikulationsort, 65Spektrogramm, 92
Vokalviereck, 65von-Hann (Hanning-)Fenster, 78
WWanderwelle, 106Wandler
elektroakustischer, 48elektrodynamischer, 49elektrostatischer, 51
Wasserfall-Diagramm, 85Webstersche Gleichung, 43
Horngleichung, 44, 72Trichtergleichung, 44
Wellenausbreitung in Röhren, 31Wellengleichung, 24, 35Wellenlänge, 26Wellenwiderstand, 28Wellenzahl, 26Wizard of Oz, 386Word Spotting, 318Worterkennung, 312
ZZeichen, siehe auch Sprachzeichen, 9
Zweiseitigkeit, 9Zeichenbenutzer, 10Zeichenindex, 14Zeichenlehre (Semiotik), 4Zeichenvorrat, 11Zeigehandlung, 371Zeitmultiplex, 188Zeitnormalisierung, dynamische, 295Zero-Padding, 81Zustandsänderung, adiabatische, 22Zwicker-Diagramm, 120, 122