Übersicht · DIGITAL AUDIO Zu diesem Foliensatz wurden zahlreiche Audiobeispiele gezeigt, die in...

12
DIGITAL AUDIO Zu diesem Foliensatz wurden zahlreiche Audiobeispiele gezeigt, die in der PDF-Version nicht enthalten sind. Was ist Audio? Eigenschaften von Schallwellen Das menschliche Ohr Räumliches Hören, Klänge & Geräusche Warum Audio digitalisieren? Analog zu Digital Probleme der AD/DA-Wandlung Psychoakustik Kompression (MP3) Übertragung (MIDI) Audio Retrieval Übersicht 2 AGENDA 3 Töne Sprache Geräusche Musik ... Was ist Audio? I Was ist Audio? 4 Schwingungen wellenförmige Vibration in Flüssigkeiten Festkörpern Gasen (Schallgeschwindigkeit: 330m/s = 1188 km/h) periodische Schwingungen (Klänge) Musikinstrumente Gesang Wind ... nichtperiodische Schwingungen Sprache Geräusche ... Was ist Audio? II Was ist Audio?

Transcript of Übersicht · DIGITAL AUDIO Zu diesem Foliensatz wurden zahlreiche Audiobeispiele gezeigt, die in...

DIGITAL AUDIO

Zu diesem Foliensatz wurden zahlreiche Audiobeispiele gezeigt, die in der PDF-Version nicht enthalten sind.

Was ist Audio?

Eigenschaften von Schallwellen

Das menschliche Ohr

Räumliches Hören, Klänge & Geräusche

Warum Audio digitalisieren?

Analog zu Digital

Probleme der AD/DA-Wandlung

Psychoakustik

Kompression (MP3)

Übertragung (MIDI)

Audio Retrieval

Übersicht

2AGENDA

3

Töne

Sprache

Geräusche

Musik

...

Was ist Audio? I

Was ist Audio? 4

Schwingungenwellenförmige Vibration in

Flüssigkeiten

Festkörpern

Gasen (Schallgeschwindigkeit: 330m/s = 1188 km/h)

periodische Schwingungen (Klänge)

Musikinstrumente

Gesang

Wind

...

nichtperiodische SchwingungenSprache

Geräusche

...

Was ist Audio? II

Was ist Audio?

5

Amplitudeobjektiv:Energie des Klanges

subjektiv:Lautstärke der Schwingung

Was ist Audio? II

Was ist Audio? 6

FrequenzenInfraschall: 0 bis 20 Hertz (Hz)

Hörschall: 20 bis 20 kHz

Ultraschall: 20 kHz bis 1 GHz

Hyperschall: 1 GHz bis 10 THz

Was ist Audio? III

Was ist Audio?

Was ist Audio? IV

7Was ist Audio?

Longitudinal- und Transversalwellen

Longitudinalwelle: Oszillatoren schwingen in der Ausbreitungsrichtung

Transversalwelle: Oszillatoren schwingen quer zur Ausbreitungsrichtung

8Eigenschaften von Schallwellen

Wellenlänge

Die Länge einer Welle (d.h. der Abstand bis zur nächsten Wiederholung) bestimmt sich aus der Periodenlänge T und der Ausbreitungsgeschwindigkeit c

9Eigenschaften von Schallwellen

Reflexion

10

Reflexionsgesetz (Einfallswinkel gleich Ausfallswinkel) gilt für Schallwellen nur, wenn die Grenzfläche groß genug im Vergleich zur Wellenlänge ist

d.h. in kleineren Räumen keine Reflexion tiefer Frequenzen

Rauigkeit der Oberfläche führt zu diffuser (zerstreuender) Reflexion, wenn Unebenheiten in der Größenordnung der Wellenlänge

d.h. auch bei zentimetergroßen Unebenheiten wirkt Wand auf tieffrequenten Schall als "glatt"

Eigenschaften von Schallwellen

Absorption, Brechung

Ein Teil der Schallenergie wird nicht reflektiert Absorptionsgrad abhängig vom Material und der Schallfrequenz

Dissipation: Umwandlung in Wärmeenergie

Transmission: Weiterleitung im absorbierenden Medium

Aufteilung der absorbierten Energie in Dissipation und Transmission

frequenzabhängig: niedrige Frequenzen höhere Transmission (Körperschall)

Auch Schall wird gebrochen, z.B. bei Luftschichten verschiedener Temperatur

11Eigenschaften von Schallwellen

Beugung

Schall-"Schatten" entsteht erst, wenn ein Gegenstand groß genug im Vergleich zur Wellenlänge ist

Bei Gegenständen in Größenordnung der Wellenlänge tritt Beugung auf

Wellen fliessen "um das Hindernis herum"

Wellen werden von einem Spalt zerstreut

12Eigenschaften von Schallwellen

13

Das menschliche Ohr

Das menschliche Ohr 14

Das menschliche Ohr

Aussenohr: HRTF = Head Related Transfer Function

Mittelohr: Trommelfell, Hammer, Amboss, Steigbügel: Verstärkung der Kraftwirkung

Innenohr: Schnecke (cochlea)

Aufgerollte Röhren (Gänge), gefüllt mit Lymphflüssigkeit

Das menschliche Ohr

Schnecke

15Das menschliche Ohr

Räumliches HörenStereo-Effekt

Unterschiedliche Lautstärke des Schallereignisses an beiden Ohren

Zeitliche Verzögerung des selben Schallereignisses in seiner Wahrnehmung durch beide Ohren

Verzögerungsmessung liefert Information über Entfernung der Quelle

Kann ein einseitig tauber Mensch räumlich hören? Eingeschränkt: ja!

Reflexion und Beugung an Umwelt und Ohrmuscheln liefern umfangreiche Information

Frequenzabhängigkeit der Ortung: Niedrige Frequenzen generell schlechter zu orten

Konsequenz physikalischer Tatsachen (Wellenlänge:Hindernis)

Siehe z.B. „Subwoofer“-Technologie

16Räumliches Hören

Laufzeitdifferenzen

17Räumliches Hören

Head Related Transfer Functions (HRTF)

18

Für alle Positionen rund um den Kopf Impulsantwort von der Position zu beiden Ohren messen (HRIR)

Fourier-Transformation davon ist die HRTF

Enthält alle physikalischen cues für die Lokalisierung

HRTF von Mensch zu Mensch verschieden

Sobald HRTF für beide Ohren bekannt ist, kann mit einem Kopfhörer Raumklang (also auch vorne/hinten und oben/unten) erzeugt werden

Räumliches Hören

Klang und Geräusch

Töne sind vom Menschen wahrnehmbare kleine Luftdruckänderungen

Primärempfindungen der Tonwahrnehmung: Tonhöhe (Bsp. verschiedene Klaviertasten)

Lautstärke (Bsp. Trommelanschlag)

Klangfarbe (Bsp. gleicher Ton auf verschiedenen Instrumenten)

Klang: alle drei Primärempfindungen wahrnehmbar

Geräusch: nur Lautstärke wahrnehmbar

19Klänge und Geräusche 20

Qualität der ReproduktionQualität ist NUR abhängig von der Analog/Digital/Analog-Konvertierung

Qualität ist unabhängig vonVerarbeitung (z. B. Geräte)

Transport (z. B. Kabel)

Speicherung (z. B. Festplatte, Magnetband, CD)

Möglichkeiten der Konvertierung/Bearbeitungverlustfreies Kopieren

nicht-sequentieller Zugriff

nicht-destruktives Editing

platzsparendere Speicherung

...

Warum Digital ?

Warum Digital?

21

PAM (Puls Amplitude Modulation)Ermittlung von Amplitudenwerten innerhalb eines Zeitintervalls

Analog zu Digital I

Analog zu Digital 22

PWM (Puls Width Modulation)Ermittlung von Impulsen, deren Länge die Intensität des analogen Signals wiedergibt

Analog zu Digital II

Analog zu Digital

23

PCM (Pulse Code Modulation)universelles Verfahren zur Digitalisierung von analogen Zeitreihen

SamplingAbtastung des analogen Signals ineinem festgelegten Zeitintervall

Verwendung von PAM

QuantisierungZuordung eines ganzzahligenWertes innerhalb eines festgelegten Zahlenbereiches

Analog zu Digital III

Analog zu Digital

Nyquist Abtast-TheoremHarry Nyquist (1889 – 1976)

Mathematisch bewiesen durch Claude E. Shannon und Vladimir Aleksandrovich Kotelnikov

die Abtastrate (Sampling Frequenz) muss doppelt so hoch sein, wie die höchste Frequenz des abzutastenden Signals

Folge: Frequenz-Überlappung (Aliasing)ggf. falsche Rekonstruktion des Signals

24

Probleme der AD/DA-Wandlung I

Nyquist

Shannon

Kotelnikov

Probleme der AD/DA-Wandlung

25

QuantisierungsrauschenFehler durch Rundung bei der Digitalisierung

Probleme der AD/DA-Wandlung II

Probleme der AD/DA-Wandlung 26

Verzerrungen (Clipping)Übersteuerung des Eingangsignals

Abschneiden der Spitzen eines Signals

Folge von Variablenüberläufen

Probleme der AD/DA-Wandlung III

Probleme der AD/DA-Wandlung

27

Hörschwelleunterschiedliche Empfindlichkeit (Lautstärkeeindruck) des Gehörs für verschiedene Frequenzbereiche

höchste Empfindlichkeit im Bereich von 2 kHz bis 4kHz

Psychoakustik I

Psychoakustik

Psychoakustik II

28Psychoakustik

29

MaskierungÜberdeckung eines Frequenzbereiches durch ein Störsignal (gleichzeitige Maskierung)

Zeitliche Maskierung verdeckt auch nach Abschalten des Störsignals den betreffenden Frequenzbereich(zeitliche Maskierung)

Psychoakustik III

Psychoakustik 30

DynamikkompressionEinsatz nichtlinerarer (logarithmischer) Quantisierung

kleine Signale werden mit niedrigeren Bitwerten kodiert

Beispiele: A-law, u-Law

Psychoakustische KompressionVerwendung von Subband-Kodierung & Maskierung

dadurch Entfernung von irrelevanten Daten

Reduktion der Datenrate

Beispiel: MP3, AAC

Audio-Kompression

Kompression

31

Kurzform von MPEG-1 Audio Layer 3Verwendung der»psychoakustischen Kompression«

Nicht für den Menschen hörbare Informationen werden entfernt

Entfernung von Redundanzen

Kompression von Audiodaten bei vermeintlich geringem Qualitätsverlust

Kanalkopplung (Stereo) – Differenzsignalbildung

Entfernung nicht hörbarer Frequenzen und maskierter Audioinformation

Karl-Heinz Brandenburg, Harald Popp: An Introduction to MPEG Layer 3. EBU Technical Review, Juni 2000.

http://www.iis.fhg.de/amm/

Kompression MP3 (I) Übersicht

Kompression 32

Algorithmus (Übersicht)

Kompression MP3 II

Kompression

33

Algorithmus (1)Anwendung eines Faltungsfilters, um ein Signal in 32 Bänder zu unterteilen

Berechnung des Schallddruckpegels eines Bandes

wenn der Schalldruckpegel eines Bandes kleiner ist als der Maskierungsschwellwert eines Nachbarbandes, wird dieses Band nicht kodiert.

Andernfalls werden die Koeffizienten quantisiert

Kompression MP3 III

Kompression 34

Algorithmus (2)Unterteilung des Datenstromes in Frames

Ein Frame entspricht einem Tonsignal über eine bestimmte Zeiteinheit

Jeder Frame enthält 384 Samples, die Abtastwerte aus 32 Teilbändern repräsentieren

Aus jedem Teilband stammen 12 Werte

Kompression MP3 IV

Kompression

35

Algorithmus (Übersicht)

Kompression MP3 V

Kompression

Kompression MP3 VI

Datenrate von 32 bis zu 320 KBit/s

Samplingrate 32/44,1/48 kHz16 Bit Stereo

Abb. zeigt typische Kompressionsartefakte bei der Fourier-Transformation

36Kompression

Advanced Audio Coding (AAC)Vergleich zu MP3

bessere Qualität bei gleicher Dateigröße

tonale und geräuschhafte Elemente im Eingangssignal effektiver erkannt und kodiert

Pre-Echo Problem (Kompressionsartefakte) verbessert.

Unterstützung für Multichannel-Audio (bis 48)

Bis zu 96 KHz Abtastfrequenz

DRM-Verfahren »FairPlay« implementiert

EntwicklungStandardisiert bei der ISO MPEG2/MPEG4, EBU-Recommendation

Dolby (AC3), Fraunhofer IIS (MP3), AT&T, Sony, Nokia ...

Erweiterung HE-AAC für niedrige BitratenMPEG-4 High Efficiency Advanced Audio Coding,mit Spectral Band Replication (SBR) auch AACplus v1

Mit Parametric Stereo (PS) auch AACplus v2

37Kompression

Hörbeispiele Audiocodecs

38

http://inka.fhtw-berlin.de/Herzog/

Kompression

39

MIDI (Musical Instrument Digital Interface)standardisiertes Protokoll zur Steuerung elektronischer Musikinstrumente und Musikeffektgeräte

physikalische Schnittstelle

Überbegriff für die Musik, die diesem Standard genügt

1984 entwickelt

Standardisierung und Weiterentwicklung durch International Midi Organisation (IMA)

MIDI Manufacturers Association(MMA)http://www.midi.org/

Übertragung - MIDI (I)

Übertragung 40

KomponentenSequenzer

Komponieren/Wiedergabe von Musik mit Rechner

MIDI Sequenzen werden in MIDI-Dateien gespeichert

SynthesizerSynthetische Erzeugung und Manipulation von Klängen

SamplerWie Synthesizer, jedoch synthetisiert ein Sampler Töne aus einer Palette von Instrument-Samples

Übertragung - MIDI (II)

Übertragung

41

Datenformatinstrumentenbezogene Kodierung

Lautstärke

Grundfrequenz

Bezeichnung des Instruments

MIDI-Nachrichten bestehen aus einem Statusbyte und bis zu 3 Datenbytes

Statusbyte 1 B B B K K K K

Datenbyte 0 _ _ _ _ _ _ _

Statusbyte kündigen eine Aktion an und gliedern sich in Kanal- und Systembefehle.

Kanalbefehle (BBB) beziehen sich auf der insgesamt 16 Kanäle (KKKK), mit denen jeweils ein angeschlossenes Instrument assoziiert ist

Übertragung - MIDI III

Übertragung 42

VorteileMIDI-Dateien sind plattformübergreifend

MIDI-Dateien sind sehr klein: 1 min Musik ca. 15- 30 Kbyte

MIDI Kodierung entspricht der Vorgehensweise beim klassischen Komponieren

NachteileOhne wirklich gute Instrumente kein schöner Klang, da synthetische Klangerzeugung

keine Sprache oder Geräusche

MIDI-Dateien klingen auf unterschiedlichen Systemen, je nach eingesetzten Geräten unterschiedlich

Übertragung - MIDI (IV)

Übertragung

43

General Midi (GM)Standard-Erweiterung ermöglicht geräteunabhängig möglichst originalgetreue Wiedergabe

Midi über IEEE 1394 (FireWire)

Verwendung aktueller Technologien und Protokolle

Übertragung MIDI V

Übertragung

Audio Retrieval

TempoerkennungVerfahren zur automatischen Schätzung der Rhythmus beschreibenden Elemente Tempo, Taktart und Mikrotime

Query by Humming (QbH)Melodieerkennung/Musiktitelerkennung auf Grundlage gesungener oder anderer monophoner Melodien

Bsp: http://www.musicline.de/de/melodiesuche/

Statistische KlassifikationJedes Geräusch hat typische Werte (loudness, pitch, brightness, bandwidth)

Trainingsset von Geräuschen einer Klasse ermöglicht Einordnung (Bsp. Gelächter, Beifall, Kinder)

...

44Audio Retrieval

Film: http://www.celemony.com/

»Taschenbuch Multimedia«HENNING, PETER A., Fachbuchverlag Leipzig, 2. Auflage 2001, gebundene Ausgabe, 603 Seiten, ISBN 3446217517, ca. 20

»Multimedia Technologie«Grundlagen, Komponenten und SystemeSteinmetz, Henning, Springer Verlag Heidelberg, 3. überarbeitete Auflage 2000, gebundene Ausgabe, 968 Seiten, ISBN 3-540-67332-6, ca. 55

»The Art of DIGITAL AUDIO«Watkinson, John, Focal Press Oxford, Third Edition 2001, Hardcover, 752 Seiten, ISBN 0-240-51587-0, ca. 84

46

Literatur

Literatur

47

http://www.ieee.org

http://www.itu.int/ITU-T/

http://www.cs.columbia.edu/~hgs/audio/

http://www.digitalaudioguide.com/glossary.htm

http://www.mp3encoding.de

http://www.midi.org/

http://www.superaudio-cd.com/

Links

Links