Digital Audio: Samplingrate, Bittiefe, Quantisierung, Dithering

Inhaltsverzeichnis

Der Vergleich zur Digital- beziehungsweise Filmkamera ist von mir nicht ganz zufällig gewählt: Die Samplingfrequenz bei Audiosignalen, also die Häufigkeit von Samples pro Zeiteinheit (meistens pro Sekunde angegeben), ist vergleichbar mit der Bildfrequenz pro Sekunde einer Filmkamera. Die Pixelanzahl für jedes einzelne Bild wiederum könnte man der Bittiefe gleichsetzen: HD-Filme „sehen besser aus“ als Super-8-Filme. Je größer die Pixelanzahl des Sensors und je häufiger ein Bild aufgenommen wird, desto exakter lässt sich das „aufzunehmende Licht“, die Szenerie digital reproduzieren.

Bittiefe

Zu unserem Glück hat ein gewisser Harry Nyquist einen Herrn Claude Shannon vor langer Zeit inspiriert, zu dessen Überlegungen ein Theorem (eine theoretische Behauptung oder auch Lehrsatz) aufzustellen, das angibt, dass ein Audiosignal mit der doppelten Frequenz gleichmäßig abgetastet werden muss, um das Ursprungssignal hinreichend rekonstruieren zu können. Die Bandbreitenbegrenzung der hörbaren Frequenzen nimmt uns dabei praktischerweise unser Gehör ab, das im Grunde nur Frequenzen zwischen maximal 20 Hz und 20.000 Hz bewusst wahrzunehmen vermag.

Der Aufwand, das analoge Ausgangssignal vollständig exakt zu rekonstruieren, ist theoretisch unendlich groß, da digitale Signale ihrem Wesen nach in jedem Falle diskontinuierlich sind, analoge dagegen immer kontinuierlich. Dass digitale Informationen nur dazu taugen, analoge Signale genähert zu speichern, ist also leider unumgänglich. Das Ausgangssignal wird „approximiert“ – schönes Wort, nicht wahr? Nyquists Theorem gilt übrigens auch bei Digitalkameras: Dort geht es ebenfalls um Frequenzen, nämlich denen des Lichts.

digital audio

Mit Blick auf die für den Menschen mehr oder weniger relevanten Signale bis 20 kHz genügt gemäß des erwähnten Theorems eine Samplingfrequenz von 40 kHz. Die für CD-Qualität übliche 44,1 kHz Samplingfrequenz/-rate rührt aus den 1970er-Jahren beziehungsweise aus Sonys „Puls Code Modulationsverfahren“ (PCM) zur Speicherung digitaler Signale auf Videobändern. Später entwickelte Sony daraus mit Philips den Red-Book-Standard für Audio-CDs.

Die um zusätzliche 4000 Hz etwas breitere Frequenz als die doppelte für den Menschen hörbare hat ihren Ursprung in möglichst einfachen Filtern, die sogenannte Aliasingeffekte beim Digitalisieren aus dem Hörbereich des rekonstruierten analogen Signals entfernen sollen – je breiter dieser „Korridor“, desto einfacher die Filtertechnik.

Puls Code Modulationsverfahren PCM

Exakt 44,1 kHz wurden daraus, weil sich Samplingratenkonvertierer einfacher gestalten lassen (genutzt für Studiotechnik oder auch Datenträgerüberspielungen), wenn die Samplingfrequenz ein ganzzahliges Vielfaches der Ausgangsfrequenz ist. Ausgangsfrequenz war hier die bei der Videodigitalisierung genutzte 60-Hz-Netzfrequenz bei 525 Linien für das zu digitalisierende TV-Signal. Die 60 Hz zu verändern, wäre sehr aufwändig gewesen, man behielt sie bei. Nicht zufällig erreicht man aber durch Multiplikation von 525 mit einem ganzzahlingen Faktor eine Frequenz höher 44.000 Hz, die wir ja erreichen wollen, um die Filter für das Anti-Alaising einfach zu halten: Die nächste größere Ganzzahl, die durch 525 teilbar ist, ist 44.100. Der Multiplikationsfaktor ist damit 84, wie gewünscht eine ganze Zahl, die uns ansonsten aber nicht weiter interessieren soll.

ethernet

Antialiasing kommt Bedeutung zu, weil durch die Aufteilung des analogen Ausgangssignals in einzelne Bits und die anschließende Rekonstruktion treppenartige Stufungen im Ergebnissignal auftreten würden. Um diese Artefakte einzudämmen, wird interpoliert, um einen möglichst kontinuierlichen analogen Signalverlauf zu erhalten.

Ein zweiter Grund für das Antialiasing sind zu niedrig wiederhergestellte Frequenzen bei ursprünglich oberhalb der halben Nyquist-Frequenz liegenden Signalen. Das so nicht originalgetreu rekonstruierte analoge Signal weist Klangverfälschungen auf (Verletzung des Nyquist-Theorems). Hierin liegt auch ein Grund dafür, dass in Tonstudios generell Frequenzen oberhalb 44,1 kHz verwendet werden, denn Mikrofone nehmen alle analogen Signale auf, die ihr nutzbarer Frequenzbereich ermöglicht und dabei ist das Ende oft nicht bei 20 kHz erreicht. Instrumente weisen teils noch erheblich höhere maximale Frequenzanteile auf. Daher ist nachvollziehbar, warum konsequent hohe Abtastraten bis zur finalen D/A-Wandlung an der Hifi-Anlage meistens zu besserem Klang beitragen: Aliasing-Effekte treten mit steigender Samplingfrequenz immer weniger auf, Antialiasing kommt weniger zum Tragen.

DAC

Filter, die alle Frequenzen oberhalb der halben Samplingfrequenz eliminieren, bevor gesampelt wird, sind in der Digitaltechnik essenziell, denn für diese wäre ja genau das Nyquist-Theorem verletzt. Wer CDs hört, die gleich nach dem ersten Aufkommen der Digitaltechnik produziert wurden, kann im Vergleich zu aktuellen Produktionen nachvollziehen, wie unzulänglich damals diese Filtertechniken waren: Sie führten zu hörbarer Sterilisierung und verringerter Musikalität bei digitalen Aufnahmen. In Kombination mit der bei jeder Digitalisierung dem Wesen nach obligatorischen Quantisierung, dass heißt der Aufteilung des kontinuierlich verlaufenden analogen Signals in abgestufte Signalbausteine, kommt es bei der Digitalisierung zu Klangverfälschungen.

Bei all dem spielt auch die Bittiefe eine Rolle. Die Quantisierung erfolgt bei einem Digitalisierungsvorgang mit einer konstanten, bestimmten Bittiefe: Sie bedeutet die Genauigkeit, mit der jedes einzelne Sample digital repräsentiert wird und bestimmt gemeinsam mit der Samplingfrequenz, wie exakt das Ausgangssignal insgesamt digitalisiert wird – und letztlich wieder rekonstruiert werden kann. Je höher die Bittiefe, desto exakter die „digitale Beschreibung“ des analogen Ausgangssignals pro Sample. 16 Bit Tiefe bedeuten, dass 2 hoch 16 = 65.535 Quantisierungsschritte pro Sample errechnet beziehungsweise analoge Amplituden beim A/D-Wandeln rekonstruiert werden können. Bei 24 Bit Tiefe sind es schon 16.777.216 Schritte. Man sieht leicht, dass eine höhere Bittiefe zu „feiner“ aufgelösten Signalen führt. Die Basis „2“ rührt übrigens von der binären Speicherung digitaler Daten her: Es gibt nur die Werte/Zustände „0“ und „1“, also nur zwei verschiedene.

usb audio

Höhere Bittiefen haben des Weiteren den positiven Effekt, dass für leise Passagen der Musik mehr Bits „übrig bleiben“, um das Signal digital zu repräsentieren. Lauteste Passagen werden mit maximal verfügbarer Bittiefe digitalisiert, leise mit zunehmend geringerer, das ist bei jedem Sampling so. Zuweilen bleiben so von den 16 Bit voller Bittiefe der CD für leise Abschnitte nur 5 Bit übrig. Für zum Beispiel leise Flötentöne ist das offenkundig zu wenig, wie man bei Aufnahmen mit geringer Auflösung und einhergehendem harschen, unklaren Klang schnell bemerken würde. Steigt also die verfügbare Bittiefe auf beispielsweise 24 Bit, bleibt bei leisen Passagen für subtile Pegel- respektive Amplitudenänderungen des analogen Signals mehr Bittiefe verfügbar.

Um zum Beispiel Kamera zurückzukommen: Je höher die Bittiefe beim Bildsensor beziehungsweise der Bildspeicherung, desto naturgetreuer, leuchtender und vielfältiger sind die Farben der Natur, des analogen Ausgangsmotivs. 24-Bit-Bilder einer Digitalkamera bilden rund 16,7 Millionen Farben ab, von denen ein Computermonitor sehr viele, aber nicht alle darstellen kann. Exakt so ist es bei der Musik: Je höher die Bittiefe, desto natürlicher klingt (theoretisch) die digitalisierte und später rekonstruierte Musik.

16 Bit haben sich aufgrund des Red-Book-Standards der CD eingebürgert. 24 oder 32 Bit, inzwischen auch teils 64 Bit hingegen sind Studiostandard. 16 Bit für CDs werden daraus übrigens mit erheblichem Aufwand mittels sogenannten Ditherings errechnet, einem Verfahren, um die unerwünschten Klangverschlechterungen aufgrund des „Weglassens“ von Bits bei der Reduzierung von beispielsweise 24 auf 16 Bit zu mildern. Dabei wird dem analogen Signal Rauschen in unhörbaren Frequenzbereichen künstlich beigemischt, um Probleme durch die Reduzierung der Bittiefe bei geringen Amplituden/Pegeln möglichst zu minimieren. Die CD ist somit technisch gesehen kein besonders erfreuliches Format für digitale Audiodaten, die Bittiefe ist vergleichsweise gering.

Jetzt haben wir zwei wesentliche Einflussfaktoren bei der Digitalisierung von analog vorliegender Musik kennengelernt: Samplingrate und Bittiefe. Das analoge Ausgangssignal wird also beim Sampling in viele kleine Teile zerlegt, den Samples, und im DAC wieder zusammengesetzt.

Billboard

Computer-Audio, Grundlagentechnik: Grundlagen & Grundbegriffe der digitalen Audiotechnik

Zurück

Weiter