Was bedeutet eigentlich Oversampling und Upsampling ?

Eindeutschung: Englische und technische Begriffe sind für „durchschnittliche“ Köpfe nicht immer leicht verständlich, versuchen wir eine Übersetzung:

  • Oversampling = Überabtastung = z.B. 2, 4 oder (heute nahezu Standard) 8-fach Oversampling
  • Upsampling = höhere Abtastung = höhere Abtast-Rate statt 44,1kHz z.B. 96kHz oder 192kHz

Wahrscheinlich wissen viele nun immer noch nicht mehr. Deshalb eine kurze Einführung in die Besonderheiten der digitalen Signal-Verarbeitung:

Was heißt digital? Digital kann nur die Höhe der Spannungswerte einer Hüllkurve (z.B. Musik) zu einem bestimmten Zeitpunkt beschreiben, dazu müssen vom analogen Signal „Proben“ genommen werden. Die „Häufigkeit“ der Probennahme wird durch die >Abtastrate< beschrieben. Eine Schwingung (~) besteht, maximal vereinfacht, aus einem positiven und einem negativem Teil; um sie digital beschreiben zu können, müssen wenigstens 2 „Proben“ genommen werden.

Die Abtastrate: Um Audio-Frequenzen bis 20kHz digital darstellen zu können, muss die Abtastrate mindestens doppelt so hoch sein, also 40kHz betragen. Die 44,1kHz der heutigen CD liegen nur ganz knapp über dem minimalen Wert, was problematisch ist, weil bei der Analog/Digital-Wandlung und der Digital/Analog-Wandlung reichlich höherfrequente Störungen entstehen. Diese „Artefakte“ waren im Ursprungs-Signal nicht vorhanden, und müssen natürlich ausgefiltert werden. Bei der Abtastrate von 44,1kHz treten die ersten Störungen bereits bei 24,1kHz (44,1kHz – 20kHz) auf.

Analoge Filter: Ein Tiefpass-Filter muss einerseits die 20kHz Audio-Frequenz noch unbeschadet durchlassen, ab 24,1kHz aber maximal sperren. Mit analogen Filtern 9. bis 11. Ordnung ist das machbar, allerdings werden an die Toleranzen der Bauteile und deren Langzeit-Stabilität extreme Anforderungen gestellt. Werden statt der passiven LC-Filter aktive RC-Filter gewählt, müssen die dann eingesetzten OP-AMPs ebenfalls extremen Anforderungen bezüglich Grenzfrequenz und Phasen-Linearität genügen. Beides ist mithin nicht praxisgerecht. Einen Ausweg bietet die digitale Filterung mittels Oversampling.

Bild 1: Block – Schaltbild des PCM 1794 A.

Moderne DA-Wandler sind komplexe und hoch – integrierte Bausteine, die sich leicht an die unterschiedlichen Einsatzzwecke anpassen lassen, und zusätzliche Funktionen aufweisen. Hier ist z.B. das Digital-Filter mit 8-fachem Oversampling fester Bestandteil des DA-Wandlers.

Digitale Filter: Die Taktfrequenz vor dem digitalen Filter wird z.B. um den Faktor 8 (=8-fach Oversampling) erhöht. Die nicht zur Musik gehörenden Störungen bzw. Artefakte werden natürlich ebenfalls um den Faktor 8 in der Frequenz erhöht, sind dadurch anschließend um diesen Faktor mehr vom Nutzsignal „entfernt“, und lassen sich jetzt relativ leicht digital ausfiltern. Um die letzten Störungen und insbesondere das Rauschen fast gänzlich zu beseitigen, reicht jetzt in der analogen Ausgangs-Stufe in aller Regel ein einfacher Tiefpass z.B. 2. Ordnung aus. Die oben beschriebenen Probleme der analogen Filter haben die digitalen Filter nicht, da die Filterparameter als numerische Konstanten festgelegt sind, die rein digital in einen ROM-Speicher geschrieben wurden.

Bild 2: Breitband-Übertragungsverhalten des digitalen Filters
des DA-Wandlers BurrBrown PCM1794A:
Bild 3: Welligkeiten des gleichen digitalen Filters im Übertragungsbereich:

Links in der Tabelle ist jeweils die Dämpfung in dB angegeben, die entsprechenden Frequenzen sind als Vielfache der Sampling-Frequenz fs dargestellt. Bild 2 zeigt, dass für 0,5fs, also die maximal mögliche obere Grenzfrequenz, die Dämpfung bereits rund – 100dB beträgt. 0,5fs entspricht bei 44,1kHz Abtastrate 22kHz Audio-Frequenz. Bild 3 zeigt im Prinzip das Gleiche, allerdings ist der Audio-Übertragungs-Bereich extrem gespreizt. 0,46 fs entspricht bei 44,1kHz Abtastrate 20kHz. Man beachte, dass die Abweichungen von der Ideal-Linie weniger als 0,000005dB betragen !!

Die Einheit dB (=Dezibel): Die Maßeinheit dB ist eine logarithmische Verhältniszahl und bezeichnet den Pegelunterschied zwischen dem leisestem, gerade noch hörbaren und dem lautesten Ton. Übersetzt bedeuten -20dB eine Dämpfung auf ein Zehntel (oder auf 10%) des ursprünglichen Pegels, -40dB eine Dämpfung auf ein Hunderstel (oder auf 1%), -60dB auf ein Tausendstel (oder auf 0,1%), usw.

Oversampling: Weil aufgrund der Bandbegrenzung kein digitales Wiedergabe-Medium störungsfrei die Daten in analoge Schwingungen zurückwandeln kann, wird Oversampling praktisch grundsätzlich eingesetzt, unterschiedlich ist nur die Oversampling-Rate. Die HiFiWERKSTATT setzt generell auf 8-faches Oversampling, egal mit welcher Abtastrate das digitale Signal angeliefert wird. Denn schließlich sollen unsere DA-Wandler nur das hörbar machen, was tatsächlich als Musik auf der CD gespeichert wurde, und nicht die Artefakte, die durch die Digital-Analog-Wandlung zwangsweise entstehen !! Das Oversampling findet nur im digitalen Filter statt, nicht im eigentlichen DA-Wandler.

Upsampling: Jetzt braucht es nicht mehr viel zur Erklärung. Das Upsampling findet vor dem digitalen Filter statt, das 8-fache Oversampling wird anschließend genauso wie ohne Upsampling ausgeführt, nur ist die Taktrate des Signals bereits 96kHz oder 192kHz. Deshalb arbeiten die DA-Wandler auf den Platinen der HiFiWERKSTATT mit 768-facher (PCM1704) oder sogar 1536-facher Datenrate (PCM1794A)!!, und zwar unabhängig von der Taktrate der „Quelle“. Außerdem werden die digitalen Daten beim Upsampling der hoer-wege DA-Wandler grundsätzlich auf 24Bit hochgerechnet. Damit werden zwar aus 16 Bit Daten keine echten 24 Bit Daten, aber die DA-Wandler erzeugen mit diesem „Trick“ um bis zu 20dB weniger Störungen, so dass besonders leise Informationen, die nur mit vielleicht 1-2Bit codiert sind, nach der Hochrechnung weniger „Gefahr“ laufen, im „digitalen Störnebel“ unterzugehen! Eine genauere Rückwandlung der Daten wird so stark vereinfacht, und die ohnehin geringen Störkomponenten im Audiosignal werden noch weniger. Außerdem kann das asynchrone Upsampeln (von 44,1kHz auf z.B. 96kHz oder 192kHz, und nicht auf 88,2kHz oder 176,4kHz) den Jitter des Ursprungs-Signals deutlich verringern. Aber auch dieser „Trick“ kann aus „Müll“ kein „Gold“ machen, so dass sich nach wie vor die Investion in ein gutes CD-Laufwerk lohnt. Denn was die „Quelle“ nicht liefert, kann auch der beste DAC nicht wandeln !!

Bild 4: Störspektrum des PCM1728 bei 16Bit/44,1kHz: Bild 5: Störspektrum des PCM1728 bei 24Bit/44,1kHz:

Bild 4 zeigt links die Höhe des Störpegels, die zusätzlich entsteht bei der Digital/Analog-Wandlung eines mit 16 Bit kodierten -60dB 1kHz-Tones, der lange, dünne Strich im Spektrum bei 1 (=1kHz). Die Beschriftung der unteren Achse ist etwas verwirrend, links beginnt es mit 20Hz und endet rechts bei 20kHz. Bild 5 zeigt die gleichen Meßbedingungen und Beschriftungen wie oben, jedoch wurde der -60dB 1kHz-Ton mit 24Bit codiert. Man sieht sehr viel weniger „Geistertöne“. Wollte man übrigens einen Pegel von -130dB (=Störpegel bei 24 Bit) prägnant beschreiben, könnte man sagen, dass das in etwa dem „Lärm“ einer fallenden Feder entspricht !!

Bild 6: THD+N PCM1728 mit 16 + 24 Bit Data: Bild 7: THD+N PCM1794A mit 24 Bit Data:

Bild 6 zeigt links den prozentualen Anteil des Störpegels, hier Verzerrungen und Rauschen, der bei der Digital/Analog-Wandlung von 16Bit und 24Bit Data entsteht, in Abhängigkeit vom Pegel. Die untere Achse beginnt links mit -60 dB (=sehr leise) und endet rechts mit 0 dB Pegel (=Maximal-Pegel) des Ausgangs-Signals. Die THD+N – Werte sind mit 24Bit Data durchgängig besser, zeigen aber in beiden Fällen den typischen Verlauf bei digitaler Signal-Verarbeitung. Anders als bei analoger Signal-Verarbeitung sind die Verzerrungen bei geringem Pegel hoch, und bei hohem Pegel gering. Analog ist der Verlauf genau umgekehrt, die Verzerrungen steigen mit dem Pegel. Bild 7 zeigt die gleiche Messung beim PCM1794A mit 24Bit Data. Man beachte die andere Beschriftung, beim PCM1794A beginnt es links bereits mit -100dB. Hier ist deutlich zu sehen, warum der PCM1794A wesentlich besser ist als der PCM1728, denn die THD+N – Werte sind durchgängig um rund 20dB (also um Faktor 10) besser.

Bild 8: THD+N PCM1794A bei 48, 96 + 192 kHz SR: Bild 9: THD+N PCM1794A von 0 – 100kHz:

Bild 8 zeigt (eigentlich) den Einfluss der Umgebungstemperatur auf Verzerrungen und Rauschen, der wie gut zu sehen ist, beim PCM1794A sehr gering ist. Uns zeigt diese Messung jedoch, dass THD+N mit höherer Sample Rate nicht niedriger werden, sondern sogar etwas ansteigen. Bei 192kHz SR sind die Werte um rund 10dB schlechter im Vergleich zu 48kHz SR. Da wir dann aber immer noch im Bereich von -100dB sind, ist das in der HiFi – Praxis normalerweise irrelevant. Bild 9 zeigt wiederum einen 1kHz -60dB Ton, links sind hier Verzerrungen und Rauschen in dB in Abhängigkeit der Frequenz angegeben. Die untere Achse beginnt links mit 0kHz und endet rechts mit 100kHz. Deutlich zu erkennen ist, dass oberhalb des Audio – Bereichs insbesondere das Rauschen ansteigt. Hier ist zum Schluss klar zu sehen, dass es ohne analoge Filter nicht geht. Im Bereich oberhalb ca. 30kHz müssen die analogen Filter für Ruhe sorgen. Die „hohe“ Kunst besteht darin, die Störungen auszufiltern, aber die Musik unangetastet zu lassen.
Quelle: Alle Messungen wurden aus den BurrBrown Datenblättern zum PCM1728 und PCM1794A entnommen.