Hartnäckiger Unsinn. Wie sich Falschaussagen am Leben erhalten

Erstellt von:
12 Juli 2018
In Blog
2.251 AUFRUFE

Die Sinne befeuern unser Hirn pausenlos mit elektrischen Nervenimpulsen. Aus den Impulsen wird ein Abbild, eine Interpretation der Aussenwelt geformt, entsteht unsere Wahrnehmung der Umwelt. Die Wahrnehmung wird beeinflusst durch unser Wissen, Einstellungen, Vorurteile, kulturellem Hintergrund und nicht zuletzt auch durch Erziehung und gesellschaftliche Werteskala. Diese Selbstbeeinflussung, Filtrierung und subjektive Interpretation lässt sich nicht ausschalten, aber durch Bildung, Wissen, Systematik, Reflexion und Kritikfähigkeit steuern/kontrollieren. Quasi eine Balance oder Dialog zwischen Objektivität (Abstraktion, Logik, Physik) und Subjektivität (Emotionen, persönliche Werte und Bewertungen) herstellen. Der amerikanische Künstler und Journalist Herb Reichert hat in einem bemerkenswert einseitigen Artikel auf audiostream.com die Objektivsten (Artikel «Audio without Numbers» Link: https://www.audiostream.com/content/audio-without-numbers) als kühle, emotionslose Trolle beschrieben und den Subjektivismus des reinen Hörens und Empfindens als den gültigen Massstab zur Beurteilung von Audiotechnik und folglich auch der Musik definiert. Er nimmt damit eine Extremposition auf der Achse Hören kontra Messen (Technik), Emotionen kontra Zahlen (Fakten) ein. Er lehnt messbare Spezifikationen nicht grundsätzlich ab, bescheinigt ihnen aber keine Aussagekraft, sondern huldigt dem Urteil der subjektiven Wahrnehmung des Hörers. Dass man so leicht ins Reich der Irrtümer und Fehlschlüsse gelangt ist naheliegend.

Subjektivist – Objektivist: wo ist da ein Problem?

Einleitend eine Begriffsbeschreibung:

Technische Konzepte, die Funktionsweise von Bauelementen und Technologien, Messmethoden, Messwerte sind nur für den ausgebildeten Techniker in der Tiefe fassbar und im Zusammenhang schlüssig und aussagekräftig. Was Herb Reicherts Huldigung für den Subjektivismus erklärbar macht. Nun gibt es verschiedene Ebenen für Technikverständnis. Wir versuchen mit unseren Blogthemen die Audiotechnik auch für Nichttechniker verständlicher zu machen und somit auch ein gewisses Mass an Fakten basiertem Wissen zu vermitteln. Dieses Wissen kann mit den subjektiven Hörerfahrungen Hand in Hand gehen. Ohne objektive Elemente und Fakten sind Fehlschlüsse und Falschaussagen kaum zu vermeiden. Mit etwas fundiertem Wissen über Audiotechnik lassen sich unsinnige Aussagen, wie die folgende, einfacher erkennen und ins Land der Anekdoten und Märchen einordnen:

 «Was viele nicht wissen», sagt der Geschäftsführer eines Hi-Fi Händlers **: «Eine Vinylplatte hat eine höhere Klangdynamik als eine CD. Sprich, da das Tonsignal nicht in Datenpakete zerhackt ist, sind die Unterschiede zwischen Laut und Leise grösser, das Musikerlebnis ist somit lebhafter». Auszug aus einem Artikel in der «Bilanz»
Link zum Bilanz Artikel: 
Vinyl statt Digital – Warum echte Musikliebhaber zur Schallplatte greifen

Mit dieser Meinung ist der Händler nicht alleine, man hört und liest sie immer wieder. Trotzdem: die Aussagen sind unsinnig und technisch falsch. Doch die Details und faktische Begründung dazu später in diesem Artikel.

Auf Falschinfomationen treffen wir im gesamten Bereich der Audiotechnik. Hartnäckig halten sich die Klötzchengrafiken um Qualitätsunterschiede der Digitaltechnik aufzuzeigen. Darstellungen wie in Bild 1 finden sich seit den 80er Jahren regelmässig, meist in Papieren der Hersteller aber auch in unabhängigen Publikationen. Sie beschreiben die Digitaltechnik grob und irreführend. Dass dann Aussagen über zerhakte Musik, wie oben, rumgereicht werden, muss nicht erstaunen.

Bild 1: Die Grafik startet gleich im ersten Bildsegment mit der simplifizierten schwarz/weiss Ausgangslage, dass ein analoges Signal per se perfekt sei und die Digitaltechnik grundsätzlich am Problem der Zerstückelung leidet. Einer der Fehlschlüsse ist: Das Problem lässt sich minimieren aber nie beheben, denn auch ein HD-Signal sei schlussendlich ein Stückwerk.

Bild 2: Noch eine Grafik aus der Kategorie Treppen und Rastergrössen, die es zu hunderten gibt, alle basieren auf der gleichen groben Vereinfachung, respektive mangelndem Wissen. «Large Error» ist ebenso falsch und irreführend wie «No Error».

Man kann auch mit korrekten Zahlen den vertrauensvollen Musikfreund auf eine falsche Fährte leiten:

Bild 3: Die Zahlen sind korrekt, doch die daraus resultierende Aussage ist wertlos, da unsinnig. Sie ist für den Musikfreund nicht hilfreich, dem Qualität wichtig ist. Dabei wird mit solchen Grafiken durchaus versucht dem Laien die Technik verständlich zu machen und ihm so einen Weg zu mehr Musikgenuss aufzuzeigen.

Diese im Bild 3 von einem bekannten HiFi-Hersteller veröffentlichte Grafik ist eindimensional und strukturell falsch, da sie verschiedene Digitalkonzepte und Einheiten locker miteinander vermischt. Wer sowas publiziert hat offensichtlich nur geringe Kenntnisse über Digitaltechnik oder, wenn doch, führt seine Kunden bewusst in die Irre um sie zum Kauf ihrer Produkte zu motivieren. Wohlverstanden, solcher Unsinn wird in den Marketingabteilungen zusammengebraut und nicht in den Ingeneurabteilungen. Offensichtlich briefen die Product Manager die Marketingleute und die verstehen wohl weniger als die Hälfte vom Thema. Einmal lanciert, vielfach kopiert und adaptiert retten sich solche irreführenden Grafiken und Aussagen über die Zeit, werden Allgemeingut, da selten von kompetenter Seite Widerspruch erhoben wird und kritische Stimmen oft im Massenrauschen untergehen.

Bild 4: Neil Young’s Pono Ecosystem (Pono Player & HD-Download Portal) ist kläglich gescheitert, trotz eigentlich guter Absicht dahinter und breiter Beachtung in den Massenmedien, dank Neil Youngs persönlichem Einsatz. Mehrere Aspekte der Young Kampagne krankten an den üblichen, technischen Faktoren und strauchelten an markttechnischen Realitäten. So entzog ihm der Content Provider Omniphone nach dessen Verkauf an 7digital die Verkaufsrechte. Shop closed! Aber auch mangelnde Kenntnis der Materie als Ganzes war ursächlich für den Misserfolg. Obige Grafik ist nur ein kleines Beispiel dazu.

Beurteilung und Korrektur der Grafiken/Aussagen

Gehen wir mal den falschen Grafiken und Aussagen auf den Grund und versuchen daraus technisch korrekte Aussagen herzuleiten die eine sinnvolle, qualitative Beurteilung erlauben. Beginnen wir mit den Grafiken der Bilder 3 und 4.

Fehler im Bild 3 Sampling Raten:

  1. Es werden verlustbehaftete und verlustfrei Formate miteinander vermischt. Man kann diesen Vergleich machen, sollte dann allerdings das Thema anders fassen und mit einer Perzeptionsskala arbeiten (subjektiv).
  2. Die Angabe bei MP3 ist eine Bitrate und keine Samplingrate. Die Einheit der Materie ist so nicht gegeben. Entweder Bit- oder Samplingrate aber nicht innerhalb einer Grafik mal so und dann wieder anders. Hinweis: bei CD ist die Bitrate 1411 kbs. Bei MP3 ist die Samplingrate 44.1 kHz (auch 32kHz, 48 kHz). Die geringere MP3 Bitrate gegenüber der CD kommt von reduziertem Informationsgehalt, respektive der verlustbehafteten Komprimierung.
  3. Es werden zwei unterschiedliche Digitalformate aufgeführt LPCM (Linear Pulse Code Modulation) als 192kHz Audio Master, 384 kHz FLAC und DSD (Direct Stream Digital). LPCM arbeitet mit 16, 24 und seltener 32 Bit Wortlänge. DSD mit 1 Bit Wortlänge. DSD gegenüber LPCM alleine mit der höheren Samplingrate in einen qualitativen Zusammenhang zu stellen, wie in der obigen Grafik, ist Unsinn und unseriös. Wir werden später sehen, DSD64 ist oberhalb der CD Qualität einzuordnen, erreicht aber nicht die Werte von 24Bit/96kHz. Und dann noch die unsinnige Benennung von Audio Master und FLAC bei 192/384 kHz Samplingraten. Master ist ein Begriff aus der Musik Produktionskette und FLAC ein Audio Container-Format. Es werden frisch fröhlich Begriffe vermischt. Das soll anscheined dem Endkunden helfen, die Materie zu verstehen. Doch wer die Materie selbst nicht versteht, kann sie auch nicht den Laien verständlich vermitteln, sondern stiftet nur Verwirrung.
  4. Durch das Weglassen der Wortlänge (Bit) entsteht eine eindimensinale Aussage. Ein digitales System ist aber nur bei der Nennung beider Kenngrössen – der Wortlänge und der Abtastfrequenz – klar definiert und charakterisiert. Ein Rechteck kann auch nicht durch Nennung einer einzigen Seite definiert werden. Auch mit Nennung beider Achsen/Dimensionen kann die effektive Qualität des Systems noch nicht sinnvoll bestimmt werden. Berücksichtigt man, dass es sich bei DSD um ein 1 Bit System mit „nur“ 6dB Dynamikumfang im ungewandelten Datenstrom handelt, kommt man auf eine deutlich veränderte Reihenfolge innerhalb der Grafik, wie weiter unten dargestellt.

Fehler Bilder 1 und 2 « Klötzchengrafiken» (Treppen und Raster)

Generell – diese Grafiken sind in zahlreichen Darstellungen in dieser oder ähnlicher Form seit Mitte der 1980er Jahren im Umlauf, als die ersten CD-Spieler mit 18 Bit D/A-Wandlern auf dem Markt erschienen. Allen Grafiken dieser Art ist gemeinsam:

  1. Sie suggerieren, dass durch eine höhere Samplingrate eine Qualitätsverbesserung im gesamten Übertragungsbreich erfolgt, was falsch ist. Fakt ist, der Übetragungsbreich wird durch eine höhere Samplingrate erweitert. Die Signalanteile, die bereits mit einer tieferen Samplingrate erfasst wurden, werden durch die erhöhte Samplingrate (Abtastrate) nicht genauer dargestellt. Sie wurden bereits mit der tieferen Samplingrate exakt reproduziert. Die Darstellung mit einem immer feineren Raster ist falsch und in der gleichen Weise irreführend.
  2. Die Erhöhung der Wortbreite von 16 Bit auf 24 Bit wird mit einer reduzierten Klötzchenhöhe (feinerem Raster) dargestellt. Oder anders formuliert: auf der gleichen Zeichenfläche werden mehr Klötzchen dargestellt. Diese Darstellung ist falsch, denn 1 Bit entspricht 6 dB Pegeldifferenz. 1 Bit umfasst somit immer einem Lautstärkebereich (Dynamik) von 6 dB. Folglich: CD > 16 x 6 dB = 96 dB Dynamikumfang. HD > 24 x 6 dB = 144 dB Dynamikumfang. Fazit mit 24 Bit Wortlänge lassen sich Signalanteile die leiser als minus 96 dB sind erfassen. Also auch hier eine Erweiterung des Übertragungsumfangs.
  3. Die immer schlanker dargestellten Balken (in Bild 1 abgesetzt und in Bild 2 verbunden) sind in zweierlei Hinsicht falsch. Absicht ist: sie sollen den bei der Analog-Digital-Wandlung entstehenden Pulszug darstellen. Der Pulszug ist der aus den einzelnen Samples (Abtastwerte) gebildete Datenstrom, der das analoge Signal zeitdiskret repäsentiert. Die einzelnen Abtastwerte haben immer die gleiche Wortlänge, CD 16 Bit, bei HD 24 Bit. Es ändert sich nur deren Binärwert (Zahl, respektive Abfolge von Einsen und Nullen). OK, man kann die Darstellung halbwegs gelten lassen und die unterschiedlichen Pulslängen als repräsentatnt für die als Binärwert ausgedrückte analoge Signalamplitude darstellen. Nur eben, keine smarte Art das Prinzip zu veranschaulichen.
  4. Und zweitens: Der grösste Fehler liegt in der groben treppenförmigen Darstellung der Binärwerte. Man interpretiert als Endnutzer diese Treppen automatisch als zurückgwandeltes, analoges Signal. Falsch: dargestellt ist lediglich eine Zwischenstufe bei der Digital-Analog-Wandlung (Zero Order Hold). Das Signal durchläuft noch das Rekonstruktionsfilter. Am Ende kommt eine exakt rekonstruierte analoge Signalwellenform raus. Nun sind auch digitale Systeme nicht 100% fehlerfrei. Doch im Vergleich zur Fehlerquote von analogen Systemen arbeitet ein digitales um ein Vielfaches genauer. Die Zahlenwerte dazu weiter unten. Allerdings muss man auch anmerken, dass digitale Artefakte (Fehler) in jedem Fall sehr unangehem anzuhören sind, während leichte Verzerrungen in einem analogen System unser Ohr (Hirn) eher toleriert, ja sogar subjektiv als angenehm empfinden kann.
  5. Die Aussage in Bild 2 bei der ersten Treppengrafik «Large Error» (grosser Fehler) zielt offensichtlich darauf ab, das omnipräsente Digitalformat 16Bit/44.1kHz (CD Format) als äusserst mangelhaft zu deklarieren. Damit soll die Käuferschaft motiviert werden in HD-Formate zu investieren. Natürlich auf Hard – und Softwareseite. Durch die Nichtauszeichnung der Werte für Wortbreite (Bit Depth) und der Abtastrate (Sample Rate) schleicht man sich elegant aus der Kritik der groben Vereinfachung. Fakt ist, dass bei einem 16 Bit Format die Quantisierungsverzerrungen, also der erwähnte Error/Fehler bei -96 dB auftreten, was extrem leise (Grenze der Hörwahrnehmung) ist und rund 30 dB leiser ist als die typischen Fehler bei der analogen Audiotechnik (Tonband/Schallplatte). Auch das «No Error», also kein Fehler bei HD Audio ist nicht ganz korrekt. Jedes digitale System erzeugt im kleinstwertigsten Bit Rundungsfehler, nur sind die bei 144 dB und so ausserhalb der Wahrnehmbarkeit, da sie durch das physikalische Rauschen der Bauteile maskiert werden, welches im Bereich von -120 dB bis -130 dB liegt.

Wie kann man die komplexe Materie einigermassen richtig erfassen?

Nun, keine einfache Aufgabe und man muss sich auch als interessierter Musikfreund etwas Zeit nehmen und sich mit den Grundzügen der Materie befassen. Eine komplexe, mehrdimensionale Welt lässt sich nicht mit simplen, kinderbuchartigen Texten und Bildern erfassen. Dies gilt für alle Bereiche des modernen Lebens.

Versuchen wir, die obigen Aussagen mit entsprechenden Grafiken in korrekte, fassbare Aussagen zusammen zu fassen, dargestellt als Bildfolge.

Bildfolge 5: Audio Frequenzbereich – was wirklich relevant ist.

Bild 5a: In Bild 2 werden die beiden Systemachsen (Dimensionen) mit Wortlänge und Samplerate und die maximal übertragbare/reproduzierbare Frequenz dargestellt.

[1] Horizontale: Abtastrate in kHz
: (Sample Rate) codiert die im Signal vorkommenden Frequenzen (Töne/Tonhöhe). Die maximal mögliche Frequenz (Ton) die aufgezeichnet und auch korrekt reproduziert werden kann, hängt von der Abtastfrequenz (Rate) (Samplingfrequenz (Rate)) ab. Die obige Grafik zeigt die Aufzeichnungsgrenze für die verschiedenen Abtastraten. Sie ist einfach die Hälfte der Abtastrate, denn das Nyquist Theorem sagt, dass zur exakten Reproduktion einer Schwingung diese mit mindestens zwei Punkten innerhalb einer Schwingungsperiode abgetastet werden muss. Oberhalb der halben Samplingfrequenz ist Schluss. Signalanteile, die darüber liegen müssen ausgefiltert werden, denn sie können nicht mehr genau reproduziert werden. Es würden falsche Frequenzen bei der Rückwandlung erzeugt, sogenannte Aliasingfehler (Frequenzen). Also nach der Hälfte ist Schluss. Folglich: je höher die Abtastrate, desto höher liegt die maximale übertragbare Frequenz (Bilder 5-2, 5-3, 5-4 und 5-5).

[2] Vertikale: Wortlänge/Wortbreite in Bit (Bit Depth) codiert die Lautstärke des analogen Signals (Laut/Leise).
Die Auflösungsgrenze wird durch das kleinstwertigste Bit bestimmt. Ist ein Signal, ein Ton leiser als das kleinste Bit, wird auf- oder abgerundet. Es entsteht ein hässlich klingender Quantisierungsfehler (Quantisierungsverzerrungen, auch fälschlich als Quantisierungsrauschen bezeichnet) – siehe Bild 5-1.

Bild 5b: Nochmals die beiden Achsen und die daraus resultierende Bitrate.

Bild 5-1: Bittiefe und Quantisierungsfehler. Nicht feinere Stufen, mehr Stufen! Wenn versucht wird die Digitaltechnik mit dem Verständnis und den Eigenschaften von Analogtechnik zu verstehen, kommt man unweigerlich aufs Glatteis. Das Thema Digitaltechnik bemüht mehr mathematische Abstraktionen, was ein leichtes Verständnis erschwert.

Bild 5-2: Mit der CD Samplingfrequenz von 44.1 kHz können Signale bis 22.05 kHz erfasst werden. Die Frequenzen von 40 und 80 kHz in unserem Beispiel werden unterdrückt, weggefiltert.

Bild 5-3: Mit der Hi-Res Samplingfrequenz von 96 kHz können Signale bis 48 kHz erfasst werden. Die Frequenz von 40kHz ist nun erfasst. Die 80 kHz werden unterdrückt, weggefiltert.

Bild 5-4: Die Frequenzen unterhalb von 22.05 kHz, die bereits mit 44.1 kHz Abtastrate (Samplingfrequenz) erfasst wurden, werden mit einer höheren Abtastrate von 96 kHz nicht präziser reproduziert, denn auch die bei der zeitdiskreten, digitalen Abtastung nicht erfassten Signalanteile zwischen den Samples (Abtastwerte), können exakt rekonstruiert werden. Die 96 kHz Abtastrate erweitert den übertagbaren Frequenzbereich von 22.05 kHz auf 48 kHz und bringt nicht grundsätzlich mehr Genauigkeit im gesamten übertagbaren Frequenzbereich 20 Hz bis 48 kHz.

Mehr Hintergrundinformationen zur Signalrekonstruktion finden Sie im Artikel “ Digital Basics – vergessen Sie Treppen und Löcher zwischen den Samples

Bild 5-5: Mit der Hi-Res Samplingfrequenz von 192 kHz können Signale bis 96 kHz erfasst werden. Nun ist auch die Frequenz von 80 kHz mit im Boot. Eine Samplingrate von 192 kHz erweitert den Audio-Frequenzbereich von 48 kHz auf 96 kHz. Die Signalanteile unterhalb von 48 kHz werden mit 192 kHz Samplingfrequenz nicht präziser dargestellt.

Die Frage ist, wie weit reicht das Frequenzspektrum unserer Instrumente. Schon mal vorweg – keines reicht nur annähernd in den Bereich von 80 kHz hinauf.

Bildfolge 6: Bitraten pro Sekunde – kein schlüssiges Kriterium für Qualität

Bild 6: Hier wird deutlich, dass die in den Bildern 3 und 4 dargestellten Bitraten keine Aussagekraft haben, denn sie vernachlässigen den Aspekt von verlustbehafteter und verlustfreier Komprimierung. In der Pono Grafik wird zwar auf den Aspekt hingewiesen, doch man kann in der dargestellten Art auch zum Ansicht gelangen, dass die Audioqualität direkt von der Bitrate abhängt. Das Thema WAV-Datei (nicht komprimiert) und FLAC-Datei (verlustfrei komprimiert) und Klangunterschiede ist, nicht überraschend, auch immer ein heisses Thema. Mehr dazu im Artikel WAV-FLAC LINK.

Was auffällt. Eine WAV-192-Datei ist doppelt so gross wie eine WAV-96-Datei, was schlüssig ist, da es sich um ein kompressionsfreies Format handelt. Bei der verlustfreien Kompression rechnen Algorithmen Bit-Redundanzen raus und codieren sie Speicherplatz sparend. Wie stark die Dateigrösse dabei reduziert werden kann, hängt von den Redundanzen innerhalb des Signals ab. Oder anders gesagt, viele gleiche Bitfolgen/Strukturen ergeben mehr Redundanzen, womit mehr Speicherplatz gespart werden kann (kleinere Dateigrösse). Vor der Wiedergabe muss die komprimierte Datei wieder entpackt werden, wie ein gefaltetes A4 Blatt, das aus dem C5 Briefumschlag genommen, vor dem Lesen entfaltet werden muss. Hohe Redundanzen, sprich eine starke Reduktion der Dateigrösse ist deutlich beim 192 kHz gesampelten Format sichtbar, was mit Bild 6-1 leicht erklärt werden kann. Die WAV Datei wurde mit der gleichen Kompressionsstufe (6) in FLAC 96 und FLAC 192 Dateien konvertiert.

Bild 6-1: in der Realität erzeugen unsere Instrumente, respektive reicht das Obertonspektrum der Instrumente über unseren Hörbereich bis in den Ultraschallbereich hinein. Doch in der Regel ist oberhalb von 40 kHz Schluss. Einzig Perkussionsinstrumente gehen da noch etwas weiter hinauf. Zeichnen wir nun – wie im Bild 6.1 dargestellt – mit einer Samplingfrequenz über 96 kHz auf, die weit über das Spektrum der Instrumente reicht (192/384kHz), erzeugt der Analog-Digital Konverter viele Nullen, da dort oben nichts mehr vorhanden ist. Viele Nullen kann man problemlos komprimieren. Mit dem nun erworbenen Wissen können wir anhand der Bitrate von FLAC 96 und FLAC 192 rauslesen, dass 192 kHz Samplingfrequenz offensichtlich keine  Mehrinformationen bringt. Bitte beachten Sie, dass die resultierende Bitrate vom Inhalt und dem Kompressionsgrad abhängig ist. Fazit: die Bitrate ist kein tauglicher Massstab für Qualität.

Bild 6-2 zeigt den mit unterschiedlichen Samplingfrequenzen erfassbaren Frequenzbereich in einer logarithmischen Skala. Das Frequenzspektrum der Instrumente und Stimmen ist in der unteren Bildhälfte dargestellt. Wir sehen – die CD deckt das Wesentliche bereits ab. Den Aspekt, dass das ganze Thema Akustik, Hören, Tonhöhe, Obertonspektrum in einem logarithmischen Verhältnis steht, lassen die allermeisten Grafiken ausser Acht. Die dargestellten Qualitätsbezüge werden so stark verzerrt dargestellt.

Bild 6-3: Ton (Frequenz Spektrum/FFT) einer Trompete mit Grundton bei 703 Hz und die ersten vier Obertöne, welche die Charakteristik, den Klang jedes Instrumentes bestimmen, also ob der gleiche Grundton von 703 Hz von einem Klavier oder Klarinette gespielt wird. [1] mit 44.1 kHz Samplingfrequenz erfasster Ton-Frequenzbereich bis 22.05 kHz. [2] 96 kHz Fs und [3] 192 kHz Fs. 

Bildfolge 7: Perzeptive Qualität – es geht ums effektiv gehörte und somit auch ums Subjekt

Bild 7: Welches Format bringt nun effektiv welche Qualität. Eine Grafik, wie Bild 7 ist natürlich weniger dramatisch und etwas weniger schnell zu lesen und zu verstehen als der «Pono-Turm» von Bild 4. Und sie zerstört auch einige Mythen, vor allem, dass Samplingraten über 96 kHz als Distributionsformat keine Mehrinformationen und somit Nutzen bringen. Die Grafik berücksichtigt den Frequenz- und Dynamikumfang der Formate, anstelle von reinen Zahlen oder subjektiv verbalen Bewertungen. Sie berücksichtigt die nicht lineare (logarithmische) Struktur der Akustik und des menschlichen Hörvermögens. Was auch datenreduzieret Formate, wie MP3 oder AAC machen. Das natürliche Obertonspektrum der Instrumente fällt zu hohen Frequenzen hin stark ab. Im Ultraschallbereich (oberhalb des menschlichen Hörbereichs) liegt die Energie bei unter 1% der Energie des Grundtons. Das ist kein Grund diesen Bereich zu vernachlässigen, aber überbewerten sollte man ihn auch nicht.

Bild 7-1: Zoom auf das Obertonspektrum des in Bild 6-1 gezeigten Musikstückes, hier in einem 24/96 Format dargestellt. Das Frequenzspektrum reicht bis knapp über 30 kHz hinauf. Die blau eingefärbten Signalpegel liegen in einem Bereich von -85 dB, sind also sehr leise.

Bild 7-2: Die MP3 Datenreduktion berücksichtigt das menschliche Hörvermögen und reduziert (eliminiert) Frequenzbereiche die weniger gut, oder nach der Auffassung der MP3-Schöpfer, nicht wahrgenommen werden. Abhängig von der Qualität des Wiedergabesystems sind die Defizite, bedingt durch die Datenreduktion deutlich hörbar, besonders bei Datenraten unter 256 kbps. In der heutigen Zeit mit schnellem Internet und Mobilfunk, sowie preiswertem, üppig verfügbarem Speicherplatz, besteht keine Notwendigkeit für Datenreduktion mehr. Tempi passati!

Bildfolge 8: der Glaube an die analoge Perfektion

Bild 8-1: Analoge Perfektion, wie dies die obigen Grafiken und die Aussage des Händlers vermitteln wollen, würde anders aussehen. Die Signalform des 1 kHz Sinussignals ist ab Schallplatte korrekt abgebildet, aber das Signal schwankt auf der Pegel- (vertikal) und Zeitachse (horizontal) was zu hörbaren Tonschwankungen führt. Wie auch in Bild 5-4 zu sehen, das zurückgewandelte digitale Signal hat keine Treppenform und ist auch nicht zerhackt. Die subjektive Beurteilung und die Realität klaffen hier auseinander.

Das komplette Video ist auf YouTube zu sehen: https://www.youtube.com/watch?v=XFxiLeQmb5k&t=164s

Bild 8-2:  Die Aussage die Vinyl Schallplatte habe eine grössere Klangdynamik lässt sich einfach auf den Wahrheitsgehalt prüfen. Wir sehen im Bild oben auf der linken Seite das Grundrauschen und Rumpeln der Einlaufrille einer neuen, gut gepressten Schallplatte. Alle Signalanteile die leiser sind als das Grundrauschen eines Systems – egal ob digital oder analog, egal ob CD, HD, Tonband oder Schallplatte – werden von den Grundgeräuschen des Systems überdeckt, maskiert. Dynamik ist die Spanne in dB zwischen dem leisesten und lautesten reproduzierbaren Signal. Die Dynamik wird in jedem System durch den Grundgeräuschpegel und den Verzerrungen, die entstehen, wenn die obere Systemgrenze überschritten wird, definiert.

In der rechten Bildhälfte sehen wir einen 1 kHz Sinuston bei -65 dB. Er ist deutlich leiser als das Grundrauschen der Schallplatte, das in diesem Fall bei rund -50 dB liegt. Das -65 dB Signal geht im Grundrauschen unter. Die LP bringt es maximal auf einen Dynamikumfang von 60 dB, die CD auf 96 dB. 60 dB entsprechen in der digitalen Welt 10 Bit. (Obere Bildhälfte: der grüne Bereich markiert die gezoomte Strecke, dargestellt in der unteren Bildhälfte).

Wenn der geschätzte Händler von «…die Unterschiede zwischen Laut und Leise [sind] grösser, das Musikerlebnis ist somit lebhafter» spricht, liegt er in der subjektiven Wahrnehmung durchaus nicht daneben, denn, wenn man z.B. eine moderne, kommerzielle Pop Produktion mit massiver Dynamikkompression auf CD und LP hört, stimmt die Aussage mit grosser Wahrscheinlcihkeit. Die LP wird lebhafter klingen, da das analoge System aus technischen Gründen weniger Dynamikkompression zulässt. Teilweise lässt der Produzent auf Vinyl andere (künstlerische) Aspekte zu, da er bei Vinyl eine in der Regel anspruchsvollere Zielgruppe im Auge hat. Nun daraus die Überlegenheit der Schallplatte abzuleiten ist ein Fehlschluss. Man ist dem Thema Loudness War auf den Leim gekrochen. Mehr dazu:

«Naht das Ende vom Loudness War? Mit Lautstärkenormalisation den Unsinn beenden».

«Verstümmelte Musik. Wie Dynamikkompression und Datenreduktion die Musik verändern»

Fazit

Der eine geniesst genuinen Vinyl Sound trotz oder gerade wegen der Artefakte. Oder kann man Vinyl nur geniessen mit der (subjektiven) Meinung, man habe ein der Digitatechnik überlegenes Format? Quasi Placebo basierter Musikgenuss. Ich denke nicht. Man kann die Fakten akzeptieren und dennoch seinen präferenzierten Sound geniessen. Und im Umkehrschluss: muss man (Objektivist) Vinyl Liebhaber als Trolle bedauern (wie Herb Reichert die Objektivsten), weil man weiss und beweisen kann, dass diese Technologie die Signawellenform weniger akkurat speichern und reproduzieren kann? Nein – sicher nicht!

Digital Audio kann – besonders in der HD Version –  einen reinen, durchhörbaren Klang bieten, tonal näher am Original als analoge Technik, die dies weniger präzise hinkriegt, jedoch in der Nähe des Originals bleibt. Diese tonalen Verfärbungen prägen das analoge Klangbild. Subjektiv übt dies auf einen Teil der Musikliebhaber mehr Anziehungskraft aus, als die „saubere“ Digitalaufnahme. Woher diese Prägung oder Vorliebe kommt, kann nur vermutet werden. Studien dazu gibt es (noch) nicht. Mag sein, dass bei den älteren Semestern, in deren Teenie Zeit es nur Vinyl gab, durch frühe Hörerfahrungen geprägt wurden und eine Portion Nostalgie mitschwingt. Was ist aber mit der Generation der 25- bis 35-jährigen, die ebenfalls als Gruppe der Retrovinyler in den Statistiken auftauchen? Ist es die Livehaftigkeit, die dem Medium nachgesagt wird? Möglich, denn ein Livekonzert ist eher durch Diffusität denn Transparenz geprägt. Oder ist es einfach das Entdecken einer anderen Klangwelt, weniger betroffen vom Kommerz-Pop Loudness War mit absurder Dynamikkompression, die erst durch die erweiterten Möglichkeiten der Digitaltechnik in der heute exzessiven Form machbar wurde. Eventuell auch, weil Vinyl als Ganzes in einer Streaming-Welt fassbarer, plakativer ist, im wahrsten Sinne des Wortes?

Wir pendeln im Alltag laufend zwischen Subjektivität und Objektivität. Auch die Audiotechnik macht da keine Ausnahme. Richtungsabhängigkeit von Kabeln (ein Witz, wenn man weiss, dass Audiosignale die Laufrichtung innerhalb jeder Periode ändern. Ausnahme: einseitige Schirmung), zweifelhaftes Zubehör und Klötzchen unter den Kabeln, kleine Schälchen und Plättchen an den Wänden. Messtechnisch lässt sich bei vielen Zubehörartikeln nichts erfassen. Man muss hier kritisch hinterfragen, ob die Hördifferenzen (Wirkung) dieser Produkte nicht primär auf Selbstbeeinflussung beruhen. Es gibt in diesem Bereich viel Sinnvolles, aber auch Absurdes. Die Amerikaner bezeichnen Produkte deren Wirkversprechen nicht vorhanden oder nachweisbar ist als Snake Oil Produkte, nach einem Ende des 19. Jahrhunderts erfolgreichen Scharlatan, der angelblich heilendes Schlangen Öl erfolgreich unter die Leute brachte. Er war auch dann noch gut im Geschäft, als erkannt wurde, dass der Flascheninhalt weder Schlangen Öl enthielt noch irgendeine Wirkung hatte. Dass der Verkaufserfolg trotz besserem Wissen nicht komplett einbrach, kann nur mit Subjektivismus oder Unwissen begründbar sein.