Wie funktioniert Audiokomprimierung und was ist "Lossless" Audio?

Erst in dieser Woche begann Spotify, "verlustfreie" Audiodateien zu testen. Aber was ist "verlustfreies" Audio genau und wie funktioniert digitale Audiokomprimierung?

Wie funktioniert Audiokomprimierung?

Das Ziel bei der Audiokomprimierung ist es, die Anzahl der Bits zu reduzieren, die für die genaue Wiedergabe eines analogen Sounds erforderlich sind. Der erste Prozess, den wir betrachten, wird "verlustbehaftet" genannt. Die verlustbehaftete Komprimierung ist eine Einwegmethode, die nicht kritische Daten wegwirft, um Platz zu sparen. Diese Techniken sind die gebräuchlichsten Methoden zum Komprimieren von Audiodateien, die in MP3-, AAC- und WMA-Dateien gleichermaßen angezeigt werden. Es gibt zwei Orte, an denen verlustbehaftete Codecs Bits retten wollen: Bitrate und Psychoakustik.

Bitrate

Die Bitrate misst die Anzahl der Bits, die für die Codierung einer einzelnen Sekunde Audio verwendet werden. Wenn wir zum Beispiel eine Kodierung mit niedriger Qualität und einer Kodierung von 8 Kilobit pro Sekunde (KBit / s) verwenden, ist unser Algorithmus darauf beschränkt, nur 8 Kilobits an Daten zu verwenden, um jede Sekunde Audio zu beschreiben. Das ist so, als würde man versuchen, ein Farbfoto mit nur einigen hundert Pixeln zu beschreiben. Sie könnten die breiten Striche richtig sehen, aber insgesamt werden Sie ein stark verschlechtertes Bild sehen. Wenn wir eine höherwertige Bitrate wie 192 KBit / s verwenden, haben wir genug Platz, um nuancierte Details abzudecken. Um zu unserem fotografischen Beispiel zurückzukehren, verfügen wir nun über genügend Pixel, um die verschiedenen Lichter, dunklen Farben und Farben in einem Bild zu beschreiben. Eine hohe Bitrate bestimmt nicht allein die Qualität einer Aufzeichnung, aber eine niedrige Bitrate kann die Ausgabequalität stark einschränken.

Psychoakustik

Psychoakustik ist die Wissenschaft davon, wie das Gehirn Klänge versteht. Durch die Manipulation bekannter Quirks in der Art und Weise, wie Menschen Geräusche wahrnehmen, können Kompressionsalgorithmen geschickt Details entfernen, die die meisten menschlichen Ohren nicht übersehen. Das Ziel ist es, Informationen, die die wahrgenommene Audioqualität eines Tracks nicht verändern, "abzurunden" und nur unwichtige Informationen sorgfältig zu entfernen.

Zum Beispiel wissen Sie vielleicht, dass der typische Bereich des menschlichen Gehörs zwischen 20 Hz und 20 kHz liegt. Natürlich können Sounds außerhalb dieses Bereichs entfernt werden. Darüber hinaus liegt der detaillierteste Bereich des menschlichen Gehörs zwischen 100 Hz und 4 kHz, und das Entfernen von leisen Tönen außerhalb dieser Frequenzbereiche beeinträchtigt die Qualität einer Aufzeichnung nur minimal. Wir können einen ähnlichen Trick mit kontrastreichen Klängen machen. Wenn ein sehr lauter Ton und ein sehr leiser Ton gleichzeitig spielen, ist der leise Ton viel schwerer wahrzunehmen als er selbst wäre. Encoder nutzen diese "Sound Masking", um den leisen Sound zu entfernen und dabei Bits zu sparen.

Die Frequenz kann auch beeinflussen, wie gut wir Töne wahrnehmen. Zum Beispiel neigt ein hartnäckiger, niederfrequenter Schlagzeugschlag dazu, die empfindlicheren, höherfrequenten Obertöne melodischer Instrumente zu übertönen. Und Soundmasking ist besonders effektiv oberhalb von 15 kHz, wo das menschliche Gehör in der Regel weniger empfindlich ist.

Gewöhnliche Audiokomprimierungsschemata wie MP3 nutzen die volle Bandbreite der Komprimierungsmöglichkeiten, während sie versuchen, der ursprünglichen Aufnahme möglichst treu zu bleiben. Natürlich haben einige Leute das Gefühl, dass das Entfernen dieser Frequenzen die Aufnahme ernsthaft beschädigt. Aus diesem Grund gibt es verlustfreie Komprimierungsstandards.

Was ist "verlustfreies" Audio?

Die verlustfreie Audiokomprimierung zielt darauf ab, die Dateigröße zu reduzieren, während das ursprüngliche Audio unberührt bleibt. Diese Codecs verwenden keine der oben genannten permanenten Komprimierungstechniken und konzentrieren sich stattdessen auf vollständig reversible Datenkomprimierungsmethoden. Sie verwenden verlustfreie Komprimierungstechniken, die aus Dateikomprimierungsalgorithmen wie ZIP entlehnt sind, um redundante Daten zu entfernen und gleichzeitig die Integrität der zugrunde liegenden Informationen zu bewahren. Zwei populäre verlustfreie Audio-Codecs - FLAC und Apple Lossless (ALAC) - verwenden Schemata, die auf ZIP-Komprimierung basieren.

Die Konzentration auf Datenkomprimierung bedeutet nur, dass viele der Details erhalten bleiben, die MP3 und andere verlustreiche Standards vernichten würden. Wenn Sie scharfe Ohren und ein hochwertiges Hörsystem haben, ist der Unterschied spürbar.

Verlustfreie Komprimierung ist nicht nur gut zum Zuhören, es ist auch ein großartiges Speicherwerkzeug. So wie Sie nicht möchten, dass ein 72-dpi-JPG die einzige digitale Kopie von Ansel Adams Fotografien ist, wollen wir nicht nur 128-kbps-MP3s von "Kind of Blue". Verlustfreie Standards wie FLAC ermöglichen es uns, Audio effizient zu speichern, ohne potenziell wegzuwerfen wertvolle Daten. Sie machen auch das Remastering und die Neuvertonung dieses Audios leichter, da das Beginnen mit kompromisslosen Mastern ein höher Qualität fertiges Produkt bedeutet.

Fazit: Können Sie den Unterschied erkennen?

Verlustfreie Audioformate ermöglichen besser klingende Aufnahmen. Aber manchmal sind die Unterschiede zwischen einer hochwertigen MP3 und einer verlustfreien Datei kaum wahrnehmbar, besonders für das ungeschulte Ohr. Wenn Sie sehen möchten, ob Ihre Kopfhörer (und Ohren) scharf genug sind, um den Unterschied zu erkennen, hat NPR einen spaßigen Test; Bedenken Sie jedoch, dass billige Kopfhörer und Laptop-Lautsprecher nicht in der Lage sind, die feinen Unterschiede zwischen verlustfreiem Audio und MP3s zu reproduzieren. Eine genauere Analyse der Codecs finden Sie in den Encoder-Bewertungen von SoundExpert.