Цифровой звук

"Супер"


Начнем мы, разумеется, с самой лакомой для меломанов зоны высших битрейтов. При этом, главная цель кодирования заключается в достижении максимально возможного качества звучания, поэтому для тестирования возьмем максимальные параметры для обоих кодеров. Для LAME берем чистый режим 320 кбит с полным звуковым диапазоном вплоть до 22 кГц и максимальным качеством (-q0), остальные параметры позволим устанавливать самому кодеру. Для OGG также возьмем режим максимального качества - 350 кбит. К сожалению, как я уже говорил, управление какими-либо другими параметрами кодирования невозможно, поэтому придется полагаться на собственные настройки кодера. Таким образом, кодеры работают практически на пределе своих возможностей по передаче звучания оригиналов. Сжимаем, декодируем, смотрим…

И что же получается? Очень интересные факты. Я со всей ответственностью могу подтвердить заверения разработчиков обоих форматов о том, что их психоакустические модели претерпели значительные изменения, которые легко заметны при анализе раскодированных семплов. В корне изменилась обработка высоких частот. Если раньше в режиме 320 кбит LAME оставлял практически полный диапазон вплоть до 22 кГц, то сейчас эти частоты также проходят через психоакустическую модель. Данный факт прекрасно иллюстрируется сонармом (частотно-временное представление звука). Сравните оригинал и раскодированный семпл (щелкните на графиках для увеличения):

Шокирующие иллюстрации, не правда ли? Но это еще что, вот полюбуйтесь, что получается у OGG на 350 кбит - срезание частот даже на уровне 16 кГц.

В закодированном сигнале встречаются даже такие вот участки АЧХ (вертикальной линией отмечена частота 16 кГц).

Согласитесь, довольно странное обращение с высокими частотами для режима максимального качества кодирования. В более ранних версиях обоих кодеров такого вольного обращения я не встречал. Интересно, как звучат эти семплы по сравнению с оригинальными записями… Начинаем прослушивание.

Вот это да! Вот это обработка звучания! Звук стал настолько близок к оригиналу, что отличить вслепую три записи стало чрезвычайно сложно.
При максимальных параметрах оба кодера передают практически идентично звучание оригинального компакт-диска. Единственное, что после многократного перекрестного прослушивания мне удалось отметить, это большую прозрачность звучания и лучшую передачу верхних средних частот у кодера OGG. Но, повторю, эта разница настолько ничтожна, что ощутимо слышна она будет только на очень качественной и дорогой аппаратуре. Таким образом, за передачу максимально возможного качества звучания оба кодера получили твердую "пятерку" с одним только отличием, что у OGG средняя скорость потока ощутимо больше 320 кбит (обычно она варьируется в пределах от 340 до 380). Разработчики разумно решили поступиться передачей частот выше 19 кГц, отдав предпочтение более важному частотному диапазону. Усредненные АЧХ кодированных и оригинальных семплов мало отличаются друг от друга, несмотря на очень вольное управление высокими частотами обоих кодеров.

Давайте проведем исследование дельта-сигналов, то есть вычислим и сравним отличия между оригинальными и кодированными семплами.

Разностный сигнал семплов LAME на слух воспринимается как негромкий широкополосный шум, сквозь который слабо пробивается основной звук с хриплым постукиванием и сильно искаженными высокими частотами. Для семплов OGG картина оказывается намного более сложной: звучание напоминает уже не просто шум, а сильно искаженный оригинал с эффектом фазовых искажений (эффект flanger или phaser). Если судить по звучанию, можно сделать вывод, что у OGG обработка разных диапазонов частот отличается значительно большей продуманностью по сравнению с LAME, у которого, похоже, для большинства поддиапазонов применяются очень близкие параметры психоакустической модели. Это видно при анализе АЧХ дельта-сигналов (красный график для LAME, белый - для OGG). Смысл приведенных графиков заключается в том, что чем ниже уровень сигнала, тем выше качество передаваемого звучания на соответствующих частотах.



Таким образом, разработчики OGG пошли по пути иного распределения приоритетов относительно применяемого в MP3 кодирования.


Они решили упростить кодирование низких и средних частот ниже 2 кГц, зато улучшить передачу верхней середины и высоких частот до 16 кГц, т.е. основного слышимого диапазона. На приведенном графике хорошо видно, что в диапазоне до 2 кГц лучше передает звучание LAME, в то время как в диапазоне от 2 до 16 кГц - OGG. Отсюда и подмеченное мною лучшее качество звучания средних частот на семплах, закодированных кодером OGG.

Как уже говорилось, кодер OGG не позволяет управлять параметрами кодирования, что заставляет нас довериться выбору разработчиков формата. В то же время LAME дает огромные возможности по управлению процессом кодирования, параметрами психоакустики и фильтров, и, если при кодировании в 320 кбит насильно срезать частоты выше 20 кГц, которые по теории никто не может услышать, можно добиться лучшего качества звучания. Нагляднее всего это можно продемонстрировать на сравнительном графике усредненных АЧХ дельта-сигналов полного и обрезанного до 20 кГц при кодировании семплов.



Разница в уровне дельта-сигнала составляет до 2 дБ, и это весьма ощутимая разница - порядка 15%. То есть, образно говоря, решив не кодировать частоты выше 20 кГц, мы получили улучшение передачи всего остального диапазона на 1-2 дБ. Я рекомендую придерживаться этого правила, если вы хотите получать более качественное звучание. Отмечу также, что разницу в звучании между семплами, обрезанными на 20 кГц, и семплами OGG обнаружить уже не просто сложно, а практически невозможно, разумеется, если кто-то из читателей не обладает абсолютно уникальным слухом.

Таким образом, в зоне высочайшего качества OGG и LAME практически не отличаются друг от друга, поэтому при выборе кодера меломаны могут руководствоваться только личными симпатиями.


Содержание раздела