: архив : архив журнала "Звукорежиссер" : 1999 : #3

Технология Super Bit Mapping
Юрий Щитов

От редакции

В предыдущем номере мы опубликовали статью Юрия Шитова о новом перспективном формате цифровой звукозаписи - DSD. Перспективы - дело хорошее, но есть повседневная практика и реально применяемые технологии, которые уступают место новым не так уж быстро. О них наши читатели также должны знать. Поэтому публикуемая в этом номере статья того же автора посвящена более старой, но актуальной до сих пор цифровой технологии - Super Bit Mapping. Пусть читатели не удивляются некоторому отступлению от хронологии в освещении темы цифровых технологий.

Явление компакт-диска народу, произошедшее более пятнадцати лет назад, произвело огромный эффект на слушательские массы, как необычным внешним видом и способом использования, так и непривычным "химически чистым" звучанием. Однако со временем выявились и известные недостатки цифрового звучания, увеличившие число "цифровых скептиков". Возникла необходимость в преодолении этих недостатков, не выходя за пределы установившегося и завоевавшего всемирную популярность формата компакт-диска. Разные фирмы-производители предложили разные методы и технологии. Одной из наиболее эффективных технологий улучшения качества звучания компакт-диска и других способов цифровой записи оказалась предложенная ведущим разработчиком цифровой звукозаписи фирмой Sony технология SBM.

Super Bit Mapping (SBM) - это метод цифровой обработки, позволяющий с большой достоверностью преобразовывать высококачественный 20-битный мастер-сигнал в 16-битный для записи на компакт-диск. Несмотря на то, что 20-битный сигнал дает в 16 раз более точный отсчет, технология SBM способна очень эффективно, в соответствии с принципами психоакустики, конвертировать его в 16-битный. В результате SBM позволяет с наименьшими потерями качества оригинальной 20-битной записи создавать стандартные 16-битные компакт-диски для потребительского рынка. Рассмотрим более подробно разницу между 16- и 20-битной записью, чтобы оценить SBM по достоинству.

Связь между качеством звука и количеством битов

Сначала - немного "азов".

Существует сильная зависимость между разрядностью (длиной цифрового слова), и качеством звука. Известно, что минимальная информационная единица - один бит - может принимать только два значения: 0 или 1. Парой битов возможно представить четыре различных величины: 00, 10, 01 и 11. Трехразрядное двоичное число дает возможность представить 8 различных значений. Каждое дальнейшее увеличение разрядности вдвое увеличивает количество возможных значений слова данных.

Чем выше разрядность, тем с большей точностью (разрешающей способностью) производится запись звука. Так, 16-битное слово дает 65 536 различных комбинаций, что соответствует дискретности младшего разряда (LSB - Least Significant Bit). Если принять максимальное значение кодируемого параметра за единицу, то младший разряд делит это значение на 2n, где n - разрядность. Если добавить еще 4 бита (до 20) к слову данных, получим в 16 (24) раз больше комбинаций - 1 048 576. Другими словами, 20-битная запись содержит гораздо больше информации о звуке, и воспроизведение такой записи будет более достоверным.

Частотная характеристика шума, являющегося результатом погрешности преобразования, показана на рис. 2. 20-битная запись имеет значительно меньшую погрешность при цифровом кодировании, поэтому уровень шума на 24 дБ ниже.

Каждый дополнительный разряд в слове данных дает улучшение соотношения сигнал/шум на 6 дБ!

Появление 20-битной звукозаписи значительно улучшило качество студийного звука. Однако возникает вопрос: как лучше конвертировать 20 бит в 16, соответствующие формату компакт-диска. Ясно, что простое отсечение четырех младших битов из 20, чтобы осталось нужное количество, было бы неправильно.

Психоакустика и слуховое восприятие

Как известно, человеческое ухо не одинаково чувствительно к звукам различной частоты. Технология SBM использует это свойство таким образом, что 16-битное звучание для человеческого восприятия становится не хуже 20-битного. Как же удается достичь этого?

Известно, что частоты от 500 до 5000 Гц лучше всего слышимы человеческим ухом, и воспринимаются как наиболее громкие. И если повысить точность отсчетов именно в этом, "хорошо слышимом на низкой громкости" отрезке диапазона, субъективное качество в целом значительно улучшится.

Как видно из рис. 2, 20-битная запись дает возможность достоверно воспроизводить звук на 24 дБ более тихий, чем 16-битная во всем диапазоне, включая "хорошо слышимый на низкой громкости" отрезок диапазона от 500 до 5000 Гц. Чтобы звучание казалось лучшим, нужно, чтобы даже самые тихие звуки были более разборчивы, чем те, что дает 16-битный звук, особенно в этом диапазоне.

Принцип SBM

Каким образом SBM преобразует 20-битный сигнал в 16-битный без потери качества звука? Уровни шума 16- и 20-битного сигналов показаны на рис. 2. Суммарная мощность шумов квантования вычисляется сложением амплитуд погрешностей преобразования во всем диапазоне частот. Эта величина зависит от разрядности цифрового слова и является постоянной. Спектральный состав шума, как видно из рисунка, равномерный. Но, хотя невозможно изменить суммарную мощность шума, можно изменить его спектральный состав так, чтобы уровень на частотах от 500 до 5000 Гц у 16-битного сигнала стал близок к уровню 20-битного. Это и будет означать, что мы достигли желаемого результата (рис. 3). Оригинальная технология формирования шума (Noise Shaping) фирмы Sony, используемая в SBM, осуществляет необходимые для этого преобразования. Другими словами, SBM передвигает шумы квантования на частоты 15 кГц и выше, где человеческое ухо гораздо менее чувствительно. В результате низкие и, что особенно важно, средние частоты звучат гораздо более чисто и реалистично.

Формирование шума и SBM

Далее звуковая информация обрабатывается формирователем шума SBM, и погрешность вычислений распределяется нужным образом по диапазону частот. Благодаря сложному алгоритму, в подробности которого вдаваться не будем, чтобы не перегружать читателя гигантскими формулами и схемами, происходит смещение шумов со средне-низкого диапазона в сторону высших частот.

Таким образом, SBM отражает 20-битную информацию, обрабатывая 16-битные импульсы в заданном диапазоне.

В результате шумы концентрируются главным образом в высокочастотном диапазоне вокруг частоты 22,05 кГц (половина частоты Найквиста 44,1 кГц). Но, хотя шумы в высокочастотном диапазоне и усиливаются, человеческое ухо не слышит их, поскольку оно гораздо менее чувствительно к частотам выше 15 кГц.

Основным способом уменьшения ошибок дискретизации (артефактов) является так называемое "формирование шума". Рассмотрим принцип формирования шума на простейшем примере.

Рис. 4 показывает однобитный квантователь без формирователя, а рис. 5 - с простейшим формирователем шума. Если подать на вход простейшего квантователя сигнал постоянной величины 0,6, то этот квантователь будет выдавать последовательность единиц, поскольку входной сигнал больше 0,5. Таким образом, в результате будет всегда заложена ошибка величиной 0,4.

Но когда тот же сигнал подается на вход квантователя с формирователем шума, результат квантования будет изменяться (рис. 5), а, проследив изменения сигнала по таблице, мы поймем, что происходит.

В момент первого отсчета в точке a напряжение будет 0,6, следовательно, в точке b будет равно 1, поскольку квантователь однобитный.

В момент второго отсчета напряжение в точке a будет 0,6 + (0,6-1) = 0,2, а, следовательно, на выходе квантователя и в точке b равно нулю. Тогда в точке c будет 0,2-0 = 0,2. Таким образом, погрешность квантователя передается на вход и учитывается при следующем квантовании.

Выход схемы в целом также дает переменный результат, который обусловлен сигналом обратной связи, а среднее значение вычисляется на определенном интервале, в данном случае интервале 10 отсчетов. Проще говоря, SBM - это способ обработки младших 4 битов 20-битного сигнала при квантовании в 16-битный сигнал.

Реальная операция формирования шума в SBM

Как показано на рис. 3, при формировании шума подачей обратной связи по погрешности квантования, за улучшение качества в одном определенном диапазоне частот мы платим увеличением амплитуды шумов в другом диапазоне.

В простейшей цепи обратной связи, такой, какая показана на рис. 5, частотная характеристика шумов квантования имеет простую форму (рис. 6), с постепенным подъемом на высоких частотах и незначительным улучшением на низких и средних частотах.

Однако частотные характеристики для шумоформирователя, соответствующие характеристикам человеческого слуха и особенностям восприятия, не могут быть получены с помощью подобных схемных решений, и поэтому в SBM используются более сложные цепи обратной связи. Такая схема показана на рис. 7.

Для того, чтобы иметь возможность контролировать частотную характеристику шумов квантования, сигнал ошибки поступает на вход 12-ступенчатого цифрового фильтра. Установленные параметры этих фильтров определяют частотную характеристику шумов квантования.

Как же на самом деле выглядит частотная характеристика шумов квантования SBM? Пример такой характеристики приведен на рис. 8. Можно увидеть, что частотные характеристики шумов квантования на средних и высоких частотах схожи с известными "кривыми равной громкости Флетчера-Менсона" (см. журнал "Звукорежиссер" № 0, стр. 6), хотя в области 10 кГц сигнал несколько подавлен и нет подъема на низкочастотных шумах.

Почему же SBM использует другую кривую, отличную от кривой громкости? Стандартная кривая громкости использовалась в SBM первоначально, до первых независимых экспертных оценок. Сравнительные тесты показали наличие некоторых непредвиденных особенностей на средних и высоких частотах, хотя в целом качество воспроизведения звука значительно превышало обычное 16-битное.

Последующие тесты с использованием 20-битной мастер-ленты в качестве эталона, позволили опытным путем подобрать оптимальный вариант характеристики для формирования шумов. Результатом явилась характеристика, изображенная на рис. 8.

Имеется несколько причин, по которым эта кривая отличается от стандартной кривой громкости. Первая из них состоит в том, что измерения для кривой громкости проводятся с помощью генератора гармонических колебаний, а реальные источники звука имеют широкий спектр частот, взаимовлияющих друг на друга.

Характеристики

На рис. 9 представлены сигналограммы 20-битного, 16-битного округленного, SBM и 16-битного округленного с предварительно добавленным шумом (dither). Сигналограммы получены при воспроизведении сигнала 100 Гц очень низкого уровня и отфильтрованного ФНЧ с частотой среза 16 кГц.


На рис. 10 показаны соответствующие спектры этих сигналов при 1 кГц, -90 дБ. Заметим, что 20-битная характеристика имеет низкий уровень шума без гармоник на более высоких частотах. У 16-битного с округлением высокий уровень шума и много гармоник. У 16-битного округленного с подмешанным шумом шумовой порог еще выше, но отсутствуют гармоники.


У SBM нет гармоник на более высоких частотах, а порог шума в диапазоне ниже 5000 Гц примерно такой же низкий как у 20-битного, шум, однако, возрастает на частотах выше 15 кГц.

На рис.11 представлена осциллограмма сигнала, когда на вход подается 1000 Гц и уровень сигнала изменяется от максимума до -120дБ, чтобы проверить линейность характеристики сигнала на выходе каждого конвертера.


В то время как 20-битный формат демонстрирует почти идеальную линейность, 16-битный с округлением дает отклонение от линейности при малом уровне входного сигнала (ниже -90 дБ). У 16-битного округленного с добавленным шумом также хорошая линейность, но на низкоуровневом сигнале (ниже -90 дБ) повышаются шумы. У SBM линейность характеристики незначительно хуже 20-битной.

Как достичь хорошего воспроизведения SBM

SBM предъявляет некоторые требования к воспроизводящей аппаратуре, чтобы максимально использовать преимущества SBM. Как видно из рис. 8, SBM на 12 дБ улучшает отношение сигнал/шум на средних и низких частотах по сравнению с обычной 16-битной записью с подмешанным шумом. Это, однако, касается только цифровой части воспроизводящего устройства, и некоторое повышение уровня шума происходит после цифро-аналогового преобразования. Если уровень шума (noise floor) после этого не ниже уровня шумов SBM, общее улучшение сигнал/шум будет незначительным (рис. 12).

100 дБ, то улучшение отношения сигнал/шум на низких и средних частотах будет составлять 2 дБ, поскольку (теоретически) 16-битный сигнал имеет отношение сигнал/шум 98 дБ. А если его принять равным 110 дБ, отношение сигнал/шум на низких и средних частотах улучшится на 12 дБ, как видно на среднем графике (рис. 12). Если отношение сигнал/шум равно 120 дБ, звук может быть воспроизведен со всеми преимуществами SBM (нижний график на рис. 12).

Очевидно, что если аппаратура, имеющая отношение сигнал/шум хуже 110 дБ, используется для воспроизведения записей, сделанных с использованием SBM, она дает незначительное улучшение качества звука. Заметим, что суммарное отношение сигнал/шум обычной 16-битной записи на компакт-диске - около 90 дБ, и поэтому суммарный уровень шума при воспроизведении не может быть лучше 90 дБ.

Однако, уровень шумов компакт-диска, записанного с SBM, составляет -100 дБ, поэтому некоторое улучшение по сравнению с 16-битным компакт-диском будет слышно при воспроизведении на аппаратуре с уровнем собственных шумов лучше 90 дБ. Это проиллюстрировано на рис. 13.

Реальные значения отношения сигнал/шум могут колебаться в зависимости от условий измерения, поэтому вышеприведенные значения не могут считаться точными. В целом, однако, если в спецификациях CD-плеера указано отношение сигнал/шум не хуже 94 дБ, можно ожидать уже заметного улучшения отношения сигнал/шум, а, следовательно, и качества при воспроизведении. Если использовать CD-плеер с 114 дБ, то преимущества SBM будут слышны в полной мере.

Также важна точность цифро-аналогового преобразователя. SBM отображает низкоуровневые 20-битные сигналы с помощью множества кратчайших импульсов. Если цифро-аналоговый преобразователь недостаточно эффективен при обработке таких импульсов, то информация о тихих звуках будет искажена.

В принципе, любой 16-битный преобразователь способен обнаружить некоторые преимущества SBM. Как правило, в спецификациях CD-плеера указывается динамический диапазон устройства. Если он превышает 98 дБ, то точность преобразователя больше 16 бит, и CD-плеер будет способен выявить преимущества SBM. Как и в случае шумового порога, динамический диапазон записи на обычный компакт-диск всего около 90 дБ, поэтому любой плеер, имеющий больший динамический диапазон, уже будет звучать лучше при воспроизведении записей с использованием SBM.

Заключение

Итак, мы убедились, что 20-битную информацию можно передать в 16-битном формате. Но может ли такой сигнал на самом деле достичь качества 20-битного звука? Чтобы ответить на этот вопрос, визуально сравним между собой каждый из этих сигналов, воспользовавшись для этого простой моделью восприятия звука человеком. Ухо человека - как микрофон, имеющий пониженную чувствительность на очень низких и очень высоких частотах. В особенности отдача мала на частотах выше 15 кГц.

Рис. 9 показывает, как будет выглядеть аналоговый сигнал 100 Гц при прохождении через 20-битную, 16-битную и SBM-обработку при уровне сигнала -90 дБ. В то время как 20-битная сигналограмма - довольно гладкая, 16-битная выглядит ступенчатой в результате пониженной точности отсчетов и возникновения шумов квантования. Сигналограмма, однако, довольно близко приближается к 20-битной, поскольку группы импульсов "усреднены" селективным удалением с помощью низкочастотного фильтра. Результирующий SBM-сигнал хорошо воспринимается человеческим слухом и приближается по виду к исходному сигналу.

Компакт-диски, записанные с помощью технологии SBM, могут воспроизводиться на любом проигрывателе компакт-дисков, без специальных модификаций, а человеческий слух будет воспринимать такое качество звука, как если бы это была 20-битная запись.

 

Замечания и предложения по работе сервера направляйте: web.master at 625-net.ru.

© 1996—2009 «Издательство 625». Все права защищены.

e-mail: magazine at 625-net.ru, тел./факс: (495) 691-7724, 695-9588.

Свидетельство о регистрации средства массовой информации Эл № 77-2794.