Звуковые системы радиовещания и телевидения. Часть 2
Общие сведения
Прочное место на рынке кинематографа, телекоммуникаций, шоу-бизнеса и компьютерных технологий занимают системы пространственного звучания Dolby Stereo и Dolby Surround (формат 3/1), Dolby Pro Logic (3/2), Dolby Digital (5.1) и Dolby Digital Surround EX (6.1). Принятое для них расположение громкоговорителей в помещении прослушивания было показано нами ранее в предыдущей части статьи.
Фирма Dolby Lab, основанная Рэем Долби в Лондоне в 1965 году, изначально состояла всего лишь из четырех сотрудников. Развитие ее звуковых систем прошло несколько этапов. А в 1996 году, благодаря достигнутым успехам в разработке новых технологий, Рэй Долби был награжден Национальной медалью США. Позже он получил почетную степень доктора наук Кембриджского университета, а также премии «Оскар» и «Эмми». Сегодня звуковые системы фирмы Dolby Lab являются наиболее распространенными и популярными в мире.
На начальном этапе развития систем фирмы Dolby, когда в руках разработчиков было только два канала передачи-записи информации, первой была разработана двухканальная стереофоническая система повышенного качества звучания Dolby Stereo на основе матричной технологии, а чуть позже — система Dolby Surround. Сегодня в формате Dolby Surround передается звуковое сопровождение телевизионных программ, причем не только художественных фильмов, но и музыкальных, спортивных передач и даже новостей. Формат Dolby Surround используется и в областях, не связанных с передачей изображений, например, звукозаписывающие компании Delos, RCA Victor/BMG Classic, Concord Jazz выпустили на рынок компакт-диски и аудиокассеты с музыкальными записями в формате Dolby Surround. Многие разработчики ведут успешные эксперименты по внедрению этой системы в видеоигры и другие мультимедийные приложения. Другими словами, системы пространственного звука фирмы Dolby Lab стали традиционными не только в кинотеатрах и домашней аудио- и видеоаппаратуре, но и в компьютерах.
Система Dolby Surround
![]() |
| Рис. 1. Аналоговая матричная система пространственного звучания Dolby Surround |
Изначально форматы Dolby Stereo и Dolby Surround были ориентированы на кинематограф (рисунок 1). Они содержат кодирующее устройство (КУ) на стороне передачи и декодирующее устройство (ДКУ) — на стороне воспроизведения (рисунок 2а). Первые декодеры Dolby Surround появились еще в 1982 году. На входы КУ подаются четыре сигнала: L, С и R — левый, центральный и правый фронтальные сигналы, а также сигнал окружения S (Surround). Сигналы L, R и C получены от микрофонов, установленных вблизи от эстрады, соответственно в левой, центральной и правой частях звукового поля студии. В этой области (на небольшом расстоянии от исполнителей) основную роль играют сигналы прямых звуков, поступающих от музыкантов по кратчайшему пути. Звучание этих сигналов сухое, обедненное в тембральном отношении. Сигнал S получен от микрофонов, расположенных в удаленной от эстрады области и содержит, в основном, реверберирующий звук помещения. Звучание этого сигнала гулкое, размытое, объемное. Левый (L) и правый (R) сигналы (рисунок 2б) через сумматоры ∑1, ∑2, ∑3, ∑4 без каких-либо изменений поступают на выход КУ. К каждому из них добавляется в равном соотношении и синфазно сигнал центрального канала (C), ослабленный аттенюатором по уровню на 3 дБ. Сигнал окружения (S) также проходит аттенюатор, где ослабляется по уровню на 3 дБ. Далее этот сигнал поступает на полосовой фильтр (ПФ) с частотами среза 100 и 7000 Гц. После чего он обрабатывается компрессором модифицированной компандерной системы шумоподавления Dolby Noise Reduction типа B, в результате сокращается его динамический диапазон и, как следствие этого, повышается средний уровень. Затем он подается на вход широкополосного фазовращателя (ШФ), где в каждом из выходных каналов сдвигается по фазе соответственно на +90° и -90°. Далее оба этих противофазных сигнала поступают на входы сумматоров ∑3 и ∑4. Сигналы L1 и R1, полученные на выходах КУ, называют комплексными стереофоническими сигналами.
![]() |
| Рис. 2. Система Dolby Surround: а — упрощенная структурная схема; б — кодирующее устройство; в — пассивное декодирующее устройство |
При прослушивании обычной двухканальной стереофонической системы с выходных сигналов кодера Dolby через громкоговорители Гр1 и Гр2 звук канала C присутствует в равной степени в обоих (левом и правом) каналах воспроизведения. Этот сигнал образует виртуальный громкоговоритель, расположенный в центре базы между ∑1 и Гр2. При этом звук канала S — излучается ∑1 и Гр2 в противофазе. Этот звук воспринимается как едва заметный, призрачный, размытый по всей базе между ∑1 и ∑4
Пассивный декодер системы Dolby Surround (рисунок 3в) восстанавливает входные сигналы КУ. Он содержит блок контроля уровней сигналов L1 и R1 (БКУ1), матрицу М1, выделяющую сигнал окружения S и являющуюся, по сути дела, вычитающим устройством. На выходе M1 мы имеем сигнал с увеличенной по уровню компонентой S. Далее этот сигнал проходит антиэлайзинговый фильтр Ф1, линию задержки (ЛЗ), полосовой фильтр (ПФ) с полосой частот 100…7000 Гц, экспандер модифицированной компандерной системы шумоподавления Dolby-В, блок контроля уровня громкости сигналов L, R и S (БКУГp), блок регулировки уровней сигналов L и R (БКУ2) и регулятор подстройки уровня сигнала S (РУs). Сигнал окружения S с выхода ДКУ подается на распределенную систему громкоговорителей (рисунок 2в, Surround).
Напомним, что громкоговоритель канала сверхнизких частот СНЧ (Soobwufer), работающий в полосе частот 20…125 Гц, может располагаться в любом месте помещения прослушивания, ибо он не влияет на пространственную структуру стереопанорамы. Однако фирма Dolby Lab рекомендует устанавливать не один, а два громкоговорителя канала СНЧ. Один из них — на расстоянии одной пятой ширины помещения от одной боковой стены, а второй — на расстоянии одной трети ширины помещения от другой боковой стены. Это позволяет избежать преобладания низких частот в одной стороне помещения, а также устранить возможность возникновения резонансов, которые могли бы появиться при центральном размещении одного громкоговорителя СНЧ.
![]() |
| Рис. 3. Разделимость сигналов L, R, C, S в системе Dolby Surround: а — объективно существующая; б — кажущаяся при слуховом восприятии при наличии ЛЗ и системы шумоподавления Dolby Noise Reduction типа В; в — к вопросу о выделении при декдировании доминирующего направления |
Полоса частот громкоговорителя фронтального канала (C) в системе Dolby Surround часто ограничивается сверху значением 9000 Гц. Левый и правый фронтальные громкоговорители излучают полную полосу частот (20…20000 Гц), в то время как громкоговорители канала окружения (S) работают в полосе частот 100…7000 Гц. Заметим, что компоненты сигнала S воспроизводятся дополнительно также левым (L) и правым (R) фронтальными громкоговорителями, но они излучаются ими в противофазе и практически не влияют на восприятие звука канала окружения Surround.
Основным недостатком любой матричной системы звукопередачи является наличие мешающих сигналов, искажающих пространственную структуру стереопанорамы. Их появление делает источники звука более размытыми и протяженными и, как правило, уменьшает размер зоны стереофонического эффекта, где еще сохраняется локализация звуковых образов качественно правильной: возможно восприятие всех основных четырех направлений — левого, фронтального, правого и тылового. Поэтому уровень мешающих сигналов должен быть как можно меньше. Это одно из основных требований, предъявляемых к любой матричной системе.
Итак, если на вход КУ воздействует только один из сигналов (L, C, R или S), то на выходах ДКУ будут появляться наряду с полезным и мешающие сигналы. Например, если на вход КУ поступает сигнал L, то полезным на выходе ДКУ будет сигнал только левого фронтального громкоговорителя (Left); остальные сигналы должны рассматриваться в этом случае как мешающие (вредные). Последние излучаются соседними по отношению к основному громкоговорителями, они ослаблены по уровню относительно основного сигнала лишь на 3 дБ (рисунок 3а). Иначе говоря, разделимость (изолированность) любого основного канала с каждым из соседних составляет здесь лишь 3 дБ. В то же время развязка между левым (L) и правым (R), а также между фронтальным (C) и пространственным (S) каналами и наоборот теоретически бесконечно велика, если АЧХ и ФЧХ КУ и ДКУ идеальны. Это условие, особенно в области верхних частот, выполнить очень трудно при наличии суммарного и разностного преобразований исходных сигналов, выполняемых в КУ и ДКУ. Именно по этой причине полоса частот в канале S ограничена диапазоном средних частот, где искажения АЧХ и ФЧХ минимальны.
Известно, что высокочастотные компоненты сигналов образуют компактные кажущиеся источники звука (КИЗ). Поэтому их исключение, особенно в канале S, приводит к тому, что слушатели не связывают восприятие высокочастотных компонент сигналов фронтальных громкоговорителей с направлением на громкоговорители окружения. Звуковые образы, создаваемые сигналом канала S, воспринимаются слушателями размытыми и распределенными в пространстве. Компандерная система шумоподавления Dolby-B дополнительно подавляет в канале S проникающие в них компоненты сигналов L и R, когда уровни последних лежат существенно ниже уровня сигнала S.
![]() |
| Рис. 4. Зависимость времени задержки сигнала S относительно сигналов фронтальных громкоговорителей в функции расстояний до мест прослушивания: а — хорошие места расположения слушателей при времени задержки 20 мс; б — тоже самое, но при времени задержки 15…30 мс |
В канал S включена линия задержки (ЛЗ) с временем запаздывания, выбираемым в пределах от 10…15 мс до 25…30 мс, в зависимости от объема помещения и от расстояний от места прослушивания до фронтальных (L, C, R) и тыловых (S) громкоговорителей (рисунок 4). Наличие задержки гарантирует, что звук фронтальных громкоговорителей достигнет ушей слушателя раньше, чем звук тыловых, а значит, возможность ошибки в оценке фронтального и тылового направлений будет исключена. Тем самым устраняется возможность ложной оценки направления на звуковой образ вследствие присущего слуху эффекта Хааса. С учетом всего изложенного ощущаемое (воспринимаемое) слушателем разделение канала С с L и R и наоборот составляет реально не менее 40 дБ (рисунок 3б).
Применение пассивных декодеров (рисунок 2в) не способно качественно обеспечить правильную локализацию источников звука в пространстве на значительной площади помещения прослушивания. С этой точки зрения определенным преимуществом обладают декодеры с регулируемым (управляемым) усилением в каналах воспроизведения, точно также как это выполняется в адаптивных стереофонических системах звукопередачи. Система фирмы Dolby Lab с активным декодером получила название Dolby Pro Logic (рисунок 5), она предназначена для применения в помещениях небольшого объема и в системах, получивших позже название «домашний кинотеатр».
Для лучшего понимания алгоритма работы системы Dolby Pro Logic предварительно рассмотрим особенности построения и режимы работы адаптивных стереофонических систем «Суперофон-35» и ABC-Stereo, разработанных в России.
![]() |
| Рис. 5. Система пространственного звучания Dolby Pro Logic |
Системы с панорамным кодированием источников звука
Кодирование звуковых сигналов. В системах с панорамным кодированием (рисунок 6а) вместо двухступенчатой процедуры формирования левого и правого сигналов (доставшейся в наследство от квадрафонии) используется новый метод, названный панорамным кодированием (ПК). Кодирование множества первичных сигналов {aixi(t)}N в левый Л(t) и правый П(t) сигналы стереопары выполняется в ПКУ. Каждый такой сигнал на стороне воспроизведения образует свой кажущийся источник звука. Множество сигналов {xi(t)}N формирует стереопанораму в помещении прослушивания; а1i и а2i — пары коэффициентов панорамного кодирования сигналов каждого источника звука, значения этих коэффициентов зависят от угла локализации, образуемого сигналами каждой из этих пар кажущегося источника звука; ji — угол, под которым этот кажущийся источник звука локализуется слушателем при воспроизведении этой пары сигналов.
![]() |
| Рис. 6. Адаптивная звуковая cистема с панорамным кодированием источников (а) и структурная схема адаптивного декодирующего устройства (б) |
Необходимо отметить также, что
DNi = 20lg(а1i/а2i); a22i + a21i = 1,
где DNi — разность уровней, определяющая оценку азимута i-го кажущегося источника звука, дБ. Величина DNi и соотношение фаз пары сигналов Лi(t) = a1ixi(t) и Пi(t) = a2ixi(t) определяют оценку азимута кажущегося источника звука.
Направлению «фронт» соответствуют синфазные сигналы равного уровня в каналах Л и П. Направлению на левый фронтальный громкоговоритель (ЛФ) соответствует ситуация, когда уровень сигнала в канале П (правом) равен нулю, при этом сигнал в канале Л отличен от нуля. Направлению на правый фронтальный громкоговоритель (ПФ), когда звук кажется исходящим из правого фронтального громкоговорителя, соответствует условие: П є 0, Л = 0. Направлению «тыл» соответствуют противофазные сигналы Л и П равного уровня. Перемещение кажущегося источника звука во фронтальной полуплоскости (между левым и правым фронтальными громкоговорителями) кодируется изменением соотношения уровней синфазных сигналов Л и П. Перемещение кажущегося источника звука в тыловой полуплоскости кодируется изменением соотношения уровней противофазных сигналов в каналах. Иначе говоря, источник звука воспринимается слушателем во фронтальной части пространства, если сигналы Л и П синфазны, и, соответственно, в тыловой части пространства, если они противофазны.
Возможно также получение ощущения движения в направлениях «фронт-тыл» и «левый-правый» не по периметру, а непосредственно по кратчайшей траектории. Эффект движения кажущегося источника звука в направлении «фронт-тыл» достигается изменением разности фаз одинаковых по уровню сигналов Л и П. При перемещении кажущегося источника звука в направлении «фронт-тыл» разность фаз сигналов Л и П изменяется от 0 до 180°. При переходе «тыл-фронт» разность фаз изменяется от 180 до 0°.
Адаптивное декодирование звуковых сигналов. Адаптивное декодирующее устройство (АДУ, рисунок 7б) содержит управляемую матрицу (УМ) основных каналов воспроизведения: левого фронтального (ЛФ1), фронтального (Ф1), правого фронтального (ПФ1) и эффектного (Э1), схему нормирования (СН), формирователь управляющих напряжений (ФУС1) управляемой матрицы, схему опознавания режимов (ОР) работы АДУ, матрицу декодера зальных каналов (ДЗК), формирователь управляющего сигнала (ФУС2) декодера зальных каналов, шумоподавитель (ШПД) канала эффектов (Э1) и линию задержки (ЛЗ). Здесь канал эффектов соответствует каналу окружения (S). Сигнал q(t) управляет работой ФУС. Структура УМ полностью определяется типом системы воспроизведения, точнее говоря, числом громкоговорителей и их размещением в пространстве. В ОР из нормированных суммарного US(t) и разностного UD(t) сигналов СН вырабатываются два разных по величине постоянных напряжения q1 и q2. Одно из них (q1) соответствует режиму формирования единственного кажущегося источника звука, а второе (q2) — режиму формирования множества кажущихся источников звука. При этом время перехода АДУ в режим формирования единственного кажущегося источника звука составляет около 10 мс, а в режим множества кажущихся источников звука — около 30 мс. На рисунке 6 показана структурная схема АДУ системы «Суперфон-35». Сигнал q(t) изменяет постоянную времени Т в цепях формирования сигналов управления. Изменение постоянной времени в цепях формирования сигналов управления обеспечивает уровень паразитной амплитудной модуляции в выходных сигналах АДУ ниже порогов их слуховой заметности.
В современных АДУ все пространство состояний сигналов стереопары Л(t) и П(t) разделено на два подпространства. Первое из них соответствует режиму формирования единственного кажущегося источника звука, а второе — формированию множества кажущихся источников звука. Повышение эффективности работы АДУ основано на реализации для каждого из этих режимов работы своего оптимального алгоритма декодирования сигналов Л(t) и П(t). Критерием опознавания режима работы АДУ является значение текущей оценки коэффициента корреляции R(t) входных сигналов Л и П. Если |R(t)| f1, а его дисперсия стремится к нулю, то входной сигнал АДУ содержит одну пару сигналов Лi(t) = a1ixi(t) и Пi(t) = a2ixi(t) и формирует единственный кажущийся источник звука. В режиме формирования множества КИЗ значение оценки |R(t)| значительно меньше 1, а дисперсия этого сигнала существенно отличается от нуля. На практике чаще всего используют косвенный метод опознавания режима работы АДУ, основанный на сравнении нормированных сигналов с опорным напряжением.
Рассмотрим характеристики АДУ при его работе в статическом режиме на примере отечественных систем «Суперфон-35» и ABC-Stereo.
Режим формирования единственного кажущегося источника звука. Декодирование сигналов Л(t) и П(t) в системе «Суперфон-35» (рисунок 7а) выполняют матрицы M1 и М2, управляемые аттенюаторы УА1…УА4 и декодер зальных каналов ДЗК. В матрице M1 сигналы Л и П подвергаются суммарно-разностному преобразованию. На выходах матрицы M1 имеем сигналы Л, 0,7(Л + П), 0,7(Л — П), П, которые проходят управляемые аттенюаторы УА1…УА4 с коэффициентами передачи соответственно b1, b2, b3, b4 и поступают на входы матрицы М2. Здесь они подвергаются второму суммарно-разностному преобразованию.
На выходах матрицы М2 имеем:
ЛФ = 0,5(Л + П)b1 + 0,5(Л — П)b2;
ПФ = 0,5(Л + П)b1 — 0,5(Л — П)b2;
Ф = 0,7(Лb3 + Пb4);
Э = 0,7(Лb3 — Пb4),
где ЛФ, ПФ, Ф, Э — левый, правый, фронтальный и эффектный выходные сигналы АДУ; b1, b2, b3, b4 — коэффициенты передачи УА; 1…5 — входы для подачи сигналов управления от ФУС. Для того чтобы в сигналах Ф и Э в равной мере присутствовали сигналы Л и П, необходимо выполнение условия b3 = b4.
Декодер зальных каналов формирует сигналы стен ЛС и ПС по правилу:
ЛС = ЭbЛС ; ПС = ЭbПС ,
причем bЛС и bПС — коэффициенты передачи УА декодера зальных каналов.
Характеристики декодирования в режиме формирования единственного кажущегося источника звука показаны на рисунке 7б. По оси абсцисс отложена разность уровней DNПЛ сигналов Л и П, а по оси ординат — уровень N сигнала на выходе УМ, вычисленный относительно его максимального значения. Кривые 1, 2, 3 на рисунке соответствуют случаю, когда сигналы Л и П синфазны, при этом сигнал Э = 0; кривые 4, 5 (штриховые линии) соответствуют случаю, когда входные сигналы Л и П противофазны, тогда сигнал Ф равен нулю.
В системе АВС-Stereo (рисунок 8а) уравнения декодирования имеют вид:
ЛФ = ЛbЛФ; ЛТ = (Л — kП)bЛТ;
ПФ = ПbПФ; ПТ = (П — kЛ)bПТ,
где ЛФ, ПФ, ЛТ, ПТ — соответственно левый фронтальный, правый фронтальный, левый тыловой, правый тыловой выходные сигналы АДУ; bЛФ, bПФ, bЛТ, bПТ — коэффициенты передачи УА.
Характеристики декодирования для этой системы в режиме формирования единственного кажущегося источника звука показаны на рисунке 8б. По оси абсцисс отложена разность уровней DNПЛ сигналов Л и П, а по оси ординат — уровень N сигнала на выходе УМ, вычисленный относительно его максимального значения. Кривые 1, 2, 3, 4 соответствуют случаю, когда сигналы Л и П синфазны. Кривые 5 и 6 (штриховые линии) соответствуют случаю, когда входные сигналы Л и П противофазны. Сигналы ЛФ и ПФ в данном случае равны нулю, а уровни сигналов ЛТ и ПТ отображают кривые 5 и 6.
При работе АДУ в режиме формирования единственного кажущегося источника звука источник звука формируется сигналами не более, чем двух громкоговорителей, а зона стереоэффекта не отличается от той, которая свойственна многоканальной стереофонической системе звукопередачи с идентичной системой воспроизведения.
Режим формирования множества кажущихся источников звука. При работе АДУ в данном режиме непрерывная адаптация УМ к каждому из первичных сигналов одновременно невозможна. В этом случае следует говорить лишь об адаптации элементов матрицы В к системе воспроизведения, конечно, с учетом свойств пространственного слуха человека. Элементы УМ — постоянные числа, причем коэффициенты передачи УА равны единице и сигналы на выходе АДУ приобретают вид:
а) для системы АВС-Stereo (k = 0,71):
ЛФ1 = Л; ЛТ1 = Л — 0,71П; ПФ1 = П; ПТ1 = П — 0,71Л; б) для системы «Суперфон-35":
ЛФ1 = Л; Ф1 = 0,7(Л + П); ПФ1 = П; Э1 = 0,7(Л — П).
Разделение каналов воспроизведения при передаче основных направлений при работе АДУ в рассматриваемом режиме существенно хуже, а зона стереоэффекта наименьшая. Это объясняется тем, что весьма часты ситуации, когда формирование кажущегося источника звука выполняется сигналами не двух, а большего числа громкоговорителей (чаще всего — трех или четырех).
Основным недостатком обеих систем является то, что в режиме формирования единственного кажущегося источника звука в случае, когда он является доминирующим источником, существенно изменяется и фоновое звучание, если оно существует, так как оно формируется только парой «полезных» громкоговорителей.
Системы Dolby Pro Logic I и Dolby Pro Logic II
Кодер здесь точно такой же, как и в системе Dolby Surround. Отличие лишь в декодере. В данном случае используется активный декодер, и режимы его работы напоминают уже описанные в рассмотренных нами звуковых системах с панорамным кодированием источников.
Декодер Dolby Pro Logic I. В принципе возможны два подхода к построению активных декодеров. Предположим, что каждый из выходных каналов воспроизведения содержит свой усилитель УУ1…УУ4 с управляемым коэффициентом передачи (рисунок 9а). Пусть сигналы управления для них формируются из входных сигналов ДКУ L1, R1, а также из их суммы (L1 + R1) и разности (L1 — R1) в специальном блоке БФУС. Здесь определяется, в каком канале следует уменьшить усиление, чтобы ослабить (подавить) мешающие (вредные) сигналы. Например, если на входе КУ присутствует только сигнал С, то следует уменьшить усиление в каналах L и R. Фактически звук может приходить с любого направления в пределах угла 3600, и этого можно достичь, меняя в определенной степени усиление в каналах воспроизведения. Но нужно это делать таким образом, чтобы формирование кажущегося источника звука в любом направлении выполнялось сигналами не более чем двух каналов воспроизведения, точно также как это делается, например, в режиме формирования единственного кажущегося источника звука рассмотренной выше стереофонической системы с панорамным кодированием сигналов источников.
Однако таким методом задача решается эффективно лишь для единственного кажущегося источника звука. Но она существенно усложняется, если звуковых образов несколько. Пусть, например, речь звучит на фоне музыки, при этом музыка по замыслу звукорежиссера должна воспроизводиться громкоговорителями каналов L и R, а речь — громкоговорителем канала С. Пассивный декодер системы Dolby Surround (рисунок 2в) с этой задачей вообще не справится — речь будет воспроизводиться громкоговорителями всех трех каналов L, C, R. Через громкоговоритель канала С будет прослушиваться суммарный сигнал L + R, а через громкоговорители канала S — разностный сигнал L — R. Теперь предположим, что ДКУ считает доминирующим сигналом речь, тогда он должен увеличить уровень сигнала в канале С и уменьшить соответственно уровень сигнала в каналах L и R. При этом музыкальное сопровождение останется только в каналах С (монофонический сигнал L + R) и S (разностный сигнал L — R). и оно будет подавлено. В моменты времени, когда говорящие герои замолкают (пауза), восстанавливается усиление в каналах L и R. При появлении речи музыкальное сопровождение по уровню опять уменьшается. Такие изменения громкости и фактуры звучания легко ощутимы. Именно этот недостаток присущ режиму формирования единственного кажущегося источника звука в рассмотренных выше системах с панорамным кодированием источников.
Другой способ (рисунок 9б) состоит в попытке компенсации мешающих сигналов путем формирования их противофазных компонент и последующего сложения с исходными сигналами. Например, если взять сигнал правого канала R, инвертировать его по фазе и затем сложить с выходным сигналом левого канала L, то компоненты сигнала С в левом и правом каналах окажутся противофазными и после сложения взаимно компенсируются, а значит в канал L компоненты сигнала С не попадут. Именно этот принцип взаимной компенсации (cancellation concept) и используется в активных декодерах системы Dolby Pro Logic.
Важно, что после исключения компонент сигнала С из левого канала воспроизведения, громкость звука (энергия сигнала) в этом канале не упадет, ибо компоненты сигнала C заместятся в этом канале инвертированным сигналом канала R (constant — power concept). В центральном канале по-прежнему прослушивается сумма сигналов L + R. В итоге, доминирующий сигнал речи фокусируется в направлении громкоговорителя центрального канала C, а музыкальный фон по-прежнему воспроизводится громкоговорителями каналов L и R и воспринимается как размытый звуковой образ. Здесь используется важное свойство слуха — его способность концентрировать внимание именно на доминирующем направлении, воспринимая все остальные звуки как размытый (без четкой идентификации его в пространстве) звуковой образ. Этот принцип получил название — выделение доминирующего (доминантного) направления.
Рассматривая этот пример, мы предполагали, что громкость речи существенно выше уровня музыкального фона. Если же оба сигнала по уровню громкости близки, то один из них становится маскирующим для компонентов другого, попавшего не в свои каналы, и требования к их «развязке» снижаются. В некоторых ситуациях вообще желательно исключить регулировку уровней сигналов на выходах ДКУ, сделав декодер пассивным. Этот режим аналогичен режиму множества кажущихся источников звука в системах с панорамным кодированием источников. Например, звуки дождя, ветра и т. п. — они не связываются слушателем с каким-либо конкретным направлением и могут воспроизводиться всеми громкоговорителями. Самая крайняя ситуация — все звуки связаны с одним единственным направлением (единственный кажущийся источник звука). С этой ситуацией не может справиться пассивный декодер, но для активного декодера — это наиболее простая ситуация. Самая же трудная ситуация — когда мы должны передать одновременно два разных равноценных направления без доминирования одного из них.
В системе с активным декодером, которая непрерывно перестраивается, выделяя то или иное доминирующее направление звука, очень важную роль, с позиций слуха, играет оптимальный выбор временных параметров декодера. В системе Dolby Pro Logic также реализовано два режима работы — быстрый и медленный. Быстрый режим реакции ДКУ используется, если доминирующее направление явно выражено и если оно меняется. Медленный режим используется, когда доминирующих направлений несколько и они близки по уровню громкости.
Вся информация, необходимая активному декодеру для управления усилением каналов воспроизведения извлекается им из входных сигналов. Ее достаточно для идентификации любого направления, что иллюстрирует рисунок 3в. Здесь ось Х соответствует левому (L) и правому (R) направлениям на источник звука (каналы L и R), ось Y — фронтальному (канал С) и тыловому (канал S) направлениям локализации. Меняя амплитуды каждого из этих четырех выходных сигналов, можно получить любое направление локализации звука в горизонтальной плоскости.
Структурная схема ДКУ системы Dolby Pro Logic представлена на рисунке 10. Она содержит полосовой фильтр (ПФ) с частотами среза 100 и 7000 Гц, матрицу М1, где выполняется суммарно-разностное преобразование входной пары сигналов L1 и R1, формирователь сигналов управления (ФСУ), управляемые усилители УУ и матрицу М2 формирования выходных сигналов декодера (Left, Right, Center, Surround). Основную часть ДКУ образуют элементы ПФ и ФУС, выполняющие анализ входной пары сигналов и формирование сигналов управления, и лишь относительно небольшая их часть (M1, УУ и M2) участвует в обработке входной пары сигналов с целью получения выходных сигналов декодера.
Основная задача ДКУ — правильно определить доминирующее направление, если таковое в текущий момент времени имеется. Перед обработкой сигналы L1 и R1 нормируются, чтобы исключить ошибки, связанные с неидентичностью характеристик каналов передачи-записи информации.
Полосовой фильтр (ПФ) отсекает высокочастотные компоненты входных сигналов с тем, чтобы исключить их из последующего анализа, так как именно они наиболее подвержены фазовым искажениям, возникающим в каналах передачи. Кроме того, напомним также, что на частотах выше 7000 Гц энергия звуковых сигналов существенно ниже, чем в области средних частот, поэтому их вклад в оценку азимута КИЗ незначителен. Далее сигналы L1, R1, L1 + R1 и L1 — R1 выпрямляются и усредняются (В1, В2, В3, В4), полученные в результате этой операции их огибающие поступают попарно на входы двух дифференциальных усилителей ДУ1 и ДУ1. При этом медленно меняющееся напряжение на выходе ДУ1 пропорционально логарифму отношения амплитуд lg [ | L | / | R | ] огибающих | L | и | R | сигналов L1 и R1, а напряжение на выходе ДУ2 соответственно пропорционально логарифму отношения амплитуд lg [ | L + R | / | L — R | ] огибающих | L + R | и | L — R | сигналов L1 + R1 и L1 — R1. Заметим, что каждый из этих двух сигналов является биполярным, то есть положительным (если L1>R1 или | L + R | > | L — R | ) и отрицательным (когда L1<R1 или | L + R | < | L — R| ).
Очевидно (рисунок 3в), что если сигнал на выходе ДУ1 положителен, то это значит, что источник звука находится справа от медианной плоскости головы слушателя, если при этом сигнал на выходе ДУ2 также положителен, то источник звука расположен справа во фронтальной части пространства. При этом его азимут в пространстве полностью определяется этой парой сигналов. Если эти сигналы равны нулю, то доминирования сигнала какого-либо источника в этом случае нет. Величина каждого из этих сигналов в блоке сравнения (БС) сравнивается с пороговым напряжением EП и, если один из этой пары сигналов или оба оказываются выше некоторого порогового значения, то это говорит о наличии доминирующего направления локализации. Как только его наличие идентифицируется, то устройство переходит в быстрый режим работы и наоборот.
Переключение постоянной времени выполняется одновременно в блоках, обозначенных на данном рисунке буквой t. При работе в быстром режиме она составляет 3…5 мс, в медленном режиме — уже около 1…2 с. Преобразователи полярности сигналов lg [ | L | / | R | ] и lg [ | L + R | / | L — R | ] (ППС1 и ППС2) формируют из двух биполярных сигналов соответственно четыре однополярных EL, ER, EC, ES. Теперь вектор доминирующего направления оказывается уже представленным четырьмя сигналами, которые уже можно использовать для регулирования коэффициентов передачи управляемых усилителей (УУ) с целью компенсации мешающих сигналов. Они образуют матрицу, состоящую из восьми таких усилителей, на выходах которой мы имеем соответственно восемь сигналов: EL х L1, EL х R1, ER х L1, ER х R1, EC х L1, EC х R1, ES х L1, ES х R1.
С учетом входных сигналов L1 и R1, на выходную матрицу М2 декодера системы Dolby Pro Logic поступает в общей сложности десять сигналов, где они суммируются и вычитаются с различными весовыми коэффициентами, образуя, в конечном итоге, выходные сигналы ДКУ — Left, Right, Center и Surround. Декодер обеспечивает точную передачу доминирующего направления, перераспределение мощности выходных сигналов так, чтобы исключить изменение громкости звучания и сделать регулировки коэффициентов передачи незаметными на слух. При работе декодера в медленном режиме возможно возникновение паразитной амплитудной модуляции в выходных сигналах декодера, а при работе его в быстром режиме возможно появление заметных на слух нелинейных искажений. Для уменьшения этих искажений решающую роль играет выбор постоянных времени в цепях формирования сигналов управления, и этой проблеме следует уделять особое внимание.
В систему Dolby Pro Logic также вводят дополнительный канал инфранизких частот LFE и соответствующий ему громкоговоритель (Subwoofer), обеспечивающий воспроизведение сигналов в полосе частот до 80…125 Гц. При этом нижняя граница полосы частот сигналов, воспроизводимых фронтальными громкоговорителями, в данном случае может быть повышена до 80…125 Гц без потери качества. Заметим, что тракт инфранизких частот оптимизируется с целью получения минимальных искажений на низших частотах. Остальные каналы воспроизведения определяют возможности системы по передаче пространственной информации и оптимизируются именно по указанному критерию.
Декодер Dolby Pro Logic II. Это активный декодер следующего поколения. Напомним, что важнейшая задача декодера (рисунки 3а и 3б) состоит в том, чтобы исключить, насколько это возможно, проникновение сигналов L и R в канал S независимо от того, в какой точке на линии базы фронтальных групп микрофонов (L, C, R) находится реальный источник звука. Если герои ведут диалог, располагаясь точно посередине между микрофонами каналов L и R, то уровень сигналов в этих каналах будет одинаков и мешающего сигнала в канале S не будет, ибо S = L — R. При неодинаковом их расстоянии от микрофонов в канале S появится мешающий сигнал, его величина зависит от разности уровней сигналов L и R. Чтобы скомпенсировать этот мешающий сигнал в канале S, необходимо предварительно выровнять уровни сигналов L и R на входе вычитающего устройства S. И это дополнительное регулирование будет уже зависеть от соотношения уровней сигналов L и R.
Для этой цели можно использовать идею, представленную на рисунке 11а. Здесь между каналами L и R и входами сумматора S включены два управляемых усилителя (УУ). Их коэффициенты передачи меняются в разные стороны под воздействием одинакового по величине сигнала управления Uу, но разной полярности. При увеличении уровня сигнала на выходе одного из УУ сигнал на выходе другого уменьшается. Если такую регулировку выполнять с требуемой точностью, то мешающий сигнал в канале S, при наличии на входе КУ сигналов L и R, будет скомпенсирован независимо от соотношения их уровней. Пример реализации такой схемы показан на рисунке 11б. Для получения требуемого сигнала управления Uу здесь используется цепь: два амплитудных детектора (АД) и дифференциальный усилитель (ДУ). Выходные сигналы управляемых усилителей проходят АД, на выходах которых мы имеем огибающие, пропорциональные амплитудам сигналов L и R. При этом величина сигнала Uу на выходе ДУ будет пропорциональна разности амплитуд этих огибающих. Он и используется здесь в качестве сигнала управления для изменения коэффициентов передачи управляемых усилителей. Итак, решение, позволяющее реализовать идею подавления мешающего сигнала в канале S, является весьма простым.
Благодаря лучшей компенсации мешающих сигналов, в декодере Dolby Pro Logic II реализованы следующие преимущества:
— простота аппаратных средств, с помощью которых достигается более эффективная компенсация мешающих сигналов;
— обе ветви, изменяющие постоянные времени в цепи формирования сигналов управления, здесь функционируют независимо друг от друга, в отличие от декодера Dolby Pro Logic I, где перевод в быстрый режим выполняется, если хотя бы один из сигналов на выходах ДУ1 или ДУ2 имеет явное доминирование по уровню, а переход в медленный режим происходит только тогда, когда амплитуды этих двух сигналов примерно равны;
— постоянная времени t в цепях формирования сигналов управления изменяется непрерывно, в отличие от ранних моделей, где она имела два фиксированных значения;
— тыловые каналы имеют полную полосу частот;
— лучше подходит для использования в бытовой аппаратуре; кроме обычного режима работы Movie с фиксированным набором параметров, предназначенного для воспроизведения кодированных фонограмм Dolby, здесь дополнительно введен режим Music. При работе в этом режиме можно изменять параметры настройки, что позволяет использовать декодер, например, в автомобильной акустике, настраивать на иное по глубине расположение слушателя или устанавливать режим панорамы, при котором создается ощущение звука, исходящего со всех сторон;
— в режиме Music линия задержки в тыловых каналах не нужна, ибо звуковые образы совсем не обязательно должны восприниматься только из фронтального направления, возможно окружение ими слушателя со всех сторон;
— может быть использован также и для улучшения качества звучания фонограмм обычной двухканальной стереофонии.
Система Dolby THX Matrix
Это — не новый формат. Основная цель — дальнейшее повышение качества звука кинофильмов, прежде всего, за счет ужесточения требований, предъявляемых к помещениям и аппаратуре. Последняя имеет более широкий динамический и частотный диапазон. Существенно повышены требования к громкоговорителям каналов воспроизведения: их диаграмма направленности стала более широкой в горизонтальной плоскости. Введена дополнительная обработка сигналов в области низких частот. В канал S добавлено декоррелирующее устройство, позволяющее получить в тыловой области псевдостереофоническое звучание. При этом сами кинозалы приобрели эксклюзивные свойства. Существенно ужесточены также требования и к оборудованию домашнего пользования.
Аппаратура позволяет воспроизводить сигналы с повышенным уровнем громкости в пиках, реалистично по фактуре, без слышимых искажений, сжатия и шумов.
Иными словами, в данном формате повышены требования к каждому виду оборудования: декодеру, усилителям, акустике и к параметрам помещения, все они жестко оговорены в документах.
Дальнейшим развитием THX стало появление стандарта THX Ultra с еще более жесткими требованиями. Таким образом, технология THX отражена в ряде стандартов и патентов, гарантирующих высококачественное и высокохудожественное воспроизведение звука кинофильмов в больших и малых помещениях.
Системы Dolby Digital 5.1 и Dolby Digital EX 6.1
В отличие от уже рассмотренных ранее, эти звуковые системы являются, во-первых, многоканальными, имеющими соответственно пять или шесть дискретных каналов передачи-записи-воспроизведения информации, а во-вторых, — цифровыми, где при кодировании звуковых сигналов используются алгоритмы компрессии звуковых аудиоданных. В них отсутствуют КУ и ДКУ, но так же, как и ранее, существует канал LFE.
Система Dolby Digital 5.1 имеет пять основных каналов: фронтальные левый (L), центральный (C), правый (R); пространственные левый (LS) и правый (RS) (с полной полосой частот 20…20000 Гц), а также НЧ-канал с полосой частот 20…125 Гц. Расположение громкоговорителей в помещении точно такое же, как и при формате Dolby Pro Logic. При кодировании звука используется алгоритм сжатия A/52. Его особенности были подробно изложены мною ранее в журнале «Звукорежиссер» (3/2001, стр. 68…73 и 4/2001, стр. 66…69) при описании системы ATSC Dolby AC-3 и по этой причине здесь не приводятся. Суммарное значение скорости цифрового потока составляет 384 кбит/с. В настоящее время данный формат доступен в Европе со спутников — вещание в формате ATSC Dolby AC-3 уже реальность.
В настоящее время на рынке предлагаются программные продукты (Soft Encode Dolby Digital 5.1) для реализации формата Dolby Digital 5.1 на персональном компьютере. Здесь предусмотрена также возможность для редактирования саундтреков, регулирования уровня громкости и времени задержки программным путем. Выход фирмы Dolby Lab на компьютерный рынок состоялся еще в 1998 году, а сегодня она уже имеет прочное место на рынке пользователей персональных компьютеров.
Дальнейшим развитием явилась система Dolby Digital Surround EX 6.1, где вся система распределенных громкоговорителей уже разделена на три группы (рисунок 12): левая (Left Surround), тыловая (Rear Surround) и правая (Right Surround). Суммарная скорость цифрового потока 320 кбит/c, сжатие цифровых аудиоданных более сильное. Поэтому допускается лишь один цикл кодирования-декодирования звуковых сигналов.
Итак, развитие цифровых систем Dolby идет по пути увеличения числа раздельных каналов передачи звука. Но мы должны помнить, что для наибольшего прироста качества число каналов не должно превышать 5…6. Дальнейшее их увеличение способствует повышению качества, но процесс этот носит экспоненциальный характер. Увеличение числа каналов передачи звука оправдано для помещений большого объема, т. к. ведет к существенному расширению зоны, где в полном объеме воспринимаются слушателем все задумки звукорежиссера. Заключительная часть статьи будет посвящена бинауральной стереофонии.






