Журнал:

Бинауральные звуковые системы

Передача пространственной информации и зона слушания в бинауральной звуковой системе

Первая удачная попытка реализации бинауральной системы с громкоговорящим воспроизведением представлена на рисунке 1. Это процессор системы TRADIS, предложенной Б. Бауэром и реализованной и исследованной П. Дамаске и В. Меллертом. Заметим, что входными сигналами является бинауральная пара Лб и Пб. Здесь осуществляется компенсация только перекрестных сигналов, один из которых поступает от левого громкоговорителя Гр1 и воспринимается правым ухом 2, а второй — от правого громкоговорителя Гр2 и воспринимается левым ухом 1. Именно наличие этих сигналов делает невозможной локализацию кажущегося источника звука (КИЗ) вне базы громкоговорителей. Для компенсации перекрестных сигналов к основному сигналу Лб или Пб каждого из громкоговорителей (Гр1 или Гр2) добавляется предварительно прошедший через фильтр (Ф) и линию задержки (ЛЗ, τ0) противофазный сигнал от другого громкоговорителя (Гр2 или Гр1). На рисунке 1 показаны также амплитудно-частотная и фазо-частотная характеристики фильтра (Ф) для случая, когда слушатель находится на оси симметрии громкоговорителей (х = 0, y ≠ 0) в точке оптимального слушания (y = 30°); для этих условий τ0 составляет 290 мкс.

Результаты экспериментальных исследований локализации кажущегося источника звука в системе TRADIS представлены на рисунке 2. Здесь по оси абсцисс отложено направление φ на реальный источник звука (рисунок 2а), по оси ординат — воспринимаемое направление φ’. Экспертизы выполнены для разных условий на речевом испытательном сигнале.

На рисунке 2а приведены результаты оценки направления φ’ на речевой источник для азимутальной плоскости при условии отсутствия реверберации (T = 0). (Это усредненные оценки 34 участников испытания). Запись сигналов Лб и Пб и их воспроизведение осуществлялись в заглушенной камере. Слушатель располагался на оси симметрии системы воспроизведения (х = 0, y = 30°). Углы отсчитывались от медианной плоскости головы; слева от фронтального направления они положительны, справа — отрицательны. Незначительный разброс экспертных оценок (на рисунке он показан отрезками вертикальных линий) свидетельствует об уверенной локализации кажущегося источника звука в пределах всей азимутальной плоскости. Однако кажущиеся источники звука, расположенные спереди, все же более компактны и четки, а в тыловой части — более размыты. Об этом свидетельствует величина разброса экспертных оценок. Исследования подтверждают возможность круговой локализации кажущегося источника звука в бинауральной системе звукопередачи. Аналогичные данные были получены и при использовании головных телефонов. При этом кажущиеся источники звука локализуются не внутри головы (как это имеет место при традиционной стереофонии), а оказываются вынесенными за ее пределы в то место, где расположен реальный источник звука. Напомним, что оценка расстояния до источника звука не является точной.

Появление реверберации (рисунок 2б) как в первичном, так и во вторичном помещениях ухудшает правильность передачи направлений при углах |φ| ≤ 90°. В этой области углов слушатели часто вместо истинного тылового направления указывают «зеркальное» фронтальное. Уверенная и четкая локализация кажущегося источника звука при наличии реверберации возможна только в передней части пространства. Однако, если время реверберации в жилом помещении не превышает 0,3 с, то звуковые образы без труда могут быть локализованы слушателем в любом направлении азимутальной плоскости. Исключение составляет тыловое направление (φ = 180°). Локализация этого звукового образа затруднена — весьма часто он кажется приближенным к слушателю (так же, как в системе ABC).

К слушателю, находящемуся в жилом помещении, кроме сигналов прямых звуков, поступают также звуковые волны, отраженные от поверхностей помещения (об этом — в первой части статьи). Сигналы отзвуков, суммируясь с сигналами прямых звуков, искажают входные слуховые сигналы, делая их нетождественными и нарушая тем самым принцип бинауральной звукопередачи. Причем первыми по времени поступления и наиболее высокими по уровню оказываются отзвуки, приходящие из той области пространства, где расположены громкоговорители. Эти отзвуки затрудняют восприятие тыловых пеленгов, стимулируя локализацию зеркального направления. Данное явление становится заметным, если Т превышает 0,3 с, то есть когда существует четко выраженная дискретная часть реверберационного процесса. На завершающем участке реверберационного процесса в каждый момент времени приходит значительное число отзвуков, и с разных направлений. Уровень отзвуков мал, так что влияние этого участка на слуховой пеленг не должно быть существенным.

Появление зеркальных пеленгов связано с воздействием именно первых отзвуков, поступающих всегда из той области полупространства, где расположены громкоговорители. Для их компенсации необходимы специальные электронные схемы, весьма сложные по своей структуре.

Вторым существенным недостатком бинауральной системы является то, что правильная передача пространственной информации (φ «φ’) оказывается возможной практически только для одной точки слушания. Даже незначительное (порядка 10…15 см) смещение центра головы слушателя влево и вправо от этой точки приводит к тому, что слуховая пеленгация кажущегося источника звука оказывается невозможной (рисунок 2в). По мнению японских исследователей, применение бинауральных регуляторов направления (G, Н) допускает поперечное перемещение слушателя не более, чем на 30 см.

При наличии реверберации во вторичном помещении наилучшие результаты бинауральная система звукопередачи с двумя громкоговорителями обеспечивает при малых размерах базы и достаточно близком расположении к ним слушателя (В = 0,6…1,2 м и x = 0). Структурная схема одной из таких систем изображена на рисунке 3а.

Амплитудно-частотные характеристики левого (правого) и перекрестных каналов этого процессора приведены на рисунке 3б; величина t = 200 мкс; расстояние громкоговорителей до ближайшей стены 60 см, до боковых 120 см.

Вторая структура, дающая неплохие результаты, показана на рисунке 4. Применение тыловых громкоговорителей (с их помощью осуществляется компенсация перекрестных сигналов Гр1 и Гр2) улучшает уверенность локализации кажущегося источника звука в задней полусфере и обеспечивает правильную передачу направлений во всей азимутальной плоскости при величине смещения относительно оптимального места до 30…40 см. При тщательной балансировке системы воспроизведения удовлетворительные результаты могут быть получены даже при величине поперечного смещения слушателя до 1 м.

Бифонические процессоры

Предварительно отметим, что разработка процессоров, использующих бинауральный метод синтеза звуковых образов, идет по двум основным направлениям:

1) создание с помощью цепей G и H устройств, имитирующих недостающие громкоговорители, свойственные другим системам звукопередачи, например, матричным;

2) разработка устройств, позволяющих в чистом виде реализовать идею бинауральной передачи и содержащих элементы (блоки), которые повышают устойчивость «бифонического» эффекта, то есть уменьшают влияние реверберации и перемещений слушателя на его качество.

С помощью процессора, структурная схема которого изображена на рисунке 5а, имитируется звучание двух кажущихся громкоговорителей (Г3 и Г4, рисунок 6), расположенных в тыловой области. Действительными источниками звука здесь являются только два громкоговорителя Гр1 и Гр2. Два других кажущихся источника звука (Гр3 и Гр4) создаются с помощью двух бинауральных регуляторов направления (обозначены на рисунке 5а цифрами I и II). Каждый из этих регуляторов содержит соответствующие блоки G и H (рисунок 6). Данный процессор имеет четыре входа, на которые могут быть поданы сигналы с выхода декодера любой матричной звуковой системы. При этом на вход 1 процессора (рисунок 5а) должен быть подан левый фронтальный сигнал (ЛФ), на вход 2 — левый тыловой сигнал (ЛТ), на вход 3 — правый тыловой сигнал (ПТ), на вход 4 — правый фронтальный сигнал (ПФ). На рисунке 5б представлен пассивный декодер системы ABC. Сигнал Л должен быть подан на вход 4 процессора (рисунок 3а), Л-кП — на вход 3, П-кЛ — на вход 2, а П — на вход 1.

Заметим, что в каждом случае пространственная звуковая панорама, свойственная соответствующему типу имитируемой матричной системы (SQ, QS, ABC, Dolby Lab и т. д.), может быть получена только для одной точки слушания и при времени стандартной реверберации Т помещения прослушивания, не превышающем 0,3 с.

Иную цель преследуют авторы бифонического процессора, предложенного фирмой Victor Company of φapan (φVC). Процессор обеспечивает совместимость стереопанорам при использовании громкоговорителей и головных телефонов при подведении к ушам слушателя сигналов, воспринятых микрофонами искусственной головы.

Прежде чем описывать структурную схему этого процессора, приведем ряд необходимых пояснений. Допустим, что источник звука расположен в медианной плоскости искусственной головы спереди (заглушенная камера). Пусть он создает одинаковое звуковое давление во всем диапазоне слышимых частот. Зависимость А’ (рисунок 7) показывает изменение уровня звукового давления на выходах микрофонов искусственной головы для этого случая, а зависимости А и В — изменение уровня звукового давления для прямого (А) и перекрестного (В) сигналов на ушах слушателя, если воспроизведение осуществляется с помощью громкоговорителей Гр1 и Гр2. При этом голова слушателя расположена симметрично относительно Гр1 и Гр2, а угол, под которым он видит эти громкоговорители, равен 60° (y = 30°). При этих измерениях к громкоговорителям подводятся сигналы постоянного уровня.

Интересно отметить, что кривые А’ и A = f1(Н11) или f1(Н22) весьма похожи, если угол на громкоговорители не превышает 60°. Кривая B = f2(Н12) или f2(Н21). Она характеризует изменения, которые претерпевает звуковая волна, распространяясь от левого громкоговорителя к правому уху и наоборот. На рисунке 8 приведена структурная схема процессора, обеспечивающего выполнение условия совместимости для случая, когда реальный источник звука расположен в медианной плоскости искусственной головы. Звуковая волна, распространяясь от источника звука (ИЗ), воздействует на микрофоны M1 и М2 макета головы (МГ). Задача процессора состоит в том, чтобы донести оба этих сигнала в неизменном виде до ушей слушателя как при использовании телефонов, так и громкоговорителей.

Процессор, удовлетворяющий этому требованию (рисунок 8), имеет два идентичных канала преобразования сигналов Лб и Пб. Каждый из них содержит блок с передаточной функцией 1/А, с выхода которого сигнал поступает на неинвертирующий вход операционного усилителя (ОУ) 2 (или 7). Выход операционного усилителя через блок с передаточной функцией В/А подключен к его инвертирующему входу. В точках Qл и QП процессора (рисунок 8) имеют место соответственно сигналы Qл = Лб/(A + B) и QП = Пб/(A + B). Если источник звука расположен в медианной плоскости, то Лб = Пб, поэтому Qл = QП.

Выражение 1/(А + В) представляет собой передаточную функцию каждого из каналов процессора. Сигналы Qл и QП излучаются громкоговорителями 5 и 10 или подводятся к телефонам (Т). Если принять во внимание, что головные телефоны обычно имеют передаточную функцию вида А + В (рисунок 9), то схема, показанная на рисунке 8, обеспечивает подведение к ушам слушателя сигналов Лб и Пб. При воспроизведении же сигналов Qл и QП через громкоговорители на левое и правое уши слушателя (с учетом равенства Лб = Пб) будут воздействовать соответственно сигналы: [Лб/(A + B)]A + [Пб/(A + B)]В = Лб и [Пб/(A + B)]A + [Лб/(A + B)]В = Пб .

Таким образом, при применении громкоговорителей использование процессора обеспечивает подведение к ушам слушателя сигналов, тождественных Лб и Пб, что позволяет говорить о совместимости стереопанорам при применении громкоговорителей и телефонов.

Все изложенное относилось к ситуации, когда источник расположен в медианной плоскости (МГ).

В реальных условиях источник звука может быть расположен в любой точке пространства. Тогда в цепь отрицательной обратной связи (ОУ) рекомендуется включать аттенюатор, обеспечивающий затухание около 3…4 дБ, так, как это показано на рисунке 10а. Этот аттенюатор (дБ) необходим для устранения искажений формы звуковой волны, если воспроизведение осуществляется через громкоговорители. На рисунке 10б представлены частотные характеристики каналов блока I (рисунок 10а).

Если же мы хотим обеспечить эффективную передачу направлений не только в медианной плоскости, то к процессору, изображенному на рисунке 10а, необходимо добавить блок пространственной локализации II.

Рассмотрим сначала более простую схему процессора, не содержащую вышеупомянутых аттенюаторов. Она необходима для понимания существа дела. Структурная схема такого процессора изображена на рисунке 11. Он содержит два блока I и II. Схема блока I идентична изображенной на рисунке 10а. К ее выходам Qл и QП подключен блок II. Он содержит сумматоры сигналов S1 и S2, блоки, имеющие передаточные функции В/А. Выходными сигналами блока II являются сигналы Sл и SП, которые после усиления усилителями подводятся к левому и правому громкоговорителям.

Выходные сигналы блока II:

Sл = Qл + (В/А)Qл — (В/А) SП и SП = QП + (В/А)QП — (В/А)Sл.

При громкоговорящем воспроизведении они обеспечивают на ушах слушателя (С на рисунке 11) сигналы Ел и ЕП, тождественные бинауральным сигналам Лб и Пб, полученным от микрофонов «искусственной головы». Иначе говоря, обеспечиваются такие же условия восприятия, как если бы слушатель находился в точке расположения макета головы.

Если блок II, показанный на рисунке 11, используется совместно с блоком I, представленным на рисунке 10а, то первый для выполнения условий Eл = Лб и EП = Пб необходимо изменить так, как это представлено на рисунке 12. Заметим, что сказанное справедливо, если все аттенюаторы вносят одинаковое затухание. Возможны и другие варианты построения структурных схем блока II, но в любом случае они должны обеспечивать преобразование исходных сигналов Qл и QП в сигналы Sл и SП, определяемые вышеприведенным выражением. Понятно, что алгоритм этого преобразования может быть неодинаков.

В заключение заметим, что, несмотря на значительные успехи, пока еще не существует методов, позволяющих устранить мешающее влияние реверберации помещения, с одной стороны, и расширить зону слушания — с другой. Это, безусловно, сдерживает широкое использование бинауральной системы звукопередачи при записи, на телевидении, в радиовещании. Некоторым недостатком бинауральной стереофонии является также отсутствие полной совместимости с традиционной стереофонической системой звукопередачи. Тем не менее, бинауральная технология, как уже было сказано ранее, имеет свою нишу и активно развивается. В этом можно убедиться, зайдя на сайт www.binaural.com, где все желающие найдут много полезной информации, а также весьма обширный каталог бинауральных записей.

Замечания и предложения по работе сервера направляйте: web.master at 625-net.ru.

© 1996—2009 «Издательство 625». Все права защищены.

e-mail: magazine at 625-net.ru, тел./факс: (495) 691-77-24, 695-95-88, схема проезда.

Свидетельство о регистрации средства массовой информации Эл № 77-2794.