Журнал:

Бинауральные звуковые системы

Часть 1. Теоретические основы

Идея бинауральной звукопередачи

Из личного опыта мы знаем, что человек, имея два уха, способен локализовать источники звука в пространстве, т. к. уверенно определяет направление на источник звука в горизонтальной плоскости (азимут), его вертикальное возвышение над горизонтальной плоскостью и расстояние до источника. При этом вся необходимая для этой оценки информация выделяется из сигналов, воздействующих на левое и правое уши слушателя, иначе говоря, из так называемой бинауральной пары сигналов.

Риc. 1а
Риc. 1б
Риc. 1в
Риc. 1г
Риc. 1д
Рис. 1. Принцип бинауральной звукопередачи: а — идея; б — общая структурная схема бинауральной звуковой системы; в — влияние сигналов, отраженных от поверхности помещения;
г — электрическая схема аналога этого процесса;
д — обощенная структурная схема бинауральной системы с громкоговорящим воспроизведением

Идея бинауральной передачи представлена на рисунке 1а. Если поместить два микрофона в ушные каналы акустического манекена и затем воспринятые ими сигналы без каких-либо изменений подвести с помощью головных телефонов к соответствующим ушам слушателя, то тот оказывается находящимся как бы в первичном звуковом поле. При этом, если манекен и слушатель имеют головы с одинаковыми размерами, формой и акустическими характеристиками, то и сигналы, воспринимаемые микрофонами манекена и ушами слушателя, будут идентичными.

Системы звукопередачи, реализующие данный принцип, называются бинауральными. Они способны создавать трехмерную, вынесенную за пределы головы слушателя пространственную звуковую панораму, создающую полную иллюзию присутствия слушателя в концертном зале, а значит, способны обеспечить более высокое, чем при обычной стереофонии, качество звучания.

Итак, в бинауральной звуковой системе (рисунок 1б) формируются левый (Лб) и правый (Пб) сигналы, тождественные тем, которые воздействовали бы на входы слухового анализатора слушателя при его расположении в первичном звуковом поле, например в концертном зале. Новыми элементами по сравнению с обычной стереофонической системой, содержащей пульт звукорежиссера (ПЗ) и стереофонический усилитель (СУ), здесь являются бинауральный регулятор направления (БРН) на передающей стороне и бифонический процессор (БП) на стороне воспроизведения звуковой информации, если воспроизведение сигналов Лб и Пб выполняется с помощью громкоговорителей Гр1 и Гр2 .

При использовании громкоговорителей для воспроизведения бинауральной пары сигналов Лб и Пб необходимо дополнительное устройство, называемое бифоническим процессором. Он (рисунок 1б) обеспечивает при громкоговорящем воспроизведении подведение к левому и правому входам слухового анализатора бинауральной пары сигналов Лб и Пб в своей первоначальной, неискаженной форме.

Процессор необходим для компенсации:

  • мешающего действия перекрестных сигналов громкоговорителей Гр1 и Гр2 (их влияние описывается передаточными функциями H12, H21);
  • изменений, происходящих в сигналах на пути их следования от левого громкоговорителя Гр1 до левого уха (1) и от правого громкоговорителя Гр2 до правого уха (2) (описываемых соответственно передаточными функциями H11 и H22);
  • сигналов, отраженных от поверхностей жилого помещения (рисунок 1в), где Hi,j — соответствующие им передаточные функции в эквивалентной этому процессу электрической схеме (рисунок 1г).

Эта совокупность отраженных сигналов образует реверберационный процесс жилого помещения, она воздействует на левое и правое уши слушателя, изменяя исходную пару сигналов Лб и Пб.

С учетом изложенного выше, полная эквивалентная схема бинауральной звуковой системы с громкоговорящим воспроизведением представлена на рисунке 1д.

В качестве БРН часто применяют «искусственную голову» (рисунок 2), в ушных проходах которой (рисунок 2б) на месте барабанной перепонки установлены приемники звука — микрофоны М1 и M2.

Достоинства и недостатки бинауральной системы

Основные достоинства и недостатки бинауральной системы передачи звука можно сформулировать следующим образом:

  1. При компенсации мешающих факторов возможна уверенная и четкая локализация кажущихся источников звука (КИЗ) в пределах всей горизонтальной плоскости: спереди, слева, справа, сзади. Однако все же кажущиеся источники звука, расположенные спереди, оказываются более компактными, а в тыловой части — более размытыми. При использовании бинауральной записи кажущиеся источники звука в случае применения головных телефонов оказываются вынесенными за пределы головы слушателя в то место, где расположены действительные источники звука. В отличие от этого, при прослушивании через головные телефоны сигналов обычной стереофонии кажущиеся источники звука (показаны на рисунке 3 кружочками) ощущаются как расположенные внутри головы слушателя. При бинауральной стереофонии оценка расстояния до источника звука, как и при естественном слушании, также не является точной.
  2. Появление реверберации, как в первичном, так и во вторичном помещениях, затрудняет оценку азимута кажущихся источников звука в тыловой области, где слушатели вместо истинного направления часто указывают соответствующее ему зеркальное фронтальное направление. Данное явление возникает особенно часто, когда время стандартной реверберации в помещении прослушивания превышает 0,3 с. Что касается ощущений акустических свойств первичного помещения, связанных с передачей глубинной локализации (его гулкости, теплоты, мягкости, светлости звучания, то они оказываются в этой системе правдоподобными. Бинауральной системе присуще более точное восстановление пространственной структуры первичного реверберационного процесса по сравнению с обычной стереофонией.
  3. Правильная передача пространственной информации при воспроизведении с помощью громкоговорителей возможна практически только для одной точки помещения, где с помощью бифонического процессора скомпенсировано действие мешающих факторов: H11, H21, H12, H22 и реверберационного процесса помещения воспроизведения. Даже незначительное (около 9…15 см) смещение центра головы слушателя влево или вправо от этой точки приводит к тому, что локализация кажущихся источников звука оказывается невозможной вне фокуса осей громкоговорителей.
Риc. 2а
Риc. 2б и 2в

Не вызывает сомнения тот факт, что в оптимальной точке прослушивания бинауральная система обеспечивает звучание, уверенно предпочитаемое обычному стереофоническому, создает эффект присутствия слушателя в концертном зале с хорошими акустическими свойствами. Однако в силу изложенных выше причин область ее применения весьма ограничена: воспроизведение с помощью головных телефонов, переносная аппаратура радиовещания и звуковоспроизведения, компьютерное моделирование. Бинауральная звуковая система мало пригодна для условий коллективного прослушивания (телевидение, домашние театры, кинозалы).

Несмотря на наличие целого ряда недостатков, бинауральная технология широко используется при записи фонограмм в радиовещании и на телевидении. В последние годы, в связи с развитием систем трехмерного звука для компьютерных тренажеров и игр, она привлекает все большее внимание исследователей (рисунок 2в), и ее применение в этой области очень быстро расширяется (рисунок 2г).

Для более глубокого понимания механизмов, заложенных в основу этой технологии записи и передачи звука, принципов построения оборудования для данной области техники необходимо подробнее рассмотреть свойства пространственного слуха человека, знание и учет которых и лежат в основе функционирования бинауральных звуковых систем.

Пространственный слух

Риc. 2г
Рис. 2. Один из первых примеров промышленного выполнения «искусственной головы» KU-100 (микрофоны установлены в слуховых проходах манекена): а — внешний вид; б — ушная раковина манекена со встроенными микрофонами — приемниками давления; в — возможное применение: для исследования звукового поля внутри автомобиля и для компьютерных игр и тренажеров ; г — амплитудно-частотная характеристика уровня звукового давления KU-100

Известно, что решающую роль в оценке направления на источник звука в реверберирующем звуковом поле играет эффект предшествования, или «эффект Хааса» (1949). Суть его состоит в отделении слуховой системой сигналов прямого звука от их реверберационных продолжений. При этом суждение о направлении на источник звука формируют сигналы прямых звуков, в то время как часть следующих за ними запаздывающих повторений в интервале времени от 1,5 до 30…50 мс подавляется слуховой системой. При больших временных сдвигах такого подавления не происходит. В этом случае отраженные сигналы рассматриваются как помеха, но одновременно, по мнению многих авторов, данная часть реверберационного процесса помещения играет важную роль при оценке расстояния до источника звука.

Рис. 3. Упрощенные структурные схемы традиционной стереофонической (а, б) и бинауральной (в, г) систем звукопередачи: 1 — первичное помещение; 2 — вторичное помещение

Именно эти механизмы пространственного слуха человека и лежат в основе бинауральной стереофонии. Поэтому их рассмотрению уделим основное внимание.

Оценка азимута источника звука.

Предположим, что под некоторым углом к медианной плоскости I-I головы слушателя находится источник звука Гр (рисунок 4а). Вследствие дифракции звуковой волны вокруг головы слушателя и частотно-зависимого затухания последней с расстоянием L, сигналы, приходящие к левому (1) и правому (2) ушам слушателя, оказываются неодинаковыми.

Они отличаются по уровню ΔLб(φ, F), по времени Δτб(φ, F) и являются функцией азимута φ и частоты F. Параметры ΔLб и Δτб бинауральной пары сигналов, соответствующих данному источнику звука, и являются носителями информации о направлении. Пара сигналов, воздействующая на уши слушателя, может рассматриваться как результат кодирования места источника звука в пространстве. Другими словами, голова и ушные раковины слушателя играют роль пространственных фильтров, а бинауральная пара сигналов на их выходе несет информацию о месте источника звука в пространстве.

Рис. 4. Кодирование места действительного источника звука в пространстве: а — к возникновению различий бинауральной пары сигналов; б — эквивалентная схема, поясняющая механизм пространственного кодирования сигнала источника; в — простейший 6инауральный регулятор направления

Изображение, показанное на рисунке 4а, формально можно заменить эквивалентной схемой (рисунок 4б). Здесь параметры слуховых сигналов формируются уже с помощью электрических устройств А и В, а сами эти сигналы воспроизводятся телефонами Т1 и Т2. Коэффициенты передачи Hφ1 и Hφ2 устройств А и В полностью описывают все изменения, которые претерпевает звуковая волна, распространяясь от реального источника звука Гр к левому (1) и правому (2) ушам слушателя. В качестве иллюстрации на рисунке 5а представлены зависимости, характеризующие изменение модуля коэффициентов передачи Hφ1 и Hφ2 от частоты для направления на источник звука φ = 120°.

Воспроизведение бинауральной пары сигналов через телефоны стимулирует у слушателя ощущение расположения источника звука в позиции Гр. Однако этот источник звука будет уже кажущимся. Меняя передаточные функции пространственных фильтров Hφ1 и Hφ2 в соответствии с положением источника звука относительно головы слушателя, можно с помощью электрической схемы, показанной на рисунке 46, обеспечить локализацию кажущихся источников звука в любом направлении азимутальной плоскости. Можно сказать, что совокупность пространственных фильтров {Hφ1}i и {Hφ2}i представляет собой простейший регулятор направления бинауральной звуковой системы.

Рис. 5. Изменение модуля коэффициентов передачи пространственных фильтров от частоты при кодировании сигнала источника звука (φ = 120°) и при воспроизведении полученной бинауральной пары сигналов Лб и Пб:
а — телефонами: 1 — Hφ1 , 2 — Hφ2;
б — громкоговорителями (ψ = 30°) — G;
в — громкоговорителями (ψ = 30°) — H

Электрическую схему, представленную на рисунке 4б, нетрудно преобразовать в вариант, показанный на рисунке 4в. Она содержит общий для обоих каналов элемент G’ с передаточной функцией Hφ1, характеризующей изменения звуковой волны, распространяющейся от источника звука Гр до ближайшего уха 1 слушателя, и блок Н’. Блок Н’ изменяет, в зависимости от азимута, параметры ΔLб и Δτб бинауральной пары сигналов Лб и Пб.

В случае обычной стереофонии, когда воспроизведение сигналов стереопары происходит через громкоговорители, для того, чтобы обеспечить локализацию кажущихся источников звука в пределах всей азимутальной плоскости, необходимо, как и ранее, также применить два пространственных фильтра, но уже с передаточными функциями G и H. Это другие функции, зависящие ко всему прочему и от расположения слушателя относительно громкоговорителей. Эти фильтры следует включить, как это показано на рисунке 6. Очевидно, что G ≠ G’ и Н ≠ Н’.

Обе структуры (рисунки 4в и 6) по слуховому восприятию тождественны. Вид функций Hφ1, G и Н для частного случая (φ = 120° и ψ = 30°) представлен на рисунке 5. Заметим, что передаточная функция Н имеет глубокий минимум на частоте 8 кГц, а модуль коэффициента передачи G имеет максимум в диапазоне частот от 300 до 5000…7000 Гц. Интересно отметить, что диапазон частот, существенно влияющих на азимутальное положение кажущихся источников звука, составляет 300…8000 Гц.

Блоки G(G’) и Н(Н’) можно рассматривать как регулятор направления. Итак, пара бинауральных сигналов, несущая информацию о месте источника звука в пространстве, может быть синтезирована двумя устройствами G(G’) и Н(Н’)

Все же пары значений ΔLб и Δτб не позволяют однозначно оценить азимутальный угол φ источника звука относительно медианной плоскости I-I (рисунок 4а). Действительно, для каждой гиперболы, построенной так, что ее фокусами являются входы 1 и 2 органа слуха (рисунок 7а), существует всегда множество пар точек (А, В), расположенных зеркально относительно линии 1-2, для которых обеспечиваются приблизительно одинаковые значения ΔLб и Δτб бинауральных сигналов. Например, для источников звука, расположенных в медианной плоскости I-I на одинаковом расстоянии от центра головы слушателя, значения ΔLб и Δτб бинауральной пары сигналов одинаковы для фронтального и тылового направлений. Несмотря на это, локализация звуковых образов оказывается безошибочной за счет дополнительного спектрального анализа бинауральной пары сигналов. Необходимые спектральные изменения вносятся блоком G(G’).

Рис. 6. Передача пространственной информации в бинауральной системе звукопередачи при воспроизведении сигналов Лб и Пб с помощью громкоговорителей (бинауральный регулятор направления)
Рис. 7. Изменение временного сдвига пары сигналов Лб и Пб при бинауральном слушании: а — к неоднозначности оценки азимута источников звука А и В; б — влияние частоты испытательного сигнала (цифры у кривых — значение средней частоты 1/3-октавной полосы белого шума) и в — среднестатистическая зависимость Δτб от φ
Рис. 8. Смещение кажущегося источника звука под действием междуушных временной (а) и интенсивностной (б) разностей бинауральной пары сигналов

Орган слуха человека имеет два механизма для оценки местоположения источника звука в пространстве. Один из них («фронт-тыл») определяет, находится ли источник звука спереди или сзади слушателя (относительно линии 1-2), а другой — направление φ на источник звука относительно медианной плоскости I-I (рисунок 4а).

Профессором Я. В. Альтманом высказано предположение, что зависимость от азимута Δτб является функцией, близкой к линейной:

Δτб = mφ, если 0° < φ <80°, 100° < φ <180°

где m1 — постоянный коэффициент. Подтверждением этому являются экспериментальные зависимости Δτб = f1(φ), взятые из его же работы и представленные соответственно на рисунках 7б и 7в, и зависимость смещения кажущихся источников звука от величины междуушной временной разности Δτб сигналов, подводимых к левому и правому ушам слушателя с помощью головных телефонов (рисунок 8а). Величина φ углового смещения кажущихся источников звука пропорциональна значению Δτб в диапазоне 0…0,63 мс. При Δτб > 0,63 мс источник звука полностью латерализован, то есть находится вблизи уха, на которое подается опережающий сигнал.

Значения ΔL и Δτ при локализации взаимозаменяемы, поэтому, если зависимость Δτб = f1(φ) является линейной, то и зависимость ΔLб = f2(φ) должна быть также линейной функцией от азимута φ источника звука ΔLб = m2·φ.

Правильность этого заключения доказана теоретически и подтверждена экспериментальными данными. На рисунке 8б приведена зависимость смещения кажущихся источников звука от величины бинауральной интенсивностной разности ΔLб сигналов, воспроизводимых головными телефонами. На рисунке 9 представлены результаты измерений величин ΔLб.

Взаимозаменяемость значений Δτб и ΔLб при локализации звуковых образов позволяет, как и при обычной стереофонии, ввести понятие коэффициента эквивалентности Кб (дБ/мс) для пары бинауральных сигналов и определить его как отношение величин ΔLб и Δτб, вызывающих одинаковое смещение источника или взаимно компенсирующих друг друга:

Рис. 9. Изменение интенсивностной разности ΔLб бинауральной пары сигналов Лб и Пб в зависимости от азимута источника звука (цифры у кривых — значение средней частоты 1/3-октавной полосы белого шума)

Кб = (ΔLб / Δτб).

Поочередное предъявление стимулов ΔLб и Δτб дает значение Кб ≈ 13 дБ/мс (рисунок 8). Эта величина близка к значению, найденному для обычной стереофонии (~10 дБ/мс).

Если допустить, что орган слуха при оценке азимута φ источника звука обменивает Δτб на эквивалентное значение интенсивностной разности (ΔLΣэк)б = Кб·Δτб вследствие явления торможения в слуховой системе, то справедлива запись:

(ΔLΣэк)б = ΔLб + Кб·Δτб.

Здесь (ΔLΣэк)б — суммарное значение эквивалентной интенсивностной разности, вызывающей то же самое смещение источника звука, что и одновременно действующие величины ΔLб и Δτб . Если учесть, что значения Δτб и ΔLб являются линейными функциями азимута φ источника звука ( ΔLб = m2·φ и Δτб = m1·φ), а величина коэффициента эквивалентности не должна зависеть от φ (Кб = const), то очевидно, что величина суммарной эквивалентной интенсивностной разности также является линейной функцией азимута φ, то есть (ΔLΣэк)б = m·φ, где m — постоянный коэффициент.

Заметим, что Δτб действует всегда в согласии с ΔLб при локализации реального источника звука. Предполагается, что значение параметра Δτб вычисляется слуховой системой по максимуму взаимной корреляционной функции бинауральной пары сигналов.

Величины Δτб и ΔLб являются не только линейными функциями азимутального угла, но и зависят от частоты (рисунки 7б и 9). При этом их вклад в оценку азимута зависит от частоты. На низких частотах (ниже 500 Гц) ΔLб << Кб·Δτб и оценка азимута практически определяется только значением Δτб; в диапазоне средних частот (500...5000 Гц) оба фактора Δτб и ΔLб приблизительно в равной степени способствуют созданию ощущения направления. На высоких частотах (выше 5000 Гц) ΔLб >> Кб·Δτб, то есть оценка азимута практически определяется величиной ΔLб. На частотах ниже 150 Гц локализация источника звука невозможна.

Временной (Δτб) и интенсивностный (ΔLб) факторы действуют на орган слуха независимо. Поэтому значение Кб может быть легко найдено методом компенсации. Предварительно введением в пару бинауральных сигналов, например, значения ΔLб латерализуют кажущийся источник звука, а затем с помощью Δτб возвращают этот кажущийся источник звука на прежнее место (медианная плоскость). В этом случае действие одного фактора компенсируется влиянием другого.

Все изложенное позволяет описать работу механизма локализации при оценке азимута источника звука следующим образом. Голова и ушные раковины слушателя выполняют роль фильтра, осуществляющего пространственное кодирование сигналов, поступающих от источника звука к левому и правому ушам слушателя. Полученная в результате этого кодирования пара бинауральных сигналов содержит всю необходимую информацию для оценки местоположения источника звука в пространстве: угловое смещение от медианной плоскости, расположение спереди или сзади слушателя, возвышение над горизонтальной плоскостью, удаление.

Суждение о величине углового смещения φ источника звука от медианной плоскости связано с оценкой слуховой системой временных (Δτб) и интенсивностных (ΔLб) различий пары бинауральных сигналов. Полученные в результате пространственного кодирования величины ΔLб и Δτб сравниваются в каждой частотной группе слуха с заученными (приобретенными в результате опыта) эталонными образцами, хранящимися в слуховой памяти. Идентификация (частичная или полная) «измеренной» пары значений ΔLб, Δτб с одним из хранящихся в памяти образцов позволяет слушателю оценить величину углового смещения источника звука в пространстве относительно медианной плоскости. Неоднозначность оценки «фронт-тыл» устраняется путем частотного анализа бинауральных стимулов.

Работа механизма «фронт-тыл».

Рис. 10. К пояснению особенностей работы механизма «фронт-тыл»: а — изменение разности звукового давления фронтального и тылового громкоговорителей от частоты; б — расположение полос направления на оси слышимых частот

Ключевым моментом для понимания работы механизма «фронт-тыл» является зависимость, показанная на рисунке 10а. Она представляет собой изменение разности уровней звукового давления:

ΔLфт = Lф - Lт, где Lф — уровень звукового давления, создаваемый у барабанной перепонки фронтальным громкоговорителем; Lт — то же самое, но для тылового громкоговорителя. В обоих случаях источник звука Гр находится в медианной плоскости I-I на одинаковом расстоянии от центра головы слушателя. Из рисунка 10а следует, что в отдельных частотных областях фронтальный источник звука создает большее звуковое давление: Lф > Lт, в других частотных полосах наблюдается обратное явление: Lт > Lф.

Более глубокое изучение фильтрующего действия головы и ушных раковин слушателя позволило ввести понятие так называемых пеленговых полос или полос направления. Их расположение на оси частот показано на рисунке 10б. Видно, что пеленговые полосы, соответствующие расположению источника звука спереди (φ = 0°), связаны с областями частот, где Lф > Lт. Пеленговые полосы, соответствующие тыловому направлению (φ = 180°), связаны с частотными областями, где Lт > Lф. Для уверенной фиксации слушателем фронтального или тылового направления достаточно иметь разницу в балансе громкоговорителей по уровню |Lф - Lт| > 1,5…2 дБ.

Предполагается, что ощущение направления «фронт-тыл» формируется преимущественно теми полосами направления, в которых сосредоточена большая часть мощности сигнала. Заметим, что условия работы механизма «фронт-тыл» должны ухудшаться для источников звука, находящихся вне медианной плоскости (φ ≠ 0° и φ ≠ 180°). Этот механизм не работает при φ = 90° или φ = 270°.

Вполне возможно, что при оценке направления «фронт-тыл» слуховая система также учитывает тот факт, что ушные раковины играют роль линии задержки, временной сдвиг которой является функцией азимута φ источника звука. Результат пространственного кодирования места источника звука сравнивается с эталонными для каждого направления образцами. Суждение о направлении является следствием идентификации результатов анализа бинауральной пары сигналов с одним из эталонных образцов.

Оценка угла возвышения источника звука.

До сих пор мы говорили исключительно о бинауральной оценке азимута источника звука. Однако признаки, лежащие в основе оценки угла возвышения источника звука, часто считают моноуральными. Ушная раковина действует подобно акустической антенне. Ее резонансные полости усиливают некоторые частоты, а ее геометрия приводит к интерференции волн, которая уменьшает другие частоты. Кроме того, частотная характеристика уха зависит от направления прихода звуковой волны (рисунок 11а).

Рис. 11. Траектории попадания в ушной канал звуковой волны от источника звука (а), спектральное окрашивание (б) и задержки, возникающие при отражении звуковой волны от краев ушной раковины (в)

В каждом случае имеются два пути распространения звука от источника до канала уха: прямой путь распространения звуковой волны и более длинный, на котором волна претерпевает отражение от ушной раковины. На умеренно низких частотах ушная раковина, по существу, собирает дополнительную звуковую энергию, и сигналы этих двух путей приходят в фазе. Однако на высоких частотах задержанный сигнал не совпадает по фазе с прямым сигналом, и происходит их взаимное ослабление. Самое большое ослабление происходит, когда разность в длине пути d равна половине длины волны, то есть, когда F = cзв / 2d. В показанном примере, это создает впадину на АЧХ — минимум вокруг частоты 10 кГц. Для типичных значений d частота минимума обычно лежит в диапазоне от 6 кГц до 16 кГц. Так как ушная раковина — более эффективный рефлектор для звуков, приходящих спереди, чем сверху, результирующий минимум намного более заметен для источников, находящихся спереди, чем сверху.

Кроме того, разность длин путей меняется с углом возвышения, поэтому частота минимума также движется с возвышением. Хотя все еще имеются споры относительно того, какие особенности являются наиболее важными для оценки угла возвышения, все же установлено, что спектральное окрашивание звука, определяемое ушной раковиной, обеспечивает первичные признаки возвышения. Его пример показан на рисунке 11б. Источник звука был расположен в двух метрах слева от слушателя и перемещался от уровня уха (0°) до возвышения в 30° над уровнем уха (красная линия — 0°, желтая — 10°, зеленая — 20°, голубая — 30°).

В ряде работ утверждается также, что весьма важную роль играют здесь и задержки в приходе звуковых волн, отраженных от ушной раковины (рисунок 11в). Левый рисунок показывает здесь задержку (в микросекундах), возникающую при отражении от краев внутреннего уха, которые определяют различия в оценке направления «фронт-тыл» в горизонтальной плоскости. Правый рисунок показывает задержку при отражении от внешнего края ушной раковины, которая важна при определении возвышения источника в вертикальной плоскости.

Глубинная локализация.

Наряду с азимутом слушатель также достаточно уверенно оценивает и расстояние l до источника звука. Перечислим признаки бинауральной пары сигналов, оказывающих влияние на определение расстояния.

  1. При средних значениях l от 3 до 15…20 м приближение и удаление источника звука сопровождаются изменением его интенсивности. В свободном звуковом поле увеличение расстояния до источника звука в два раза сопровождается уменьшением уровня звукового давления на 6 дБ. Экспериментальные данные подтверждают связь оценки расстояния l с уровнем интенсивности источника звука (L). В качестве примера на рисунке 12 приведена соответствующая зависимость, заимствованная из работ проф. В. Я. Альтмана. Однако, чтобы использовать громкость для определения расстояния, нам необходимо также знать кое-что относительно характеристик источника звука. Так, например, каждый из нас знает из личного опыта, что при звучании человеческой речи, независимо от уровня, шепоту, нормальному разговору и крику соответствует разное качество звука. Громкость и знание особенностей источника дают нам полезную информацию для создания представления о дистанции до источника звука.
  2. При малых расстояниях l до источника звука (l < 2 м) наблюдаются изменения спектра сигналов вследствие искажения фронта звуковой волны головой и ушными раковинами. При расстоянии, превышающем 10...15 м, начинает сказываться частотно-зависимое затухание звуковой волны. Оба вида изменений формы спектра влияют на оценку дистанции до источника звука. Кроме того, возрастание амплитуды низкочастотных составляющих в спектре сигнала связано с ощущением приближения источника звука; искусственное уменьшение амплитуды высокочастотных составляющих в спектре воспринимается как удаление источника звука.
  3. В отличие от азимутальной, глубинная локализация возможна и при моноуральном слушании, но бинауральное восприятие существенно повышает точность определения расстояния. При расстоянии более 10 м слух должен предъявлять очень жесткие требования по разрешающей способности временных интервалов и приращений интенсивности, значительно превышающие возможности человека. Однако при меньшей дистанции необходимая разрешающая способность находится в пределах, доступных человеческому уху. Этот способ оценки может играть существенную роль в условиях открытого пространства или заглушенной камеры.
  4. В помещениях, где наряду с прямым звуком на слушателя воздействует значительное число отраженных волн, важным фактором, стимулирующим глубинную локализацию, является реверберация, точнее, величина акустического отношения. Благодаря эффекту предшествования, слуховой анализатор способен оценить энергию прямых звуков и отзвуков, составляющих реверберационный процесс. Большинство исследователей считают этот фактор важнейшим при определении расстояния. Все же необходимо признать, что стройной модели, объясняющей с достаточной полнотой механизм оценки расстояния, пока нет. Накопленные здесь сведения можно охарактеризовать как весьма скромные. Однако слушательский опыт свидетельствует о том, что глубинная локализация в естественных условиях не отличается большой точностью.

(Окончание следует…)

Замечания и предложения по работе сервера направляйте: web.master at 625-net.ru.

© 1996—2009 «Издательство 625». Все права защищены.

e-mail: magazine at 625-net.ru, тел./факс: (495) 691-77-24, 695-95-88, схема проезда.

Свидетельство о регистрации средства массовой информации Эл № 77-2794.