: архив : архив журнала "Звукорежиссер" : 2002 : #07

112 конвенция AES в Мюнхене.
Научные результаты. Часть 2

Ирина Алдошина

Кроме секций, о которых шла речь в первой части этой статьи, на конвенции в Мюнхене работали еще три секции: "Звукозапись для пространственных систем", "Пространственный звук" и "Низкоскоростное аудиокодирование".
Рис.1 План большой студии в Берлине

Первую секцию, которая представляла особый интерес для звукорежиссеров, поскольку была посвящена проблемам современных технологий звукозаписи, с большим обзорным докладом открыл Г. Штайнке (Германия)"Акустика помещений и технологические аспекты для классических многоканальных записей звука". Он уделил особое внимание проблемам, возникающим в начале и в конце тракта звукозаписи, а именно влиянию акустики студий звукозаписи (на примере большой студии для классической музыки в Берлине - рисунок 1) и влиянию помещений прослушивания, требования к которым оговорены в стандарте AES TD 1001.0.01-05, и который, по его мнению, требует пересмотра.

Темой следующего доклада самых активно работающих в настоящее время специалистов в этой области - Ф. Рамсей (Англия), С. Бок (Дания) и др. - была "Субъективная оценка качества звука при различных ограничениях в домашних аудиовизуальных системах". Первая часть доклада называлась "Эффекты ограничений по высокой частоте" (пр.5562).

Для пространственных систем воспроизведения в стандарте 5.1 (ITU-R B.775-1) были проведены исследования влияния ограничений высокочастотной части диапазона на общее звуковое впечатление при одновременном восприятии видеоизображения. Субъективные экспертизы показали, что для некоторых видов программного материала можно допустить определенное ограничение в тыловых каналах по высоким частотам (с частотой среза 10 кГц) без значительного ухудшения общего звукового впечатления. Следующим элементом, в котором допустимы некоторые ограничения, является центральный канал, а вот к ограничениям частотного диапазона в правых и левых передних каналах слух очень чувствителен. Причем наличие видеоизображения не оказывает существенного влияния на оценку качества звука при таких ограничениях.

В докладе Ф. Рамсея и В. Льюиса (пр.5563) было исследовано "Влияние расположения тылового микрофона на общее впечатление пространственности звучания при записи с помощью пятиканальной системы ненаправленных микрофонов" (естественно, при воспроизведении через системы Surround Sound 5.1).

Известный звукорежиссер Д. Гризингер (США) сделал очень ценный доклад, о котором, возможно, стоило бы рассказать отдельно более подробно. Он называется "Стерео и пространственное панорамирование на практике"(пр.5564). В нем исследовано положение речевых и музыкальных источников при двух- и трехканальном воспроизведении через громкоговорители. Было показано, что известный закон панорамирования (sin-cos) дает точное положение мнимого источника для трехканального воспроизведения, но дает ошибку в сторону расширения мнимого источника при двухканальном воспроизведении. Существенную роль в определении положения мнимого источника имеет спектр сигнала, при этом речевые частоты 700…4000 Гц играют доминирующую роль.
Рис2 Cистема расположения микрофонов"АВ+
центральное заполнение"

В докладе с длинным названием "Почему микрофонная стереосистема "АВ-поликардиоидная с центральным заполнением" является наилучшей при Surround-записи симфонического оркестра?" (пр.5565, Австрия) рассмотрены существующие варианты стереомикрофонных систем с точки зрения их соответствия требованиям к современным пространственным системам звуковоспроизведения, и показано, что система, структура которой представлена на рисунке 2, обладает определенными преимуществами при записи симфонического оркестра.

Большой комплекс работ по анализу различных микрофонных систем для записи пространственного звука выполняется М. Вильямсом (Франция). В докладе на этой конвенции (пр. 5567) он привел результаты измерения характеристик направленности различных микрофонных систем не только в горизонтальной, но и в вертикальной плоскости, что представляет собой очень полезную информацию для точной локализации источника звука, структуры ранних отражений и др.

Рис.3 Локализационная кривая

Новый важный для практики работы звукорежиссеров критерий по определению угла звукозаписи, т.е. полезного сектора охвата звуковой панорамы, был предложен в докладе Г. Тайле, Германия (пр.5568). Были рассмотрены методы определения этого сектора охвата для различных стереосистем микрофонов: XY, AB, ORTF, OCT, Blumlein и др., - и предложен способ его оценки, основанный на так называемых локализационных кривых (рисунок 3 ),что дало возможность ввести новый критерий для оценки микрофонных систем: "Угол звукозаписи 75%".

Следующая секция - "Пространственный звук" - проводилась за два заседания, поскольку в ней было представлено 16 докладов. Основные направления в докладах на этой секции были посвящены:

  • отработке методики субъективной оценки пространственных систем звуковоспроизведения;
  • сравнению различных технологий создания пространственного звука и совершенствованию техники аурализации (т.е. построения виртуальных компьютерных моделей помещения).

К первому направлению можно отнести доклад "Тренировка слушателей для оценки пространственного звуковоспроизведения" (пр. 5584), в котором был предложен метод тренировки слушателей для оценки ширины мнимого образа и расстояния до него. Показано, насколько уменьшилось количество ошибок даже у неопытных слушателей после тренировки по предложенной методике.

В докладе "Сравнение объективных измерений для предсказания субъективной оценки пространственных признаков", Англия (пр. 5591) было показано, в частности, что субъективная оценка ширины мнимого источника тесно связана с измеренной величиной интераурального коэффициента кросс-кореляции. Этот результат был предсказан еще в работах Беранека, но здесь получены точные числовые соотношения.

Наконец, доклад Н. Захарова и др. "Натуральное воспроизведение музыки и окружающих звуков" (пр. 5581) был посвящен очень актуальной проблеме: "Какое количество каналов надо реализовывать в пространственных системах для обеспечения натуральности звучания?" Исследовались системы от обычной стереофонической до перифонической (4, 5, 6, 8, 10 каналов). Было показано, что натуральность воспроизведения не связана напрямую с увеличением количества каналов: например, переход от системы с пятью каналами к системам с шестью и семью каналами не дает существенного улучшения в восприятии этого параметра. Видимо, задача решается значительно более сложными методами, чем простое увеличение числа каналов.

Рис.4 Общая схема комнаты прослушивания

Проблемам создания виртуальных моделей помещений были посвящены два доклада.. В первом докладе - "Активная комната для прослушивания: субъективный анализ" (пр. 5585) - изложены результаты создания специального помещения для прослушивания, в котором была установлена пятиканальная система плоских громкоговорителей и специальная система экранов (рисунок 4). С их помощью, а также с помощью компьютерного моделирования, можно было изменять основные параметры звукового поля: время реверберации, структуру ранних отражений и др. В этом помещении были организованы субъективные экспертизы по оценке влияния параметров реверберационного процесса на восприятие качества звучания различных инструментов.

Вариации различных параметров помещения: его размеров, расположения и ширины источника и др., и их влияние на субъективную оценку виртуальных моделей помещения - анализировались во втором докладе "Дизайн виртуальных комнат для звуковоспроизведения" (пр. 5580).

С использованием виртуальных компьютерных моделей помещения была выполнена очень полезная работа известного английского психоакустика Б. Мура и др. "Локализация речи" (пр. 5592). В ней исследовалось влияние ограничений частотного диапазона на локализацию речевого источника - такая ситуация обычно происходит с возрастом. Было показано, что снижение верхней границы полосы пропускания с 16 до 8 кГц значительно ухудшает локализацию речи. Таким образом, высокочастотные составляющие, даже в диапазоне 11…16 кГц, несут важную информацию о локализации речевого сигнала, что важно учитывать при работе звукорежиссера. Интересный результат был получен по локализации отдельных звуков: например, гласная "и" лучше локализуется, чем "а" и "у". Слоги, содержащие согласные "с", локализуются лучше, чем другие (поскольку в спектре звука "с" много высокочастотных составляющих). Было показано, что локализация источников речи влияет на ее разборчивость. Авторы собираются продолжить исследования именно по этому направлению.

Можно выделить еще один доклад на этой секции, посвященный аудиовизуальным системам "Субъективные эксперименты по эффектам комбинирования пространственного звука и видео в аудиовизуальных системах" (пр. 5582). В докладе изучались эффекты неидентичности восприятия видео и звукового образа в конференц-системах. Было показано, насколько это несоответствие определяет общую субъективную оценку всей системы в целом.

Наконец, последняя секция на этой конвенции - "Низкоскоростное аудиокодирование" - была посвящена проблемам разработки новых алгоритмов и технологии создания аудиокодеров с низкой скоростью передачи данных. На этой секции было 16 докладов, из них два больших т.н. "приглашенных" доклада: первый (пр. 5553) был посвящен новой технологии SBR (Spectral Band Replication), которая позволяет существенно увеличить эффективность компрессии в аудиокодерах. Она дает возможность реконструировать высокие частоты на приемном конце, освобождая процесс кодирования и передачи данных от высокочастотных компонент, что позволяет снизить скорость передачи при сохранении качества аудиосигнала. В декабре 2001 года эта технология была выбрана как базовая модель для процесса стандартизации в MPEG-4.

Применению этой же технологии SBR были посвящены еще два доклада немецких специалистов. В первом из них (пр. 5559) было сообщено, что объединение технологии SBR и аудиокодирования по системе MPEG-AAC легло в основу нового стандарта для цифрового радиовещания, созданного промышленным концерном DRM, и одобренного ITU. Разработанный для частот передачи ниже 30 МГц (длинные, средние и короткие волны), он предполагает значительное улучшение качества аудиосигнала, большую зону охвата и новые дополнительные возможности для вещания.

Во втором докладе "Объединение MP3 с SBR: характеристики нового MP3PRO алгоритма" (пр. 5560) сообщается, что такое объединение снимает ограничения по полосе частот, характерное для низкоскоростного кодирования, и позволяет передавать широкий диапазон без существенных искажений со скоростью ниже 64 кбит/с.

Второй приглашенный доклад сотрудников фирмы Philips "Параметрическое кодирование для высококачественного аудио" (пр. 5554) был посвящен проблемам разработки нового поколения параметрических кодеров, позволяющих уменьшить скорость передачи данных, алгоритмы которых легли в основу процесса стандартизации по системе MPEG-4 Extension 1.

На этой секции был сделан еще ряд докладов, посвященных различным алгоритмам кодирования данных. В частности, можно выделить два доклада американских специалистов: "Применение бинауральных параметров для кодирования стерео и многоканального звука" (пр. 5574), и "Почему бинауральные параметры лучше, чем интенсивностное стереокодирование" (пр. 5575). В них утверждается, что использование бинауральных параметров при кодировании стерео и многоканального звука значительно эффективнее, чем принятое в настоящее время в стандартах ISO/MPEG интенсивностное стереокодирование.

Таким образом, можно отметить, что к решению проблем совершенствования компрессии сигналов при создании нового поколения перцептуальных кодеров и разработке нового поколения стандартов по системе MPEG-4 привлечены в настоящее время значительные научные и промышленные ресурсы.

Как и на всех предыдущих конвенциях, здесь было проведено 16 семинаров по самым актуальным темам. Для обсуждения на эти семинары приглашаются ведущие мировые специалисты, которые делают интереснейшие доклады и проводят с аудиторией очень полезные дискуссии. Мне кажется, что самые интересные результаты можно услышать именно на семинарах. Очень жаль, что эти семинары, в отличие от докладов на секциях, не фиксируются письменно. Этот вопрос уже обсуждался на Совете директоров, и можно надеяться, что какие-то меры по сохранению этих дискуссий будут приняты.

На семинаре W-1 обсуждались актуальнейшие сейчас для развития средств передачи информации вопросы "О восприятии ошибок при каскадном включении кодеков". В семинаре участвовали представители Dolby Labs и института радиотехники IRT в Мюнхене - главного разработчика цифрового радиовещания. Проблемы возникают в связи с тем, что звук, передаваемый по цифровым каналам, несколько раз перекодируется, например звук из Интернета в формате МР3 записывается на минидиск с использованием ATRAC. При передаче радиовещательных сигналов используются MUSICAM (Европа), АС-3 (США), ААС (Япония) и др. Все эти перекодировки создают дополнительные шумы квантования и ухудшают качество звучания. На семинаре обсуждались возможные варианты включения последовательных кодеков с целью уменьшения искажений.

Специальный семинар, проведенный под председательством представителя фирмы Studer, был посвящен обсуждению темы "Современная техника микширования для многоканального звука". На нем обсуждалась новая технология VSP - виртуальное пространственное панорамирование, предполагающее при формировании пространственного образа в процессе микширования комбинированное использование натуральных микрофонных записей и синтезированных параметров виртуальных помещений, т. е. применение методов аурализации в сочетании с принятой техникой панорамирования.

Как уже было сказано в статье о предыдущей конвенции, технический комитет по аудиокодированию выпустил специальный СD-ROM, где собраны различные звуковые примеры, показывающие возможные искажения, которые могут возникать в процессе низкоскоростного кодирования сигналов, учитывающего различные психофизические явления (маскировку и др.). Обсуждению причин этих искажений был посвящен следующий семинар - "Прослушивание перцептуальных аудиокодеров".

Очень актуальная проблема обсуждалась на семинаре "Многоканальное аудиопроизводство в радиовещании". Интересно, что вел его представитель Японии, а не Германии, как обычно. Обсуждение касалось вопросов передачи звука в формате 5.1, которая уже широко применяется в звукозаписи, но в радиовещании и телевидении используется только несколькими радиовещательными кампаниями в мире.

На семинаре "Физика и психофизика пространственных звукозаписей" на различных музыкальных примерах демонстрировалось, как особенности слухового восприятия могут определить успех различных технологий звукозаписи. Хорошие пространственные записи должны обладать такими слуховыми параметрами, как широкая зона прослушивания, реалистическая локализация, точное ощущение дистанции до слухового источника, ощущение реального окружающего пространства и др. На этом семинаре также обсуждалось, как эти свойства зависят от соотношения прямого звука, ранних отражений (в пределах 20…50 мс) и поздних отражений (150…300 мс).

Очень представительный семинар под руководством председателя Технического Комитета AES В. Войчика, с участием известных специалистов Ф. Рамсея, Г. Тиле и др., был проведен на тему "Будущее пространственных систем звуковоспроизведения". На нем обсуждались как уже известные пространственные системы звуковоспроизведения, например в формате 5.1, так и новые, включая формат 10.2, Ambisonics и др. Причем, в течение всей конвенции работали демонстрационные комнаты, где можно было послушать и сравнить разные виды пространственных систем.

Интересные вопросы обсуждались на семинаре, посвященном роли продюсера в звукозаписи в наше время, когда стремительно меняются технологии, а также меняется соотношение между музыкальной интерпретацией произведения и его технической реализацией. Роль продюсера в индустрии звукозаписи становится все более сложной и непонятной. Известные продюсеры высказали свои соображения по этим вопросам.

"Пространственный звук в формате 5.1 для телевидения высокой четкости" обсуждался на семинаре под руководством Т. Камекава (Япония) и Т. Дэйли (Dolby Lab, США). Были продемонстрированы примеры различных программ (музыка, фильмы, театральные постановки и пр.) с пространственным звуком 5.1. Обсуждалось, как ускорить их широкое внедрение в телевидение. На этом фоне монофонический звук в нашем телевидении выглядит совершенным анахронизмом…

Самым полезным и, с моей точки зрения, самым интересным семинаром был семинар под названием "Что должен знать аудиоинженер о слуховом восприятии звука?". Семинар проходил под председательством известного профессора Д. Беголта (США) и представлял собой ряд учебных лекций, посвященных современной психоакустике. Идея семинара состояла в том, что при профессиональной подготовке специалистов, работающих со звуком (аудиоинженеров, звукорежиссеров и др.), абсолютно необходимо знание современных достижений в области механизмов слухового восприятия звука, включая восприятие высоты, громкости, тембра, чувствительности к фазе, эффектов маскировки, пространственного восприятия источника, временной интеграция и временной развертки, слуховых эффектов в помещении, слуховых различий при воспроизведении через громкоговорители и стереотелефоны и др. В связи с этим изучение данных вопросов должно быть обязательно включено в учебные программы подготовки всех аудиоспециалистов. Что касается России, то я уже давно говорю, что такой предмет, как "Психоакустика", должен обязательно входить в образовательные стандарты звукорежиссеров и аудиоинженеров.

Наконец, еще один семинар под руководством С. Липсица обсуждал достоинства и недостатки современных сигнальных процессоров в технике обработки звука, опять шел разговор о преимуществах однобитных сигналов и пр. Интересным было сообщение о применении цифровых процессоров при проектировании активных акустических систем.

Теперь очень кратко о выставке: у меня, к сожалению, было мало возможностей посмотреть ее детально, поэтому в первую очередь я старалась поближе познакомиться с акустической техникой. На выставке было представлено более 200 фирм, которые занимаются профессиональным аудиооборудованием (уже давно было принято решение, что бытовая аудиотехника не участвует в выставках AES) - это число меньше, чем обычно для конвенций, особенно проводимых в США. Организаторы объяснили это общим спадом в экономике после 11 сентября.

Как обычно, участвовали такие гиганты как Sony, Philips, Neumann, Genelec и др., однако на каждой выставке появляются какие-то новые фирмы. Например, прямо на конвенции отмечала свой дебют новая фирма профессионального звукового оборудования Interfacio.

Микрофонная техника была представлена огромным многообразием фирм (их было более двадцати) и моделей. Интересно отметить, что стоило на предыдущих двух конвенциях фирме Neumann показать свой первый цифровой микрофон Solution-D, как уже на этой конвенции шведской фирмой Milab была показана модель цифрового микрофона DM-1001. Микрофон имеет прямоугольный капсюль с двумя конденсаторными мембранами, у каждой из которых свой встроенный АЦП. Сигнал затем обрабатывается встроенным сигнальным процессором, который может производить микширование переднего и заднего сигналов для формирования заданной характеристики направленности, и выполнять некоторые другие операции обработки и микширования. Микрофон имеет стандартизованный выход для подключения к цифровым пультам. Так что, похоже, цифровые микрофоны начинают выходить на рынок…

Рис.5 Микрофон
Brauner Phantom

Фирма Beyerdynamic показала новый радиомикрофон из серии Opus-2000 c шестнадцатью программи-руемыми частотами и карманным передатчиком. Новые кардиоидные микрофоны представили немецкие фирмы Behringer и Brauner. На рисунке 5 показан микрофон градиента давления Brauner Phan-tom с выдающимися параметрами: диапазон 20 Гц…22 кГц, максимальное SPL 142 дБ, собственный шум 8 дБ, отношение "сигнал/шум" 86 дБ.

Фирма DPA, которая десять лет назад отделилась от B&K, представила новую линейку конденсаторных кардиоидных микрофонов с большими диафрагмами, например, модель 4041.

Фирма Neumann, наряду с полной линейкой аналоговых микрофонов, продолжает совершенствовать свой цифровой микрофон. Она представила систему Solution-D, состоящую из микрофона D-01, специального интерфейса DMI-2R и программного обеспечения RCS.

Рис.6 Aгрегаты с
излучателями Хейла

Фирма Sennheiser представила широкую гамму радиомикрофонов, в том числе серию S-5000 с самым маленьким в мире передатчиком с габаритами 61х53х17 мм и весом 130 г.

Фирма Shure показала новую серию радиомикрофонов с системой автоматического сканирования окружающей обстановки и выбором оптимальной частоты передачи. Фирма Schoeps разработала микрофонную стойку из пяти микрофонов для пространственной звукозаписи.

Из новых студийных мониторов можно выделить: мониторы фирмы ADAM AUDIO, в которых в качестве не только высокочастотного, но и среднечастотного звеньев используются излучатели Хейла с плоской диафрагмой из гофрированной фольги (рисунок 6).

Фирма Genelec, как всегда, представила огромное количество мониторов. В качестве новинки демонстрировалась серия субвуферов, в которых используется особая конструкция корпуса (вернее, фазоинвертора), значительно снижающая нелинейные искажения от турбулентности воздуха на низких частотах.

Интересную конструкцию активного коаксиального трехполосного монитора представила фирма ME-Geithain. Это модель RL901K, в которой используется специальная конструкция корпуса с регулируемым задним излучением, обеспечивающим кардиоидную характеристику направленности в диапазоне 30…300 Гц, что позволяет устанавливать мониторы вблизи стен и в углах помещения.

Наконец, фирма Klein+Himmel показала специальную систему мониторов для контроля записей для систем Surround Sound 5.1.

Особенностью европейских конвенций является участие в выставках довольно большого числа фирм, специализирующихся на измерительной технике. Это, прежде всего, знаменитая фирма B&K, которая на этой конвенции представила новый шумомер/анализатор Observer 2260 с очень широкими возможностями измерения и анализа параметров аудиосигналов в диапазоне частот 6,3 Гц…20 кГц, в том числе времени реверберации в помещении и др.

Фирмы Audio Precision, DK-Audio и др. представили аудиоанализаторы для многоканального звука (6 цифровых каналов), позволяющие проводить измерения гармонических и интермодуляционных искажений, импульсных характеристик, межканальных фазовых характеристик и др.

Даже фирма Dolby Lab, показавшая, как обычно, большое многообразие кодеров и декодеров разного применения, представила новый измеритель громкости-LM100.

Фирма Klippel продолжает развивать свое направление по созданию аппаратуры для измерения линейных и нелинейных искажений в громкоговорителях. Новинкой была установка Power Monitor8, позволяющая тестировать в реальном времени до восьми громкоговорителей одновременно.

Достаточно большое количество фирм представило новые процессоры по обработке звука с очень сложными алгоритмами. Например немецкая фирма DSPecialists показала новый эхоподавитель, распознаватель речи, новый адаптивный шумоподавитель и др.

Фирма DBX представила специальный процессор для управления параметрами громкоговорителей в системах звукоусиления в реальном времени.

Особый интерес вызвала демонстрация возможностей целого комплекса VoicePrismPlus (фирма TC Electronic - Helicon), обладающего огромными возможностями по обработке голоса. В их числе: изменение тембра, сдвиг высоты, коррекция исполнения отдельных нот и фраз, усиление формант, транспонирование в другую тональность, введение вибрато и других эффектов. При наличии таких приборов для выступлений на эстраде можно вообще не иметь голоса! Правда, надо иметь деньги...

Наконец, все известные фирмы, такие как Sony, Neve, Tascam, Yamaha и др., представляли свои цифровые микшерные пульты, в которых уже обычными стали параметры 24бит/96кгц, с числом каналов 64 и более.

Таким образом, конвенция в Мюнхене в очередной раз показала, что аудиотехника развивается очень быстрыми темпами, и в данный момент идет процесс перехода на цифровой пространственный звук во всех областях: телевидении, радиовещании, звукозаписи.

 

Замечания и предложения по работе сервера направляйте: web.master at 625-net.ru.

© 1996—2009 «Издательство 625». Все права защищены.

e-mail: magazine at 625-net.ru, тел./факс: (495) 691-7724, 695-9588.

Свидетельство о регистрации средства массовой информации Эл № 77-2794.