109-й конгресс AES - Surrounded by Sound.
Часть 1
Ирина Алдошина
Очередной 109 конгресс AES в Лос-Анжелесе, который проходил с 21
по 26 сентября, был организован под девизом Surrounded by Sound,
что дословно можно перевести как "окруженные звуком". Как следует
из послания к конгрессу Президента AES Давида Робинсона, это отражает
современный этап развития мировой аудиотехники - переход от стереофонии
к многоканальному звуку (рисунок 1)
Организация конгресса поражает своим масштабом: общее число посетителей
достигло почти восемнадцати тысяч человек, число фирм-участников
выставки составило 416. За всю более чем пятидесятилетнюю историю
AES это был самый крупный форум, собравший научную и производственную
элиту мировой аудиотехники. Председателями 109-го Конгресса были
Рой Приттс и Рон Штрайхер. (Рой Приттс - профессор Денверского Университета,
неоднократно приезжал в Санкт-Петербург и Москву).
Торжественное открытие конгресса включало: приветственную речь
знаменитого музыканта и композитора Херби Хенкока - обладателя семи
премий Grammy; церемонию награждения членов AES за выдающиеся научные
и организационные успехи; концерт джаз-оркестра Военно-Воздушных
Сил США.
Наряду с огромной выставкой, на конгрессе работали 16 научных секций,
на которых было представлено более 100 докладов; 14 семинаров по
актуальным вопросам развития аудиотехники; прошли заседания 14 технических
комитетов, а также заседания 6 комитетов (26 рабочих групп) по разработке
стандартов.
Кроме того, на конгрессе был организован целый ряд специальных
мероприятий. Это технические экскурсии на крупнейшую корпорацию
Harman International, производящую акустические системы; в Институт
Слуха; на телевизионную студию NBC Studio (телевидение высокой четкости
и многоканального звука); в Staples-центр, недавно построенный спортивно-концертный
комплекс с современной системой озвучивания; на фабрику по производству
кабелей для аудиоаппаратуры Whitmor Wirenetics, а также на знаменитую
телекиностудию The Village, основанную еще в 20-е годы.
На конгрессе прошла специальная выставка "Когда правил винил",
на которой были представлены действующие образцы аудиоаппаратуры
50-60-х годов.
Состоялась мемориальная лекция, посвященная памяти выдающегося
ученого Р. Хайзера.
На лекциях известные специалисты делали обзоры и прогнозы развития
аудиотехники. Профессор Алан Кей прочитал лекцию на тему "Компьютерная
революция в аудио еще не завершена". Анализ этой лекции и аналогичной
лекции на предыдущем конгрессе на тему "Аудио в новом тысячелетии"
я представлю позже.
На 109-м конгрессе прошла встреча-дискуссия "Карьера женщин в аудиоиндустрии",
в которой принимали участие женщины, сделавшие успешную карьеру:
Марина Бози, профессор Станфордского университета, Келли Кабрал
- продюсер из Голливуда и др. На этой встрече и я попыталась рассказать
о российских примерах успешной карьеры женщин в аудио, хотя таких
примеров не так много.
На конгрессе состоялось несколько специальных семинаров и дискуссий,
посвященных проблемам работы продюсеров звукозаписи и их взаимоотношений
с артистами, в которых приняли участие знаменитые продюсеры такие
как Эл Шмитт, Джек Дуглас, Джордж Массенбург, Гленн Джонс и др,
а также артисты-обладатели платиновых дисков.
Впервые в мире была организована передача по сетям Интернет-2 видеоизображения
и многоканального звука с параметрами 24 бита/96 кГц в форматах
PCM и MPEG AAC между Университетом МакГилла в Монреале и Университетом
Южной Калифорнии в Лос-Анжелесе, где была устроена техническая презентация
новой технологии передачи данных, и обсуждены ее потенциальные возможности.
Прошел специальный семинар, посвященный проблемам профессионального
риска музыкантов и звукоинженеров при работе с высокими уровнями
громкости, связанного с ухудшением и потерей слуха. В нем приняли
участие специалисты из различных институтов США и Канады, занимающиеся
этой проблемой. Были представлены современные средства защиты слуховой
системы, а Институтом слуха также продемонстрирована автоматизированная
система контроля, на которой могли снять свои аудиограммы все присутствующие.
Был осуществлен большой комплекс мероприятий для студентов (этому
направлению работы AES уделяет особенно большое внимание): ассамблея
студенческих делегаций, конкурс студенческих работ по звукозаписи,
выставка образовательных программ, заседание комитета преподавателей
и студентов, форум по обсуждению возможностей получения работы,
предусматривающий встречи и предложения представителей аудиобизнеса.
Состоялось также заседание специального Комитета SPARS, объединяющего
менеджеров и владельцев крупнейших студий звукозаписи. Комитет предоставляет
возможности для сдачи специального экзамена с последующим отбором
для работы на этих студиях.
Работа AES со студентами заслуживает отдельного разговора, поскольку
может предоставлять значительные возможности и для студентов российских
ВУЗов.
Принять участие во всех этих мероприятиях, семинарах, секциях,
комитетах и выставке одному человеку невозможно, а представителей
от России встретить не удалось, за исключением многих наших бывших
специалистов, работающих сейчас на различных фирмах в Америке. Поэтому
постараюсь изложить свои субъективные впечатления от отдельных мероприятий
и, прежде всего, от работы научных секций и семинаров.
На шестнадцати секциях конгресса было сделано 110 докладов в основном
специалистами из США (35докладов), Германии, Дании и Англии (по
10 докладов), Японии, Франции, Канады и др. Из России докладов на
этом конгрессе, к сожалению, не было ни одного.
Тематика секций была следующая: цифровая обработка сигналов (2
секции), громкоговорители (2 секции), микрофоны, аналоговая обработка
сигналов, акустика помещений, многоканальный звук, звук в компьютерных
сетях, звукозапись и звуковоспроизведение, инструментарий и измерения,
автомобильный звук, низкоскоростное кодирование (Low Bit-Rate Coding)
(2 ceкции), восприятие и психоакустика (2 секции).
Основное внимание было уделено проблемам кодирования, передачи
и воспроизведения пространственного звука, механизмам восприятия
звука слуховой системой (т.е. проблемам расшифровки звукового образа),
новым методам измерений и субъективных оценок систем пространственного
звука, анализу нелинейных процессов в электроакустических преобразователях,
проблемам передачи высококачественного пространственного звука по
сетям Интернет и др.
На секции "Восприятие и психоакустика" особо необходимо отметить
обзорный доклад "Перцептуальная реконструкция звукового поля" (США-Великобритания),
посвященный эволюции систем пространственной передачи. От стереосистем,
где по двум каналам передается частичная информация о расположенном
во фронтальной плоскости перед слушателями первичном окружающем
звуковом пространстве, развитие пришло к бинауральным системам,
т.е. передаче по двум каналам записей, выполненных на "искусственной
голове, и системам аурализации. Эти системы позволяют воссоздать
с помощью адаптивных процессоров подавления отраженных сигналов
и с использованием передаточных функций головы пространственное
звучание через телефоны или акустические системы. Однако общей проблемой
во всех этих системах является необходимость фиксации положения
слушателя в пространстве или использования стереотелефонов с коррекцией
передаточных функций и учетом индивидуальных особенностей.
Альтернативной техникой могло бы быть развитие многоканальной передачи,
однако для полной передачи звукового пространства потребовались
бы не менее тысячи каналов и расположение излучателей по поверхности
сферы вокруг головы слушателя, что в данное время является нереализуемой
задачей. Поэтому основные усилия направлены на развитие двухканальных
систем передачи звуковой информации, - как с учетом передаточных
функций головы, так и специальных систем кодирования и декодирования
двухканальной информации (например, формат 5.1).
На этой и других секциях было представлено много докладов, посвященных
проблемам совершенствования алгоритмов и способам их реализации:
например, доклад "Улучшение алгоритмов подавления перекрестных связей
за счет использования психоакустического частотного маскирования"
(Сингапур), "Коррекция пространственного звукового образа с использованием
процессорной технологии в реальном времени" (Сингапур), "Стабильность
акустического подавления перекрестных связей как функция частоты
и расположения громкоговорителей" (Мексика-Испания), "Система пространственного
воссоздания звука с учетом движения головы слушателя" (США) и др.
Важное значение для проблемы расшифровки "слухового образа" имеют
представленные на этой секции доклады "Психоакустические модели
и нелинейные свойства слуха" (Англия), где количественно оцениваются
нелинейные искажения, возникающие в слуховой системе, и предлагаются
методы предсказания слуховых искажений при больших уровнях сигнала,
и "Пространственная структура акустических полей вокруг ушной раковины"
(Англия), где используются численные методы для расчета структуры
звукового поля вокруг ушной раковины, что имеет очень важное значение
для локализации и пространственного восприятия звукового образа.
Разработке техники субъективной оценки пространственных систем
звуковоспроизведения были посвящены доклады английских специалистов.
Нужно отметить, что вопросы обработки звука с учетом психоакустических
требований обсуждались и на других секциях.
Так, на секции "Громкоговорители" был прочитан большой доклад известного
специалиста Ф. Туле "Акустика и психоакустика громкоговорителей
и помещений - стереофоническое прошлое и многоканальное будущее",
где были сформулированы основные задачи аудиоиндустрии на этапе
перехода к многоканальным системам записи и воспроизведения.
Из докладов, представленных на этой секции, можно отметить "Проектирование
студийных контрольных агрегатов с использованием техники цифровой
коррекции искажений" (Швейцария), "Оценка основных параметров субвуферов
и их влияние на качество звучания" (Дания).
Интересную информацию о разработке сверхвысокочастотного громкоговорителя
для DVD-аудио, имеющего плоскую характеристику в диапазоне 10…100
кГц, представили в докладе специалисты фирмы Matsushita (Япония).
На этой секции в двух стендовых докладах (Англия и США) рассматривалось
применение техники конечных элементов к расчету структуры распределенных
мод колебаний на поверхности диафрагм громкоговорителей и создаваемых
ими звуковых полей. Подробный анализ причин возникновения и методов
измерения интермодуляционных искажений в громкоговорителях был выполнен
в докладе известных специалистов из Канады.
Вопросам оценки нелинейных искажений в электроакустических преобразователях
был посвящен ряд докладов на секции "Инструментарий и метрология".
Прежде всего, необходимо отметить доклад В. Клиппеля (Германия),
в котором дано описание установки с использованием лазерной интерферометрии,
позволяющей производить измерения параметров громкоговорителей при
больших смещениях в динамическом режиме, а также приведено описание
пакета программ по идентификации основных видов нелинейности в громкоговорителях.
Новые методы измерений нелинейных искажений в преобразователях
с помощью специальных видов мультитоновых сигналов были рассмотрены
в докладах Александра Войшвилло, работающего ныне на фирме Cervin-Vega.
Результаты измерений передаточных функций на искусственной голове
с высоким угловым разрешением (почти 12 тысяч направлений) были
представлены в докладе специалистов из Дании.
На секции "Акустика помещений" можно отметить доклад представителей
Dolby Labs "Влияние акустики помещений на параметры и установку
субвуферов", а также ряд докладов по архитектурному дизайну студий
для многоканальных записей (Япония, Германия).
На секции "Многоканальный звук" были представлены доклады по технологии
микширования многоканального пространственного звука (Израиль),
по новым алгоритмам кодирования высококачественного многоканального
звука, обеспечивающим лучшее соотношение сигнал/шум (США), и др.
Особый интерес представило сообщение японских исследователей "Интерактивное
многоканальное воспроизведение звука, связанное с VRML-графикой".
В этой системе многоканальный звук передается вместе с графической
информацией о форме и размерах помещения. В приемнике звуковая информация
декодируется вместе с графической, а воспроизводимый звук автоматически
изменяется в реальном времени, если слушатель меняет свою позицию
в помещении. Синхронизация изображения и звука дает ощущение объемной
реальности.
Большое внимание было уделено на этом конгрессе проблемам звука
в автомобиле. На секции "Автомобильный звук" был представлен обзорный
доклад "Дизайн автомобильного звука", в котором рассмотрены проблемы
формирования акустического поля в салоне автомобиля, размещение
громкоговорителей и усилителей, их настройка и контроль. Два доклада
итальянских исследователей были посвящены вопросам разработки специальных
алгоритмов и процессорных устройств (проект APLODSP) для коррекции
структуры звукового поля в салоне автомобиля.
На секции "Звукозапись и звуковоспроизведение" можно отметить доклады,
посвященные описанию новых алгоритмов по подавлению шумов "Новый
алгоритм шумоподавления, использующий очень малую систему микрофонов"
(Германия) и проектированию новой конструкции искусственной головы
Valdemar для бинауральных звукозаписей (Дания).
На секции "Микрофоны" было представлено четыре доклада, из них
очень интересный доклад, посвященный технике визуализации пространственных
характеристик направленности микрофонов (Дания).
Большое количество докладов было представлено на секциях "Цифровая
обработка сигналов" - 14 докладов, "Низкоскоростное кодирование"
- 12 докладов, и "Обработка аналоговых сигналов" - 7 докладов. Так,
специалистами из Ганновера (Германия) был представлен доклад "Параметрическое
аудиодекодирование по стандарту MPEG-4 с уменьшенной сложностью",
в котором рассматривались различные приближения, позволяющие уменьшить
сложность компьютерного декодирования при сохранении качества аудиосигнала.
В докладе "Метод ортогональной обработки амплитудной и фазовой
характеристик сигнала в процессе субъективных экспертиз" предложен
метод независимого управления амплитудными и фазовыми характеристиками
источников звука для субъективных тестов. Проблемам адаптивной обработки
бинауральных сигналов для двух слушателей и четырех громкоговорителей
(в т.ч. подавлению перекрестных связей) был посвящен доклад специалистов
из Калифорнийского Университета. Следует отметить, что до настоящего
времени решение этой задачи было получено для одного слушателя,
находящегося в фиксированном положении.
Ряд докладов был посвящен новым технологиям цифрового синтеза музыкальных
сигналов.
В докладе Д. Вандеркоя и М. Липшица "Почему профессиональное однобитовое
сигма-дельта преобразование - плохая идея" утверждается, что аудиоиндустрия
совершит трагическую ошибку, если вместо многобитного линейного
PCM примет как формат для архивации однобитовое сигма-дельта преобразование,
из-за принципиально присущих ему искажений. (Необходимо отметить,
что упомянутые специалисты работают в фирме, конкурирующей с разработавшей
однобитный формат DSD, и их заявления могут иметь коммерческую подоплеку
- прим. ред.)
Проблемам совершенствования алгоритмов перцептуальной компрессии
аудиосигналов, используемых в стандартах MPEG-2/4, было посвящено
несколько докладов немецких ученых. Наконец, два доклада были посвящены
разработке нового стандарта ITU-T P.862 по объективной оценке качества
речи с использованием новой перцептуальной модели PECQ. Этот стандарт
предполагается использовать при оценке качества речевых кодеров
и качества передачи речи по телефонным сетям.
Учитывая большой интерес к проблемам передачи аудиоданных по компьютерным
сетям, на конгрессе была организована специальная секция "Звук в
компьютерных сетях", на которой было представлено пять докладов,
посвященных вопросам управления аудиосигналами в сетях CobraNet
и EtherNet, передаче в цифровом аудиосигнале контекст-ориентированной
информации (любого рода данные, относящиеся к сигналу: ноты, текст
и др), способам ее кодирования и декодирования, применению стандарта
IEEE-1394 Firewire к архитектуре построения аудиосистем в компьютерных
сетях и др.
Одновременно с работой технических секций на Конгрессе проходили
заседания технических комитетов. Начиная с 1979 года техническую
политику Общества определяет Технический Совет (в настоящее время
его возглавляет Веслав Войчик) и подчиняющиеся ему комитеты по основным
направлениям аудиотехники, в задачу которых входит определение основных
направлений технической и научной политики Общества, рекомендации
к публикации различных статей, книг, сборников и т.д., связь с Комитетами
по стандартам, проведение семинаров по наиболее актуальным проблемам,
связь с другими обществами.
На 109-м конгрессе работало 12 Технических комитетов по следующим
направлениям:
- многоканальные и бинауральные аудиотехнологии,
- Кодирование аудиосигналов;
- Аудиосистемы для компьютерных сетей;
- Восприятие и субьективная оценка сигналов;
- Оптическая звукозапись;
- Микрофоны и их применение;
- Громкоговорители и телефоны;
- Сигнальные процессоры;
- Передача и вещание;
- Акустика и звукоусиление;
- Студийная запись и производство;
- Архивирование, реставрация и цифровые библиотеки.
В состав комитетов входят на добровольной основе ведущие специалисты
из всех стран мира, если у них есть идеи, предложения и возможность
принимать реальное участие в работе. Такие возможности, теоретически,
есть и у российских специалистов-членов AES.
Работа
с виртуальным микшерным пультом
Поскольку я принимала участие в работе комитета "Восприятие и субъективная
оценка", остановлюсь на его работе подробнее.
Основные направления исследований в этом комитете: психоакустика,
оценка систем звукозаписи и звуковоспроизведения, психометрия. На
109-м Конгрессе комитетом были организованы семинары, в частности,
чрезвычайно интересный семинар "Аудиовизуальное взаимодействие"
под руководством Д. Беголта (исследовательский центр NASA, США),
на котором собралось много профессионалов, занимающихся этими проблемами.
На семинаре был сделан ряд сообщений, происходила оживленная дискуссия
по вопросам общности и различия восприятия образа, звука и движения,
методологии их исследования и возможностям практического применения
в современных системах мультимедиа, телеконференций, виртуальной
реальности, играх и т. д.
Кроме того, этим же комитетом был подготовлен семинар "Перцептуальное
кодирование - что мы слышим?" (под руководством М. Эрне, Федеральный
институт технологий, Швейцария), на котором отмечалось, что, как
показала практика, в современных системах сжатия, использующих сложные
психоакустические алгоритмы, нередко возникают искажения, отличающиеся
от традиционных и не идентифицируемые слушателями. Предполагается
провести работу по подготовке звукового материала с такого рода
искажениями, и дать обьяснение причин их возникновения.
Комитет предполагает подготовить целый ряд семинаров на следующих
конгрессах, в том числе учебную серию "Психоакустические основы
деятельности звукорежиссера". Наряду с подготовкой и проведением
семинаров, ведется подготовка публикаций (статей, монографий,WEB-страниц,
компакт-дисков и др). В частности, в процессе подготовки находится
антология "Восприятие и субъективная оценка звукозаписей", подготовлена
серия компакт-дисков с демонстрацией различных слуховых явлений,
книг по психоакустике и др. Кроме того, 22…24 июня 2001 года в Баварии
предполагается проведение специальной конференции AES "Восприятие
многоканального и бинаурального звука".
Интерфейс
виртуального микшерного пульта
Аналогичная работа проводится и другими комитетами: их объединенными
усилиями на Конгрессе было организовано проведение 14 семинаров.
Кроме уже упомянутых, были проведены семинары: "Акустика малых помещений",
"Разборчивость речи в системах звукоусиления", "Микрофоны", "Нетрадиционные
излучатели", "Цифровые библиотеки, сохранение и метаданные", "Мастеринг
для Интернет", "Многоканальная аудиопродукция для DVD" ,"Аудио высокого
разрешения" и др.
Особого разговора заслуживает работа комитетов по стандартам, которыми
в настоящее время ведется подготовка очень важных для развития аудиотехники
документов, но об этом, а также о впечатлениях от огромной выставки,
расскажу во второй части этой статьи.
Хочу только выделить один экспонат, который на меня произвел сильное
впечатление: Калифорнийский Институт звукозаписи представил "Виртуальный
микшерный пульт" - реализованный программно микшер, который позволяет
управлять параметрами звука (балансом, громкостью, панорамой и др.),
наблюдая все это в визуальном трехмерном пространстве. Некоторое
представление об этом могут дать рисунки (рис.2-5). Кроме этого,
к нему прилагается учебник "Искусство микширования" - визуальное
руководство ко всем операциям, которые выполняются в процессе микширования.
Как и на предыдущем Конгрессе, вице-президент AES Рой Приттс передал
нашей секции CD-ROM с полными текстами докладов, представленных
на 109-м Конгрессе. Копия этого диска в ближайшее время будет передана
в редакцию журнала. (Продолжение следует)