Одновременно работала специальная студенческая сессия, включающая в себя конкурс звукозаписей, стендовые доклады студентов, специальные учебные лекции и технические экскурсии. Я считаю, что наши студенты вполне могут принимать участие и в конкурсах и в стендовых докладах, для начала - заочно, поскольку победители имеют большой шанс получить стипендии на поездки.
 |
|
И.А.Алдошина и П.Брюль
|
>На конгрессе были продолжены традиции чтения лекций, посвященных памяти Хайзера. Но на этот раз была настоящая сенсация - для чтения лекции был приглашен легендарный Пьер Брюль! (см. фото) Думаю, что в России нет человека, который имел бы хоть какое-то отношение к звуку, и не слышал о микрофонах знаменитой фирмы Bruel & Kjaer. Несмотря на свои 87 лет, П. Брюль прочитал блестящую полуторачасовую лекцию "Акустика малых студий", о которой я постараюсь рассказать отдельно.
Кроме того, были организованы технические туры на фабрику по производству громкоговорителей Stage Accompany, студию звукозаписи Polyhymnia Recording Center, в Технический Университет в Эйндховене и в знаменитый Музей колоколов.
По моему впечатлению, от нескольких последних конгрессов, самые интересные доклады и сообщения делаются на семинарах, поскольку для участия в них приглашаются ведущие мировые специалисты в каждом направлении техники, а вот на технических сессиях, наряду с очень ценными докладами, попадаются иногда и средние. Однако, если все доклады на сессии издаются в электронном или печатном виде, то материалы, обсуждаемые на семинарах, не издаются и не записываются. При этом, к сожалению, теряется большой объем очень ценной информации.
Начну с семинаров. Всего их было проведено пятнадцать, о некоторых расскажу подробнее, о других коротко.
Первый назывался "Мифы в Аудио"-(W-1 Myths in Audio). Он проходил под руководством известнейшего ученого М. Хоуксворда (Университет Эссекс, Англия).Семинар был посвящен проблемам неразрешенных противоречий в технологии цифрового аудио, в частности, вопросам выбора частоты дискретизации, разрядности квантования, принципов построения выходных форматов. Эти вопросы чрезвычайно важны для дальнейшего развития цифрового звука (особенно в системах пространственного воспроизведения), поскольку в настоящее время передаваемая полоса частот, точность развертывания по амплитуде и др. уже превышают возможности человеческого слухового восприятия. Дальнейшее расширение их требует значительных материальных затрат, поэтому вопросы - где надо остановиться, в каких направлениях должны развиваться параметры цифровых систем - послужили основной базой для дискуссий многочисленных представителей науки и промышленности.
Второй семинар был посвящен новой для AES теме - "Звук в играх" (W-2 Sound for Games). Эта тема, которой AES в последние годы начал уделять существенное внимание в связи с тем, что в этой области развивается крупное направление индустрии. Цель этого семинара состояла в обсуждении таких важных вопросов, как художественное качество звукового сопровождения игр, применение различного программного обеспечения (компрессии данных, передачи форматов 5.1,передачи звука по сетям Интернет), установление связи между аудио и видео, а также вопросы восприятия звука в различных культурах.
Наиболее интересный, с моей точки зрения, семинар был посвящен теме "Эволюция пространственных систем звуковоспроизведения"(W-3 Evaluation of Spatial Sound Reproduction). Председателем этого семинара был Ф. Рамси - известный специалист, постоянно выступающий на всех конгрессах с очень глубокими докладами, автор многочисленных книг и статей. Кроме того, в семинаре принимали участие наиболее активно работающие в этом направлении специалисты Н. Захаров (Финляндия) и С. Бек (Дания).
По общему мнению специалистов, одной из главных научных задач в аудиотехнике на современном этапе является развитие психоакустических моделей для оценки качества звучания систем пространственного воспроизведения звука. Эта проблема требует выделения физических признаков, характеризующих пространственные параметры звукового поля в помещении, постановки экспериментов по установлению субъективных оценок восприятия пространственных признаков, их статистической обработки, установления значимых корреляционных связей с параметрами звукового поля, а также разработки рекомендаций для техники звукозаписи.
На семинаре было сделано шесть докладов, из них принципиально важный доклад С. Бека о разработке принципов организации субъективных экспертиз и создании общих аудиокогнитивных моделей восприятия звука. В развитие этих идей были сделаны сообщения:
- о выделении совместных аудиовизуальных признаков в оценке качества звучания (Н. Форд, Англия);
- о применении методов многомерного шкалирования при субъективной оценке качества звука, где были проанализированы уже применяющиеся методы CMDS, INDSAL, CCA, MDS;
- новая методология, учитывающая индивидуальные различия слушателей CLASCAL (В. Мартенс, Япония).
Наконец, был сделан доклад Николая Захарова, посвященный вопросам "понимания предпочтений слушателей в оценке восприятия пространственного звука". Анализ дискуссий на этом семинаре показывает, насколько важны эти проблемы для развития современной аудиотехники, и какое внимание уделяется им в ведущих мировых центрах (Англии, Дании, Японии и др.).
Субъективная оценка аудиосистем для транспорта была предметом обсуждения на семинаре W-4, которое включало в себя дискуссию об организации субъективных экспертиз для оценки качества звука в автомобилях (выбор и тренировка экспертов, отбор музыкальных отрывков и др.). Это особенно актуально, так как в данный момент идет разработка соответствующего стандарта (о котором постараюсь рассказать в дальнейшем более подробно).
Семинар W-5 под руководством У. Хорбаша (фирма Studer) был посвящен технологии синтеза звукового поля для групповых излучателей (звуковых колонок,кластеров и др.)с помощью цифровых процессоров, что позволяет контролировать и перестраивать их временные и частотные характеристики. Эта проблема актуальна для систем звукоусиления, систем домашнего театра, кино и др. На семинаре обсуждались дальнейшие перспективы развития таких систем.
Под руководством Й. Херре (Германия) был проведен первый семинар W-6 по обсуждению нового стандарта MPEG-7, который уже выходит из области аудиовизуального кодирования, и включает в себя эффективный поиск, отбор и семантическое описание передаваемого материала.
Одна из горячих проблем, которой были посвящены не только несколько докладов на конференции, но и специальное заседание технического комитета, и отдельный семинар W-7 под руководством известного ученого-психоакустика проф. E.Миясака (Япония), заключается в том, что возможности современного цифрового кодирования в формате 24 бита/96 кГц позволяют передавать звук с частотой, намного превышающей возможности человеческого слуха (20 кГц), и неясно, насколько дальше нужно расширять технические возможности аппаратуры.
Уже несколько лет под руководством проф. E.Миясака ведутся работы по оценке восприятия сверхвысоких частот. На этом семинаре обсуждались вопросы возможности попадания высокочастотных компонент в слышимый диапазон за счет интермодуляционных искажений (в громкоговорителях, микрофонах, при распространении по воздуху, в самой слуховой системе). Работы в этом направлении сейчас активно продолжаются, и, учитывая их экономическую значимость для дальнейшего развития цифровой аппаратуры, можно ожидать получения достаточно исчерпывающих результатов.
В современной технике DVD и SDMI широко используется специальная служебная информация (audio watermarking), "спрятанная" от слухового восприятия в аудиосигнале, и предназначенная, в том числе, и для защиты интеллектуальной собственности и авторских прав. На семинаре W-8 обсуждались различные методологии тестирования сигналов с этой дополнительной информацией, и ее влияние на качество звучания.
Семинар W-9 "Микрофоны и звукосниматели в цифровую эпоху" был организован достаточно любопытно. Дело в том, что одиннадцать лет тому назад, в Монтре, на 88-м конгрессе AES, был проведен семинар под точно таким же названием. Теперь руководители семинара (те же самые!), в котором участвовали представители ведущих микрофонных фирм (Neumann, Sennheiser и др.), решили обсудить, насколько поднятые тогда вопросы (цифровые микрофоны, соответствие микрофонов и микшеров, техника звукоснимателей, переходные искажения и качество звучания и др.) оказались актуальными в начале нового тысячелетия.
Наиболее ценную информацию, как мне кажется, удалось услышать на специальном семинаре W-10 "Объективные измерения качества звучания". Только ради одного этого семинара стоило побывать на Конгрессе! Открыл семинар обзорным докладом по проблеме в целом Й. Берендс (KPN Research, Голландия). В докладе были высказаны следующие идеи: в прошлом для оценки качества звучания аппаратуры использовались такие объективные характеристики, которые характеризовали инвариантность сигнала во временной и частотной областях: АЧХ, ФЧХ, КНИ, переходные искажения, отношения сигнал/шум и др.
Сейчас развитие техники цифровой обработки сигналов позволяет перейти на качественно другой уровень, и применить новые методы объективной оценки качества звучания, используя известные в психоакустике законы субъективного восприятия: маскирования, ассиметрии, сегрегации слуховых потоков, определение высоты по развернутым и неразвернутым гармоникам, распознавания образов с использованием нейронных сетей и др. (О некоторых из этих принципов можно прочитать в серии статей "Основы психоакустики", о других еще предстоит написать). Часть этих новых методов уже нашла отражение в стандартах: PEAQ ("Психоакустическая оценка качества аудиосигналов", стандарт ITU-R-BS.1387) и PESQ ("Психоакустическая оценка качества речи", стандарт ITU-T -P.862).
Следующим был доклад Б. Мура (Университет Кэмбридж, Англия). Мур - один из самых знаменитых ученых в области психоакустики, автор целого ряда книг и сотен статей. Его доклад назывался "Ограничения и неточности слуховых моделей, используемых для психоакустической оценки звучания". Многолетние исследования индивидуальных особенностей слуховой системы показали значительные разбросы целого ряда характеристик - например, АЧХ слухового канала имеет значительные вариации по форме, в частности, пик в области 2200…2400 Гц, связанный с резонансом слухового канала, имеет разброс по уровню до 15 дБ.
Кроме того, большое внимание было уделено вопросам нелинейной компрессии (которая проявляется сильно на средних уровнях сигнала), и нелинейной маскировки, а также проблемам межканального взаимодействия между различными слуховыми фильтрами. Все эти новые и достаточно тонкие результаты исследований еще не учитываются в психоакустических моделях, используемых для оценки качества звучания.
Подробный анализ используемых в настоящее время объективных методов измерений аудиоаппаратуры был представлен в докладе Р. Кабота (США). В нем было уделено большое внимание использованию многотоновых сигналов для оценки аппаратуры (этой проблеме было посвящено несколько докладов на этом и предыдущих конгрессах), что позволяет точнее оценить интермодуляционные искажения, и больше соответствует реальным музыкальным и речевым сигналам. В двух последних докладах достаточно подробно было рассказано о научных результатах психоакустических экспериментов, которые легли в основу разработки вышеуказанных стандартов по оценке аудиосигналов.
Проблемам аудиовизуального взаимодействия был посвящен специальный семинар W-11, руководителями которого были представители исследовательского центра NASA (США) и фирмы Philips. Учитывая, что решение этих проблем необходимо для развития современных систем мультимедиа во всех их приложениях - от игр до тренировки астронавтов - неудивительно, что лидерами в их исследовании являются такие крупные организации.
Очень большое внимание на этом конгрессе было уделено теме "Акустика малых помещений": был проведен специальный семинарW-12, а также вышеупомянутая специальная лекция г-на Брюля. Такое внимание к этому вопросу связано с тем, что в настоящее время широко внедряются многоканальные системы звуковоспроизведения (например 5.1 Dolby Digital), и оценка влияния акустики контрольных студийных помещений и жилых комнат на воспринимаемый характер звучания пространственных систем является очень актуальной.
Первой на семинаре была прочитана учебная лекция проф. Тичи (США), в которой были изложены классические основы акустики помещений. Профессор Тичи сказал, что этот материал он читает своим студентам - могу сказать, что нашим студентам читается примерно то же.
А вот следующим был большой доклад С. Бека о результатах работы по проекту "Архимед". (Это уже нашим студентам, к сожалению, не читается, поскольку таких работ в стране не ведется, а их результаты еще не опубликованы). Проект "Архимед" - это комплекс научных исследований, выполняемых в европейских странах, и его целью является оценка влияния различных отражений в малых помещениях на тембр и локализацию звука при многоканальном воспроизведении. В докладе были приведены уже полученные результаты, позволяющие оценить влияние на воспринимаемый тембр расположения громкоговорителей в комнате, роль уровней и направления первых отражений и др.
Знаменитый ученый Ричард Смолл (надеюсь, что все, кто занимается звуком, знают, что такое параметры Small-Thiele) сделал доклад на следующем семинаре W-13 "Методы измерения параметров громкоговорителей". В этом докладе он отметил, что модели низкочастотных оформлений акустических систем, использующие электромеханические аналогии и параметры Small-Thiele, позволяют достаточно точно рассчитать форму АЧХ в области низких частот на малых уровнях сигнала. Для больших уровней необходимо создание новых моделей, учитывающих сложный нелинейный характер изменения вышеуказанных параметров в зависимости от уровня сигнала. Докладчик определил направление дальнейших исследований, и предложил более точные эквивалентные схемы. В развитие этих идей были сделаны доклады Клиппеля (Германия), Кларка (США) и др., где предложены различные идентификационные модели для установления нелинейной зависимости параметров эквивалентных схем от уровня подводимого сигнала.
Наконец, последние два семинара (W-14 и W-15) были посвящены теме "Что такое метаданные и как можно их использовать?", а также проблемам разработки форматов для обмена данными между различными компьютерными платформами (стандарт AES31-3-1999).
Перейдем теперь к краткому анализу докладов, которые были сделаны на технических секциях. Компакт-диск с с текстами всех докладов (препринтами) я по установившейся традиции передам в редакцию, так что с заинтересовавшими докладами можно будет познакомиться подробнее. (Заказать копию диска можно будет в редакции, предварительно связавшись по телефону или эл. почте - прим. ред.)
 |
|
Рис.1. Пространственная система автомобиля
|
 |
|
Рис.2. Новый магнепланарный автомобильный громкоговоритель
|
На секции А "Автомобильный звук" было сделано семь докладов, в основном специалистами из Италии (под рук.проф. A. Фарина), работы которых финансируются фирмой Fiat. В настоящее время идет активное внедрение систем Surround Sound в салоны автомобилей - в одном из докладов (препринт 5286 "Мультимедиа в автомобиле") предлагалась уже система Logic7, т.е. с семью каналами воспроизведения (рисунок 1). Естественно, что актуальными являются проблемы разработки методов объективной и субъективной оценки этих систем - их обсуждению и было посвящено большинство докладов на этой секции(препринты 5281, 5283, 5284, 5287).
Интересная конструкция коаксиального излучателя с плоским магнепланарным громкоговорителем (рисунок 2) для автомобилей была представлена в докладе (препринт 5282). Авторы утверждают, что благодаря возможности управления характеристикой направленности излучателя можно добиться более точной локализации звукового образа в салоне.
На секции В "Техника измерений" рассматривалось применение современных измерительных систем на базе портативных компьютерных станций с использованием процессорной обработки для оценки многоканальных систем и систем бинауральной стереофонии в различных залах (препринты 5288, 5289), а также применение новых алгоритмов нелинейной оптимизации при измерениях в помещениях с реверберацией и высоким уровнем шумов (препринт 5290). Похоже, что дорогостоящие заглушенные камеры постепенно уходят в прошлое - техника процессорной обработки позволяет получать аналогичные результаты в обычных помещениях.
Чрезвычайно интересная информация была представлена в докладе Ф. Кенига (Германия) "Влияние электромагнитных полей стереотелефонов на здоровье человека" (препринт 5293). Учитывая, что звукорежиссеры проводят в стереотелефонах немалую часть своего времени, остановлюсь на результатах, представленных в этом докладе, более подробно.
Проблемой влияния слабых электромагнитных полей на биологические объекты соответствующие медицинские организации занимаются давно: в частности, американская Комиссия по защите от радиации (NCRP) рекомендовала допустимую норму для человека 200 нТ (наноТесла, единица магнитного потока). Эти нормы легли в основу стандартов для компьютерных мониторов. Авторы исследовали слабые магнитные поля более ста моделей стереотелефонов прижимного, охватывающего и вкладного типов лучших зарубежных фирм, используя розовый шум при подводимом уровне 70 дБ, и установили, что среднее значение магнитного потока составляет 1034 нТ, что явно превышает нормы. Такие результаты заставили авторов отметить необходимость более детальных работ по измерению этих величин на реальных сигналах разного уровня и при разной длительности воздействия, и введения соответствующих безопасных норм для стереотелефонов. Думаю, что такие работы чрезвычайно актуальны и для нас.
На секции "Низкоскоростное аудиокодирование" (Low-Bit Rate Audio Coding) под руководством профессора Марины Боузи (DTS, США) было сделано девять докладов (препринты 5294-5302), посвященных, в основном, проблемам совершенствования алгоритмов кодирования и декодирования сигналов с учетом психофизических моделей для передачи звука в соответствии со стандартами MPEG 1-4, что позволяет увеличить скорость обработки, повысить надежность передачи данных и уменьшить заметность искажении при сжатии звуковой информации.
На секции "Громкоговорители" (ceкции D и F) было сделано семнадцать докладов. Основное
внимание в докладах было уделено решению двух основных проблем: анализ и уменьшение нелинейных искажений во всех элементах акустических систем, и процессорное управление параметрами акустических систем с целью согласования их с акустикой помещения. Первым на секции был доклад Б. Злотогорского (Польша), посвященный сравнению нелинейных параметров низкочастотных оформлений акустических систем - закрытых, фазоинверсных и с пассивным излучателем. На базе Mathcad была создана программа, моделирующая их нелинейные характеристики, и рассчитаны амплитудная характеристика, нелинейные искажения и др. (к сожалению, к этому докладу не был представлен препринт). Принципам проектирования низкочастотных оформлений акустических систем типа "полосовой фильтр шестого и восьмого порядков" был посвящен также доклад проф. А. Добружского (Польша) (препринт 5325).
В докладах В. Клиппеля (Германия) (препринты 5310 и 5308) были представлены идентификационные модели линейных и нелинейных искажений в громкоговорителях, и разработана программа компьютерного моделирования (аурализации), позволяющая смоделировать различные виды искажений на тестовых и музыкальных сигналах и прослушать полученный результат. Эта система демонстрировалась фирмой Klippel & Co на выставке, и она является, по-моему, чрезвычайно полезным инструментом для разработчика - не зря ее закупила фирма JBL.
Пакет программ SSAVV (препринт 5318), позволяющий на основе метода электромеханических аналогий моделировать работу электродинамического громкоговорителя и акустической системы с несколькими низкочастотными динамиками, был продемонстрирован в докладе специалистов из Мадридского Университета.
Три доклада были посвящены задачам формирования и контроля электронными методами характеристик направленности в звуковых колонках (препринты 5304 и 5322).
 |
| Рис.3. Оптимизация характеристики направленности
полосового излучателя
|
Интересная конструкция многополосного электростатического громкоговорителя с управляемой характеристикой направленности была представлена специалистами из Хельсинкского университета (Финляндия, препринт 5306): каждая из 14 полос питается от отдельного источника. Подбирая по определенному алгоритму уровень сигнала на каждую полосу, можно формировать общую характеристику направленности (пример после оптимизации показан на рисунке 3). Несколько докладов было посвящено проблемам проектирования фильтрующе-корректирующих цепей (препринт 5321), в том числе доклад Невилла Тиле (из той самой пары Small и Thiele), посвященного оптимизации фазовых характеристик акустических систем - точнее, снижению величины ГВЗ (группового времени задержки) за счет оптимизации параметров фильтров.
Интересные результаты были представлены в докладе специалистов из Аальборгского университета (Дания, препринт 5323) по субъективным оценкам работы цифровых корректирующих процессоров при согласовании трехполосных акустических систем и акустики помещения. Были исследованы эффекты изменения параметров таких систем в реальном времени и проведены их субъективные оценки. Установлено, что применение корректирующих цифровых процессоров позволяет значительно улучшить качество звучания акустических систем даже в средних по параметрах помещениях.
"Пространственное восприятие и процессорная обработка звука" были темами специальной секции Е. Первым на ней был доклад проф. А.Чижевского и др. из Гданьского университета. Он очень активно работает, часто выступает на конгрессах, написал отличную книгу по цифровой обработке звука, которую подарил мне (к сожалению на польском языке - может быть, найдутся энтузиасты ее перевести?).
Еще один доклад назывался "Определение влияния визуальных признаков на восприятие пространственного звука" (препринт 5311). В нем была поставлена серия экспериментов по оценке связи между восприятием видеоинформации на экране и оценкой качества звука систем Surround Sound, в частности точности локализации звукового образа. Полученные результаты показывают количественную связь изменения точности локализации при наличии видеообраза или без него (образ на экране как бы "притягивает" звук).
Интересно было узнать из доклада С. Брикса и др. (Германия, препринт 5314), что существует общеевропейский проект CARROUSO, направленный на "создание, оценку и управление в реальном времени высококачественным аудиовизуальным пространством (3D-Audio) в контекстe MPEG-4". Задача проекта - разработать новые технологии для передачи звукового поля, создаваемого реальным или виртуальным пространством, в другое удаленное пространство. Этим же проблемам - формирования и передачи реального или виртуального звукового пространства - были посвящены доклады Ф. Рамси (Англия) и др. (препринты 5316 и 5317).
Очень полезные результаты были представлены в докладе уже упоминавшегося Н. Захарова из фирмы Nokia (препринт 5315), где исследовано влияние индивидуальных особенностей головы, формы ушной раковины и др. на характеристики направленности слуховой системы при восприятии громкости. Эти данные чрезвычайно важны для развития бинауральной стереофонии, а также создания различных видов адаптивных процессоров.
На секции G "Анализ и синтез звуков" было представлено девять докладов, три из них из Финляндии. Вообще докладов из различных университетов Финляндии на этом конгрессе было очень много, причем на очень современном уровне - можно только позавидовать возможностям научных учреждений этой небольшой страны. Один из этих докладов (препринт 5331) был на тему "Реставрация и улучшение инструментальных записей, основанных на моделировании звукового источника".
На примере ударных струнных тонов было показано, что предварительная информация об общих механизмах звукоизвлечения в данном источнике (инструменте) значительно облегчает процесс реставрации его записей. Уже на нескольких конгрессах докладываются результаты работ Ф. Чижевского и Б. Костек (Гданьский Университет) по теме "Автоматическое распознавание звуков музыкальных инструментов - дальнейшее развитие" (препринт 5334). В этом докладе сделана классификация существующих методов автоматической идентификации музыкальных инструментов, показаны пути дальнейшего развития этого направления.
Чрезвычайно интересный доклад (препринт 5328) был сделан Т. Джехан и Б. Шенер из MIT Media (один из самых известных центров по психоакустике, находящийся в Кембридже, США). Он посвящен созданию новой технологии и программного продукта, который в реальном времени моделирует и предсказывает тембр различных музыкальных инструментов, основываясь на психоакустических моделях слуха. Кроме того, демонстрировалась возможность синтеза различных струнных инструментов и певческого голоса, а также возможность кросс-синтеза и создания их объединенных тембров (это процесс, по аналогии с видео, получил название morphing).
(Продолжение следует)