| |
114 конвенция AES в Амстердаме. Научные результаты, часть 2
Ирина Алдошина
В первой части этой статьи уже было рассказано о работе ряда секций 114 конвенции AES, о работе учебных семинаров, о студенческих секциях и о лекции Блауерта. Эта лекция опубликована в Интернете, и, учитывая необычные и нестандартные идеи, которые он в ней высказал, я расскажу о ней более подробно в дальнейшем. В этой части статьи продолжу рассказ о работе других секций, семинаров и о некоторых результатах выставки.
Очень представительной, как по составу участников, так и по уровню докладов, была секция "Пространственное восприятие и процессорная обработка". На секции было представлено 11 док-ладов (интересно отметить, что это были доклады только от европейских стран: Англии, Германии, Франции) и председателем секции был Г. Тиле (IRT, Institut fur Rundfunktechnik, Мюнхен). Этот институт и сам г-н Тиле были основными создателями системы цифрового вещания DAB "Эврика".
Первый доклад на этой секции был посвящен проблеме "Изучение формы и ширины звукового источника в реальном и виртуальном звуковом пространстве" (пр. 5766). Используемые в настоящее время в стандартах MPEG-4 алгоритмы могут описать точечный источник и его движение, но не могут описать звуковые источники, имеющие пространственную протяженность (хор, например). В докладе предложено уточнить основной алгоритм Audio BIFS c целью введения учета вертикальной и горизонтальной ширины источника. Субъективные экспертизы подтвердили эффективность этих предложений, которые должны быть добавлены в стандарты MPEG-4.
Известный специалист в области психоакустики Ф. Рамси и его коллеги из Англии представили доклад (пр. 5769), где была описана методика тренировки слушателей для оценки пространственных характеристик звукового поля. Учитывая, что сейчас происходит переход на пространственные системы записи и воспроизведения звука, предложенная методика является очень актуальной.
Продолжаются работы по бинауральной стереофонии: в докладе "Новое приближение в детектировании атаки звука в бинауральных потоках" (Англия, пр. 5767) предложен новый цифровой детектор выделения основных признаков сигнала в период его атаки, то есть в первые несколько миллисекунд, что позволяет выделить важные пространственные признаки сигнала и идентифицировать его.
В докладе японских специалистов (пр. 5770) предложен новый алгоритм для учета движения источника - это очень важная проблема, решение которой необходимо для внедрения бинауральной стереофонии, поскольку, как известно, бинауральный эффект при воспроизведении через громкоговорители реализуется в очень ограниченной зоне. Новые алгоритмы, позволяющие расширить эти зоны, а также учесть движение источника, являются очень актуальными.
Создание методов контроля и субъективной оценки междуушных кросскорреляционных коэффициентов при воспроизведении бинауральных записей явилось темой следующего доклада специалистов из Англии (пр. 5771).
В докладах, сделанных на втором заседании этой секции, также основное внимание было уделено проблемам бинауральной стереофонии. Доклад "Изучение влияния формы головы на передаточные функции на низких частотах" (Англия, пр. 5787) был посвящен важному практическому вопросу, так как известно, что для бинауральной стереофонии необходимо использовать записи на "искусственной голове", которая является достаточно дорогим прибором и выпускается в небольших количествах. В докладе были представлены результаты работ по оценке влияния формы головы, формы ушных раковин и др. на погрешности в определении передаточных функций, что позволит решить вопрос допустимого упрощения этого устройства.
В связи с развитием систем аурализации ("Звукорежиссер", 7/2000) вопросы точности воссоздания трехмерных моделей звукового поля с учетом бинауральных передаточных функций являются очень актуальными, этой проблемой уже на протяжении ряда лет занимается научный отдел France Telecom, специалисты которого и представили результаты своих работ (пр. 5789).
Эти же специалисты провели анализ достоинств и недостатков воссоздания трехмерного звукового поля в технике Ambisonic и "волновой синтез" - хотя "идеологически" это разные методики, но во многих случаях они дают близкие результаты (пр. 5788). Новый способ процессорного управления трехмерной структурой звукового поля Arkamys, позволяющий значительно улучшить качество воспроизведения бинауральных, стерео- и пространственных записей был представлен в докладе французских специалистов (пр. 5790).
По существу аналогичным проблемам, то есть качеству пространственных систем записи и воспроизведения, была посвящена и следующая секция "Многоканальный звук" под руководством председателя технического комитета AES В. Войчика (Университет McGill, Канада). Здесь можно выделить два доклада.
Доклад известных и очень часто выступающих на всех конвенциях AES специалистов Ф. Рамси и С. Бека (пр. 5802), был посвящен вопросам влияния ограничений воспроизводимого диапазона частот на субъективную оценку качества бытовых пространственных систем в формате 5.1. Было установлено, что при таком ограничении слушатели сильнее замечают изменение тембра, чем изменение пространственных характеристик.
Второй доклад канадских специалистов (пр. 5803) был посвящен проблеме четкого определения границ ранних и поздних отражений в помещении - эта граница приближенно считается равной 80 мс. Поскольку эти два вида искажений по-разному влияют на воспринимаемое качество звучания в помещении, то была поставлена серия экспериментов, позволяющая установить эту границу для разных условий прослушивания.
Два доклада на этой секции были посвящены применению алгоритмов "волнового синтеза" WFS для воспроизведения речи и улучшения ее разборчивости во время видеоконференций (пр. 5800 и 5801).
Проблемам трансформации систем пространственного воспроизведения Ambiophonic и Ambiosonic в современные системы пространственного воспроизведения 5.1 по стандарту ITU был посвящен доклад Р. Миллера (пр. 5799, США).
Следующая секция "Анализ и синтез звука" (восемь докладов) была посвящена вопросам автоматического распознавания музыкальных инструментов и создания компьютерных музыкальных композиций. Можно отметить очень серьезный доклад по этому направлению "Использование физиологической модели уха для автоматического распознавания источника и мелодии" (Германия, пр. 5807), в котором была представлена новая компьютерная модель периферической слуховой системы, включая обработку сигнала внутренними волосковыми клетками, и специальные алгоритмы распознавания источников и обработки мелодий.
В двух докладах представлены результаты работ по автоматическому распознавания нетональных (ударных) музыкальных инструментов (пр. 5806 и 5808). Наконец, проблемам распознавания и выделения отдельных мелодических линий в многоголосных музыкальных сигналах был посвящен доклад испанских специалистов (пр. 5811). Интересно, что алгоритмы, использующие расчет центроидов и автокорреляционной функции, позволяют корректно классифицировать большинство многоголосных музыкальных сигналов.
Новый алгоритм временного субполосного нелинейного шкалирования для распознавания музыкальных источников по их атаке был представлен в докладе английских специалистов (пр. 5812).
Результаты всех этих работ в определенной степени вносятся в новое поколение стандартов MPEG-7 (пр. 5810), и создают базу для автоматизации значительной части операций в процессе микширования звука.
 |
Выступление И.А. Алдошиной с докладом на конгрессе
|
На секции "Акустика записи и воспроизведения" наряду с другими докладами, посвященными анализу и синтезу звуков различных музыкальных инструментов, был представлен наш доклад совместно с коллегами из Института истории искусств и Санкт-Петербургского Университета, посвященный акустике русских колоколов (пр. 5794)
Одной из самых многочисленных (23 доклада) была секция "Процессорная обработка звука". Ее возглавлял П. Исти, руководитель лаборатории Sony Broadcast, расположенной в Оксфорде, Англия. (Японские фирмы давно ведут политику экспансии, скупая целые европейские фирмы вместе со специалистами).
Несколько докладов было посвящено применению сравнительно новой техники представления сигналов в пространстве wavelets (теперь уже и в отечественной технической литературе начало использоваться это слово в русском написании "вейфлет") для шумоподавления, компрессии и других видов преобразования (пр. 5829 и 5849).
Фирма Philips представила несколько докладов, посвященных новой технологии DEM при создании АЦП и ЦАП для аппаратуры Hi-Fi (пр. 5846 и 5823), обладающих большой линейностью (КНИ <-115 дБ) и хорошим отношением "сигнал/шум" (>119 дБ).
Очень полезный доклад был представлен А. Брайтом (фирма Nokia) "Дискретная модель громкоговорителя" (пр. 5847). В нем была изложена разработанная теория дискретно-временной модели громкоговорителя, и показано применение ее для идентификации параметров громкоговорителей, компенсации нелинейных искажений в них и эквализации их характеристик.
В докладе "Частотно-временной анализ, моделирование и эквализация импульсной характеристики помещения" (Греция, пр. 5826) представлена новая техника, обеспечивающая точное моделирование ранних отражений, и показано применение ее для разных помещений. Аналогичной проблеме был посвящен еще один доклад греческих специалистов (пр. 5779).
Наконец, единственный доклад специалистов из Индии (пр. 5777) был посвящен проблеме автоматического выделения изменения высоты голоса (мелодии) из многоголосного сопровождения, в частности сопровождения перкуссионных инструментов. Алгоритм основан на новых психоакустических моделях слухового восприятия (как видите, даже в Индии занимаются этими проблемами на современном уровне, - а где у нас?!).
На секции, посвященной передаче звука по компьютерным сетям, можно выделить два доклада: первый (пр. 5780) был посвящен созданию системы NARE - новой среды для обмена музыкальными программами по сетям в реальном времени. В настоящее время уже появилась практика исполнения произведений через компьютерные сети музыкантами, находящимися в разных точках пространства.
Второй доклад (пр. 5783) был посвящен также очень актуальной проблеме создания новых алгоритмов эхоподавления. Эта проблема актуальна, прежде всего, для передачи звука в помещениях, для создания компьютерных моделей аурализации и для измерительных систем без использования безэховых камер.
Несколько стендовых докладов в рамках этой сессии было посвящено созданию новых алгоритмов для улучшения передачи трехмерного звукового поля в рамках стандартов MPEG-4, а также очень любопытный доклад специалистов из Политехнического института в Португалии (пр. 5817) о создании нового алгоритма (утилита VotA), позволяющего моделировать на компьютере пение хора (если в него введен текст и задана мелодия) через любое MIDI-устройство.
Наконец, на последней секции "Низкобитовое кодирование", которой руководила профессор М. Бози, основные доклады представителей фирм Philips, Dolby и др. были посвящены проблемам создания новых аудиокодеров с низкой скоростью передачи данных для высококачественного трехмерного звука в рамках стандартов MPEG-4.
Кроме научных секций, на конвенции работало тринадцать обычных семинаров (о специальных учебных семинарах уже было сказано в первой части статьи). В семинаре "Многоканальный звук. Новые творческие возможности" участвовали звукорежиссеры из разных европейских стран, они обсуждали в основном творческие возможности эстетического и эмоционального воздействия на слушателей, которые обеспечивают новые технологии записи, передачи и воспроизведения пространственного звука.
Под руководством такого известного специалиста, как В. Беголт (NASA, США) был проведен семинар "Электронная реверберация для концертных залов". Со времени первого масштабного применения систем искусственной реверберации в 60-е годы (в Большом Кремлевском дворце и Royal Festival Hall в Лондоне) произошли большие изменения: во-первых, появились большие возможности за счет современной процессорной обработки звука; во-вторых, получено много новых результатов в психоакустических исследованиях по субъективному восприятию реверберации. Участники семинара обсудили пути дальнейшего развития таких систем, опираясь, прежде всего, на дальнейшее углубление в понимании процессов восприятия отдельных стадий реверберационного процесса.
Следующий семинар был посвящен проблеме "Корреляция между субъективными и объективными измерениями в автомобильных звуковых системах". В развитие автомобильных аудиосистем вкладываются значительные средства, над ними работают большие научные центры (например, крупный центр в Милане, руководитель профессор Фарина). Поэтому вопросы разработки методов объективной оценки их параметров и установление связи с субъективными оценками их качества привлекают большое внимание - на всех конгрессах этим вопросам было посвящено несколько докладов. На семинаре обсуждались текущее состояние этих вопросов и пути их дальнейшего развития.
Семинар "Акустика больших залов - проблемы их изучения" начался с большого обзорного доклада М. Баррона о специфических особенностях структуры звуковых полей в больших помещениях, которые характеризуются высокой степенью диффузности поля, наличием плотной структуры резонансных частот, большим временем реверберации, трудностью обеспечения всех зрительских мест ранними отражениями и недостаточным уровнем звукового давления на всей площади зала. Кроме того, были проанализированы известные в настоящее время субъективные критерии оценки залов и их связь с объективными характеристиками для больших залов.
Следующий доклад П. Маппа был посвящен вопросам оценки разборчивости речи в больших помещениях (театрах, соборах, стадионах и пр.). В нем были представлены результаты измерений в различных помещениях таких критериев для оценки разборчивости, как STI, %ALCon и др., и выделены факторы, оказывающие наибольшее влияние при построении систем звукоусиления в них.
Еще один доклад В. Беголта был посвящен проблемам измерений и аурализации в больших залах с учетом движения источника.
Наконец, доклад Дж. Брауна назывался "Стереосистемы для озвучивания", и был посвящен проблемам создания стереообраза при установке систем озвучивания в больших залах. В целом семинар был очень полезным - жаль только, что от него, как и от остальных, не остается письменных свидетельств.
Специальный семинар "Применение методов волнового синтеза" обсуждал комплекс работ по проекту CARROUSO, о котором также был сделан доклад на научной секции. В этом проекте принимают участие университеты, научные институты и производственные фирмы из разных европейских стран. Целью проекта является создание средств для записи, передачи и воспроизведения пространственной звуковой информации в формате MPEG-4 с использованием методов волнового синтеза для воссоздания пространственной картины звука на всех слушательских местах. Была организована демонстрация некоторых результатов применения волнового синтеза и обсуждены возможности для его дальнейшего использования.
На нескольких семинарах обсуждались такие проблемы, как дальнейшее развитие стандартов MPEG-4, которое в настоящее время развивается в направлении создания новых психоакустических кодеров, обеспечивающих передачу высококачественного звука, а также исследования дополнительных возможностей кодирования на очень низких скоростях 24 кбит/с.
Этому же вопросу, то есть низкобитовому кодированию пространственного звука, был посвящен специальный семинар. С докладом о последних достижениях по значительному снижению скорости кодирования для многоканальных аудиосистем выступил представитель фирмы Dolby известный специалист М. Дэвис, так что, по-видимому, можно ожидать в ближайшее время появления новой аппаратуры.
 |
|
Рис.1а
|
Было проведено еще несколько семинаров по усовершенствованию АЦП и ЦАП для современных систем записи и обработки звука, по развитию многоканального аудио в формате DSD, о создании новых стандартов для согласования передачи цифрового звука по компьютерным сетям, а также семинар под руководством представителей фирм Nokia и B&K о методах тестирования оголовья (стереотелефона с микрофоном) для сотовых телефонов - это новый вид аппаратуры, производство которого очень быстро развивается.
 |
Рис.1б. Принцип работы системы Carmen
|
 |
| |
 |
|
Рис.2. Измерения с помощью программы DIRAC
|
Постараюсь теперь кратко рассказать о выставке. Поскольку у меня не было возможности ознакомиться с ней детально, расскажу только о некоторых моментах, показавшихся мне наиболее интересными, в первую очередь с научной точки зрения, что, конечно, очень субъективно.
Научный центр строительной акустики CSTB (Франция) показал очень интересную систему Carmen. Это "система активного контроля реверберации в залах с помощью виртуальных стен, создающих натуральный эффект звучания". Принцип работы системы Carmen показан на рисунке 1: в стены встраиваются наборы блоков, каждый из которых содержит микрофон, громкоговоритель, усилитель, цифровой фильтр. Все блоки находятся под управлением центрального процессора. Количество таких блоков может быть от 16 до 48, мощность 300 Вт, пиковый уровень на микрофонах больше 130 дБ, цифровой процессор имеет динамический диапазон 110 дБ (24 бит).
С помощью такой системы можно анализировать в реальном времени акустическую обстановку в зале, добавлять необходимые ранние и поздние отражения, обеспечивать необходимое покрытие площади зала с заданным уровнем звукового давления, менять время реверберации (от 0,8 до 2,5 с), задавать необходимые тональный баланс и уровень разборчивости. Эти системы установлены уже в таких знаменитых театрах, как Opera Bastille (Париж), Центр Конгрессов в Монако, в Большом Театре и др. По отзывам специалистов, звук в таких залах ощущается как абсолютно естественный, - так что, возможно, это новый этап в развитии техники озвучивания.
Всемирно известная фирма B&K, которая на протяжении многих десятилетий разрабатывает измерительную аппаратуру, включая шумомеры, измерительные микрофоны, вибродатчики и т. д., и которой были оснащены тысячи студий, телецентров и т.д. (в том числе большинство радиодомов и телецентров в Советском Союзе), продолжает вести большой объем научно-исследовательских работ в области акустической метрологии. На 114-й конвенции фирма показала на выставке последние достижения в создании новых программных продуктов и приборов, к числу наиболее впечатляющих можно отнести лазерные установки для анализа процесса вибраций диафрагм громкоговорителей в реальном времени, и новый программный продукт DIRAC (тип 7841). Это аппаратно-программный комплекс, который обеспечивает измерение полного набора акустических параметров помещения на основе анализа его импульсной характеристики (рис. 2). Измерительный сигнал может генерироваться непосредственно в звуковой карте, а может быть взят из внешнего источника. В полном соответствии с действующими в настоящее время международными стандартами можно измерить время реверберации, время ранних отражений, ясность С 80, энергию поздних отражений, коэффициент кросскоррелляции, раннюю энергию боковых отражений, различные коэффициенты для оценки разборчивости речи (STI, RASTI, %ALCon и др.), отношение "сигнал/шум" и др. Появление такого продукта означает создание совершенно новых возможностей для оценки, коррекции и проектирования залов и студий с заданными акустическими свойствами.
Фирма JBL наряду со своей традиционной продукцией (контрольные мониторы и пр.) активно представляла новый программный продукт EASE 4. 0. Это пакет программ для акустического моделирования различных залов, созданный совместно с В. Анертом, крупнейшим немецким специалистом, хорошо известным в России (он автор ряда книг по озвучиванию, постоянно принимал и принимает участие в проектировании новых объектов в России, в частности ММДМ).
Фирма Klippel представила свой анализатор, о котором уже было рассказано на предыдущем конгрессе, но с новым усовершенствованным программным продуктом к нему для измерения нелинейных искажений в громкоговорителях.
Фирма Dolby показала новые технологии передачи пространственного звука, в том числе по системе MPEG-4 AAC для передачи по интернету. Она же демонстрировала передачу первого европейского концерта в реальном времени с пространственным звуком по системе 5.1. Одновременно она показала новый процессор Model 585, который позволяет корректировать высоту звука в пределах 15% для восьми каналов в реальном времени.
В целом, как мне показалось, наметилась некоторая общая тенденция - все большее число фирм представляло новые программные продукты для решения различных проблем в технике обработки звука.
На выставках AES демонстрируется в основном профессиональная акустическая аппаратура (бытовая крайне редко), поэтому фирмы показывали различные варианты контрольной акустики.
 |
Рис.3. Модель монитора фирмы ADAM с излучателем Хейла
|
 |
|
Рис.4. Мониторы фирмы Fostex
|
 |
|
Рис.5. Мониторы фирмы Focal
|
 |
|
Рис.6. Громкоговоритель в виде прозрачного экрана фирмы NXT
|
Фирма Genelec показала новую систему контрольных агрегатов для записи пространственных систем 1029 LSE Power Pak, включающую в себя пять активных двухполосных мониторов, и низкочастотный блок (29…85 Гц, чувствительность 108 дБ/м, мощность 120 Вт). Кроме того, была показана новая линейка мощных низкочастотных блоков, в которых используются новые технологии изготовления корпусов LSE (ламинарный спиральный корпус). В LSE оболочка корпуса сделана из листа металла, свернутого в спиральную трубу, на одном конце которой находится громкоговоритель. Она же является и трубой фазоинвертора, что, за счет большого радиуса, позволяет снизить скорость потока воздуха и уменьшить искажения.
Фирма ADAM специализируется на выпуске контрольных мониторов с излучателями Хейла. На этой выставке она показала, среди других, новую модель мощного монитора S7A (рис. 3), в котором в качестве высокочастотных и среднечастотных громкоговорителей использованы излучатели Хейла, в качестве низкочастотных - излучатели 10" с диафрагмами из сотового материала, покрытого кевларом, а также отдельный низкочастотный блок с двумя 15" громкоговорителями. Излучатели расположены симметрично по принципу Д'Апполито для симметризации характеристик направленности. Вся система активная, использует пять усилителей (1 х 150 Вт для ВЧ, 2 х 150 Вт для СЧ, 500 Вт для НЧ и 1000 Вт для субвуфера).
Фирма Fostex представила линейку мониторов ближнего поля с необычной технологией изготовления диафрагм и подвесов в виде тангенциальных призм для увеличения жесткости (рис. 4).
Наконец, очень современный цифровой контрольный монитор с цифровым входом и встроенным DSP (24 бит, 96 кГц), позволяющим производить цифровую фильтрацию и коррекцию сигналов в реальном времени, показала фирма Focal. В этом мониторе (рис. 5) применен высокочастотный громкоговоритель с диафрагмой из бериллия (самый легкий и самый ядовитый металл, поэтому освоение технологии изготовления диафрагм из него представляет громадные трудности). Управление этим монитором производится беспроводным методом прямо с компьютера типа PALM.
Фирма NXT, которая уже на многих выставках демонстрирует новый вид плоских пленочных излучателей, представила на этот раз новую технологию Sound Vu, позволяющую демонстрировать новый тип излучателя с диафрагмой из прозрачной пленки, расположенной перед экраном большого телевизора. Она же демонстрировала специальную игровую систему с таким же плоским прозрачным экраном в качестве громкоговорителя (рис. 6). Интересно, что у нее уже появились последователи, фирма Panphonics также представила легкие плоские громкоговорители в виде картин, не имеющих в конструкции никаких металлических элементов.
Как и на предыдущих конгрессах, на выставке было огромное многообразие микрофонов всех ведущих фирм: AKG, Neumann, Sennheiser, Milab, Sanken, Audio-Technica и многих других. Если сенсацией предыдущих конгрессов было появление цифрового микрофона фирмы Neumann - Solution-D, то на этой выставке цифровые микрофоны показывали уже и другие фирмы, например, фирма Milab, модель DM-1001.
 |
Рис.7. Cтруктура микрофона Sennheiser MKH-2080
|
 |
Рис.8. Расчет звукового поля для стереотелефона
|
 |
|
Рис.9. LEXICON 960-L
|
Фирма Sennheiser представила линейку конденсаторных микрофонов серии MKH-2080 с очень низким уровнем шумов ~10 дБА и большим динамическим диапазоном ~130 дБ. О степени сложности таких микрофонов можно судить по рисунку 7. Audio-Technica показала несколько серий микрофонов, в том числе серию Artist Elite, предназначенную для передачи студийного качества звука в живых концертах, а также новую серию ламповых микрофонов. Интересно, что в модели АЕ2500 (для записи ударных) используются два капсюля - динамический и конденсаторный в связанном - корпусе. Наряду с огромным многообразием микрофонов (в том число радиомикрофонов) фирма AKG показала новые типы стереотелефонов, в частности К-271, созданный уже по самой современной технологии с помощью компьютерного моделирования структуры звукового поля в нем (рис. 8).
Разумеется, на выставке было представлено огромное многообразие микшерских пультов и устройств процессорной обработки звука. Остановлюсь только на одном устройстве знаменитой фирмы Lexicon 960L, о его размерах можно судить по рисунку 9 (на пульте он стоит слева). Он реализует пакеты программ по автоматическому формированию программ, многоканальному панорамированию, созданию эффектов многоканальной реверберации, формированию многоканального звука в различных форматах из стереозаписей и т. д.
Разнообразие аппаратуры на выставках AES показывает, какими стремительными темпами развивается аудиотехника. На данном этапе ее развитие идет по пути передачи высококачественного пространственного звука с помощью различных цифровых средств: цифрового радиовещания, телевидения, сетей мультимедиа, цифровой звукозаписи и т. д., что требует прогресса в понимании психоакустических механизмов восприятия пространственного звука. Впрочем, как следует из лекции Блауерта, не только звука - речь идет о передаче трехмерной виртуальной реальности для всех органов чувств: слуха, зрения, обоняния, осязания и др.
К чему это все приведет - вот вопрос?
|