: архив : архив журнала "Звукорежиссер" : 2001 : #1

AES-109. Взгляд в будущее аудио
Ирина Алдошина

На 107-м конгрессе AES в 1999г была введена новая традиция организовывать мемориальные лекции, посвященные памяти выдающегося ученого Ричарда Хейзера.

Для чтения этих лекций было решено приглашать всемирно известных ученых и специалистов, которые могли бы сделать анализ современного состояния и оценить перспективы развития различных направлений аудиотехники. Эта идея получила всеобщую поддержку как в научной среде, так и среди фирм-производителей, поскольку нельзя не оценить важность таких прогнозов для дальнейшего развития.

Всего было прочитано три таких лекции: на107-м конгрессе Роджер Лагадек выступил с докладом "Цифровое аудио и изменения в Интернете"; на 108-м конгрессе Джеймс Мурер с докладом "Аудио в новом тысячелетии", и на 109-м Алан Кей с докладом "Компьютерная революция еще не завершена".

Представляется, что информация об основных идеях, изложенных в этих лекциях, чрезвычайно полезна и для наших специалистов, работающих в различных направлениях аудио, поскольку она дает возможность оценить, в каком направлении предполагается дальнейшее развитие мировой науки, техники и индустрии. Может быть, это даст возможность не пропустить очередную техническую революцию, как это случилось с нами в середине ХХ века если и не удастся "догнать",то хотя бы "быть в курсе".

Разумеется, во всех этих лекциях излагается субъективная точка зрения, но, учитывая, что излагают ее специалисты мирового класса, можно надеяться, что большая вероятность реализации их прогнозов имеется.

Рассмотрим кратко основные идеи Мурера, изложенные им в лекции "Аудио в новом тысячелетии".

Джеймс Мурер всемирно известный ученый в области цифрового аудио и компьютерной музыки. Он получил докторскую степень в Стенфордском Университете. С 1987 г он работает вице-президентом фирмы Sonic Solutions, хорошо известной всем звукорежиссерам. За разработку пакетов программ NoNOISE и применение их для шумоподавления и реставрации в телевидении и радиовещании он был награжден в 1991 году серебряной медалью AES и премией Emmy в 1996г. В 1999г ему была присуждена премия Academy of Motion Picture Arts, больше известная как Оскар, за пионерские работы по применению цифровых процессоров в обработке звука для кино.

Поскольку область профессиональных интересов Джеймса Мурера относится к цифровому звуку, то именно в этом направлении он попытался сделать прогноз на будущее.

В период 1940-50 гг. профессиональное аудио стремилось к точной передаче натурального звука, стараясь как можно ближе воссоздать атмосферу концертов, в чем и добилось значительных успехов. В настоящий момент техника двинулась далее, к "сверхнатуральным" звукозаписям они стали настолько совершенны, что их невозможно было бы воспроизвести в натуре. Стандарты для записи музыки сейчас чрезвычайно высоки, студийные альбомы сейчас почти полностью синтетические, со звуками, никогда не возникающими в природе. Граница между "реальными" и "синтетическими" инструментами, которая была так ясна в несколько десятилетий назад, сейчас стала неопределенной. Сегодня любой клавишный инструмент имеет огромную библиотеку звуков, большинство из которых никогда не существовало в виде колебаний молекул воздуха на своем пути к записи в память семплеров. Обычно доступный музыкальный материал связывается с объемами памяти процессоров, которые ранее были немыслимы. Для прогноза их развития на последующие годы можно попробовать проанализировать опыт работы с цифровым аудио за последние двадцать лет, и экстраполировать его на следующие двадцать лет.

Прогресс в аудиотехнике за последние тридцать лет был феноменальным, и если в следующие тридцать лет прогресс будет развиваться такими же темпами, то становится даже интересно, что инженеры будут тогда делать. Сейчас тратится масса времени на создание инструкций для процессорной обработки с тем, чтобы ввести еще один канал аудио или сделать еще один фильтр. Что будет, если через некоторое время этого уже не потребуется!

Когда Гордон Мур из фирмы Intel открыл так называемый "закон Мура", согласно которому возможности полупроводниковых приборов каждые полтора года удваиваются, он имел в виду только количество транзисторов, которые можно разместить на заданной площади силиконовой подложки. Он не говорил о скорости работы микропроцессоров, или плотности записи на жестком диске, или о пропускной способности сетей. Каждая технология имеет свою скорость роста, и они не всегда совпадают. Интересно сравнить скорости роста разных технологий по закону Мура. Правда, некоторые специалисты предсказывают остановку наращивания плотности интегральных цепей в последующие десять лет, некоторые в тридцать лет, что напоминает дискуссию 50-х годов о том, что запасы нефти в мире истощатся к 1964 году. Хотя сейчас и кажется, что некоторые технологии достигли своего насыщения (например, уменьшение размеров транзисторов или увеличение плотности записи на жестком диске), однако можно предположить, что будут изобретены принципиально новые технологии, которые решат эти проблемы.

Для того, чтобы оценить скорость роста компьютерных мощностей, можно сравнить время, которое потребовалось для реализации цифровых алгоритмов реверберации звука в помещении. В 1978 году на компьютере DEC PDP-10 это потребовало десять часов компьютерного времени на каждую секунду звука. Этот эксперимент, недавно повторенный на компьютере Apple Macintosh G3, занял только две секунды, т.е. производительность компьютера выросла в 18 тысяч раз за 22 года, т.е. в 2,25 раз за два года почти точно по закону Мура.

Необходимо, правда, уточнить, что при этом произошло совершенствование алгоритмов быстрого преобразования Фурье (БПФ): если раньше процедура БПФ требовала 6Nlg2N микросекунд, то теперь только 1/5Nlg2N микросекунд.

Если скорость роста мощности компьютеров будет продолжаться в таком же темпе и в последующие 22 года, то это даст возможность обрабатывать 9 тысяч каналов звука в реальном времени, используя БПФ на миллион точек. Даже высочайший аудиопрофессионал не сможет охватить умом звуковую информацию на девяти тысячах каналов, даже и девятьсот нереально.

Самый смелый предсказатель не мог предвидеть такого увеличения мощности компьютеров. Это полностью изменит природу аудио и радикально изменит возможности аудиоспециалистов. Технические проблемы, которые были отложены десятилетия назад, можно будет решать на принципиально новом уровне. Через двадцать лет фундаментальная проблема, перед которой встанут звукорежиссеры, аудиоинженеры и другие специалисты, работающие со звуком, будет состоять не в том, как выполнить отдельные операции со звуком, а в том, как "упаковать" всю эту мощь в такую среду, которую человек в состоянии будет освоить и выучить. Если современный микшерский пульт может иметь до 2000 и более органов управления, то невозможно представить, работу на цифровой звуковой рабочей станции с двумя миллионами виртуальных кнопок, ручек и фейдеров.

Хуже того, большинство из этих операций управления будет связано с такими трудными для понимания акустическими и электронными параметрами, что потребуется чуть ли не докторская степень, чтобы понять, что и как надо регулировать. По-видимому, единственное решение для реализации такого контроля - создание "интеллектуального помощника" (подробнее об этом ниже).

Трудно представить, что существуют технологии, которые растут еще быстрее, чем по закону Мура! На сегодня это емкости сетей передачи данных. За двадцать два года скорость передачи данных локальных сетей увеличилась с 1 Мбит/с до 1 Гбит/с, что превышает фактор 1,36 за год. Пропускная способность домашних сетей выросла с 300 бод до 100 кбод (на DSL-соединениях). Это соответствует фактору увеличения 1,36 за год.

Скорость модемов увеличилась с 300 бод в 1977 году до 300 кбод (DSL) в 1999 году. Экстраполяция до 2021 года дает 300 мегабод, если не произойдет еще какой-то качественный скачок. В 1977 году Ethernet имел скорость 1 Мбит/с, Ethernet-2 имел 10 Мбит/с, а сегодня оптоволокно позволяет обеспечить скорость 1 Гбит/с. Если экстраполировать дальше, можно получить скорость 1 Тбит/с, если опять-таки не произойдет качественного скачка.

Это уже привело к созданию мощных инфраструктур, например, сетей спутниковых телефонных систем и сетей сотовых телефонов, которые растут с невероятной скоростью. Совершенно очевидно, что все дома в индустриальных странах в следующие двадцать лет будут связаны оптоволоконными линиями, способными передавать сигналы с частотой до десятков, а то и сотен гигагерц, что откроет новые возможности. Нет сомнения, что все вещательные сигналы (радио и телевидение) будут форматированы как IP-пакеты и, вероятно, все аудио- и видеосигналы будут передаваться через те же самые сети.

Уже не будет отдельных кабельного ТВ, Интернета и телефонных каналов. Они все будут распределяться в едином формате, и будут ближе к Интернету, чем к кабельному ТВ. Дома или в офисе можно будет слушать по сети любое количество международных каналов вещания. К этому времени оперативная твердотельная неподвижная память будет способна сохранять десятки гигабайт данных, поэтому не будет необходимости использовать движущиеся носители, такие, как оптические и жесткие диски. Компрессия звука также уйдет в прошлое, может быть, еще останется какая-то компрессия видеоданных, но это тоже временно.

В 1978 году на Конгрессе AES в Гамбурге Том Стокхэм сделал доклад о перспективах цифрового аудио перед очень скептически настроенной аудиторией. Он сказал, что на рубеже столетий устройство цифровой записи объемом менее одного кубического фута (то есть 30 кубических сантиметров) будет в состоянии записывать 16 каналов звука длительностью 40 дней и 40 ночей. Аудитория встретила это заявление смехом. Однако, если взять за основу цифровой звук 16 бит/50 кГц, то за 40 суток необходимо передать 40 х 24 х 3600 х 16 х 100К = 5,5 ТБ информации. Современный жесткий диск имеет объем до 70 ГБ, и необходимо примерно 80 таких дисков, что требует обьема в два кубических фута. Том Стокхэм ошибся всего в два раза, то есть почти не ошибся!

На рисунке показан рост объемов памяти жестких дисков в компьютерах: если в1977 году он составлял 20 МБ, в 2000 году 50 70 ГБ, то можно экстраполировать: к 2021 году будет доступно 2,7 ТБ. Верхняя кривая показывает рост количества мегабайт на один кубический фут, что позволяет предположить, что в корпусе современного диска будет размещаться 380 ТБ, при этом диск 2,7 ТБ будет уже так мал по размерам, что его можно будет размещать прямо на материнской плате. Предсказание Стокхэма будет реализовано в самое ближайшее время!

Рост объемов памяти жестких дисков

Уже много лет ведутся споры, кто за кем развивается: аудио вслед за компьютерными технологиями, или наоборот (где хвост, где собака). Если до 70-х годов аудио пассивно шло вслед за компьютерами, то сейчас целый ряд новых технологий был разработан прежде всего для аудиовидеоиндустрии, и лишь затем интегрирован в современные компьютеры. Например, технологии DAT, CD, DVD первоначально были созданы для замены аналоговой аудиовидеозаписи. Прогресс развития технологий показывает, что самые современные процессоры, которые используются сейчас только в больших военных проектах (например, IntelMMX, Motorola AltiVec), перейдут в аудио- и видеоиндустрию, и через несколько лет окажутся в профессиональной студийной технике, а затем и в бытовой аппаратуре.

Хотя анализ прогресса в развитии микрофонов и громкоговорителей не входит в тематику данного доклада, однако можно предположить возможность развития одного из направлений применения цифровых технологий в их использовании: каждый микрофон и громкоговоритель может быть снабжен крошечным GSP-приемником, который через несколько лет почти ничего не будет стоить.

Если использовать при записи, например, оркестра большее число микрофонов, чем инструментов, разместив их достаточно близко к музыкантам, то цифровые технологии дадут возможность обострить характеристику направленности микрофонов, используя специальные алгоритмы шумоподавления, основные идеи которых уже опубликованы. Это позволит записывать звук каждого инструмента в отдельный канал, обеспечивая подавление звуков от остальных инструментов. Наличие информации о расположении каждого микрофона (с помощью GSP) позволит сделать все операции более точными. Естественно, все микрофоны будут беспроводными, будут иметь собственный АЦП, интерфейс и IP-адрес для соединения в сеть. Они будут принимать команды для управления их усилением и формой характеристики направленности если еще сохранятся микрофоны градиента давления.

В последние годы ХХ века значительно возросли частоты дискретизации в профессиональной аудиотехнике, что позволяет передавать диапазон частот, значительно превосходящий возможности слуховой системы человека. Хотя дальнейшее увеличение частоты дискретизации и встречает некоторый скептицизм, однако есть важные причины для дальнейшего развития этого процесса. При нелинейных операциях цифровой обработки звука возникают боковые полосы, которые могут превосходить частоту Найквиста и, следовательно, попадать в слышимый диапазон частот. Увеличение частоты дискретизации позволит применять различные алгоритмы нелинейной обработки (например, независимое управление высотой тона и формой спектральной огибающей) без изменения тембра музыки или качества звучания речи и др.

Таким образом, колоссальный прогресс в развитии техники цифровой обработки звука приведет через несколько лет к тому, что возникнет необходимость микшировать тысячи каналов и управлять сотнями тысяч контроллеров. Совершенно ясно, что это превосходит границы человеческих возможностей. Поэтому можно ожидать в ближайшие 20 лет появления нового направления в профессиональном аудио создания "интеллектуальных компьютерных ассистентов звукорежиссера", на которых будет перекладываться все больше и больше функций управления громкостью, балансом и др.

К этому времени можно надеяться на большой прогресс в проблеме расшифровки формирования звукового образа в слуховой системе человека, в частности, на создание психоакустических моделей распознавания громкости, высоты, тембра и др. Вероятно, в ближайшие годы будут созданы компьютерные программы, которые смогут распознавать различные музыкальные формы, музыкальные инструменты, биения и др. Постепенно объем знаний в этом направлении будет расти, и рутинная часть работы по микшированию звука будет все больше перелагаться на плечи компьютеров, оставляя людям только творческую работу.

Вероятно, не все, что было здесь рассмотрено, будет реализовано, но ясно, что ускоряющийся прогресс аудиотехнологий, заставит значительно изменить функции звукорежиссера и аудиоинженера: потребуется большая изобретательность, чтобы научиться справляться со всей этой мощью и создать внутри нее среду, в которой человек мог бы работать со звуком.

P.S. На очередном 110-м конгрессе AES в мае 2001 года в Амстердаме будет прочитана следующая лекция по прогнозам развития других направлений в аудиотехнике. Если эта информация покажется интересной читателям, то можно и у нас ввести такую традицию: один-два раза в год публиковать обзоры по материалам этих лекций.

 

Замечания и предложения по работе сервера направляйте: web.master at 625-net.ru.

© 1996—2009 «Издательство 625». Все права защищены.

e-mail: magazine at 625-net.ru, тел./факс: (495) 691-7724, 695-9588.

Свидетельство о регистрации средства массовой информации Эл № 77-2794.