Компьютер в радиовещании
Михаил Сергеев
Странное ощущение возникает, когда я вижу в студии ведущего, вставляющего
в проигрыватель диски по плей-листу. Сегодня эту рутинную работу
вполне можно автоматизировать: фонограммы записываются на жесткий
диск компьютера, который в заданном порядке их воспроизводит.
Конфигурация компьютерного вещательного комплекса может быть разной.
В принципе, можно обойтись одним компьютером, но оптимальной представляется
конфигурация, включающая как минимум три аппарата: эфирный компьютер,
компьютер студии производства и редакторский. В студии производства
готовятся все фонограммы: программа, отбивки, реклама. Редактор
(директор программ) формирует плей-лист. Эфирный компьютер выдает
сигнал в эфир.
В результате все, кроме живого голоса ведущего, записано заранее.
При такой технологии вещания материалы выводятся в эфир строго по
плану, заметно уменьшается количество ошибок, отступлений от плей-листа.
Большую помощь директору программ и музыкальному редактору может
оказать автоматический планировщик, формирующий плей-лист по заданным
критериям. Правда, при всем уважении к технике следует отметить,
что никакой компьютер не сможет заменить интеллект человека. Программа
станции - это продукт творчества, а творить компьютер пока не умеет.
Зато есть задачи, которые компьютерный комплекс решает хорошо.
Хранение фонда фонограмм
Для хранения фонограмм используется обычно жесткий диск большой
емкости (или несколько дисков), или RAID-массив. Несколько лет назад
предпочтение, безусловно, следовало отдать RAID-массиву, сегодня
можно без него обойтись, но необходимо позаботиться о сохранности
фонотеки, например, дублировать ее на резервный компьютер, это оказывается
заметно дешевле, чем RAID-массив.
Управление массивом информации
Известно большое число программ, позволяющих формировать плей-лист,
выводить рекламу, и выполняющих еще ряд функций - вполне можно найти
подходящую. Эта тема отдельной статьи.
Вопрос выбора операционной системы Windows 95/Windows 98/Windows
NT/Windows 2000 можно серьезно рассматривать, когда используется
корректно установленное легальное программное обеспечение. Трудности,
возникавшие при первых опытах с Windows 95 и Windows 98, едва ли
стоит считать принципиально неустранимыми, а преимущества Windows
NT - бесспорными.
Кодирование и декодирование сигнала
Формат PCM требует очень большого объема носителя и практически
не используется в автоматизированных системах радиовещания, он вытеснен
форматами MPEG-1 Layer 2 и Layer 3 (MPEG - аббревиатура названия
Moving Picture Experts Group. Сами стандарты называются ISO/IEC-11172
и ISO/IEC-13818). Структура потоков данных стандартизована, что
обеспечило широкое их распространение.
Превратить звуковой сигнал в поток (или файл) с определенной структурой
можно разными способами: формально мы получаем поток MPEG-1 Layer
2 и Layer 3, но качество звучания восстановленного сигнала оказывается
разным. Почему так происходит?
Принцип сжатия информации
В основе алгоритмов компрессии MPEG1 Layer 2 и Layer 3 лежит наличие
психофизиологической избыточности в сообщении. Дело в том, что часть
составляющих сигнала маскируется другими составляющими. Маскируемые
спектральные составляющие сигнала можно исключить без заметных на
слух потерь.
Для анализа и обработки сигнал нужно преобразовать в спектральную
область, воспользовавшись ДКП, ПФ или другим алгоритмом.
Рис.1
На рисунке 1 показан спектр звукового сигнала. Кодер выделяет высокоуровневые
составляющие и рассчитывает порог маскирования, то есть уровень,
ниже которого сигналы оказываются неслышимыми. Спектр сигнала разделяется
на полосы (в данном примере - 5 полос), и для каждой полосы определяется
допустимый шаг квантования, то есть количество бит, необходимых
для кодирования сигналов в этой полосе. В примере получилось, что
в первой полосе достаточно иметь 4 бита, во второй полосе - 4, в
третьей - 8, в четвертой - 2, а сигнал пятой полосы можно вообще
не передавать - 0 бит. При столь значительном снижении разрядности
кода сигнал передается без слышимых искажений, а объем сообщения
оказывается существенно уменьшен.
Во втором примере (Рис. 2) получилось иначе. Для передачи без искажений
нужно 24 бита на 5 полос, а пропускная способность канала передачи
позволяет передать меньший объем, например, 22. При недостаточной
скорости кодирование производится с потерями слышимой информации.
Нужно снижать разрядность кода в какой-то из полос, допустив появление
заметных на слух искажений. Можно снизить качество передачи в первой
полосе, а можно - в пятой. Какое из этих решений окажется лучше
с точки зрения заметности искажений? Собственно, кодеры различаются
именно стратегией распределения пропускной способности канала передачи
при ее дефиците. А дефицит пропускной способности имеет место -
желание уменьшить объем носителя вынуждает сжимать данные до предельных
значений.
Рис.
2
Особенности алгоритмов Layer 2 и Layer 3
Изменение свойств обрабатываемого сигнала приводит к перераспределению
пропускной способности канала в частотной области. Вначале передаются
все спектральные составляющие. Переход к узкополосному сигналу позволяет
повысить в полосе этого сигнала разрядность кода и уменьшить искажения
квантования.
Алгоритм Layer
2 использует последовательную независимую обработку фреймов (кадров)
сообщения. Каждый фрейм, то есть фрагмент сообщения, существует
как самостоятельный объект, именно это и обеспечивает возможность
нелинейного монтажа. Покадровая обработка обусловливает и малое
время задержки сигнала при кодировании.
Алгоритм Layer 3 учитывает предыдущее и последующее состояния сигнала,
что позволяет использовать маскирование во временной области и повысить
эффективность компрессии, но затрудняет нелинейный монтаж и приводит
к заметной задержке сигнала при кодировании. Рисунок 3 иллюстрирует
особенность работы алгоритма кодирования - переход от широкополосного
шумового сигнала к синусоидальному. В течение переходного периода
кодер постепенно перераспределяет пропускную способность канала.
Возникшие искажения синусоидального сигнала на слух незаметны, так
и проявляется маскирование во временной области.
Оценить качество кодирования Layer 2 и Layer 3 по объективным характеристикам
сигнала чрезвычайно трудно: для решения этой задачи нужно иметь
формализованную модель заметности искажений, возникающих при кодировании.
Эта модель должна учитывать маскирование во временной и спектральной
областях. (Статьи И.А.Алдошиной о свойствах слуха служат хорошей
иллюстрацией сложности задачи моделирования слухового восприятия).
В настоящее время самым надежным методом оценки качества кодирования
является прослушивание. Косвенным признаком служит скорость кодирования:
хорошие кодеры обычно работают медленнее.

Рис. 3
Программное или аппаратное решение?
Когда появились эффективные алгоритмы сжатия звуковых сигналов,
486-й процессор существовал только в мечтах, но ресурсов этого процессора
было недостаточно не только для кодирования, но и для декодирования
сигналов. В такой ситуации появились специализированные карты с
процессором, позволяющим кодировать и декодировать сигнал, не загружая
CPU компьютера. В контексте 486-го процессора это решение было единственно
правильным.
Эти карты (например, серия PCX от Digigram) предназначены для профессионального
применения в радиовещании. Балансные вход и выход, высококачественные
ЦАП и АЦП - непременные атрибуты такого оборудования. Но недостатки
- это продолжение достоинств. Небольшие тиражи обусловили высокую
цену - от $1000 и выше.
Естественное желание сэкономить подталкивает к выбору конфигурации,
построенной на неспециализированных устройствах. Звуковая плата
за $50, обычный компьютер за $800, жесткий диск большого объема
(75 ГБ за $600) позволяют обеспечить вполне приемлемое качество
и надежность. Но нет ли здесь подвохов? И для кого же разрабатываются
и производятся специализированные платы ввода/вывода сигналов с
процессором на борту?
Пять лет назад для кодирования и декодирования сигналов необходимо
было использовать специализированные карты, но процессоры для компьютеров
совершенствуются с умопомрачительной скоростью, и серенький по сегодняшним
меркам Celeron 400 позволяет кодировать и декодировать звуковой
сигнал в реальном времени.
Качество звуковых карт тоже не стоит на месте. Большие тиражи бытовых
звуковых карт - основа низкой цены. При тираже 100 тысяч штук можно
обеспечить за $50 такое же качество АЦП и ЦАП, как в штучном изделии
за $1000. Положительно влияет на цену и отсутствие специализированного
процессора на плате. CPU компьютера оказывается существенно дешевле
специализированного, прежде всего за счет колоссального тиража.
В результате многие производители оборудования автоматического
вещания используют CPU компьютера для кодирования и декодирования
сигналов, и ориентируются на стандартные устройства ввода/вывода.
Преимущества такого подхода вполне понятны. Во-первых, дешевеет
"железо", что расширяет круг потенциальных покупателей. Пользователь
может начать работу с простейшим "бластером", а потом купить более
качественный, сообразуя желание повысить качество звука с финансовыми
возможностями.
При появлении нового, более эффективного алгоритма кодирования
звуковых сигналов программное решение позволяет без труда подключить
новинку и пользоваться. Возможность перепрограммирования процессора
специальной карты под новый алгоритм ограничена.
Качество устройств ввода/вывода
В начале эпохи MPEG стоимость носителя информации была весьма высокой,
и использовались предельные степени компрессии данных, при которых
именно алгоритм работы кодера был основным источником искажений.
При скорости 128 кбит/с кодирование сигнала Layer 2 с полосой 15
кГц создает такие искажения сигнала, что качество ЦАП широкого применения
уже мало на что влияет. Такое же положение пока сохраняется, хотя
сегодня винчестер объемом 75 ГБ стоит всего $600, и нет необходимости
предельно сжимать сигнал. Алгоритм Layer 3 при скорости 256 кбит/с
обеспечивает качество, практически неотличимое от качества оригинала,
и искажения устройств ввода/вывода уже следует принимать во внимание.
Традиционно в центре внимания оказывается уровень шумов, именно
этот параметр долгое время был узким местом звуковых карт.
Качество аналогового-цифрового преобразования выяснить очень просто.
Из дополнительных приборов потребуется только генератор. Начать
можно с измерения уровня собственных шумов АЦП. Следует выбрать
линейный вход, установить максимальное усиление и записать небольшой
фрагмент, примерно 10 с. Еще до начала записи можно оценить уровень
шума с помощью монитора в Sound Forge. Хочу обратить внимание читателей
на тот факт, что этот монитор показывает уровни достаточно условно.
Для измерения шумов следует воспользоваться среднеквадратичным измерителем,
который имеется в Sound Forge: RMS в меню Tools/Statistics. Полученное
среднеквадратичное значение шумов гораздо точнее отражает шумовые
свойства карты, чем монитор.
Полезно также определить значение уровня шума, взвешенное с учетом
чувствительности слуха. С помощью эквалайзера из пакета Sound Forge
(Process/EQ/Graphic) можно ввести требуемую коррекцию АЧХ. Именно
взвешенное значение наиболее точно отражает шумовые свойства звуковой
карты и показывает, насколько будет заметен шум записи, сделанный
с аналогового входа карты.
Надо отметить, что записи с аналогового входа достаточно редко
используются в радиовещании, гораздо чаще фонограмма уже переведена
в цифровой вид и имеет значение только качество цифро-аналогового
преобразования.
Уровень шумов ЦАП можно измерить следующим образом. Сначала нужно
синтезировать с помощью Sound Forge фонограмму длительностью около
10 секунд с уровнем 0 дБ (100%), затем - примерно 10 секунд нулевого
сигнала (0%).
К выходу карты подключается вольтметр, который регистрирует уровень
выходного сигнала при воспроизведении каждого их этих фрагментов.
В меню "регулятор громкости" надо выбрать для воспроизведения единственный
источник - WAVE и установить регулятор уровня воспроизведения в
положение максимального усиления.
Для карты SBLive! в режиме воспроизведения получено отношение сигнал/шум:
49 дБ в полосе 20 Гц…330 кГц (-3 дБ), 81 дБ - с фильтром МЭК "А".
Величина 49 дБ, конечно, не впечатляет, но мощность шумов сосредоточена
на высоких частотах, кратных частоте строчной развертки монитора.
В звуковой части спектра ситуация оказывается гораздо приятнее:
81 дБ - вполне приемлемое для радиовещания значение.
Качество записи с аналогового входа оказалось не столь высоким,
отношение сигнал/шум равно:
49 дБ в полосе 20 Гц…330 кГц (-3 дБ), 63,5 дБ с фильтром МЭК "А".
Как воспроизводящее устройство такая карта вполне пригодна, но
для записи аналоговых сигналов следует взять более качественный
преобразователь.
Ограничиваться измерениями уровня шума при оценке качества звуковой
карты не следует - сегодня на первый план выходят искажения сигнала,
связанные с цифро-аналоговым преобразованием. Например, SBLive!
обеспечивает при воспроизведении файлов чистое, прозрачное звучание.
Для массовых звуковых карт это скорее исключение, чем правило, чаще
приходится сталкиваться с неприятным, жестким, хрустящим звучанием.
Особенности работы с компрессированными сигналами
Вне зависимости, используется CPU компьютера или специализированный
процессор на звуковой карте, полезно учитывать специфику компьютерной
технологии и особенности алгоритмов.
Если исходная фонограмма имеет низкий уровень, то нужно сначала
нормализовать уровень, а потом кодировать сигнал. Если сделать наоборот,
сначала кодировать, а потом нормализовать уровень уже декодированного
сигнала, то результат будет худшим.
Во-первых, при кодировании учитывается уровень сигнала, и тихий
сигнал кодируется более грубо. Компрессор в эфирном тракте поднимет
уровень тихих сигналов, и искажения окажутся заметными. Особенно
заметны потери при использовании низких скоростей: менее 128 кбит/с
для Layer 3 и менее 256 кбит/с для Layer 2.
Во-вторых, и специализированная звуковая карта, и бытовая имеют
ограниченный динамический диапазон. Чем ближе уровень выходного
сигнала к максимальному значению, тем меньше сказываются шумы и
искажения ЦАП на качестве звука.
Выбор тактовой частоты Fs при кодировании сигналов может заметно
повлиять на качество звучания. Полоса рабочих частот в радиовещании
составляет 15 кГц, то есть можно использовать Fs = 32 кГц. В этом
случае основные потери качества будут связаны с искажениями ЦАП.
При повышении тактовой частоты уменьшается влияние искажений ЦАП,
но ухудшается качество кодирования. Для Fs= 48 кГц, например, полоса
кодируемых сигналов равна 24 кГц, и для кодирования участка спектра
от 15 до 24 кГц совершенно бесполезно расходуется часть ограниченного
потока, которая отнимается у среднечастотных составляющих сигнала.
При работе в формате Layer 3 необходимо учитывать еще и особенность
алгоритма его работы: учет предыдущего и последующего состояний
сигнала. Для корректного кодирования нужно иметь в начале фонограммы
хотя бы 100 мс тишины. Если это условие не выполняется, то возможно
появление щелчка в начале фонограммы (Рис. 4)

Рис. 4
Предварительная обработка сигналов
Переход на компьютерную технологию вещания требует пересмотра отношения
к технологическому процессу. При вещании с компакт-дисков необходима
существенная обработка динамического диапазона сигналов, поскольку
изменить параметры сигнала на диске невозможно. Непременный элемент
радиовещательной студии - динамический процессор или компрессор,
обеспечивающий сжатие динамического диапазона. Аппараты эти всегда
сложные и дорогие: в реальном времени довести сигнал до эфирных
кондиций, не создавая заметных на слух искажений, очень непросто.
Если же обрабатывается файл, то задача существенно упрощается.
Во-первых, файл доступен для редактирования, в отличие от фонограммы
на компакт-диске.
Во-вторых, программный компрессор, обрабатывающий файл, "знает"
о нем все, и может заранее изменить коэффициент передачи. В качестве
примера взят компрессор из Sound Forge (Рис. 5). Программная компрессия
позволяет предвидеть изменения уровня сигнала и исключить искажения,
связанные с ограничением амплитуды, это хорошо видно на нижнем графике.
Еще до увеличения уровня компрессор начал уменьшать коэффициент
передачи. Понятно, что условия работы у программного компрессора
более простые, чем у обычного, и можно получить лучшие результаты.

Рис. 5а

Рис. 5б
Важной представляется еще одна особенность предварительной обработки:
можно подобрать для каждой фонограммы оптимальные параметры алгоритма,
что практически невозможно при обработке выходного сигнала студии
обычным компрессором. На рисунке 6 в качестве примера показан фрагмент
реальной фонограммы до компрессии (верхнее окно) и после (нижнее
окно). Мощность сигнала возросла на 12 дБ, такой подъем без искажений
получить от обычного компрессора очень сложно.

Рис. 6
Звучание при программной компрессии получается иным, чем при аппаратной,
но утверждение о бесспорных недостатках компьютерной обработки кажется
необоснованных.
При подготовке фонограмм к эфиру полезно обработать начало и конец
произведения, чтобы микс получался благозвучным. Автомат работает
по программе и не может, как ведущий при ручной работе, учесть особенности
той или иной фонограммы.
Заключение
Автоматическое функционирование студии открывает новые возможности
для работы, но не позволяет многого из того, что было доступно при
ручной работе. Это не хорошо и не плохо: нужно использовать преимущества,
обходя недостатки. И нет никакого смысла в автоматизированной студии
вещания воспроизводить технологию ручного вещания. Надеюсь, что
адепты применения в радиовещании исключительно профессиональной
аппаратуры не воспримут эту статью, как попытку покушения "на святое".
Новая технология позволяет построить более дешевую студию. Не призываю
к безоглядной экономии, но если нужный результат можно получить
за более низкую цену, то почему бы и не сделать этого?
В некоторых случаях специализированная профессиональная техника,
безусловно, предпочтительнее. Очевидны и бесспорны преимущества
более дорогих разъемов XLR перед дешевыми бытовыми RCA, даже при
несимметричном подключении. Но не надо доводить идею до абсурда,
уподобляясь известному персонажу, занятому поиском чернил для восьмого
класса. Зачем искать чернила, если под руками есть компьютер и принтер?