: архив : архив журнала "625" : 2000 : #8

Цифровая магнитная видеозапись:формат Sony Betacam SX
Константин Гласман

В середине 80-х годов, когда завершалась разработка первого формата цифровой магнитной видеозаписи D-1, никто не смог бы предположить, что средняя скорость появления новых форматов будет держаться на уровне, превышающем один формат в год, на протяжении почти полутора десятков лет. Однако фактом сегодняшнего дня является то, что за 14 лет, прошедших с момента демонстрации первого промышленного цифрового видеомагнитофона, было предложено уже более полутора десятков форматов цифровой записи на магнитную ленту. Факт красноречивый, он наглядно демонстрирует, что пока не создан универсальный формат видеозаписи, в равной степени отвечающий требованиям различных этапов процесса производства телевизионных программ. Цифровой видеомагнитофон формата D-1 обеспечил запись и воспроизведение компонентного видеосигнала с высочайшим качеством. Он быстро нашел применение в системах, в которых именно качество является важнейшим и непременным условием. Однако качество записи было достигнуто за счет высокой стоимости, большого веса и значительных габаритов. А ведь требования к аппаратам цифровой магнитной видеозаписи разнообразны, а часто и противоречивы. Например, для съемки программ новостей важнейшее значение имеют малые габариты, вес, энергопотребление. Возможность многократной перезаписи без потерь качества выходит на первое место в сфере монтажа и компоновки программ. Фактор, в значительной мере определяющий успех формата для любой сферы, - затраты на приобретение и обслуживание аппаратов видеозаписи. Даже из этого неполного списка требований ясно, что задача создания универсального формата невероятно трудна и пока не имеет практического решения. Решение, признаваемое оптимальным на сегодняшний день, предполагает создание линейки взаимосвязанных форматов, каждый из которых позволяет добиться наилучшего баланса качества и затрат для одного или нескольких этапов создания телевизионных программ, но которые вместе обеспечивают нужды всего телевизионного производства.

Концепция

Сфера формата Betacam SX - производство программ новостей, а также спортивных передач, документальных фильмов и других подобных программ. Новости - одна из основных телевизионных программ. Именно программы новостей в значительной степени определяют "лицо" телевизионного канала и служат важным фактором борьбы за лидерство и зрительские симпатии. Состязательность диктует свои требования: новости из любых точек земного шара должны выходить в эфир с минимальными задержками, производство программ должно не должно быть связано с крупными капитальными затратами и эксплуатационными расходами. Уже давно признано, что для удовлетворения этих требований значительная часть программ новостей должна монтироваться там, где эти новости рождаются, т.е. во внестудийных условиях. Следовательно, комплект телевизионной аппаратуры для съемки и внестудийного монтажа программ новостей должен быть компактным, легким и включать небольшое число единиц оборудования. Аппаратура должна быть надежной и допускать эксплуатацию в широком диапазоне климатических и погодных условий.

В сфере программ новостей аналогового телевидения наиболее широко используется формат Betacam SP, что, конечно, не могло не оказать влияния на формирование концепции цифрового формата, приходящего на смену Betacam SP. Совместимость с Betacam SP в режиме воспроизведения - важнейший фактор, способствующий переходу к цифровым технологиям при сохранении инвестиций, сделанных в эпоху аналогового телевидения.

Предлагать для замены формата аналоговой видеозаписи лишь цифровой формат записи на ленту - значит не использовать преимуществ новых технологий. Запись на ленту была и остается важным компонентом телевизионного производства, но наиболее эффективное ее применение в цифровых системах достигается на путях объединения ленточных видеомагнитофонов с дисковыми накопителями данных. Нелинейный монтаж обеспечивает значительное повышение производительности, что очень важно для производства телевизионных программ новостей, но лишь при условии более быстрого, чем в реальном времени, обмена данными между видеомагнитофоном и дисковым накопителем. Из приведенных рассуждений неизбежно следует вывод о необходимости применения эффективной системы компрессии цифровых данных. Компрессия - это также средство, облегчающее передачу цифровых телевизионных сигналов по линиям телекоммуникаций и внедрение сетевых технологий производства программ.

Итак, Betacam SX - это не просто формат видеозаписи, а цифровая система, объединяющая разные носители и технологии: ленту - для съемки и линейного монтажа в полевых условиях, диск - для нелинейного монтажа в студии, цифровые интерфейсы - для подключения к сетям передачи данных и линиям телекоммуникаций, компрессию - для повышения эффективности обмена данными.

Видеокомпрессия как фактор проектирования аппаратуры видеозаписи

История магнитной видеозаписи показывает, что совершенствование аппаратуры достигалось за счет улучшения параметров магнитных носителей и видеоголовок, конструкции лентопротяжных механизмов, а также благодаря применению новых способов обработки записываемых и воспроизводимых сигналов. Прогресс в сфере обработки сигналов отличается наиболее быстрыми темпами, что объясняется широким применением специализированных больших и сверхбольших интегральных схем. Один из важнейших видов обработки - видеокомпрессия, позволяющая сократить скорость потока записываемых данных за счет устранения избыточности, присущей типичных телевизионным изображениям. Видеокомпрессия используется в большинстве современных систем видеозаписи, поэтому соперничество форматов видеозаписи - это и соревнование алгоритмов компрессии. Чем же вынужден будет заплатить формат, занявший в соревновании алгоритмов компрессии второе место? Рассмотрим ситуацию, в которой один алгоритм позволяет при одном и том же уровне артефактов компрессии, т.е. при одном и том же качестве изображения, записывать в два раза меньший объем данных.

Для записи в 2 раза большего объема данных в единицу времени можно удвоить скорость транспортирования ленты, сохранив неизменными такие параметры, как ширина строчки записи и минимальная длина волны. Но в этом случае в 2 раза уменьшится длительность записи на одну кассету. Если попытаться сохранить время записи, то придется удвоить длину ленты, находящейся в кассете, что увеличит размеры кассеты при сохранении толщины ленты. Можно уменьшить в 2 раза ширину строчки записи, сохранив на исходном уровне длину ленты и размеры кассеты. Но чем меньше ширина строчек, тем труднее решается проблема трекинга, или совмещения траектории движения головок воспроизведения со строчками записи. Становятся более жесткими требования к параметрам механизмов транспортирования ленты, возникает потребность в точной регулировке и юстировке механизмов. Все это удорожает механизмы аппаратов видеозаписи, увеличивается стоимость ремонта и регулировки. Применение динамического трекинга еще более усложняет и удорожает видеомагнитофон. При уменьшении ширины строчки уменьшается отношение сигнала к шуму для считываемого с ленты сигнала, возрастает влияние выпадений. Поэтому уменьшение ширины строчек записи требует применения более дорогих лент для восстановления исходного отношения сигнал/шум и снижения влияния выпадений.

При увеличении объема данных, записываемых в единицу времени, должна быть обеспечена необходимая пропускная способность канала магнитной записи/воспроизведения. Пропускная способность прямо пропорциональна относительной скорости головка/лента. Для удвоения скорости потока записываемых данных можно, например, увеличить в 2 раза частоту вращения барабана видеоголовок. Но это приводит к проблемам - ухудшению контакта головок с лентой и ускоренному износу головок. Другой способ записи данных с большей скоростью - удвоение числа головок на барабане. Это позволяет распределить данные по удвоенному числу каналов с исходной пропускной способностью. Но удвоение числа головок сопровождается соответствующим увеличением числа вращающихся трансформаторов, усложнением конструкции барабана и неизбежно связано с увеличением стоимости и усложнением обслуживания.

Таким образом, неэффективная система компрессии связывает конструкторов аппаратуры видеозаписи по рукам и ногам, но зато чем больше удается сжать цифровой поток данных перед записью, тем больше возможностей открывается перед разработчиками.

Эффективная система компрессии позволяет записывать данные с меньшей скоростью, благодаря чему можно получить:

- большее время записи на кассету;
- уменьшить размеры кассет;
- ускорить перемотку и, соответственно, уменьшить продолжительность сеанса монтажа.

Благодаря более широким строчкам записи можно:

- использовать более дешевую ленту;
- улучшить взаимозаменяемость (эксплуатационную совместимость) видеофонограмм;
- увеличить допуски на параметры механизмов транспортирования ленты и, тем самым, снизить стоимость производства и обслуживания аппаратов видеозаписи и повысить их надежность.

Уменьшение количества видеоголовок и вращающихся трансформаторов:

- упрощает конструкцию;
- уменьшает затраты на замену головок.

Уменьшение скорости вращения барабана и сокращение числа головок с соответствующими усилителями:

- уменьшает уровень акустических шумов;
- снижает потребление энергии, что особенно важно при создании камкордеров.

Требование телевизионной отрасли - снижение не только капитальных затрат, но и эксплуатационных расходов. Эксплуатационные расходы среди прочих статей включают стоимость кассет с лентой и затраты на замену видеоголовок или барабанов видеоголовок. Неизбежные, хотя и не столь явные расходы - перезапись архивов в связи со сменой форматов. Уменьшение числа основных головок записи и воспроизведения позволяет установить дополнительные головки для воспроизведения записей, сделанных в других цифровых или аналоговых форматах, снимая необходимость перезаписи архивных материалов.

Итак, применение видеокомпрессии данных представляет собой эффективный фактор проектирования аппаратов видеозаписи. Компрессия, применяемая в Betacam SX, позволяет довести поток данных компонентного видеосигнала стандарта 4:2:2 до 18 Мбит/с, т.е. сжать его почти в 10 раз. Такая скорость потока данных является самой маленькой в мире современной цифровой видеозаписи. Ближайшие соседи - это формат бытовой видеозаписи DV и форматы на базе DV - DVCAM и DVCPRO, в которых скорость потока компрессированных данных почти на 40% больше - 25 Мбит/с, причем при стандарте дискретизации 4:2:0 или 4:1:1. Поэтому именно формат Betacam SX позволил разработчикам в наибольшей степени использовать преимущества, обеспечиваемые компрессией как фактором проектирования.

Пространство или время?

Для компрессии, или плотной упаковки данных, в телевидении используются два основных способа кодирования: внутрикадровое и межкадровое. Каждый из них характеризуется своими эксплуатационными ограничениями. Сокращение скорости потока данных за счет внутрикадрового кодирования (JPEG, DV) устраняет пространственную избыточность телевизионного изображения, но оставляет временную. Результатом такого ограничения является то, что при заданной скорости компрессированного потока данных качество изображения оказывается ниже, чем оно могло бы быть, если бы устранялась и временная избыточность. С другой стороны, при заданном уровне качества изображения скорость компрессированного потока данных оказывается больше, чем она могла бы быть при устранении временной избыточности.

При межкадровом кодировании (примером является MPEG-2) устраняется и пространственная, и временная избыточность изображения. При компрессии до заданной скорости потока данных такая система позволяет получить более высокое качество изображения, чем в случае только внутрикадрового кодирования. Эффективность межкадрового кодирования зависит от количества кадров в группе изображений - чем больше длина группы, тем выше степень компрессии. Однако использование больших групп изображений затрудняет монтаж. Монтаж с использованием процедуры декодирования, коммутации и повторного кодирования не является удовлетворительным решением, поскольку такой способ связан с искажениями и необратимыми потерями качества. Поэтому целесообразность применения эффективных систем компрессии с межкадровым кодированием в видеозаписи определяется тем, насколько реализуются такие требования, как произвольный выбор входных и выходных точек при монтаже компрессированных потоков. Таким образом, использование эффективного межкадрового кодирования MPEG-2 в системах производства телевизионных программ возможно только после решения проблемы монтажа компрессированных потоков. Монтажу телевизионных программ на уровне компрессированных потоков данных уделяется в настоящей статье особое внимание.

При выборе способа кодирования надо принимать во внимание еще один важнейший фактор, связанный с накоплением искажений изображения и артефактов при последовательном включении кодеков компрессии. Применение одинаковых систем компрессии снимает эту проблему, применение аналогичных - значительно снижает ее остроту. Компрессия MPEG-2 уже применяется на ряде этапов телевизионного производства и вещания: при выдаче цифровых телевизионных программ в эфир, при передаче программных материалов по сетям и линиям коммуникаций. Поэтому использование MPEG-2 в процессе производства телевизионных программ - это стратегический выбор, стимулирующий решение проблемы монтажа на уровне компрессированных потоков видеоданных. Betacam SX стал первым форматом цифровой видеозаписи, предусматривающим применение системы компрессии MPEG-2.

Betacam SX - приложение MPEG-2

MPEG - это обобщенная модель компрессии телевизионного изображения, в которой можно выделить уже принятые стандарты MPEG-1, MPEG-2, MPEG-4 и спецификацию MPEG-7, подготавливаемую для стандартизации (рис. 1). Спецификация MPEG-2 описывает обобщенную схему компрессии, основанную на межкадровом кодировании. Огромная сфера приложения MPEG-2 - это передача и распределение телевизионных программ в системах наземного, кабельного и спутникового телевизионного вещания (параметры кодирования в таких современных системах определяются параметрами основного и высокого уровней основного профиля: MP@ML, MP@HL. Набор параметров компрессии, задаваемый основным уровнем студийного профиля, или профиля 422, определяет видеокомпрессию, удовлетворяющую требованиям производства телевизионных программ. Структура дискретизации исходных материалов соответствует соотношению 4:2:2 (это и дает название профиля), скорость потока компрессированных видеоданных - до 50 Мбит/с. Для сравнения - в подмножестве MP@ML, используемом в вещании, структура дискретизации - 4:2:0, максимальная скорость потока компрессированных данных - 15 Мбит/с).


 Рис. 1. Betacam SX в иерархической структуре системы видеокомпрессии MPEG

Даже внутри области, задаваемой комбинацией профиля и уровня, может потребоваться введение дополнительных ограничений на параметры видеокомпрессии, которые определяют область конкретного применения MPEG-2. Эту ограниченную область принято называть приложением. Формат Betacam SX является приложением основного уровня студийного профиля 422, ориентированным на область телевизионной журналистики и производства программ новостей.

Введение понятий профиля, уровня и приложения соответствует принципу функциональной и эксплуатационной гибкости, заложенному в систему MPEG. При кодировании потока видеоданных в соответствии с параметрами приложения Betacam SX используются средства MPEG-2, поэтому обобщенный декодер MPEG-2 и декодер 422P@ML могут декодировать поток компрессированных данных Betacam SX. Однако параметры Betacam SX представляют собой подмножество 422P@ML, которое соответствует требованиям конкретного приложения - производства программ новостей.

Приложение Betacam SX предполагает структуру дискретизации изображения 4:2:2, что соответствует Рекомендации ITU-R 601. Кодирование с целью устранения пространственной избыточности основано на дискретном косинусном преобразовании в рамках блоков с размерами 8~x~8 пикселов. Кодирование, сокращающее временную избыточность, предполагает дифференциальную импульсно-кодовую модуляцию с компенсацией движения в рамках макроблока из четырех блоков. Таблицы квантования и энтропийного кодирования соответствуют спецификации MPEG-2. Важнейшее ограничение, определяющее приложение, - длина группы изображений. В Betacam SX используются открытые двухкадровые группы со структурой I-B, т.е. состоящие из I- и B-изображений. В основе выбора такой длины и структуры группы изображений - стремление минимизировать скорость потока компрессированных данных при обеспечении требования монтажа с точностью 0 кадров.

Применение B-кадров означает значительное уменьшение потока компрессированных данных. Если для сюжетов, типичных для телевизионного вещания, объем данных в кадре типа B составляет примерно четверть от объема I-кадра, то система компрессии, основанная на группе изображений I-B, характеризуется скоростью потока приблизительно 62% от скорости потока, составленного из одних I-кадров (при одном и том же уровне качества изображения). При фиксированном значении цифрового потока применение группы из изображений типа I и B обеспечивает более высокое качество, чем в случае потока данных из одних I-кадров.

Группа из I- и B-кадров обеспечивает также некоторое преимущество в сравнении со структурой I-P (поскольку объем данных в кадре типа P составляет примерно 35% от объема I-кадра, то скорость потока из групп I-P составляет около 68% от потока из одних I-кадров). Однако это преимущество невелико. Более важным является то, что применение группы I-B дает большую гибкость в монтаже, чем группы I-P. Пара кадров I-P является закрытой группой, в которой P-кадр кодируется с использованием предсказания на основе предшествующего кадра типа I. Это обеспечивает простой монтаж компрессированных потоков, но лишь на границах групп изображений из двух кадров. Группа I-B - открытая, в ней изображение типа B кодируется с использованием как предшествующего, так и последующего кадров типа I. На первый взгляд кажется, что в такой структуре все кадры связаны в неразрывную цепочку, которую нельзя разорвать без сбоя. Однако гибкость, присущая системе MPEG-2, позволяет перемаркировать или перекодировать B-кадр в P-изображение, полученное путем предсказания как на основе предыдущего, так и последующего I-кадров. Последнее обстоятельство и означает, что монтажные точки могут устанавливаться без ограничений и монтаж возможен с точностью 0 кадров.

Особенностью Betacam SX как приложения MPEG-2 является также управление квантованием как регулятором степени компрессии. В компрессии, применяемой, например, в телевизионном вещании, квантование коэффициентов дискретного косинусного преобразования проводится таким образом, что поддерживается постоянной средняя скорость цифрового потока, но объем данных, необходимых для описания одной группы изображений не является постоянным. Однако специфика видеозаписи накладывает свои ограничения. Каждая группа изображений должна записываться на одном и том же количестве наклонных дорожек. Стабилизация объема компрессированных данных, описывающих группу изображений, осуществляется с помощью квантования коэффициентов косинусного преобразования. Управление квантованием в процессе кодирования выполняется таким образом, что объем данных группы не превышает некоторой заданной величины, поскольку группа изображений записывается на фиксированном количестве дорожек.

Параметры формата Betacam SX

Параметры кодирования цифровых сигналов и общие параметры формата приведены в табл.1 и 2. Благодаря структуре дискретизации 4:2:2 цветовая информация сохраняется с детальностью, необходимой для выполнения монтажа и введения специальных эффектов на уровне, соответствующем требованиям производства программ. Квантование соответствует расходу 8 бит на отсчет. Записи подлежат 608 строк каждого кадра при стандарте разложения изображения 625/50 (576 строк соответствуют активной части кадра, а 32 - интервалу гашения, в котором может передаваться важная дополнительная информация). В 608 строках содержится 8x(720+360x2)x608=7004160 битов данных сигнала яркости и цветоразностных сигналов (в активной части каждой строки записывается 720 отсчетов яркостного сигнала и по 360 - каждого цветоразностного). При частоте кадров 25 Гц это соответствует скорости потока данных компонентного видеосигнала 7004160x25=175,104 Мбит/с. Для стандарта 525/60 в каждом кадре записывается 507 строк, что соответствует принципу 5/6, впервые реализованному в аппаратах формата D-1. При частоте кадров 30 Гц (точно - 29,97 Гц) скорость потока видеоданных практически равна аналогичному показателю для системы 625/50, а именно: 8x(720+360x2)x29,97=175,044 Мбит/с.

Таблица 1. Формат Betacam SX.
Параметры кодирования входных сигналов.
Параметр
Значение
Видео
Частота дискретизации, МГц
13,5 (Y), 6,75 (R-Y/B-Y)
Число записываемых отсчетов в строке
720 (Y)
360 (R-Y/B-Y)
Число записываемых строк в кадре
608 (625/50)
507 (525/60)
Квантование, бит/отсчет
8
Компрессия
10:1, MPEG-2 422P@ML
Звук
Частота дискретизации, кГц
48
Квантование, бит/отсчет
16
Число каналов
4

После сокращения пространственной и временной избыточности скорость потока данных составляет 18 Мбит/с, что приблизительно и соответствует степени компрессии 10:1. Скорость 18 Мбит/с - это самое малое значение среди всех форматов цифровой видеозаписи, существующих в настоящее время, поэтому разработчики аппаратуры формата Betacam SX могли воспользоваться преимуществами малой скорости потока записываемых данных в наибольшей степени.

Таблица 2. Общие параметры формата Betacam SX.
Параметр
Значение
Ширина ленты, мм
12,65
Толщина ленты, мкм
14,5
Рабочий слой
Металло-порошковый (1450 Э)
Могут использоваться ленты типов
UVWT и BCT-MA
Размеры кассет, мм
     S
     L

156x96x25
245x145x25
Минимальная длина волны, мкм
0,744
Диаметр барабана головок, мм
81,4
Частота вращения барабана, Гц
75 (625/50)
74,925 (525/60)
Число строчек/группу
12 (625/50)
10 (525/60)
Ширина строчек, мкм
32
Шаг пар строчек, мкм
64
Угол наклона строчки, град
4,62
Азимут, град
15,26
Скорость транспортирования
ленты, мм/с
59,575 (Betacam SX 625/50)
59,515 (Betacam SX 525/60)
101,5 (Betacam/SP 625/50)
118,6 (Betacam/SP 525/60)
Продольные дорожки
Дорожки временного кода, управления, дополнительная
Время записи на
кассету (макс.), мин
     S
     L


62 мин.
194 мин.

Полный поток записываемых на ленту данных составляет около 40 Мбит/с. Эта величина включает в себя 18 Мбит/с компрессированных видеоданных, к которым добавляются проверочные данные для защиты от ошибок (42%), данные четырех некомпрессированных каналов звука с защитой (159%). Значительный объем проверочных данных (общий усредненный их объем превышает 80%, обеспечивая защиту как от флуктуационных шумов, так и от ошибок, обусловленных выпадениями, царапинами на ленте и загрязнением головок) является отличительной особенностью формата Betacam SX. Благодаря такому объему проверочных данных оказывается возможным, например, полностью восстановить (не маскировать, а именно восстановить путем вычислений с использованием проверочных данных) информацию, содержащуюся на двух наклонных дорожках из 12 дорожек группы изображений, в случае ее потери из-за выпадений или царапин.

Высокой надежности способствует также канальное кодирование по методу парциальных отсчетов, которое минимизирует низкочастотные и высокочастотные составляющие записываемого цифрового сигнала, согласовывая спектр сигнала с частотными характеристиками канала магнитной записи-воспроизведения.


 Рис. 2. Структура видеофонограммы формата Betacam SX

Структура видеофонограммы формата Betacam SX показана на рис. 2. При записи телевизионного сигнала в стандарте разложения 625/50 группа изображений, состоящая из двух кадров, записывается на 12 наклонных строчках, в стандарте 525/60 - на 10. Запись производится одной парой головок, т.е. за один оборот барабана записываются две наклонных дорожки. При частоте вращения барабана 75 Гц за интервал времени, равный двум телевизионным кадрам, барабан делает 6 оборотов при частоте кадров 25 Гц и 5 - при частоте кадров 30 Гц (это еще одна иллюстрация принципа 5/6), что и дает 12 и 10 наклонных строчек соответственно.

Небольшая величина потока компрессированных данных (18 Мбит/с) позволила установить довольно большие (в сравнении с другими цифровыми форматами) значения ширины строчек и шага пары строчек (32 и 64 мкм соответственно), а также минимальной длины записываемой волны (0,74 мкм), что повышает отношение несущая/шум для считываемых с ленты данных. Пакеты звуковых данных располагаются в середине наклонных строчек, что обеспечивает их дополнительную защиту. Близость параметров формата для стандартов разложения на 625 и 525 строк позволяет выпускать аппараты с переключением систем 625/50 и 525/60.

Запас в отношении несущая/шум и высокая степень защиты используется для упрощения механизма транспортирования ленты. Именно этот запас позволяет увеличить ширину и шаг строчек и упростить решение проблемы трекинга - совмещения траектории движения головок при воспроизведении со строчками записи.

Для записи используется специальная металлопорошковая лента с толщиной 14,5 мкм. Однако и ленты типов BCT-MA и UVWT-MA с металлопорошковым слоем, предназначенные для Betacam SP, могут использоваться для записи и воспроизведения в аппаратах формата Betacam SX. Лента с оксидным рабочим слоем, предназначенная для аналогового аппарата Betacam, также может использоваться в видеомагнитофонах Betacam SX, но только при воспроизведении аналоговых видеозаписей. Длительность записи при использовании малой кассеты типа S превышает 60 минут, и 190 минут - большой кассеты типа L.

Многоголовочный трекинг

Единственный способ обеспечить надежное воспроизведение записанного сигнала в аналоговой видеозаписи - точный трекинг, т.е. совмещение траектории головок воспроизведения со строчками записи. Эта проблема решается за счет уменьшения допусков и повышения требований к точности поддержания параметров барабана видеоголовок и механизма транспортирования ленты. Но при воспроизведении с переменной скоростью, в режимах стоп-кадра и обратной перемотки воспроизведение без помех достигается лишь за счет динамического трекинга. В цифровой видеозаписи нет жесткой необходимости считывать данные в том же порядке, в котором они записывались. Это означает, что проблему надежного считывания не обязательно решать так же, как в аналоговой видеозаписи. Однако до сих пор в цифровых системах записи побеждал традиционный подход.


 Рис. 3. Компоновка барабана видеоголовок (а) и иллюстрация принципа считывания парой головок (б,в)

Альтернатива, предлагаемая в аппаратах Betacam SX, заключается в увеличении числа головок воспроизведения (рис. 3). Головки объединяются в пары, траектории движения которых смещены друг относительно друга на половину шага наклонных дорожек. Если одна головка полностью сошла с дорожки, то другая следует точно по середине дорожки (рис. 3б). Хотя головки A1 и A2 воспроизводят сигналограмму одной дорожки в разное время, цифровая техника позволяет объединять сигналы двух видеоголовок и воспроизводить все записанные на дорожке данные независимо от трекинга. Такой способ работает эффективно и в том случае, когда дорожка искривлена, например, из-за растяжения ленты (рис. 3в). Данные одной части дорожки воспроизводятся первой головкой, другой части - второй головкой. Аналогичным образом осуществляется воспроизведение с нестандартной скоростью.

Таким образом, исчезает необходимость в сложных системах динамического трекинга. Это также означает, что считывание данных дорожки группой головок позволяет значительно упростить и удешевить механику видеомагнитофонов. Упрощается и удешевляется обслуживание аппаратов. Смена барабана головок становится процедурой, которая может выполняться в полевых условиях и после которой не требуется никаких юстировок. Надежное считывание записанных данных может выполняться при скоростях, в четыре раза превышающих нормальную. Такой режим используется для перевода записанных материалов с ленты на жесткий магнитный диск встроенного в видеомагнитофон дисковода или диск внешнего сервера. Это достигается увеличением скорости транспортирования ленты и использованием всех головок воспроизведения для считывания данных, записанных на наклонных дорожках. Увеличения частоты вращения барабана не требуется.

В режиме перемотки с большой скоростью видеоголовки воспроизведения пересекают несколько наклонных дорожек, поэтому данные считываются с дорожек пакетами в квазислучайном порядке. Наименьшая единица данных, считываемых в таком режиме, - макроблок с размерами 16x16 пикселов. Изображение, видимое на экране монитора, составляется из макроблоков нескольких соседних кадров. Такая мозаичная картинка опознаваема при скоростях, превышающих нормальную в 75 раз.

Линейный монтаж

Возможный способ монтажа в цифровых телевизионных системах с видеокомпрессией связан с декодированием компрессированных потоков данных и превращением их в цифровой видеосигнал. Этот способ предполагает, что собственно монтаж осуществляется с использованием декомпрессированных видеосигналов, после чего смонтированный поток цифрового видео вновь кодируется и трансформируется в поток компрессированных видеоданных. Если такая монтажная процедура повторяется несколько раз, то накапливаются искажения и артефакты компрессии. Но эти дополнительные искажения будут отсутствовать, если монтаж выполняется без процедуры декомпрессии и последующей повторной компрессии смонтированных сигналов.

Как было отмечено выше, в формате видеозаписи Betacam SX, являющемся приложением системы компрессии MPEG-2 422P@ML, используются группы изображений из двух кадров: кадра типа I и кадра типа B. В кадре типа I используется только внутрикадровое кодирование, он независим от остальных изображений последовательности кадров. Но кадр типа B кодируется с использованием двунаправленного предсказания, поэтому для его декодирования нужны данные и из предыдущего, и из последующего видеокадров. Если в процессе монтажа исключается и заменяется новым любой из соседних компрессированных I-кадров, то кадр типа B в общем случае не может быть декодирован. Однако спецификация MPEG-2 предусматривает положение, которое делает возможным монтаж компрессированных потоков видеоданных. Любой из B-кадров в последовательности I-B-I-B-… может кодироваться с использованием однонаправленного предсказания, что превращает его в кадр типа BU (индекс U и означает однонаправленный - Unidirectional). Для предсказания может использоваться любой соседний I-кадр. Это и определяет специфику способа монтажа компрессированных потоков, кодированных в соответствии со спецификацией формата Betacam SX. Если в соответствии с выбранной точкой монтажного перехода B-кадр должен потерять какой-либо из опорных кадров, то этот B-кадр должен быть перекодирован и заново записан на ленту как кадр типа BU. Таким образом, перекодированию подвергается только один B-кадр на стыке двух монтируемых сюжетов, что и обеспечивает практическое отсутствие эффекта накопления искажений при последовательных монтажных операциях.


 Рис. 4. Принцип монтажа компрессированных видеоданных в видеомагнитофоне формата Betacam SX

Техническую возможность такого способа обеспечивает наличие головок опережающего воспроизведения (рис. 3-4). Компрессированные данные, несущие информацию об изображениях окрестности точки монтажного перехода, могут быть считаны головкой опережающего воспроизведения и декодированы (декодер SX на рис. 4 - это декодер системы компрессии MPEG-2 422P@ML, спроектированный для приложения Betacam SX). После этого видеокадры окрестности монтажного перехода могут быть вновь закодированы и записаны на прежнее место с помощью головки записи.

Следует иметь в виду, что наименьшим блоком данных, который может быть считан с ленты и вновь записан в таком режиме монтажа, является группа изображений. Это связано с тем, что граница между B- и I-кадрами в группе не фиксирована на ленте, ее положение зависит от свойств последовательности телевизионных кадров, например, от соотношения между детальностью и динамичностью сюжета (но группа изображений из двух кадров всегда записывается на 12 (625/50) или 10 (525/60) наклонных дорожках).


 Рис. 5. Монтаж в режиме вставки (входная точка предшествует кадру типа B)

Рис. 5-8 иллюстрируют различные случаи реализации монтажных решений, отличающихся друг от друга положением входной и выходной точек при вставке в уже записанную на ленте последовательность компрессированных изображений (последовательность A, или старая запись) группы видеокадров, полученных от другого источника (последовательность B, или видеокадры вставки).

На рис. 5 выбранная входная точка находится между двумя группами изображений последовательности A. В каждой группе первым следует компрессированное изображение типа B (границы групп показаны двойной вертикальной линией). Кадр A6, уже записанный на ленте, является изображением типа I (с внутрикадровым кодированием). Поэтому для сохранения исходной последовательности компрессированных изображений (B-I), (B-I), …, (B-I) первое изображение последовательности B (оно обозначено как B1) должно быть закодировано как кадр типа B (изображение B1 должно заместить на ленте кадр A7 типа B). На рис. 5-8 тип компрессированного кадра показан в правом нижнем углу. Изображение B1 из последовательности B, конечно, не похоже на изображение A7, поэтому B1 должно кодироваться как кадр типа BU (с однонаправленным предсказанием, причем опорным должно быть изображение B2, которое будет кодироваться как кадр типа I). Преобразование видеокадра B1 в компрессированное изображение типа BU производится кодером SX. Это компрессированное изображение и записывается первым. Его запись является началом фактической записи при осуществлении вставки. Данные, считываемые головкой опережающего воспроизведения, используются только для правильной фазировки групп изображений в записываемой вставке. Точка начала новой записи совпадает с входной точкой монтажного перехода в режиме вставки, установленного автором монтажного решения.


 Рис. 6. Монтаж в режиме вставки (входная точка предшествует кадру типа I)

Рис. 6 иллюстрирует случай, когда входной точке монтажного перехода предшествует кадр типа I. Первый кадр вставки (это изображение B1 из последовательности B) должен кодироваться как кадр типа I и затем записываться на ленту вместо кадра A8. Проблема в том, что последний кадр старой записи (это кадр компрессированных данных A7) теряет один из своих двух опорных кадров, без которого он не может быть декодирован. Эта проблема решается следующим образом. Кадры A6, A7, A8 считываются с ленты с помощью головки опережающего воспроизведения и декодируются декодером SX (см. рис. 4). Затем декодированный видеокадр A7 заново кодируется как кадр типа BU (в качестве опорного при предсказании используется только изображение A6) и вместе с изображением B1, кодированным как кадр типа I, записывается на ленту в рамках одной группы изображений. Точка фактического начала новой записи в режиме вставки опережает входную точку монтажного перехода. Первым кадром вставки является, конечно, изображение B1, но кадр A7 старой записи должен быть записан заново после перекодирования из кадра типа B в кадр типа BU.


 Рис. 7. Монтаж в режиме вставки (выходная точка следует за кадром типа I)

Выходная точка монтажного перехода в режиме вставки может также быть выбрана как внутри группы изображений, так и между группами. На рис. 7 показан случай, когда выходная точка следует за кадром типа I старой записи. Последний видеокадр вставки (в примере рис. 7 это кадр B49) кодируется как кадр типа I и замещает кадр A55 последовательности A. Но в результате такого замещения кадр A56, кодированный и записанный прежде на ленте как кадр типа B, теряет предшествующее опорное изображение A55. Это означает, что старая запись не может оставаться неизменной после завершения вставки последовательности вписываемых изображений. Кадры компрессированных данных A55, A56 и A57 считываются с ленты с использованием головки опережающего воспроизведения и декодируются. Затем видеокадр A56 кодируется заново как кадр типа BU с использованием в качестве опорного лишь изображения A57. Но изображение A57 также должно заново записываться как кадр типа I, поскольку наименьшим блоком данных, который кодируется и записывается на ленту, является группа изображений. Кадр A55 после процедуры перекодирования группы A56 - A57 замещается кодированным изображением B49. Его опережающее считывание необходимо только для декодирования кадра A56 типа B. Становится ясным, что в варианте рис. 7 точка завершения новой записи сдвигается на одну группу изображений по отношению к выходной точке вставки.


 Рис. 8. Монтаж в режиме вставки (выходная точка следует за кадром типа B)

В примере рис. 8 выходная точка вставки следует за кадром типа B (A56) и предшествует кадру типа I (A57) последовательности A. Последний видеокадр вставки (B50) кодируется как кадр типа BU с однонаправленным предсказанием, причем в качестве опорного используется предшествующий кадр B50 типа I. Кадр B50 типа BU объединяется со считанным с опережением кадром A57 типа I старой записи и полученная группа записывается на ленту вместо группы A56 - A57 старой записи.

Примеры рис. 5-8 показывают, что точки монтажного перехода и точки начала (или завершения) новой записи не всегда совпадают. Но это не является следствием каких-либо ограничений на положение входной и выходной точек вставки. Входная и выходная точки могут быть установлены в любых местах, т.е. точность монтажа равна ±0 кадров. Перезапись одного или двух кадров до входной и после выходной точек является "профилактической", она направлена на предупреждение появления локальных дефектов регулярной структуры кодированных групп изображений, которые могли бы проявиться при монтаже.

В примерах рис. 5-8 видеокадры вставки представляют собой последовательность некодированных или декодированных изображений (имеется в виду кодирование MPEG-2). Если бы вставка представляла собой поток компрессированных данных, то потоки данных A и B должны были бы быть сфазированы для согласования во времени групп изображений (пример такого фазирования показан на рис. 23 статьи "MPEG - это просто!", "625, 2000г., №3, с.5-23). Необходимость фазирования обусловлена следующими обстоятельствами. Объем данных, необходимый для описания кадра типа I, намного больше объема кадра типа B. Поэтому два компрессированных I-кадра не могут следовать друг за другом в смонтированном потоке данных без риска переполнения буфера декодера (см. статью "MPEG - это просто!", "625, 2000г., №3, с.5-23). Однако после фазирования точки монтажного перехода могут быть установлены произвольным образом, т.е. как на границах групп изображений, так и внутри групп, что и иллюстрируется рис. 5-8. Ограничение, связанное с фазировкой компрессированных потоков, обходится как за счет декодирования компрессированных данных вставки, так и при использовании гибридных магнитофонов, в котором декодирование монтируемых потоков может быть выполнено лишь один раз после отработки всех монтажных операций.

Гибридный аппарат

Betacam SX - это не только формат цифровой компонентной видеозаписи на магнитную ленту. Стремление объединить преимущества систем записи на ленту и дисковых систем нелинейного монтажа привело к разработке гибридных аппаратов Betacam SX. Они включают в себя ленточные видеомагнитофоны и накопители данных на жестких магнитных дисках. Аппарат DNW-A100 (DNW-A100P), выпускаемый фирмой Sony в настоящее время, оснащен двумя встроенными дисководами жестких дисков. Компрессированные данные, считываемые с магнитной ленты, могут загружаться в дисковую память (рис. 9), причем максимальная скорость передачи данных между ленточным магнитофоном и дисководом жесткого диска в четыре раза превышает скорость, с которой данные записываются на ленту аппарата Betacam SX в нормальном режиме. Дисковая память гибридного аппарата служит основой системы нелинейного монтажа.


 Рис. 9. Потоки сигналов в гибридном магнитофоне Betacam SX

В гибридном аппарате данные с магнитного диска считываются блоками, содержащими целые группы изображений. При скоростях, превышающих нормальную, могут выбрасываться целые кадры, а оставшиеся - декодироваться и воспроизводиться. В результате данные могут воспроизводиться при скоростях перемотки, превышающих нормальную в 100 раз.

Время записи в случае использования двух встроенных дисководов составляет 90 минут. Оно может быть увеличено до 6,4 часа путем подключения внешнего накопителя - массива жестких магнитных дисков, организованных по системе RAID-3, к порту SCSI-2 гибридного аппарата. С использованием этого внешнего массива дисков оказывается возможным воспроизводить полностью смонтированную программу одновременно с записью новых видеоматериалов. Режим одновременной записи и воспроизведения возможен и в случае использования встроенного дискового накопителя, но при условии, что в смонтированных сценах не используется раздельный монтаж изображения и звука.

Гибридный аппарат Betacam SX может служить связующим звеном между цифровыми и аналоговыми системами. Видеоматериалы, записанные на аналоговых видеомагнитофонах Betacam и Betacam SP, могут воспроизводиться, оцифровываться, кодироваться и загружаться в дисковую память накопителя на жестких дисках. Кассеты с металлопорошковой лентой, предназначенной для видеомагнитофонов Betacam SP, могут использоваться для записи цифровых данных в аппаратах Betacam SX, причем время записи удваивается благодаря тому, что скорость транспортирования ленты в Betacam SX примерно в два раза меньше, чем в Betacam SP.

Сегодняшняя телевизионная техника быстро развивается, поэтому в гибридных аппаратах Betacam SX расширенный ряд входных и выходных сигналов. Для работы в аналоговом окружении в нем могут использоваться аналоговые компонентные и композитные входы и выходы видео. Для работы в цифровых системах предусмотрен последовательный цифровой интерфейс SDI. Для работы в сетях передачи видеоданных важнейшее значение имеет оснащение аппаратов Betacam SX интерфейсом SDTI, позволяющим передавать компрессированные данные со скоростью, в четыре раза превышающим обычную.

Обмен звуковыми сигналами (четыре канала) может производиться и в аналоговой форме, и в цифровой (интерфейс AES/EBU). Звуковые сигналы могут также передаваться с использованием интерфейса SDI в форме дополнительных данных, встроенных в поток видеоданных.


 Рис. 10. Монтаж с использованием гибридного магнитофона Betacam SX: видеозапись на ленте,  мастер-файлы на диске и смонтированная программа

Нелинейный монтаж

Гибридный аппарат может работать с различными контроллерами нелинейного монтажа. Видео и звуковые материалы, считываемые с магнитной ленты или поступающие с внешнего видеомагнитофона, записываются на диск гибридного аппарата в виде мастер-файлов (рис. 10). На диске может быть до 256 мастер-файлов произвольной длительности. Смонтированная с использованием контроллера программа представляет собой последовательность мастер-файлов или их фрагментов, расположенных в порядке, выбранном при монтаже. Но эта программа представляет собой не фактически записанную в нужном порядке последовательность выбранных фрагментов, а виртуальный файл, существующий в виде списка входных и выходных точек в выбранных мастер-файлах. В таком списке может быть до 1000 строк. Смонтированная таким образом программа может быть многократно исправлена, а после завершения работы она может быть воспроизведена, например, для выхода в эфир, а также записана на диск в виде нового мастер-файла или на ленту - для архивирования.


 Рис. 11. Декодирование виртуального файла с использованием сдвоенного декодера

Программа, смонтированная на диске в виде виртуального файла, воспроизводится путем сдвоенного декодирования (рис. 11). Фактическое переключение между двумя потоками данных выполняется путем коммутации декодированных цифровых сигналов. Декодирование выполняется лишь один раз после отработки монтажных решений, поэтому снимается проблема накопления артефактов и искажений компрессии, характерная для цифровых телевизионных систем с последовательным включением кодеков компрессии. Необходимое фазирование двух потоков данных, считываемых с диска, осуществляется с помощью управляемых переменных задержек. Важная роль отводится блоку памяти на выходе сдвоенного декодера (рис. 11). Эта память, организованная в виде кольцевого буфера, позволяет воспроизводить программу с переменной скоростью (внутри диапазона ±1 от нормальной скорости).

Практическая реализация

Монтаж цифровых потоков, компрессированных с использованием межкадрового кодирования MPEG-2 422P@ML, осуществим с использованием и ленты, и диска. Предыдущие разделы были посвящены принципам монтажа. Они показали, что решение возможно, но с использованием достаточно сложных методов обработки сигналов и при наличии значительных вычислительных мощностей. Но существует ли практическое воплощение этих принципов, приемлемое с экономической точки зрения? Ответ на вопрос заключается в том, что кодек компрессии Betacam SX (MPEG-2 422P@ML) строится на трех больших интегральных схемах (рис. 12). В качестве буферной памяти вместе с каждой интегральной схемы обработки сигналов используются микросхемы быстрой оперативной памяти. В виде отдельной интегральной схемы выполнен измеритель вектора движения, выполняющий оценку сначала с точностью до одного пиксела (ME-1), а затем - до 1/2 пиксела (ME-1/2). В структурных схемах кодера и декодера (рис. 13 и 14) можно найти все элементы общей системы видеокомпрессии MPEG-2 ("625", 1997, №7, с.60-75), приложением которой является кодек формата Betacam SX.


 Рис. 12. Схемотехническая реализация кодека Betacam SX


 Рис. 13. Структурные схемы ИС кодера Betacam SX


 Рис. 14. Структурная схема ИС декодера Betacam SX

Оценка практиков

Изящная технико-экономическая концепция, положенная в основу цифрового формата Betacam SX, реализована в семействе изделий, включающих в себя видеомагнитофоны, видеокамеры, гибридные рекордеры и монтажные системы. Но технический анализ не может заменить мнения человека, освоившего аппаратуру и применяющего ее в каждодневной работе. Давно известно, что практика - критерий истины. Что же думают о формате Betacam SX практики видеосъемки и монтажа?

Журнал "Television Broadcast" (January 2000, volume 23, issue 1, p.14) опубликовал результаты ежегодного опроса главных операторов программ новостей, работающих в телекомпаниях США. Цель опроса - определить, кто "Номер 1" среди цифровых форматов для электронной журналистики. 49 процентов телекомпаний, предполагающих перейти к цифровым технологиям в сфере программ новостей, рассматривают Betacam SX в качестве основного варианта (на втором месте - DVCPRO с 42% голосов). Еще более показательны следующие данные опроса. Сейчас 31% процент операторов программ новостей использует Betacam SP, 29% - Betacam SX, 21% - DVCPRO. Так вот, среди тех операторов, которые работают с Betacam SP, 48% считают его наилучшим. А тех, кто не только работает с Betacam SX, но и предпочитает его всем остальным форматам, - 80% (для DVCPRO соответствующий показатель - 76%).

Таким образом, победителем этого года в соревновании форматов цифровой видеозаписи надо признать Betacam SX. Чем это можно объяснить? Это формат видеозаписи, технические решения которого позволяют создавать аппаратуру компактную, надежную и более дешевую, чем ее нецифровые аналоги, для тех сфер телевидения, в которых производительность и экономичность являются приоритетными факторами. Betacam SX представляет собой приложение открытого стандарта MPEG-2, пригодного для всех стадий процесса производства телевизионных программ. Совместимость с Betacam SP превращает его в наиболее краткий и экономически эффективный путь перехода от аналоговых к цифровым сетевым технологиям. Итак, Betacam SX - это не просто формат видеозаписи, а цифровая система, которая объединяет разные носители и технологии и открывает новые возможности перед создателями телевизионных программ.

 

Замечания и предложения по работе сервера направляйте: web.master at 625-net.ru.

© 1996—2009 «Издательство 625». Все права защищены.

e-mail: magazine at 625-net.ru, тел./факс: (495) 691-7724, 695-9588.

Свидетельство о регистрации средства массовой информации Эл № 77-2794.