Цифровая магнитная видеозапись: формат
Digital S
Константин
Гласман, иллюстрации Маргариты Покопцевой
Концепция формата Digital S
Развитие видеозаписи продемонстрировало, что ни один формат цифровой
записи не смог удовлетворить всем требованиям телевизионного вещания.
Фирма JVC, создавая формат Digital S, стремилась занять определенную
нишу в сфере телевизионного производства, в связи с чем разработка
этого формата была подчинена следующим основным целям:
- создать видеомагнитофон, качественные показатели которого должны
превосходить параметры любого аналогового аппарата и цифрового магнитофона
с дискретизацией входного видеосигнала в соответствии с форматом
4:1:1 или 4:2:0;
- обеспечить интерфейс с существующими цифровыми и аналоговыми телевизионными
системами, создавая возможности для эволюционного развития и совершенствования
техники телевизионного вещания;
- выйти на рынок с приемлемыми для большинства покупателей стоимостными
показателями видеомагнитофона.
Сочетание сравнительно высокого качества с низкой ценой должно
было сделать основными покупателями аппаратов Digital S владельцев
существующих аналоговых телевизионных систем со сравнительно скромными
финансовыми возможностями. Однако при анализе экономических проблем
перехода к цифровым технологиям необходимо учитывать не только капитальные
вложения, эксплуатационные расходы и затраты на видеоленту. Важным
фактором является также скорость, с которой аналоговое оборудование
заменяется на цифровое. Имея интерфейсы с существующими аналоговыми
телевизионными системами, Digital S должен был обеспечить эволюционный
путь технического переоснащения телевизионных компаний. Приобретение
всего лишь одного монтажного видеомагнитофона формата Digital S,
оснащенного аналого-цифровыми и цифро-аналоговыми преобразователями,
должно было привнести много преимуществ цифрового производства программ
в действующую телевизионную систему.
Видеокомпрессия
стала важным фактором современной технологии видеозаписи. Способ
и степень компрессии формата Digital S были определены после установления
следующих основных требований:
- дискретизация изображения в компонентном формате 4:2:2;
- лента шириной 12,65 мм с металлопорошковым покрытием в кассете
типа S-VHS;
- время записи около 2 часов;
- обеспечение возможностей многократной перезаписи при сохранении
вещательного уровня качества.
Удовлетворение этих требований привело к установлению сравнительно
небольшой степени компрессии - 3,3:1. Был выбран способ компрессии,
основанный на внутрикадровом кодировании с использованием дискретного
косинусного преобразования. На выбор способа повлияли также соображения,
связанные с обеспечением монтажа с точностью до кадра и приемлемого
качества при ускоренном в несколько десятков раз воспроизведении
в прямом и обратном направлениях, а также, конечно, экономические
факторы.
Важным элементом концепции формата Digital S стала совместимость.
В данном случае совместимость означает возможность воспроизведения
телевизионных программ, записанных в формате S-VHS, что обеспечивает
преемственность между существующими фильмотеками в формате S-VHS
и библиотеками в формате Digital S.
Видеофонограмма и компоновка барабана головок
Рис.
1. Видеофонограмма формата Digital S
TI секторы содержат информацию о дорожках, необходимую для автоматического
трекинга. Они записываются три раза на каждой наклонной дорожке,
что обеспечивает их воспроизведение при любых скоростях ленты. Таким
образом, в формате Digital S для совмещения траектории движения
головок воспроизведения с дорожками записи используются не только
сигналы, записанные на продольной дорожке управления, но и данные,
записываемые вращающимися головками на наклонных дорожках.
Рис.
2. Структура видеофонограммы кадра формата Digital S (стандарт разложения
625/50)
На ленте записываются три продольных дорожки. Одна такая дорожка
предназначена для записи импульсов управления, которые могут использоваться
также для быстрого поиска и монтажа. Две дорожки служат для записи
двух каналов монтажного звука.
Формат Digital S предполагает использование современной металлопорошковой
магнитной ленты с двухслойным рабочим покрытием. При использовании
ленты толщиной 14,4 мкм длительность записи составляет 104 минуты,
применение более тонкой ленты позволит увеличить это время до 2
часов.
Лента помещается в кассету, подобную видеокассете S-VHS. В магнитофоне
Digital S используются автоматическая очистка ленты от пыли и система
очистки головок, которая активизируется при загрузке и выгрузке
кассеты. Эти меры обеспечивают более высокий уровень защиты от выпадений,
вызванных пылью. Механизм транспортирования ленты Digital S представляет
собой усовершенствованную версию S-VHS. Использование в качестве
близких прототипов хорошо отработанных и проверенных в течение многих
лет кассеты и механизма S-VHS позволило не только сэкономить время
и средства на разработку, но и повысить надежность аппаратов Digital
S. Кроме того, это позволяет сравнительно простыми средствами обеспечивать
совместимость видеофонограмм S-VHS и Digital S с целью создания
видеомагнитофонов Digital S, которые могут воспроизводить телевизионные
программы, записанные в формате S-VHS.
Важнейшим компонентом любого видеомагнитофона является барабан
видеоголовок. Конструкция барабана Digital S была существенно усовершенствована
по сравнению с системой S-VHS. Вращающийся барабан с видеоголовками
находится между двумя неподвижными, тогда как в обычной системе
S-VHS вращается верхний барабан, а нижний является неподвижным.
Высота вращающегося барабана сравнительно невелика, что обеспечивает
стабильность контакта "головка-лента" и улучшает линейность наклонных
дорожек на ленте. На вращающемся барабане монтажного видеомагнитофона
находятся две пары головок записи, две пары головок воспроизведения
и две вращающиеся стирающие головки.
В формате Digital S предусматривается использование компрессии
с симметричной схемой кодирования-декодирования. Интервалы времени,
затрачиваемые на кодирование (компрессию) и декодирование (декомпрессию),
- одинаковы, они равны примерно двум кадрам. Для реализации при
монтаже предварительного воспроизведения головки воспроизведения
располагаются на вращающемся барабане примерно на 1 мм выше, чем
головки записи, что соответствует опережению во времени около четырех
кадров. Это позволяет воспроизвести сигнал, записанный на ленте,
и после обработки записать его на тех же дорожках ленты с использованием
одного видеомагнитофона.
Кодирование входных сигналов
Формат Digital S предполагает использование структуры дискретизации
телевизионного изображения в соответствии с Рекомендацией ITU-R
601. Яркостный сигнал дискретизируется с частотой 13,5 МГц, цветоразностные
сигналы - с частотой 6,75 МГц (табл. 2). Применение стандарта дискретизации
4:2:2 обеспечивает резкость и разрешение цветных деталей изображения
на уровне, необходимом для качественного осуществления разнообразных
операций в процессе компоновки и монтажа телевизионных программ.
Табл.
2. Формат Digital S. Параметры кодирования входных сигналов
Компрессия, предусматриваемая форматом Digital S, основана на применении
дискретного косинусного преобразования (DCT - Discrete Cosine Transform),
в процессе которого матрица элементов изображения трансформируется
в матрицу коэффициентов косинусного преобразования, называемую также
DCT-блоком. В формате Digital S, как и во многих других стандартах
компрессии, предполагается использование DCT-блоков с размерами
8 точек по горизонтали и 8 точек по вертикали. Четыре DCT-блока,
которые складываются из двух блоков, образованных отсчетами яркостного
компонента изображения, и двух - отсчетами цветоразностных компонентов,
составляют макроблок формата Digital S (рис. 3). Макроблок соответствует
области телевизионного изображения с размерами 16 точек по горизонтали
и 8 точек по вертикали, то есть в его состав входят отсчеты яркостного
и цветоразностных компонентов в 16 точках восьми соседних строк
кадра. Макроблок представляет собой основной элемент в процессе
маскирования обнаруженных, но не исправленных ошибок. 27 соседних
макроблоков, которые представляют собой массив из девяти макроблоков
по горизонтали и трех по вертикали, образуют структуру, называемую
суперблоком (рис. 4). Телевизионный кадр представляет собой массив
суперблоков с размерами 5 блоков по горизонтали и 24 (в системе
с разложением 625/50) или 20 (в системе 525/60) - по вертикали (рис.
5).
Рис.
3. Структура макроблока Digital S (2 блока DCT сигнала Y, 1 блок
DCT сигнала Cr, 1 блок DCT сигнала Cb)
В системе с разложением 625/50 телевизионный кадр записывается
на двенадцати наклонных дорожках (6 пар дорожек). Первая дорожка
пары записывается головкой с положительным углом азимута, вторая
- с отрицательным. Так как число пар дорожек в кадре является четным,
то суперблоки, соответствующие одним и тем же областям телевизионного
изображения в последовательности кадров, будут записываться одной
и той же парой головок. Если откажет одна из головок записи или
воспроизведения, то часть телевизионного изображения будет безвозвратно
потеряна. Чтобы этого не было, происходит изменение порядка записи
суперблоков. В одном кадре на дорожках с положительным азимутом
записываются нечетные ряды суперблоков, на дорожках с отрицательным
азимутом - четные. В следующем кадре порядок записи рядов суперблоков
меняется на противоположный. Поэтому даже в случае отказа одной
головки воспроизводимое изображение может возобновляться через каждые
два кадра с использованием данных, записанных другой головкой. В
системе разложения изображения 525/60 один кадр записывается на
пяти парах дорожек. Так как число пар дорожек нечетное, то одна
и та же головка записывает разные области изображения в соседних
кадрах без изменения порядка записи четных и нечетных рядов суперблоков
в массиве телевизионного кадра.
Рис.
4. Структура суперблока формата Digital S (27 макроблоков)
Компрессия и перемешивание видеоданных
Скорость передачи видеоданных, кодированных по стандарту 4:2:2
при 8 битах на отсчет равна 216 Мбит/с. Если записывать только активную
часть телевизионного изображения, то скорость цифрового потока данных
определяется величиной 166 Мбит/с. Формат Digital S предполагает
использование компрессии для доведения скорости записываемого потока
данных примерно до 50 Мбит/с, что соответствует степени компрессии
3,3:1.
Рис.
5. Структура кадра изображения формата Digital S (стандарт разложения
625/50)
Основные этапы компрессии: дискретное косинусное преобразование
массива чисел (отсчетов изображения), содержащихся в DCT-блоке;
квантование коэффициентов косинусного преобразования; зигзагообразное
сканирование DCT-блока; кодирование полученной последовательности
данных словами переменной длины. Управление скоростью компрессированного
потока данных производится путем изменения шкалы квантования для
коэффициентов косинусного преобразования. Чем более грубая шкала
квантования используется, тем меньше скорость потока данных на выходе
кодера компрессии. Практически воздействие на шкалу квантования
осуществляется путем изменения так называемого фактора квантования,
то есть числа, на которое делятся коэффициенты косинусного преобразования
в процессе квантования (при декомпрессии коэффициенты косинусного
преобразования должны быть умножены на фактор квантования для восстановления
округленных значений коэффициентов).
Перед компрессией цифровые данные, описывающие кадр изображения,
подлежат перемешиванию (рис. 6). Надо отметить, что цель перемешивания
принципиально отличается от назначения одноименной операции, осуществляемой
в видеомагнитофонах без компрессии. Дело в том, что в видеозаписи
компрессированные данные должны записываться с постоянной скоростью
и пакетами фиксированной длины. Но при одной и той же шкале квантования
(имеется в виду квантование, осуществляемое в процессе компрессии)
области с малым содержанием высокочастотных компонентов после компрессии
занимают меньший объем, чем области такой же площади с большим содержанием
высокочастотных компонентов. Иными словами, участки с плавно меняющейся
яркостью изображения, отличающиеся малым содержанием высокочастотных
компонентов, компрессируются "легко", они требуют для своего описания
лишь малое число коэффициентов косинусного преобразования. Участки,
содержащие контуры, перепады яркости, мелкие детали, компрессируются
"трудно", для их описания требуется большое количество коэффициентов.
Если в записываемый на ленту пакет фиксированной длины попадет много
"труднокомпрессируемых" участков изображения, насыщенных высокочастотными
компонентами, то придется использовать более грубое квантование,
что вызовет искажение изображения и появление артефактов. Поэтому
желательно, чтобы в блок видеоданных, который после компрессии превращается
в пакет фиксированной длины, не попадали бы только "труднокомпрессируемые"
участки.

Рис. 6. Обработка сигналов изображения и звука в процессоре видеомагнитофона
формата Digital S
Блок видеоданных, который трансформируется в процессе компрессии
формата Digital S в пакет фиксированной длины, называется видеосегментом.
Элементарным объектом в процессе перемешивания является макроблок.
Цель перемешивания - предотвратить попадание в видеосегмент серии
макроблоков с большим содержанием высокочастотных компонентов. В
формате Digital S предполагается образование видеосегментов, состоящих
из пяти макроблоков, причем эти макроблоки берутся в процессе перемешивания
из различных суперблоков, образующих кадр телевизионного изображения
(рис. 5). Насыщенность макроблоков мелкими деталями в процессе перемешивания
не определяется, закон перемешивания является фиксированным, но
он оптимизирован таким образом, что для типичных изображений обеспечивается
минимум артефактов компрессии при постоянном объеме компрессированного
сегмента.
Квантование и кодирование в процессе компрессии
Управление локальной степенью компрессии и обеспечение постоянства
объема данных в компрессированном сегменте, достигаемое за счет
изменения характеристик квантования, обладает рядом особенностей.
Перед квантованием коэффициентов выполняются следующие операции:
- классификация DCT-блоков;
- начальное масштабирование;
- оценка.
Первой выполняется классификация, в процессе которой DCT-блоки
относят к одному из четырех классов. Признаком классификации служит
абсолютная величина коэффициентов - амплитуд косинусоидальных составляющих,
которые описывают переменную составляющую яркости в пределах DCT-блока.
DCT-блок, содержащий лишь несколько коэффициентов переменной составляющей
малой величины, относят к нулевому классу. Такой блок "легко" поддается
компрессии. DCT-блок, содержащий большое число коэффициентов средней
величины и несколько коэффициентов большой, относят к третьему классу.
Такой блок "трудно" компрессируется. Промежуточные варианты получают
номера: первый и второй.
После классификации выполняется начальное масштабирование, в процессе
которого коэффициенты переменной составляющей округляются, их длина
уменьшается с 10 до 9 битов. Характер округления зависит от класса
DCT-блока. Для блоков от нулевого до второго классов отбрасывается
старший разряд, для блоков третьего класса - младший.
Выполняемая следующей оценка заключается в выборе такого фактора
квантования, при котором объем данных в компрессированном видеосегменте
не превосходит заданной величины - в формате Digital S на компрессированный
видеосегмент отводится 385 байтов. С целью достижения наилучшего
качества в формате Digital S применяются различные факторы - делители
для четырех частотных областей DCT-блока, причем используется всего
9 различных комбинаций делителей. Выбранная комбинация делителей
определяется классом DCT-блока и так называемым числом квантования
(от 0 до 15).
После квантования и сканирования DCT-блоков выполняется кодирование
потока данных кодовыми словами переменной длины, причем объектами
кодирования служат пары чисел, представляющие значение ненулевого
косинусного коэффициента и количество предшествующих этому коэффициенту
нулей (из этого правила исключается постоянная составляющая, то
есть нулевой коэффициент). Предварительно выполненная оценка гарантирует,
что объем данных не превысит 385 байтов для каждого компрессированного
сегмента. Однако надо иметь в виду, что в этот объем включаются
не только кодированные данные DCT-блоков, но и сведения о классах
блоков и числа квантования (последние данные нужны для определения
комбинации делителей и восстановления матрицы отсчетов сигнала в
процессе декомпрессии).
Кодирование с целью защиты от ошибок и канальное кодирование
385 байтов компрессированого видеосегмента делятся на 5 блоков
(по 77 байтов) данных внутреннего кода, каждый из которых защищается
от ошибок восьмью проверочными байтами кода Рида-Соломона (85,77).
Кодовое слово внутреннего кода, дополненное синхрословом (2 байта)
и словом опознавания (3 байта), образует синхроблок длиной в 90
байтов. Внешнее кодирование производится с помощью кода Рида-Соломона
(149,138). К 138 байтам данных добавляется 11 проверочных байтов.
135 синхроблоков видеоданных, составляющих 1/24 часть компрессированного
видеокадра (в системе 625/50), 3 синхроблока дополнительных видеоданных,
не подлежащих компрессии, и 11 синхроблоков с проверочными данными
образуют видеосектор (рис.7), который записывается на половине наклонной
дорожки. Кодирование с целью обнаружения и исправления ошибок в
формате Digital S достаточно мощное. Оно позволяет исправлять до
четырех случайных ошибок в каждой строке матрицы видеосектора и
восстанавливать до одиннадцати строк этой матрицы, искаженных в
результате обусловленной выпадением пакетной ошибки.
Рис.
7. Структура видеосектора формата Digital S
Сигналы звукового сопровождения (до четырех каналов) не компрессируются.
После перемешивания и форматирования они подвергаются внешнему кодированию
с целью обнаружения и исправления ошибок с помощью кода Рида-Соломона
(14,9). Как и во всех других форматах, защита звука более мощная,
чем защита видеосигнала. Внутреннее кодирование является общим с
кодированием видеосигнала (рис. 8).
Рис.
8. Структура звукосектора формата Digital S
Основу канального кодирования - в формате Digital S этот процесс
называется модуляцией - составляет комбинация рандомизации и модифицированного
кодирования БВН (без возвращения к нулю). Рандомизированный поток
данных подвергается модуляции, или преобразованию 24-25. Это преобразование
заключается в добавлении дополнительного бита перед началом каждых
трех последовательных байтов (24 битов). Значение дополнительного,
двадцать пятого, бита определяется из условия предотвращения длинных
серий 0 или 1, что улучшает частотную характеристику записываемого
сигнала, снижая уровень низкочастотных компонентов.
Формат Digital S предусматривает обмен данными в компрессированном
виде в форме DIF-последовательностей (рис. 6). Такой интерфейс может
использоваться для обмена видеосигналами между видеомагнитофонами
Digital S без выполнения операций декодирования и кодирования (декомпрессии
и компрессии). DIF-последовательности могут соответствующим образом
форматироваться и передаваться в виде полезной нагрузки с помощью
последовательного цифрового интерфейса SDI. Использование передачи
данных в компрессированной форме возможно также при вводе информации
в систему нелинейного монтажа, что дает экономию времени.
В процессоре видеомагнитофона Digital S (рис. 6) для компрессии
и кодирования с целью обнаружения и исправления ошибок и обработки
звука используются интегральные схемы, разработанные для магнитофонов
формата DV (хотя формат Digital S и не является производным формата
DV). Интегральные схемы, выполняющие перемешивание и модуляцию,
разработаны специально для аппаратов Digital S.