Цифровая магнитная видеозапись. Формат
DV
Константин Гласман
Концепция
Число форматов цифровой магнитной видеозаписи приближается к
двум десяткам. Это ясно показывает, что ни один из форматов не
может соответствовать всем разнообразным требованиям телевизионного
производства. Но ясно и то, что телевизионному производству не
нужно такое число форматов, поэтому конкуренция между фирмами-разработчиками
необычайно остра и напоминает боевые действия. На страницах технических
журналов ведутся жаркие споры о том, какие из форматов найдут
себе место на рынке телевизионного оборудования будущего. Но
к формату DV эти споры не имеют отношения, его будущее безоблачно.
В это можно поверить, даже не вникая в суть проблемы и зная лишь
то, что под флагом DV в рамках консорциума DVC (Digital Video
Cassette) объединили свои усилия многие десятки ведущих фирм
мира – разработчиков и производителей телевизионной техники.
Впрочем, всеобщая поддержка формата DV не означает исчезновения
конкуренции и не требует применения антимонопольного законодательства.
Договорившись о поддержке единого формата, члены консорциума
выпускают разнообразные технические системы и устройства, работающие
в стандарте DV, но соперничающие друг с другом за предпочтения
покупателей. Такая конкуренция внутри семейства изделий формата
DV способствует улучшению качественных показателей и снижению
стоимости аппаратуры.
Работа консорциума DVC, имевшего целью создание формата цифровой
видеозаписи бытового назначения, началась благодаря совместным
усилиям четверки компаний: Matsushita (Panasonic), Philips, Sony,
Thomson, к которой затем присоединились Hitachi, JVC, Mitsubishi,
Sanyo, Sharp, Toshiba (списки приведены в алфавитном порядке
и не основаны на оценке значимости вклада участника консорциума).
Исследования и разработки велись в четырех направлениях:
• видеокомпрессия;
• семейство интегральных схем для обработки данных;
• формат записи и механизм транспортировки ленты;
• лента и семейство кассет.
Были рассмотрены самые разнообразные предложения. Исследовались
даже варианты, которые казались отвергнутыми десятки лет назад,
например, многоканальная продольная запись с использованием неподвижной
матричной головки. Однако была принята традиционная система наклонно-строчной
записи, как более дешевая в производстве и обеспечивающая большую
плотность записи. В 1993 г. первая десятка членов консорциума
DVC утвердила принципы и параметры формата DVC (впоследствии
аббревиатура редуцировалась до DV). Ширина ленты, равная 1/4’’,
длительность записи компонентного видеосигнала на кассету с размерами
125x78x14,6 мм, равная 4,5 ч, при качестве, близком к вещательному.
Такие показатели произвели впечатление даже на знатоков. В 1995
г. было начато промышленное производство видеокамер формата DV.
В 1998 г. Международная электротехническая комиссия IEC (International
Electrotechnical Commission) приняла формат DV в качестве международного
стандарта IEC 61834, регламентирующего систему
наклонно-строчной цифровой видеозаписи бытового назначения с
использованием магнитной ленты шириной 6,35 мм (Helical-scan
digital video cassette recording system using 6,35 mm magnetic
tape for consumer use).
Цифровая видеозапись может проникнуть в бытовую сферу только
при условии, что стоимость приобретения аппаратуры и затраты
на ее эксплуатацию (включая расходы на приобретение кассет с лентой)
являются невысокими и доступными для видеолюбителей. Поэтому
финансово-экономический аспект проектирования формата DV был
важнейшим. Но на работу консорциума несомненное влияние оказали
также исследование и разработка новых систем цифрового телевизионного
вещания, выполнявшиеся в то же время. Создание цифрового спутникового,
кабельного и наземного телевидения, а также быстрое расширение
глобальной телекоммуникационной сети Интернет предопределили
грядущий значительный рост потребности в программных материалах
для телевизионного вещания во всех его новых формах. Одним из
важнейших условий расширения рынка телевизионных программ является
снижение расходов на телепроизводство, поэтому уменьшение капитальных
затрат на приобретение оборудования и расходов на его эксплуатацию
было бы важнейшей задачей проектирования нового формата видеозаписи
и для вещательного телевидения. Система видеозаписи формата DV
разрабатывалась для бытового применения, но параметры, положенные
в основу формата, обеспечивают настолько высокие качественные
показатели, что становится ясным: разработчики предусматривали
использование аппаратуры формата DV в производстве программ для
телевизионного вещания, например, в сфере производства программ
новостей.
Практика работы с видеокамерами DV показала, что формат вышел
за рамки исходной цели создания цифровой видеозаписи бытового
назначения и смог найти применение в профессиональном и вещательном
телевидении благодаря высоким качественным показателям воспроизводимого
изображения. Аппараты формата DV оказались настолько дешевыми,
что стали доступными для видеолюбителей, желающих повысить техническое
качество записей, и настолько высококачественными, что стали
удобными для производителей телевизионных программ, заботящихся
об экономии ресурсов.
Важнейшим фактором достижения столь уникального сочетания показателей
явилась разработка эффективного алгоритма видеокомпрессии, обеспечивающего
сравнительно малую величину компрессированного потока данных
(25 Мбит/с), (причем только за счет внутрикадрового кодирования)
при сохранении высокого качества изображения. К достоинствам
алгоритма надо отнести также то, что он допускает сравнительно
простую аппаратурную реализацию (надо полагать, что именно требование
простоты реализации было решающим при выборе внутрикадрового
кодирования). Последнее обстоятельство сделало возможным создание
комплекта больших интегральных микросхем для тракта записи/воспроизведения
видеокамер формата DV, обеспечивающих надежную работу и дешевых
при массовом производстве.
Важнейшая роль, которую сыграл алгоритм видеокомпрессии в успехе
формата DV, объясняет, почему описание формата DV начинается
с изложения принципов обработки данных.
Обработка видеосигнала
Видеокомпрессия
Общая схема компрессии
Видеокомпрессия или сжатие потока видеоданных – важнейший и
самый сложный компонент системы обработки сигналов, определяемый
стандартом DV (IEC 61834). Она устраняет избыточность, свойственную
кадру типичного телевизионного изображения, доводя скорость компрессированного
потока видеоданных до 25 Мбит/с. Основные элементы видеокомпрессии
DV: дискретно-косинусное преобразование DCT (Discrete Cosine
Transform), квантование коэффициентов DCT, энтропийное кодирование
последовательности квантованных коэффициентов DCT (рис. 1). Видеокомпрессия
DV выполняется путем внутрикадрового кодирования, однако она
представляет собой адаптивную систему, приспосабливающуюся к
движению изображаемых объектов. Поэтому в составе схемы компрессии
есть устройство, осуществляющее оценку движения, на основе которой
принимается решение о режиме дискретно-косинусного преобразования
и уточняются особенности квантования коэффициентов DCT.
Объектом основных операций видеокомпрессии является малая часть
кадра телевизионного изображения, называемая видеосегментом.
Объем пространства данных, занимаемого компрессированным видеосегментом,
определен стандартом и не может быть превышен. Особенностью схемы
компрессии DV является отсутствие обратной связи в виде информации
о степеsни заполнения пространства, отведенного для компрессированного
видеосегмента. Управление квантованием коэффициентов DCT выполняется
на основе оценки энтропии входных данных. Роль устройства оценки
энтропии велика, т.к. при переполнении отведенного пространства
возникают необратимые искажения из-за потери части данных, а
частичное заполнение этого пространства означает слишком грубое
квантование и свидетельствует об искажениях изображения в виде
шумов квантования, которых можно было бы избежать.

Компрессия DV
Параметры аналого-цифрового преобразования видеосигнала
Основной интерфейс видеомагнитофонов формата DV – аналоговый.
Поэтому стандарт DV регламентирует параметры аналого-цифрового
преобразования входного видеосигнала: структуру дискретизации,
частоты дискретизации яркостного и цветоразностных компонентов
телевизионного изображения, число уровней квантования. В качестве
прототипа используется структура дискретизации, задаваемая Рекомендацией
ITU-R BT.601, в соответствии с которой яркостный компонент Y каждой
телевизионной строки дискретизируется с частотой 13,5 МГц, цветоразностные
сигналы Cr и Cb – с частотой 6,75 МГц,
а квантование производится с использованием 10 битов на отсчет.
Скорость потока данных составляет при этом 10x13,5+10x6,75x2=270
Мбит/с.
Выбор параметров аналого-цифрового преобразования телевизионного
изображения в формате DV подчинен целям уменьшения объема данных,
подлежащих записи. За счет перехода к квантованию с расходом
8 бит/отсчет (т.е. ценой увеличения шумов квантования на 12 дБ)
можно сократить записываемый поток на 20%. Поток данных можно
уменьшить также за счет исключения обратного хода и перехода
к записи телевизионного сигнала в пределах активной части растра.
Тогда можно записывать только по 720 отсчетов сигнала Y и по
360 – Cr и Cb в каждой из 576 (при разложении
изображения на 625 строк и частоте полей 50 Гц, далее обозначаемом
как стандарт 625/50) или 480 (при разложении изображения на 525
строк и частоте полей 59,94 Гц, далее обозначаемом как стандарт
525/60) активных строк растра. В сочетании с переходом к квантованию
с расходом 8 бит/отсчет это позволяет сократить записываемый
поток с 270 Мбит/с до 8x(720+360x2) x576x25=8x(720+360x2)x480x30=165,888
Мбит/с. Надо отметить, что для системы разложения 525/60 точное
значение скорости потока отличается коэффициентом 30/29,97=1,001.
Доведение потока данных 166 Мбит/с до заданной величины 25 Мбит/с
с использованием внутрикадрового кодирования было бы связано
с довольно значительным уровнем искажений и артефактов. Теория
и практика видеокомпрессии доказывают, что наилучшего результата
можно достичь за счет сочетания компрессии с предваряющей ее
обработкой, заключающейся в сглаживании телевизионного изображения.
Ценой некоторой потери четкости изображения можно уменьшить уровень
искажений и артефактов, вызываемых необратимыми потерями данных
при компрессии, и добиться более высокого качества сжатого изображения.
Структура дискретизации 4:1:1
Рекомендация 601 определяет соотношение частот дискретизации
яркостного и цветоразностных сигналов как 4:2:2. Это означает,
что полоса частот яркостного сигнала должна быть в два раза больше
полосы каждого из цветоразностных. Однако в аналоговом телевидении
это соотношение значительно больше. Если исходить из того, что
основным входным сигналом видеомагнитофона DV является аналоговый
сигнал, то полосу частот цветоразностных сигналов можно сократить.
Если уменьшить полосу частот цветоразностных сигналов еще в два
раза (по отношению к полосе, устанавливаемой Рекомендацией 601),
то можно сократить в два раза и частоту дискретизации Cr и Cb,
переходя к структуре дискретизации 4:1:1 и доводя число отсчетов
Cr и Cb до 180 в каждой строке (рис. 2).
Четкость в цвете по горизонтали при этом уменьшается в два раза,
но яркостная четкость остается неизменной. Переход к структуре
дискретизации 4:1:1 позволяет довести поток видеоданных до 8x(720+180x2)x576x25=8x(720+180x2)x480x30
=124,416 Мбит/с.

Рис. 2. Структура дискретизации 4:1:1
Структуры дискретизации 4:2:0
Другой возможный вариант сокращения потока данных сводится к
двукратному (в сравнении с форматом 4:2:2) уменьшению четкости
цветных деталей в вертикальном направлении. Такой подход позволяет
выравнить цветовую четкость в вертикальном и горизонтальном направлениях.
При переходе к используемому в системе MPEG-2 формату 4:2:0 (рис. 3)
матрицы отсчетов цветоразностных компонентов телевизионного изображения
имеют размеры 360x288 (625/50) или 360x240 (525/60), что дает
такую же, как и в случае формата 4:1:1, величину потока данных:
8x(720x576+360x288x2)x25=8x(720x480+360x x240x2) x30=124,416
Мбит/с.
Отсчеты цветоразностных компонентов в формате 4:2:0, принятом
в системе компрессии MPEG-2, не совмещены с отсчетами яркостной
составляющей. Надо отметить, что преобразование формата 4:2:2
в формат 4:1:1 может осуществляться за счет отбрасывания каждого
второго отсчета цветоразностных компонентов (конечно, в сочетании
с предварительной низкочастотной фильтрацией цветоразностных
компонентов). Но нельзя поступить аналогичным образом и просто
исключить часть отсчетов при преобразовании структуры 4:2:2 в
формат 4:2:0. Если отбросить цветоразностные отсчеты в каждой
второй строке телевизионного кадра, то одно поле вообще не будет
участвовать в формировании цветного изображения. Это означало
бы не только двукратное уменьшение цветовой четкости по вертикали,
но и двукратное уменьшение временной разрешающей способности
по отношению к цветным деталям изображения. Поэтому матрица отсчетов
цветоразностных компонентов образована точками, которые не находятся
на строках телевизионного изображения и не совпадают с яркостными
отсчетами ни одного из двух полей (рис. 3), хотя половина из
них рассчитывается с использованием интерполяции из отсчетов
строк одного поля, а половина – другого. Необходимость такой
интерполяции усложняет формирование потока видеоданных.

Рис. 3. Структура дискретизации 4:2:0 (MPEG-2)
Вариант формата 4:2:0, в котором уменьшается цветовая четкость
по вертикали, но отсчеты цветоразностных компонентов совмещены
с отсчетами яркостной составляющей изображения, может быть получен
из прототипной структуры 4:2:2 путем поочередного исключения
одного цветоразностного компонента в каждой второй строке каждого
поля (рис. 4). Это означает, что в двух строках телевизионного
кадра следуют отсчеты Y/Cr, Y, Y/Cr,…,
в двух следующих – Y/Cb, Y, Y/Cb,…, затем
– снова Y/Cr, Y, Y/Cr,…, и т.д. Именно
такой вариант формата 4:2:0, упрощающий формирование цветоразностных
сигналов, устанавливается стандартом DV.

Рис. 4. Структура дискретизации 4:2:0 с совмещенными отсчетами
яркостного и цветоразностных сигналов
4:1:1 или 4:2:0?
В случае использования форматов 4:1:1 и 4:2:0 степень компрессии,
необходимой для доведения скорости потока данных до 25 Мбит/с,
составит приблизительно 5:1. Надо отметить, что для исключения
искажений дискретизации все компоненты телевизионного изображения
должны быть подвергнуты предварительной двухмерной фильтрации
в соответствии с частотами дискретизации, заданными для горизонтального
и вертикального направлений.
Стандарт DV устанавливает использование формата 4:1:1 для системы
525/60, а формата 4:2:0 – для 625/50. Для того, чтобы понять
предпосылки такого решения, целесообразно сначала оценить соотношение
четкости по вертикали и горизонтали в цифровом изображении, устанавливаемом
Рекомендацией 601. Формат стандартного телевизионного изображения,
или отношение ширины изображения к его высоте, равен 4/3. Если
исходить из требования одинаковой четкости по горизонтали и вертикали,
то при разложении телевизионного изображения на 625 строк (576 активных
строк) каждая строка должна содержать 576x4/3=768 пикселей, а
при разложении на 525 строк (480 активных строк) – 480x4/3=640
пикселей. Но активная часть строки в соответствии с Рекомендацией
601, содержит 720 пикселей как для системы 625/50, так и для
системы 525/60. Это означает, что пиксель не является квадратным
ни в системе 625/50, ни в системе 525/60, и что четкость в горизонтальном
и вертикальном направлениях не является одинаковой. В системе
625/50 фактический пиксель вытянут в горизонтальном направлении
(его формат можно оценить числом 1,07), и четкость по горизонтали
хуже, чем по вертикали. В системе 525/60 пиксель сжат в горизонтальном
направлении (его формат равен 0,89), и четкость в горизонтальном
направлении лучше, чем в вертикальном.
Приведенные расчеты не учитывают влияния чересстрочности телевизионного
изображения, однако из них следует главный вывод: в системе 625/50
ощущается некоторый недостаток горизонтальной четкости (в сравнении
с вертикальной), а в системе 525/60 – вертикальной (в сравнении
с горизонтальной). Поэтому структура дискретизации 4:1:1, ухудшающая
горизонтальную четкость в цвете, оказывается менее приемлемой
для системы 625/50, чем структура 4:2:0. Можно отметить также,
что структура 4:2:0, ухудшающая четкость в цвете по вертикали,
является для системы 525/60 менее подходящей, чем структура 4:1:1.
Сыграла свою роль, несомненно, и разница в абсолютных значениях
числа строк, определяющая различие в вертикальной четкости в
системах телевидения с 625 и 525 строками.
Известна также трактовка установленного стандартом DV правила
выбора структур дискретизации, связанная с наследованием показателей
систем аналогового телевидения. В системах PAL и SECAM, используемых
в странах со стандартом разложения 625/50, вертикальная цветовая
четкость хуже, а горизонтальная – лучше, чем в системе NTSC,
применяемой в странах со стандартом 525/60. Поэтому изображения
в формате DV выглядят немного похожими на своих аналоговых предшественников.
Дискретно-косинусное преобразование: формирование макроблоков
Дискретно-косинусное преобразование всех компонентов телевизионного
изображения является блочным. Оно выполняется в рамках массива
пикселей с размерами 8x8 элементов, называемого блоком DCT. В
каждый блок DCT входят строки двух полей телевизионного кадра.
Нечетные строки блока образованы отсчетами, располагающимися
в строках первого поля, четные – в строках второго поля (надо
иметь в виду, что нумерация строк начинается с нуля, поэтому
самая верхняя строка блока DCT, имеющая номер 0, образована пикселями
второго, или четного, поля). При структуре дискретизации 4:1:1
один массив отсчетов каждого из цветоразностных сигналов с размерами
8x8 элементов может быть сформирован из фрагмента телевизионного
кадра с высотой 8 строк и шириной 32 яркостных пикселя (рис. 5).
В пределах такой области можно образовать четыре блока DCT яркостного
компонента Y и по одному блоку DCT цветоразностных сигналов Cr и Cb.
Эти шесть блоков входят в макроблок – важный элемент иерархической
структуры цифрового изображения формата DV. В случае использования
дискретизации 4:2:0 один макроблок формируется из квадратного
массива отсчетов, образованного 16 последовательными строками
кадра (рис. 6). Пять макроблоков, взятых из различных областей
телевизионного кадра, образуют видеосегмент – объект основных
операций видеокомпрессии, показанных на рис. 1.

Рис. 5. Макроблок формата 4:1:1

Рис. 6. Макроблок формата 4:2:1
Дискретно-косинусное преобразование: декорреляция
Известно, что коэффициент корреляции соседних элементов типичного
телевизионного изображения близок к единице, т.е. велика вероятность
того, что уровни сигнала соседних пикселей одинаковы. Дискретно-косинусное
преобразование является средством декорреляции, которая позволяет
описать блок отсчетов из 64 пикселей с использованием меньшего
числа коэффициентов DCT. Например, фрагмент изображения из 64 пикселей,
в пределах которого яркость меняется в горизонтальном направлении
скачком от 100 единиц (уровней квантования) до нуля (рис. 7),
может быть однозначно описан с использованием всего пяти коэффициентов
DCT: постоян-ной составляющей DC (Direct Current) и четырех амплитуд
базисных функций дискретно-косинусного преобразования с номерами,
или индексами, пространственных частот горизонтального направления
fh=1, 3, 5, 7. Поскольку в вертикальном направлении
яркость не меняется, то амплитуды всех базисных функций с номерами,
или индексами пространственных частот вертикального направления
fv>0 равны нулю. Первая базисная функция (fh=1)
одномерного дискретно-косинусного преобразования является результатом
дискретизации половины периода косинусоиды, сдвинутой влево на
половину интервала дискретизации (рис. 8). На интервал вычисления
одномерного
дискретно-косинусного преобразования (8 пикселей) приходится
один период дискретизированной косинусоиды для базисной функции
с номером 2 (fh=2), полтора периода – для базисной
функции с номером 3 (fh=3) и т.д. Результатом дискретно-косинусного
преобразования является массив действительных чисел, которые
могут быть положительными и отрицательными, что соответствует
присутствию в спектре базисных функций, суммируемых со знаком
плюс или минус соответственно. На рис. 7 результаты дискретно-косинусного
преобразования показаны для упрощения по абсолютной величине,
т.е. в виде амплитудного спектра. Суммирование постоянной составляющей
и четырех базисных функций, взятых с соответствующими амплитудами
и знаками (C (1,0), C (3,0), C (5,0) и C (7,0)), позволяет восстановить
исходное распределение яркости при воспроизведении. Таким образом,
замена отсчетов сигнала коэффициентами DCT позволяет значительно
сократить объем записываемых данных.

Рис. 7. Блок статического изображения, содержащий перепад
яркости (а) и его частотный спектр (б) (fh, fv -
пространственные частоты горизонтального и вертикального направлений;
С(fh, fv) - коэффициенты дискретно-косинусного
преобразования 8-8-DCT)

Рис. 8. Базисные функции дискретно-косинусного преобразования
Дискретно-косинусное преобразование: адаптация к движению
Приведенные выше рассуждения, позволившие сделать оптимистический
вывод о возможности значительного сокращения объема данных с
использованием
дискретно-косинусного преобразования, требуют уточнения, связанного
с чересстрочной разверткой. Изображение, показанное на рис. 7,
является статическим. А типичными для телевидения являются изображения
движущихся объектов. Кадр изображения образуется двумя полями,
следующими друг за другом с интервалом 1/50 или 1/60 с. Если
объект изображения движется, и граница между белым и черным участками
смещается слева направо, то картинка рис. 7 превратится в изображение,
показанное на рис. 9 (скорость смещения границы равна одному
пикселю за поле). Даже такое небольшое движение вызвало "зазубривание" контура,
в результате чего число значимых коэффициентов DCT возросло во
много раз в сравнении со статическим вариантом, показанным на
рис. 7.

Рис. 9. Блок динамического изображения, содержащий перепад
яркости (а) и его частотный спектр (б) (fh, fv -
пространственные частоты горизонтального и вертикального направлений;
С(fh, fv) - коэффициенты дискретно-косинусного
преобразования 8-8-DCT)
Стандарт DV предлагает эффективное и сравнительно простое решение
проблемы при сохранении внутрикадрового кодирования. Сначала
блок элементов изображения с размерами 8x8 пикселей раз-бивается
на два суббло-ка, включающие в себя 4 строки по 8 пикселей, причем
в один субблок 4-8 входят строки первого поля, а в другой – второго
поля телевизионного кадра (рис. 10). Следующий этап: пиксели
одноименных строк двух субблоков 4-8 складываются, образуя блок
суммы полей, и вычитаются, образуя блок разности двух полей.
Блоки суммы и разности подвергаются дискретно-косинусному преобразованию,
в результате которого вычисляются две матрицы 4-8 коэффициентов
DCT (общий объем двух матриц остается равным 64 коэффициентам).
Движение объекта передачи, которое в случае использования матрицы
8-8 привело к зазубриванию контуров и резкому возрастанию числа
значимых коэффициентов DCT, вызвало размытие границ между черным
и белым участками на блоке пикселей суммы двух полей и появлению
контура границы на блоке разности. Поэтому матрицы коэффициентов
DCT двух блоков 4-8 содержат меньшее число значимых коэффициентов,
чем одна матрица 8-8. Приведенная на рис. 10 схема обработки
данных обратима. Выполняя обратное дискретно-косинусное преобразование
над суммой и разностью двух матриц DCT 4-8, можно восстановить
значения отсчетов, образующих четные и нечетные строки исходного
блока пикселей.

Рис. 10. Дискретно-косинусное преобразование 2-4-8-DCT
Описанная схема обработки в некоторой степени напоминает алгоритм
дифференциальной импульсно-кодовой модуляции. Вместо одного поля
передается сумма сигналов двух полей, а вместо второго – разность,
которую можно рассматривать как ошибку предсказания. Если сигналы
двух полей одинаковы, то разность обращается в ноль, то есть
общий объем записываемых данных сокращается. Но эта аналогия
лишь приблизительна. Ведь сигналы двух полей, разделенных интервалом
времени в половину периода кадра, относятся к разным точкам пространства
телевизионного кадра.
Преобразования по схеме рис. 10 обратимы лишь при условии, что
с коэффициентами DCT не происходит нелинейных трансформаций.
Но квантование коэффициентов DCT, которое является непременным
атрибутом видеокомпрессии, представляет собой нелинейное преобразование.
Допустим, что значения части коэффициентов, в основном, высокочастотных,
матрицы разности после квантования обратились в ноль. Тогда,
после выполнения обратных преобразований, произойдет размытие
вертикальных контуров объектов, причем величина размытия будет
тем больше, чем больше горизонтальная составляющая скорости движения.
Впрочем, это размытие может иметь даже полезный эффект, ведь
оно маскирует расслоение двух полей и связанное с этим зазубривание
вертикальных границ. Но потери четкости и резкости произойдут
и в вертикальном направлении, причем даже для статического изображения.
Это связано с тем, что для матрицы коэффициентов 4-8 максимальный
номер собственной функции равен трем, что означает двукратное
сокращение полосы пространственных частот по вертикали в восстанавливаемом
изображении. Иными словами, если сигналы двух полей становятся
почти одинаковыми (ведь многие коэффициенты матрицы разности,
в основном, высокочастотные, в результате квантования могут обратиться
в нуль), то это равносильно удвоению ширины строки.
Дискретно-косинусное преобразование по схеме 2-4-8 (рис. 10)
должно использоваться лишь при больших различиях сигналов двух
полей, т.е. при значительной динамике телевизионного изображения.
Если изображение статично или почти статично (в рамках блока
изображения с размерами 8x8 пикселей), то целесообразно использовать
схему дискретно-косинусного преобразования 8-8 (рис. 7), поскольку
в этом случае можно добиться более высокой четкости в вертикальном
направлении. Поэтому в алгоритме видеокомпрессии стандарта DV
(рис. 1) предусмотрена оценка движения, или степени динамичности
изображения, на основе которой принимается решение о выборе режима
DCT. Стандарт DV не регламентирует способ оценки движения, стимулируя,
тем самым, усилия разработчиков, направленные на повышение качества
декомпрессированного изображения. Но стандарт предусматривает
возможность выбора оптимального режима дискретно-косинусного
преобразования для каждого блока DCT, что делает алгоритм видеокомпрессии
чрезвычайно гибким.
Продолжение следует.