Многопрограммное цифровое телевизионное вещание
по наземным и спутниковым каналам связи.
Часть вторая. Цифровое кодирование телевизионных сигналов.
Лев Севальнев
Возможны два подхода к цифровому кодированию ТВ сигналов: непосредственное кодирование полного цветового сигнала SECAM, PAL NTSC и раздельное составляющих цветового сигнала. В последнем случае сигнал яркости и два цветоразностных сигнала кодируются независимо, а затем три потока видеоданных мультиплексируются (объединяются) в один общий цифровой поток.
Первый метод кодирования предпочтительней, когда ТВ тракт состоит из последовательно включенных цифровых и аналоговых звеньев, на стыках которых требуются
взаимные переходы между цифровой и аналоговой формами представления ТВ сигналов. Такая смешанная аналого-цифровая
структура ТВ тракта обычно характерна для
начальной стадии внедрения цифровых методов передачи ТВ программ. На этой стадии, в частности, было выяснено, что для PAL
и NTSC частоту дискретизации следует синхронизировать с частотой цветовой под несущей, также было выяснено, что лучшей частотой
дискретизации являются
четвертые гармоники под
несущих в этих системах.
Так появился стандарт
EBU "Спецификация видеостыков для 625-строчных цифровых сигналов
PAL", документ Tech 3280-
Е (последняя версия - апрель 1995г.) и стандарт кодирования сигналов
NTSC: "Параллельный интерфейс для компонентного цифрового видеосигнала системы M/NTSC",
документ SMPTE-244M.
Кроме этого было установлено, что при кодировании полного цветового
сигнала SECAM в синхронизации частоты дискретизации с частотами цветовых поднесущих особой
необходимости нет, поэтому частота дискретизации может выбираться с
определенным произволом, например равной 13,5 МГц. В конечном итоге выяснилась
нецелесообразность цифрового кодирования полного сигнала. Однако работы первого этапа не были бесполезны, поскольку легли в основу раздельного кодирования.
Раздельное кодирование сигналов цветного телевидения, в принципе, позволяет создать вещательную систему цифрового телевидения, обеспечивающую более высокое качество изображения. Но самое главное, что связано с таким кодированием, заключается в возможности унификации стандартов цифровых ТВ систем со стандартами разложения 625 строк/50 полей и 525 строк/59,94 полей, что в цифровых системах снимает многие проблемы, к примеру международного обмена ТВ программами. Существенно упрощается обработка сигналов, связанная с сокращением избыточности.
Европейский Вещательный Союз (EBU) и Общество инженеров кино и телевидения
(SMPTE) в 1979 г. начали работы, целью которых стал международный стандарт по раздельному кодированию цветового ТВ сигнала. Итог - принятые МККР два документа: Рекомендация 601 "Параметры кодирования для цифровых телевизионных студий" (1982г.) и Рекомендация 656 "Видеостыки для раздельных видеосигналов в 525- и 625-строчных телевизионных системах" (1986г.). Эти рекомендации являются общепризнанной основой для всех работ, связанных с профессиональным цифровым телевидением.
Эти Рекомендации стали базой при разработке Стандартов на цифровые видеостыки ТВ систем с 625 и 525 строчными растрами: документ EBU Tech.3267 "Видеостыки Европейского Вещательного Союза для 625 строчных цифровых видеосигналов уровня 4:2:2 Рекомендации МККР 601" (вторая редакция - 1992г.), документ SMPTE 259M "Последовательные цифровые видеостыки для 10-битового раздельного кодирования уровня 4:2:2 и композитного кодирования с частотой дискретизации равной 4-кратному значению цветовой поднесущей" (вторая редакция - август 1995г.) и ряд других Стандартов. Вскоре в первые редакции (версии) упомянутых Рекомендаций и Стандартов были внесены некоторые изменения, в том числе и принципиального характера. Это необходимо иметь в виду при использовании ранних редакций документов.
Процесс дискретизации определяется тремя основными факторами: структурой дискретизации - относительным расположением отсчетов видеосигнала в пространстве и времени, числом отсчетов на одну ТВ строку - частотой дискретизации видеосигнала и видом фильтрации видеосигнала, выполняемой до дискретизации.
Структура дискретизации видеосигналов Теоретический анализ и эксперименты показали, что наилучшей является ортогональная структура дискретизации, поясняемая рисунком. Отсчеты в этом случае берутся на пересечении горизонтальных и вертикальных линий ТВ растра. Положение этой сетки жестко связано с растром и не изменяется от поля к полю и от кадра к кадру. Поэтому, к примеру, аппаратурные помехи или искажения будут менее заметны на ТВ изображении, чем при подвижной сетке отсчетов, поскольку способны создавать лишь неподвижные контура. Например, снижается заметность муаровых помех, возникающих при наложения спектров аналогового и дискретизированного ТВ сигналов, если фильтрация высокочастотных составляющих недостаточно глубокая. Кроме того, периодичность структуры дискретизации заметно упрощает процедуру цифровой обработки ТВ сигнала при информационном сжатии видеоданных, фильтрации, необходимой при формирования спектра кодируемого сигнала, при преобразовании стандартов разверток и т.п. Во всех упомянутых случаях при ортогональной дискретизации отсчеты ТВ сигналов в последовательных кадрах и строках пространственно совмещены, поэтому нет необходимости в промежуточной интерполяции (передискретизации) отсчетов, как это характерно для структур дискретизации, не имеющих пространственной совместимости отсчетов.
Современная техника вносит свои коррективы в проблему дискретизации. Так, в настоящее время практически все телевизионные камеры работают с твердотельными преобразователями "светсигнал" (ПЗС матрицами), имеющими собственную жестко заданную ортогональную структуру дискретизации. Две различные структуры дискретизации в ПЗС и электрическая в кодере могут мешать друг другу, что в итоге ведет к появлению муаровых помех, если эти структуры будут выбираться произвольно.
Разработчики международных стандартов на параметры дискретизации и цифрового кодирования учитывали помимо прочего и потребности современной технологии производства телевизионных программ. Дело в том, что одни - электронная рирпроек-ция, микширование, спецэффекты и т.п. предъявляют наивысшие требования по качеству сигнала, другие могут удовольствоваться средним уровнем качества, видеожурналистика - один из возможных примеров. "Стричь все под одну (сашую дорогую!) гребенку" просто не выгодно. Вот почему была стандартизована иерархия частот дискретизации сигналов яркости и цветности, соответствующая коэффициентам 1, 2, 4, 8. Коэффициент 4 отвечает частоте дискретизации 13,5 МГц = 4x3,375 МГц, соответственно 1 - 3,375 МГц.
Для наиболее ответственных технологических
операций в студиях рекомендуется стандарт 4:4:4 - это означает, что яркостный и оба цветоразностных сигнала дискретизируются с одинаковой частотой 13,5 МГц. Более часто используется иерархический уровень 4:2:2, что означает частоту дискретизации для яр-костного сигнала 13,5 МГц, для цветоразно-стных - 6,75 МГц. В четвертьдюймовом формате цифровой видеозаписи DVC Pro, например, используется уровень 4:1:1 (в системе NTSC), а значит при дискретизации сигнала яркости 13,5 МГц, цветоразностные дискретизируются вчетверо реже с частотой 3,375 МГц. Напротив, в преобразователях стандартов (см. наш номер 5, 1995 г.) высшего уровня уже используется стандарт 8:8:8, что соответствует частоте дискретизации 27 МГц для всех компонент и по качеству - системам телевидения высокой четкости! В телевизионной журналистике используется иерархический уровень 2:1:1.
Частоты дискретизации сигналов яркости и цветности - тайны выбора!
Два стандарта телевизионного разложения родили клубок проблем, распутать который долгое время казалось невозможным. На первых порах и от цифрового кодирования не ждали ничего чрезвычайного, но внимательное изучение цифровых соотношений показало, что на уровне стандартов цифрового кодирования возможно создание единой иерархической системы стандартов, снимающей не все, но очень и очень многие проблемы. Это интересный и важный вопрос, которого мы касались выше, заслуживает более детального рассмотрения.
Выбирая частоты дискретизации, естественно стремиться к минимальным различиям кодированных сигналов стандартов разложения 625 /50 и 525/59,94. Близость значений частот строчной развертки 15625
Гц (для систем SECAM и PAL) и 15734,264 Гц (для системы NTSC) позволяет выбрать одинаковое число отсчетов в активной части ТВ строк обоих стандартов ТВ разложения - тех, что воспроизводятся на экране телевизора. При таком выборе можно пытаться устранить процедуру передискретизации (интерполяции) отсчетов вдоль строки при преобразовании стандартов разложения. Это условие выполнено, если частота дискретизации сигнала яркости кратна частотам строк. Таким образом, остается определить наименьшее общее кратное, Оказалось - это 2,25 МГц. Кроме того, частота дискретизации должна удовлетворять требованиям теоремы отсчетов, согласно которой она должна в два раза превышать верхнюю частоту кодируемого сигнала, т.е. быть не менее: 6 МГц х 2 = 12 МГц. Ближайшая частота, которая удовлетворяет двум этим требованиям 2,25 МГц х 6 = 13,5 Мгц. Именно она и была, в конце концов, принята в качестве частоты дискретизации сигнала яркости в иерархии единых студийных стандартов цифрового кодирования. Эта частота совпадает с 864 (или 858) гармоникой частоты строк системы с 625 (или 525)-строчным разложением изображения. Поэтому в полной цифровой строке будет 864 (858) отсчетов сигнала яркости. Разработчики стандарта пошли дальше и постановили, что в обоих стандартах разложения следует использовать одно число отсчетов - 720. Упоминаемая выше опорная для иерархии цифровых стандартов частота 3,375 МГц = 1,5x2,25 МГц.
При цифровом кодировании синхроимпульс исключается из состава цифровой ТВ строки, поскольку передаваемая им информация о частоте строк легко восстанавливается в декодере по частоте дискретизации, поскольку последняя жестко связана с частотой строк. При этом для опознавания интервалов активной части ТВ строки в цифровую последовательность вводятся две опорные временные метки - синхрогруппа начала активной строки (НАС) и ее конца (КАС).
Все сказанное выше равно относилось к обоим стандартам разложения, однако далее мы будем иметь в виду стандарт 625/50, применительно к которому попробуем оценить скорость передачи данных. В стандарте 4:2:2 в строке содержится 864 отсчета сигналов яркости и по 432 цветоразностных - иными словами 1728 отсчетов (кодовых слов), из них 1440 составляют активную часть строки. Таким образом каждую секунду передается 1728 х 15625 = 27 Мкод.слов/с. При 10-битовом уровневом кодировании скорость цифрового потока составит 270 Мбит/с.
При цифровом кодировании фазовые соотношения между частотами дискретизации сигналов яркости и цветности устанавливаются таким образом, чтобы отсчеты сигнала яркости и двух сигналов цветности пространственно совпадали, т.е. формируются три пространственно совмещенные ортогональные решетки отсчетов сигналов яркости и цветности. Поскольку отсчетов сигналов цветности в стандарте 4:2:2 вдвое меньше отсчетов сигналов яркости, установлен порядок, при котором отсчеты сигналов цветности передаются с каждым нечетным отсчетом сигнала яркости. Передача строки начинается с синхрогруппы НАС, за которой следует кодовое слово цветоразностного сигнала синего и затем кодовое слово сигнала яркости, последним передается кодовое слово цветоразностного сигнала красного. Далее передается второй отсчет сигнала яркости, после чего рассмотренная процедура повторяется.