: архив : архив журнала "625" : 2002 : #7

Цифровая магнитная видеозапись. Формат DV. Продолжение
Константин Гласман
Иллюстрации Маргариты Покопцевой
Рис. 17. Структура компрессированного видеосегмента

Перемешивание видеоданных

В общей схеме обработки данных при записи (рис. 18) видеокомпрессия является лишь элементом, но элементом самым сложным и важным. Поэтому в канал обработки данных включены компоненты, поддерживающие работу устройства компрессии. Перед компрессией цифровые данные, описывающие кадр изображения, подлежат перемешиванию (рис. 18). Надо отметить, что цель перемешивания в аппаратах формата DV принципиально отличается от назначения одноименной операции, осуществляемой в видеомагнитофонах без компрессии. Дело в том, что в видеозаписи компрессированные данные должны записываться с постоянной скоростью и пакетами фиксированной длины. Но области изображения с малым содержанием высокочастотных компонентов после компрессии занимают меньший объем данных, чем области такой же площади с большим уровнем высокочастотных компонентов. Иными словами, участки с плавно меняющейся яркостью изображения, отличающиеся малым содержанием высокочастотных компонентов, компрессируются "легко", так как они требуют для своего описания лишь малое число коэффициентов косинусного преобразования. Участки, содержащие контуры, перепады яркости, мелкие детали, компрессируются "трудно", поскольку для их описания требуется большое число косинусных коэффициентов. Если в записываемый на ленту пакет фиксированной длины попадет много "труднокомпрессируемых" участков изображения с большим количеством высокочастотных компонентов, то придется использовать более грубое квантование, что связано с искажением изображения и появлением артефактов. Поэтому желательно, чтобы в блок видеоданных, который после компрессии превращается в пакет фиксированной длины, не попадали бы только "труднокомпрессируемые" участки.

Рис. 18. Обобщенная схема канала записи

Блок видеоданных, который трансформируется в процессе компрессии DV в пакет фиксированной длины, - это видеосегмент. Цель перемешивания - предотвратить попадание в один видеосегмент серии макроблоков с большим содержанием высокочастотных компонентов. Стандарт DV предполагает образование видеосегментов, состоящих из пяти макроблоков, причем эти макроблоки берутся в процессе перемешивания из различных частей телевизионного изображения. Насыщенность макроблоков мелкими деталями в процессе перемешивания не определяется, закон перемешивания является фиксированным, но он оптимизирован таким образом, что для типичных изображений обеспечивается минимум артефактов компрессии при постоянном объеме компрессированного сегмента.

Рис. 19. Структура кадра изображения в формате 4:1:1 (625/50)
Рис. 20. Структура кадра
в формате 4:2:0 (625/50)

Перемешивание организуется в рамках иерархической структуры цифрового телевизионного изображения, элементами которой являются суперблок, видеосегмент и макроблок. При структуре дискретизации 4:1:1 в пределах восьми строк кадра, каждая из которых содержит по 720 пикселов, можно образовать лишь 22 целых макроблока (рис. 19). Крайний правый макроблок приходится создавать из отсчетов области, включающей в себя 16 соседних строк кадра. Таким образом, на основе отсчетов 16 соседних строк можно образовать 45 целых макроблоков. Макроблоки объединяются в суперблоки трех типов (все они показаны на рис. 19), каждый из которых состоит из 27 макроблоков. 576 строк кадра в стандарте разложения 626/50 позволяют образовать 60 суперблоков, включающих в себя 45x576/16=1620 макроблоков (при стандарте разложения 525/60 кадр состоит из 45x480/16=1350 макроблоков, объединяемых в 50 суперблоков).

При структуре дискретизации 4:2:0 16 соседних строк телевизионного кадра позволяют образовать 45 одинаковых макроблоков (рис. 20). Для стандарта 625/50 1620 макроблоков кадра объединяются в 60 одинаковых суперблоков, для системы 525/60 1350 макроблоков объединяются в 50 суперблоков.

Перемешивание достигается за счет формирования видеосегмента из пяти макроблоков, взятых из различных суперблоков кадра. Номера макроблоков Mi,j,k кадра можно описать с помощью трех индексов: i - номер суперблока по вертикали (i=0, 1, …, n-1, где n=12 для 625/50 и n=10 для 525/60); j - номер суперблока по горизонтали (j=0, 1, …, 4); k - номер макроблока в суперблоке (k=0, 1, …, 26). Номера пяти макроблоков, входящих в один видеосегмент Vi,k, образуются с помощью следующих соотношений:

Ma,2,k, где a=(i+2) mod n;
Mb,1,k, где b=(i+6) mod n;
Mc,3,k, где c=(i+8) mod n;
Md,0,k, где d=(i+0) mod n;
Me,4,k, где e=(i+4) mod n.

Рис. 21. Структура кодовых слов внешнего и внутреннего кода защиты от ошибок

Как следует из приведенных соотношений, в каждый из видеосегментов (для стандарта разложения 625/50 образуется 1620/5=12x27=324 видеосегмента, для стандарта 525/60 - 1350/5=10x27=270 видеосегментов) входят макроблоки из суперблоков, имеющих разные номера по горизонтали и вертикали, но порядковые номера этих макроблоков внутри суперблоков одни и те же. Процедура видеокомпрессии выполняется над макроблоками видеосегмента Vi,k последовательно, начиная с Ma,2,k и заканчивая Me,4,k. В результате выполнения процедуры видекомпрессии, описанной выше, формируются компрессированные макроблоки CMa,2,k, CMb,1,k, CMc,3,k, CMd,0,k, CMe,4,k (см. рис. 17), и образуется компрессированный видеосегмент CVi,k.

Рис. 22. Синхроблоки видеосектора

Перемешивание в формате DV связано только с видеокомпрессией, поэтому после видеокомпрессии компрессированные данные подвергаются процедуре обратного перемешивания (рис. 18). В процессе этого восстанавливается исходная структура кадра телевизионного изображения. Цель обратного перемешивания - максимизировать объем данных, считываемых при нестандартных скоростях воспроизведения.

Защита от ошибок

Формат DV предусматривает защиту видеоданных как от обусловленных шумами случайных ошибок, которые неизбежны при столь плотной упаковке данных (на один записываемый бит в формате DV отводится 2,4 квадратных микрометра в режиме SP и 1,6 - в режиме LP), так и от больших пакетных, связанных, например, с выпадениями. Защита от ошибок, возникающих при записи и воспроизведении, основана на использовании кода-произведения. Внутренний код - код Рида-Соломона (85, 77) над полем Галуа из 256 элементов GF (256). 77 информационных символов (каждый символ - это байт) кодового слова D76, D75, …, D1, D0 - это данные компрессированного макроблока с добавленным байтом, содержащим код статуса STA и число квантования QNO (рис. 17). В процессе кодирования к 77 байтам данных добавляются восемь проверочных байтов K7, K6, …, K1, K0, вычисляемых в соответствии с алгоритмом кода Рида-Соломона (рис. 21). Это означает, что в пределах кодового слова, содержащего данные одного компрессированного макроблока, может быть исправлено четыре байта, содержащих ошибки.

Рис. 23. Структура видеосектора
Рис. 24. Сигналограмма одного кадра
телевизионного изображения (625/60)
Рис. 25. Сигналограмма одного кадра
телевизионного изображения (525/60)

Внешнее кодирование выполняется по правилам кода Рида-Соломона (149, 138) над полем GF (256). Длина информационной части кодового слова - 138 байтов. Эти 138 байтов включают в себя 135 одноименных байтов 135-ти макроблоков, а также три байта дополнительных видеоданных. Дополнительные видеоданные - это, например, информация о стандарте разложения, типе видеосигнала, режиме записи (допустим, оригинальная запись или вставка), системе вещания, дате и времени записи, типе объектива, цветовом балансе и др. К 138 информационным символам D137, D136, …, D1, D0 добавляется одиннадцать проверочных байтов K10, K9, …, K1, K0 (рис. 21). Такие параметры означают, что с помощью внешнего кода оказывается возможным исправлять пакетную ошибку длиной до одиннадцать компрессированных макроблоков в пределах массива с размерами 149x85 байтов, если сведения о номерах макроблоков, содержащих ошибки, будут находиться с помощью декодера внутреннего кода.

Матрица кода-произведения с размерами 149x85 байтов, включающая в себя видеоданные (данные 135 компрессированных макроблоков), дополнительные видеоданные в объеме 77x3=231 байта, а также проверочные байты внешнего и внутреннего кода, показана на рис. 22 (матрица выделена жирной линией). Строка матрицы - кодовое слово внутреннего кода. Каждая строка области видеоданных - компрессированный макроблок с проверочными байтами внутреннего кода. Столбец матрицы - слово внешнего кода.

Выбор параметров кодирования тесно связан со структурой телевизионного изображения и сигналограммы. Отмеченное выше число макроблоков, равное 135, - это 1/10 от всех всех макроблоков телевизионного кадра при разложении 525/60 и 1/12 - при разложении 625/50. Принцип 6/5, обоснованный при создании первого формата цифровой видеозаписи D-1, используется и в формате DV. Конечно, числа, характеризующие кодирование, представляют собой результат оптимизации параметров всех систем видеомагнитофона, основанной на статистике ошибок. Но, владея принципом 6/5 и зная результаты оптимизации применительно к системе защиты от ошибок, можно с уверенностью утверждать, что кадр изображения при стандарте разложения 625/50 будет записываться на двенадцати наклонных дорожках, а при стандарте 525/60 - на десяти дорожках.

Видеосектор

Когда к кодовому слову внутреннего кода добавляется двухбайтовое синхрослово Sync и трехбайтовое слово опознавания ID (рис. 22), то получается структура, называемая в стандарте DV синхроблоком данных. На базе 135 компрессированных макроблоков формируется 149 синхроблоков данных. В качестве синхрослова используется одна из двух последовательностей: F:00011111111110001 или G:11100000000001110 длиной в 17 битов. Почему двухбайтовое слово состоит из 17 битов, и каким образом происходит выбор одной из двух последовательностей в качестве синхрослова? Об этом - в следующем разделе, посвященном канальному кодированию. Слово опознавания, или идентификации ID состоит из двух байтов идентификационных данных (ID0 и ID1) и одного проверочного байта, или байта паритета IDP. Идентификационные данные содержат информацию о сфере практического приложения (например, что это формат бытовой цифровой видеозаписи), номере пары дорожек и номере синхроблока данных. Байт паритета IDP содержит проверочные данные, необходимые для защиты от ошибок идентификационных сведений ID0 и ID1 (проверочные данные внутреннего и внешнего кода матрицы кода-произведения используются для исправления ошибок только в видеоданных). Биты байта паритета IDP вычисляются по правилам кода Боуза-Чоудхури-Хоквингема (12, 8, 3).

149 синхроблоков данных - основная часть видеосектора (рис. 23), записываемого в пределах одной наклонной дорожки на магнитной ленте. Видеосектор начинается с преамбулы и заканчивается постамбулой. Преамбула состоит из стартовой последовательности и двух предсинхроблоков, которые показаны на рис. 22 под номерами 17 и 18. Постамбула начинается с постсинхроблока (его номер 168) и заканчивается защитной областью. Дополнительные байты предсинхроблоков и постсинхроблока - фиксированные числа F0 (ID2) и FF (ID3). Стартовая последовательность формируется из двух 25-битовых групп: A:0001110001110000011100011 или B:1110001110001111100011100. Выбор правила формирования последовательности осуществляется перед записью (о правиле выбора - в следующем разделе, посвященном канальному кодированию). Длина стартовой последовательности - 400 битов. Защитная область имеет такую же структуру, как и преамбула, и отличается только длиной (925 битов).

Канальное кодирование

Непосредственно перед записью данные видеосектора подвергаются канальному кодированию, называемому в стандарте DV модуляцией. Однако кроме собственно модуляции канальное кодирование включает в себя еще две операции: рандомизация и преобразование в код БВНМ (модифицированный код без возвращения к нулю). В процессе канального кодирования рандомизация выполняется первой. Она представляет собой сложение (с помощью операции "Исключающее ИЛИ") цифрового потока с псевдослучайной последовательностью, генератором которой является регистр сдвига с обратными связями.

Рэндомизированный поток данных подвергается модуляции 24-25, в процессе которой трехбайтовые слова (24 бита) преобразуются в 25-битовые кодовые слова. Дополнительный бит вставляется в последовательный поток в начале группы из трех байтов по следующим правилам. Если в окрестности границы группы следует серия нулей или единиц, длина которой больше десяти (включая добавочный бит), то дополнительный бит принимает значение, которое разбивает эту серию (в серию нулевых битов вставляется единичный, в серию единичных битов - нулевой). Если же в окрестности границы нет серий одинаковых битов, то значение вставляемого бита выбирается таким, чтобы в частотном спектре записываемого потока данных появлялись специальные низкочастотные компоненты, или пилот-сигналы, позволяющие отличать друг от друга наклонные дорожки и несущие информацию для системы трекинга (свойства пилот-сигналов поясняются в следующем разделе).

Модулированные данные затем преобразуются в код БВНМ. Целью этого кодирования является согласование спектра записываемого на ленту сигнала с частотной характеристикой канала записи-воспроизведения и улучшение способности к самосинхронизации.

Стартовые последовательности и защитные области не подвергаются процедурам канального кодирования, поскольку их структура уже соответствует тем требованиям, в соответствии с которыми подвергается обработке основной поток данных. Надо отметить также, что первый байт слова опознавания ID0 (рис. 22) не подвергается модуляции. Этот байт образует 25-битовое кодовое слово вместе с синхрословом из 17 битов. Для того, чтобы это 25-битовое слово удовлетворяло требованиям модуляции 24-25, к байту ID0 подбирается одна из двух последовательностей (F или G), которые можно использовать в качестве синхрослова. Выбор правила формирования стартовой последовательности и защитной области из двух 25-битовых групп (A или B) определяется вторым пунктом правила модуляции, в соответствии с которым записываемый сигнал каждой дорожки содержит требуемые пилот-сигналы.

Рис. 26. Частотные характеристики сигналов дорожек

Сигналограмма кадра

Как было уже отмечено, один видеосектор несет 1/12 (в системе 625/50) или 1/10 (в системе 525/60) часть от видеоданных одного кадра телевизионного изображения. Кадр из двенадцати или десяти видеосекторов записывается, соответственно, на двенадцать (рис. 24) или десять (рис. 25) наклонных дорожках. Дорожки нумеруются последовательно в интервале 0…11 или 0…9.

Стандарт DV предполагает, что наклонные дорожки, записываемые на ленте, могут быть трех типов: F0, F1, F2. Информацию о типе дорожки и должны нести пилот-сигналы, которые представляют собой тональные компоненты спектра, формируемые благодаря модуляции 24-25. Дорожка типа F0 отличается тем, что компоненты с частотами f1 и f2 должны быть ослаблены не менее, чем на 9 дБ (рис. 26). На дорожке типа F1 должен генерироваться пилот-сигнал - тон с частотой f1 и уровнем 16…19 дБ. При формировании потока данных дорожки типа F2 должен создаваться пилот-сигнал с частотой f2 и уровнем 16…19 дБ (частоты f1 и f2 представляют собой, соответственно, 1/90 и 1/60 от частоты, период которой равен временному интервалу записи одного бита).

Дорожки следуют группами в соответствии с типами и характеристиками пилот-сигналов: F0 - F1 - F0 - F2. В системе 525/60 в кадре оказывается 2,5 таких группы (рис. 25), поэтому порядок следования дорожек разных типов оказывается разным для двух соседних кадров. Если в одном кадре вторая дорожка является дорожкой типа F1, то вторая дорожка следующего кадра будет иметь тип F2. Эта информация является важной для работы систем управления лентопротяжным механизмом, она отображается значением специального сигнала PF (Pilot Frame), который равен нулю для кадра со второй дорожкой типа F1 и 1 - для кадра со второй дорожкой типа F2. Для системы 625/50 кадр состоит из трех таких групп по четыре дорожки (рис. 24), поэтому все кадры являются одинаковыми по отношению к типу второй дорожки и значение бита PF всегда равно 0.

Таким образом, модуляция 24-25 является не только элементом канального кодирования, она также формирует пилот-сигналы для системы трекинга, что, в принципе, позволяет обойтись без продольных дорожек, на которых записываются импульсы управления для приводов лентопротяжного механизма.

Окончание следует

 

Замечания и предложения по работе сервера направляйте: web.master at 625-net.ru.

© 1996—2009 «Издательство 625». Все права защищены.

e-mail: magazine at 625-net.ru, тел./факс: (495) 691-7724, 695-9588.

Свидетельство о регистрации средства массовой информации Эл № 77-2794.