: архив : архив журнала "625" : 2002 : #8

ЦИФРОВАЯ МАГНИТНАЯ ВИДЕОЗАПИСЬ ФОРМАТ DV
Продолжение. Начало см. "625", 2002 г.,№№3, 4, 7.

Константин Гласман
Иллюстрации Маргариты Покопцевой

Обработка звукового сигнала

Большая часть данных, записываемых на наклонных дорожках ленты, - это видеоданные, т.е. данные, несущие информацию о видеосигнале. Видеосектор - основной и наиболее сложный компонент каждой наклонной дорожки, он занимает большую ее часть (около 85%). Его структура в значительной мере предопределяет вид остальных секторов. Поэтому структура звукосектора, который записывается на каждой наклонной дорожке и в рамках которого объединяются данные, несущие информацию о звуковом сопровождении телевизионной программы, имеет много общего со структурой видеосектора.

Режимы кодирования звука

Основной интерфейс для сигналов звукового сопровождения - аналоговый, поэтому звуковые сигналы перед записью преобразуются в цифровую форму. Сигналы звукового сопровождения не подвергаются компрессии. Они записываются в виде двух звукоблоков. Блоки обрабатываются идентичным образом, но независимо друг от друга, что создает возможности для независимого монтажа записываемых звуковых сигналов. Каждый блок состоит из пяти (система 525/60) или шести (система 625/50) звукосекторов, которые записываются, соответственно, на пяти или шести последовательных наклонных дорожках. Первый звукоблок записывается на дорожках T0…T4 (525/60) или T0…T5 (625/50), второй - на дорожках T5…T9 (525/60, рис. 25) или T6…T11 (625/50, рис. 24).

Рис. 18. Обобщенная схема канала записи

Звукоблоки - это физические носители звуковых сигналов, которые обозначаются в стандарте как CH1 и CH2. Кодироваться сигналы звукоблоков могут различным образом. Стандарт DV предусматривает четыре режима кодирования, которые характеризуются частотой дискретизации, параметрами и типом квантования и числом каналов (таблица 4).

В режимах 48k; 44,1k и 32k используется частота дискретизации 48 кГц; 44,1 кГц и 32 кГц соответственно. Во всех трех режимах в каждом звукоблоке записывается один звуковой сигнал, т.е. один канал звукового сопровождения, и используется импульсно-кодовая модуляция с линейной шкалой квантования и расходом 16 битов на один отсчет. Кодированные данные представлены в дополнитель- ном коде. В режиме 32k-2ch в каждом звукоблоке записывается два звуковых сигнала, т.е. два канала звукового сопровождения. Увеличение числа каналов достигается ценой уменьшения точности квантования (12 битов на один отсчет) и, соответственно, увеличения уровня шумов квантования. Для снижения субъективной слышимости шумов квантования используется нелинейная шкала квантования. Переход от квантования с кодовыми словами длиной 16 битов к словам из 12 битов происходит в соответствии со следующими правилами: в диапазоне чисел 16-битовой шкалы 0…±511 шаг квантования не меняется, в диапазоне ±512…±1023 шаг увеличивается в два раза, в диапазоне ±1024…±2047 шаг увеличивается в четыре раза и т.д.

Рис. 24. Сигналограмма одного кадра
телевизионного изображения (625/60)
Рис. 25. Сигналограмма одного кадра
телевизионного изображения (525/60)

При каждой частоте дискретизации возможны два режима обработки: синхронный и несинхронный. В синхронном режиме частота fs генератора, формирующего импульсы дискретизации звука, синхронизируется сигналом fh строчной развертки изображения с помощью системы фазовой автоподстройки частоты и находится в целочисленном соотношении с частотой строк. В режиме дискретизации 48k fs=fhx1144/375 для стандарта 525/60 и fs=fhx384/125 для системы 625/50. В режимах 32k и 32k-2ch fs=fhx2288/1125 для стандарта 525/60 и fs=fhx256/125 - для 625/50.

В несинхронном режиме частота дискретизации звука, конечно, не является произвольной, ее значение должно поддерживаться в среднем равным величинам 48 кГц, 44,1 кГц и 32 кГц, но стабильность этих значений определяется лишь стабильностью самого генератора.

Режимы 48k и 32k-2ch характеризуются наибольшей скоростью потока данных на выходе аналогоцифрового преобразователя - 1,536 Мбит/с (16x48000x2=12x32000x4=1536000), определяющей требования к пропускной способности канала записи/воспроизведения звукового сопровождения.

Звукокадры, звукоблоки, звукосекторы

Звуковые данные обрабатываются в рамках кадров, причем длительность этих звукокадров равна длительности видеокадров. Таким образом, при частоте дискретизации 48 кГц в синхронном режиме кадр содержит ровно 48000/25=1920 звуковых отсчетов одного звукового сигнала для системы 625/50. Для стандарта разложения 525/60 среднее число отсчетов на интервале видеокадра оказывается дробным - 48000/29,97=1601,6. Целое число отсчетов приходится на пять видеокадров (1601,6x5=8008), поэтому число отсчетов в звукокадрах устанавливается в соответствии со следующей последовательностью: 1600, 1602, 1602, 1602, 1602 (1600+1602x4=8008). Подобно тому, как данные видеокадра делятся на двенадцать (система 625/50) или десять (система 525/60) видеосекторов, данные звукокадров двух звуковых сигналов также делятся перед записью на двенадцать или десять звукосекторов (один звукоблок записывается на шести или пяти наклонных дорожках). Принципу 6/5 удовлетворяют числа отсчетов 1944 (625/50) и 1620 (525/60). Поэтому на один звукосектор приходится 1944/6=1620/5=324 отсчета в каждой из систем 625/50 и 525/60.

16-битовые данные каждого отсчета перед обработкой и записью делятся на два байта (старший байт и младший байт). Таким образом, при 16-битовом представлении 324 отсчета записываются в виде 648 байтов. Это число и определяет максимальный объем основных данных одного звукосектора (девять строк по 72 байта). Неиспользуемое пространство в конце каждого звукокадра заполняется произвольными данными (полезные данные переносят (1920/6)x2=640 байтов в системе 625/50).

Рис. 27. Синхроблоки звукосектора
Рис. 28. Структура звукосектора

При частоте дискретизации 32 кГц на интервал времени, равный длительности видеокадра, в синхронном режиме приходится 32000/25=1280 отсчетов для системы 625/50 и приблизительно 1067,734 отсчетов в системе 525/60. Для системы 525/60 целое число отсчетов приходится на интервал 15 звукокадров, т.е. на интервал времени, равный 15 видеокадрам (1067,734x15=16016), в пределах которых численность звуковых отсчетов на звукокадр определяется следующим образом: первый и восьмой кадры содержат по 1066 отсчетов, остальные 13 кадров - по 1068 (1068x13+1066x2=16016). Для соответствия принципу 6/5 в каждом кадре отводится место для 1296 (система 625/50) или 1080 (система 525/60) отсчетов.

12-битовые кодовые слова, называемые словами данных Y и Z, трансформируются в байты следующим образом: восемь старших битов двух отсчетов образуют два байта, называемые старшими байтами Y и Z, а объединение оставшихся четырех битов каждого отсчета - третий байт, называемый младшим байтом. Таким образом формируется (1280x2/2)x3=3840 байтов (625/50), которые делятся по шести звукосекторам шести дорожек, что определяет объем полезных данных каждого сектора в режиме 32k-2ch (3840/6=640 байтов, что дает такую же величину, что и в режиме 48k). Полный объем данных звукосектора равен 648 байтам (2x(1296/2)x3/6=2x(1080/2)x3/5=324).

В несинхронном режиме на один кадр приходится переменное число отсчетов, приведенные выше значения характеризуют максимальные величины (в режиме 44,1k возможна только несинхронная работа).

Защита звука от ошибок

Для эффективной защиты по отношению к большим пакетным ошибкам звуковые данные подвергаются перемешиванию в пределах кадра. К перемешанным звуковым данным добавляются дополнительные данные, затем объединенный массив подвергается двухмерному кодированию Рида-Соломона (рис. 27). Внешний код - код (14,9) над полем GF(256), т.е. символами кодовых слов являются восьмибитовые байты. Внутренний код - общий с внутренним кодом видеоданных. Для данных, несущих звуковые сигналы, в каждом секторе отводится 648 байтов. Структура звукосектора (рис. 28) подобна структуре видеосектора и отличается лишь числом синхроблоков данных и длиной постамбулы.

Дополнительные данные звука содержат такие сведения, как частота дискретизации, параметры квантования, число каналов в звукоблоке, число отсчетов звука в кадре, тип телевизионной системы (625/50 или 525/60), постоянная времени предкоррекции, назначение наполнения блока, например, содержит ли он моноканал, левый, правый канал стерео и т.д.

Кодированная последовательность байтов звукосектора подвергается канальному кодированию, называемому в стандарте DV и обозначенному на рис. 18 как модуляция, поскольку модуляция 24-25 представляет собой основное содержание этого процесса. Канальное кодирование звукоданных выполняется так же, как и видеоданных.

Продолжение следует

 

Замечания и предложения по работе сервера направляйте: web.master at 625-net.ru.

© 1996—2009 «Издательство 625». Все права защищены.

e-mail: magazine at 625-net.ru, тел./факс: (495) 691-7724, 695-9588.

Свидетельство о регистрации средства массовой информации Эл № 77-2794.