Системы видеокомпрессии: от MPEG-1 до AVC и VC-1
| Системы видеокомпрессии: от MPEG-1 до AVC и VC-1 |
|---|
|
Развитие цифрового телевизионного вещания неразрывно связано с совершенствованием методов и технических средств видеокомпрессии, или сжатия, потоков цифровых видеоданных. Видеокомпрессия позволяет экономно расходовать самый дорогой ресурс систем коммуникаций и информационных систем — пропускную способность каналов связи. Без видеокомпрессии цифрового телевизионного вещания как глобальной информационной системы не существовало бы сейчас по простой причине — оно было бы слишком дорогим.
Первые системы сжатия потоков данных появились в начале двадцатых годов прошлого века, когда были сделаны попытки передачи изображений по кабельным линиям, соединяющим Нью-Йорк и Лондон. Квантование изображения позволило сократить время передачи одного кадра с недели до трех часов [1, 2]. Значительный прогресс в создании систем видеокомпрессии был достигнут в семидесятые годы двадцатого века. Он базировался на результатах фундаментальных исследований, относящихся к созданию статистических моделей изображений, оценке точности восстановления изображений, разработке оптимальных алгоритмов преобразований, используемых при кодировании изображений [3]. В восьмидесятые годы было предложено много новых алгоритмов сжатия видеоданных, но реальной движущей силой цифрового телевидения видеокомпрессия стала только после ее международной стандартизации.
Первый этап международной стандартизации: MPEG-1 — MPEG-2
Первым стандартом видеокомпрессии, оказавшим значительное воздействие на развитие телевизионного вещания и открывшим телевидению новые возможности, стал MPEG-1. Он был разработан исследовательской группой, широко известной как MPEG — Moving Picture Experts Group (группа экспертов по кодированию движущихся изображений). Официальное обозначение группы MPEG, под которым публикуются все документы и стандарты, — ISO/IEC JTC1/SC29/WG11. Оно определяется тем, что это одиннадцатая рабочая группа (WG11) двадцать девятого подкомитета (SC29) Объединенного технического комитета № 1 (JTC1), созданного Международной организацией стандартизации (ISO) и Международной электротехнической комиссией (IEC) для выполнения исследований и разработок стандартов в области информационных технологий. Группа MPEG была образована в январе 1988 года с целью разработки систем кодирования изображения и звука для устранения избыточности. В первом заседании группы в мае 1988 года участвовало 25 экспертов, к середине девяностых годов группа MPEG объединяла уже сотни специалистов, представляющих около 200 организаций из 26 стран.
Первым результатом работы группы MPEG стал стандарт ISO/IEC 11172 — Information Technology — Coding of Moving Pictures and Associated Audio for Digital Storage media at up to about 1,5 Mbit/s (Кодирование изображения и звука при скоростях цифрового потока компрессированных данных до 1,5Мбит/с). Именно этот стандарт, опубликованный в 1993 году, стал известным под названием MPEG-1. Роль этого стандарта была велика. Именно MPEG-1 сделал возможным интерактивное видео на компакт-дисках, но уже в 1990 году была начата работа над новым стандартом — ISO/IEC 13818 — Information Technology — Generic coding of Moving Pictures and Associated Audio Information (Обобщенное кодирование изображения и звука). Этот стандарт (первая версия была опубликована в 1994 году) приобрел мировую известность под названием MPEG-2.
Среди 10 составных частей стандарта MPEG-2 можно выделить три основные: 13818-1 — Systems, 13818-2 — Video, 13818-3 — Audio. Спецификация 13818-2 — Video регламентирует кодовое представление данных и процесс декодирования, обеспечивающий воспроизведение компрессированных телевизионных изображений. 13818-2 предполагает сжатие потока видеоданных за счет устранения пространственной и временной избыточности, присущей телевизионному изображению. Устранение пространственной избыточности основывается на использовании дискретного косинусного преобразования, временной — на дифференциальном кодировании с компенсацией движения. Кодирование MPEG-2 (Video) является обобщенным, или типовым, в том смысле, что предложенная схема может использоваться в различных приложениях, предусматривается работа в широком диапазоне скоростей потоков кодированных данных. Для содействия практическому использованию обобщенного алгоритма во множестве средств компрессии выделены подмножества, определяемые профилями (функциональными особенностями, определяемыми подмножеством синтаксических элементов) и уровнями (параметрами).
Изображения могут быть чересстрочными и построчными. Число элементов в кадре может меняться от 352і288 (288 активных строк по 352 элемента в каждой строке) для низкого уровня основного профиля (MP@LL) до 1920і1152 для высокого уровня высокого профиля (HP@HL). Максимальная скорость потока компрессированных данных может находиться в диапазоне от 4 Мбит/с (MP@LL) до 100 Мбит/с (HP@HL).
Спецификация 13818-3 определяет кодовое представление сигнала звукового сопровождения. Системная спецификация 13818-1 устанавливает правила объединения данных видео и звука в единый поток. Она определяет обобщенные методы мультиплексирования и синхронизации потоков видео-, звуковых и дополнительных данных. Используется пакетная схема мультиплексирования. Синхронизация обеспечивается за счет передачи вместе с компрессированными данными меток времени (опорное время программы, время декодирования и предъявления). Элементарные потоки компрессированных видео, звука и дополнительных данных сегментируются, а полученные при сегментации пакеты мультиплексируются, образуя программный, или транспортный, поток.
Важнейшая особенность стандарта MPEG-2 состоит в том, что представление сигналов телевизионного изображения и звука в форме, задаваемой спецификациями 13818-1/2/3, позволяет обращаться с видео- и звуковыми потоками как с потоками компьютерных данных, которые могут записываться на самые разнообразные носители информации, передаваться и приниматься с использованием каналов связи и сетей телекоммуникаций, которые существуют сегодня и появятся в будущем. Обстоятельство, заслуживающее отдельного упоминания, заключается в том, что процедура кодирования не регламентируется стандартом. Это оставляет возможности для совершенствования кодеров и улучшения качества воспроизводимого изображения.
Система компрессии MPEG-2 среди всего семейства MPEG имеет наиболее широкую область применения. Во всех системах цифрового телевизионного вещания, принятых в мире (ATSC, DVB, ISDB), используется компрессия, или сжатие потоков данных, в соответствии с алгоритмами и процедурами, регламентированными стандартами MPEG-2 [4]. В каждом цифровом телевизионном приемнике или приставке есть декодер MPEG-2. Практически все изображения, демонстрируемые в программах совре-
менного аналогового телевидения, на некотором этапе производственного цикла были закодированы по системе MPEG-2. Можно сказать, что MPEG-2 сделал возможным цифровое телевизионное вещание. Но к областям применения MPEG-2 относится не только телевизионное вещание (наземное, спутниковое, кабельное), но и радиовещание, электронное кино, электронная журналистика, видеозапись, системы видеоконференцсвязи, интерактивные видеодиски.
Создание стандартов MPEG-1 и MPEG-2 представляет собой выдающееся достижение и важную веху в развитии цифрового телевидения. В 1996 году Национальная академия телевизионного искусства и науки США (National Academy of television Arts and Sciences) присудила Международной организации стандартизации и Международной электротехнической комиссии самую престижную премию телевидения — Engineering Emmy. Награда была присуждена с формулировкой — «За международную стандартизацию JPEG, MPEG-1 и MPEG-2».
