MPEG-4 High-efficiency AAC Audio: новые возможности
Профиль MPEG-4 High Efficiency AAC представляет собой комбинацию MPEG AAC и дополнения SBR Bandwidth Extension. Дополнение базируется на технологии SBR (Spectral Band Replication), разработанной компанией Coding Technologies. Эта технология применяется компанией-разработчиком и ее клиентами под маркой aacPlus1. Первой коммерческой системой, использовавшей то, что сейчас приобрело название High Efficiency AAC, была XM Radio, и произошло это в июне 2001 года. С тех пор новый профиль получил определенное признание благодаря тому, что позволил обеспечить качество звука компакт-диска при стереопотоке 48 кбит/с и достаточно высокое качество стереозвука при потоке 32 кбит/с. В конце 2001 года ценность профиля была признана специалистами MPEG, и сегодня этот профиль рассматривается как ключевой для кодирования звука по стандарту MPEG-4, получив название High-Efficiency AAC.
MPEG-4 High Efficiency AAC (HE-AAC) — это не замена AAC, а скорее дополнение, которое расширяет возможности высококачественного звука MPEG-4 на гораздо более низких скоростях потока. Декодеры High Efficiency AAC будут декодировать как обычные потоки AAC, так и улучшенные AAC с SBR. В результате получается дополнение с обратной совместимостью со стандартом, которое практически удваивает эффективность кодирования звука в соответствии с MPEG-4.
SBR представляет собой оригинальную технологию расширения полосы пропускания, позволяющую звуковым кодекам обеспечить те же самые слуховые ощущения при почти вдвое сниженной скорости потока. В результате при помощи High Efficiency AAC достигается CD-качество стереозвука при 48 кбит/с и высокое качество звука 5.1 surround при 128 кбит/с. Этот уровень эффективности является более чем достаточным для доставки контента через Интернет и дает возможность реализации новых приложений на рынке мобильного и цифрового вещания.
По заявлениям компании Coding Technologies, лицензирование технологии SBR влечет за собой появление простой модели лицензирования MPEG-4 AAC, предусматривающей ежегодные отчисления за персональные компьютерные приложения, плату за ее использование в аппаратных устройствах в расчете за единицу, и никакой дополнительной оплаты за электронное распространение музыки. Такая структура лицензии, ее техническая простота специально разработана для того, чтобы сделать HE-AAC удобным для коммерческого использования.
Звуковой профиль MPEG-4 High-Efficiency AAC
Новый звуковой профиль High-Efficiency AAC состоит из существующего объекта типа MPEG-4 AAC и нового объекта типа SBR.
В марте 2003 года группа специалистов MPEG Audio сделала большой шаг вперед, закончив работу над спецификацией High Efficiency AAC. В целях удовлетворения потребностей цифрового телевидения и звуковой индустрии будет также стандартизирован профиль MPEG-2 AAC LC plus SBR, созданный в дополнение к MPEG-2 AAC (MPEG-2, Part 7). Это означает, что какой бы из профилей (MPEG-2 или MPEG-4 AAC) сегодня не применялся, системные операторы могут использовать новую, открытую, стандартизированную технологию, чтобы уменьшить необходимую им полосу пропускания практически вдвое.
Кроме того, группа MPEG признает «маломощный» декодер для HE-AAC. Он разработан совместно компаниями Panasonic, NEC и Coding Technologies. Метод маломощного декодирования требует на 40% меньше мощности процессора и декодирует потоки HE-AAC лишь с незначительным ухудшением качества звука. Наличие маломощного и высококачественного декодеров для HE-AAC позволяет запускать процесс декодирования на базе максимально широкого диапазона процессоров, используемых в мобильных и портативных звуковых устройствах.
Слуховые испытания
![]() |
| Рис. 1. Результаты тестирования MPEG при потоке 24 кбит/с |
![]() |
| Рис. 2. Результаты слуховых испытаний Digital Radio Mondiale для монопотока 24 кбит/с |
![]() |
| Рис. 3. Результаты слуховых испытаний EBU для стереозвука 48 кбит/с |
За последние два года было проведено несколько независимых испытаний, чтобы продемонстрировать преимущество MPEG-4 HE-AAC по сравнению с обычным AAC, другими стандартами кодирования и соответствующими кодеками. Эти тесты показывают, что MPEG-4 HE-AAC обеспечивают существенный выигрыш по сравнению со своими конкурентами, в том числе и по сравнению с AAC без дополнений. Испытания однозначно говорят о том, что на сегодня MPEG-4 HE AAC является наиболее качественным звуковым кодеком из всех существующих.
Группа MPEG в рамках выбора технологии проводила слуховой тест для MPEG-4 Audio Extension 1. В ходе теста опытные слушатели использовали метод «слепого» тестирования MUSHRA, чтобы беспристрастно оценить звук, соответствующий разным кодекам, в сравнении с эталонным некодированным звуком. Для тестирования, как это принято в MPEG, использовались фонограммы, которые считаются трудно кодируемыми, например, клавесин, язычковый камертон, мужская немецкая речь, кастаньеты и др. Даже при таких жестких условиях тестирования HE-AAC показал высокую эффективность и доказал, что является очевидным улучшением для AAC (рис. 1).
Digital Radio Mondiale (DRM) является международным консорциумом, разрабатывающим новый глобальный стандарт для цифрового вещания в диапазонах AM ниже 30 МГц. Были проведены слуховые испытания DRM. Тестирование на предмет выбора технологии, проведенное этой организацией, проводилось для фонограмм, закодированных с потоком 24 кбит/с в режиме моно и также с использованием метода MUSHRA. Для кодирования брался среднестатистический вещательный контент. HE-AAC снова продемонстрировал высокую производительность даже при сравнении с AAC при потоке 32 кбит/с (рис. 2).
В 2002 году Европейский вещательный союз (EBU) проводил второй тур слухового тестирования интернет-звука. Этот комплекс испытаний предусматривал сравнение различных кодеков на нескольких скоростях потока с кодеком aacPlus фирмы Coding Technologies, в том числе поток 48 кбит/с. Результаты показали, что aacPlus (то есть HE-AAC) является очевидным победителем и значительно превосходит своих конкурентов. Отчет EBU также констатирует, что технология SBR (используемая как в aacPlus, так и в mp3PRO) является единственным кардинальным усовершенствованием в области компрессии аудио, что и показали тесты в сравнении с такими же испытаниями двухгодичной давности (рис. 3).
Рынки
То, что MPEG-4 HE-AAC позволяет достичь высокого качества звука при очень малых скоростях потока, не только дает возможность расширять существующие рынки его применения, но и открывает путь к возникновению новых рынков для цифрового звука. Там, где полоса пропускания является важным фактором, применение High-efficiency AAC является просто неоценимым. Этот кодек не просто приводит к улучшению качества только звука, но и позволяет повысить уровень качества цифрового ТВ. Объединив HE-AAC с видео формата MPEG-4, можно снизить степень сжатия видеоизображения, обеспечив ему более высокое качество и не нанеся ущерба качеству звука. И это можно сделать для моно-, стерео- и многоканального режимов. В сочетании со стандартом видеокодирования MPEG/ITU AVC (включенного в стандарт MPEG-4 как часть 10) новый кодек позволяет достичь и других качественных улучшений.
Мобильное потоковое вещание и загрузка
С новыми сетями обеспечения мобильных услуг 2.5G и 3G связано и появление серьезных ожиданий в плане реализации мобильных услуг мультимедиа. Потоковое видео и другие широкополосные услуги уже довольно широко демонстрируются как очень удачное воплощение новых инфраструктур. Проблема состоит в том, что для большей части территорий пиковая полоса пропускания этих сетей обычно составляет около 144 кбит/с, притом каждый индивидуальный пользователь имеет скорость подключения 40 кбит/с. Доставка качественного видео по таким каналам связи весьма проблематична и может не оправдать ожиданий пользователей.
HE-AAC хорошо подходит для решения этой проблемы, поскольку позволяет обеспечить пользователя возможностью загрузки видео приемлемого качества и потоковым звуковым вещанием при доступных уже сегодня каналах. HE-AAC с потоком 48 кбит/с обеспечивает качество стереопрограмм на уровне компакт-диска, а при потоке 32 кбит/с качество звука хоть и не достигает этого уровня, но остается высоким. Такие скорости потока в сочетании с ростом рынка платной подписки на аудиоуслуги говорят о том, что в мире рождается новый мощный бизнес.
Цифровое вещание по спутниковым и кабельным каналам
Первый коммерческий успех пришел к aacPlus после использования его в XM Satellite Radio. На базе уже имевшейся полосы пропускания aacPlus позволил XM Radio предложить своим клиентам большее число каналов с лучшим качеством, чем это смогла сделать конкурирующая система Sirius Radio, применявшая соответствующий кодек PAC фирмы Lucent. Кодек aacPlus был также выбран консорциумом Digital Radio Mondiale как часть стандарта для цифрового радиовещания в коротковолновом диапазоне и AM.
Это позволило High-efficiency AAC занять свое место в мире открытых стандартов для цифрового вещания по кабельным и спутниковым каналам. Поскольку операторы ищут возможность поднять уровень своих услуг путем либо увеличения числа транслируемых каналов, либо повышения разрешения, эффективность HE-AAC дает им больше возможностей в плане консолидации полосы пропускания для звука, чтобы высвободить ресурсы для видео или обеспечить в той же полосе большее число звуковых каналов для многоязыкового вещания, а также вещания в стандарте 5.1 Surround. Поскольку Spectral Band Replication (SBR) также была добавлена в стандарт MPEG-2, операторы получили возможность маневра в применении HE-AAC в сочетании с MPEG-2 или MPEG-4.
Распределение по Интернету
Видео по запросу и другие платные услуги приобретают в Интернете все большее распространение. При предоставлении этих услуг ограничения, накладываемые скоростью работы серверов и шириной канала так называемой «последней мили», создают операторам и владельцам технических средств проблемы в обеспечении своих клиентов высококачественными и надежными услугами. Стандарт MPEG-4 почти вдвое снижает требования к полосе пропускания, что позволяет уменьшить стоимость и повысить качество услуг доставки контента по Интернету.
Благодаря тому, что HE-AAC является последователем AAC в плане совместимости с решениями по управлению правами на контент и не требует дополнительной платы за распространение контента, становится возможным создание безопасного и экономичного транспорта для доставки звукового и аудиовизуального контента по сети Интернет.
Применение и лицензирование
Следуя правилу, которое применяется для MPEG-4 AAC, технология SBR также предусматривает структуру лицензирования из расчета за каждый кодек и без дополнительной платы за распространение или использование контента, существующего в электронной форме. Такая структура делает MPEG-4 HE-AAC очень удобным для реализации коммерческих услуг по доставке контента. Лицензирование HE-AAC состоит из двух этапов. Детали и расписание сообщаются компанией Coding Technologies, если речь идет о лицензировании объектов типа SBR, либо фирмой Via Licensing, если лицензируются объекты типа AAC.
На сегодня MPEG-4 HE-AAC представляет собой доказавшую свою состоятельность технологию, которая уже широко применяется и готова к еще более интенсивному использованию.
Исходный код для эталонного декодера вскоре будет доступен (если уже не стал доступен — прим. редактора) в группе MPEG, а оптимизированный исходный код для кодеров и декодеров уже можно получить у различных производителей, включая Coding Technologies и Fraunhofer IIS. Уже существуют оптимизированные бинарные приложения для Win32, Linux, MacOS X, ST Micro, ARM, Motorola и Trimedia, завершаются разработки приложений для других систем.
Технология SBR
Технология SBR, или Spectral Band Replication, была разработана компанией Coding Technologies как общий метод существенного повышения эффективности таких распространенных кодеков, как MPEG Layer-3 (MP3) и MPEG AAC. SBR не подменяет ядро кодека, а скорее работает в связке с ним, позволяя организовать более эффективный процесс кодирования и почти вдвое уменьшить скорость потока. Кодек MPEG-4 Audio использует SBR в сочетании с AAC, благодаря чему создается профиль High-efficiency AAC, названный aacPlus компанией Coding Technologies.
Участвуя в процессах кодирования и декодирования, SBR обеспечивает корреляцию между низко- и высокочастотным составляющими звукового сигнала и использует ее для высококачественного описания этого сигнала с применением очень малого объема данных.
Данные SBR, описывающие высокочастотную составляющую, объединяются со сжатыми низкочастотными данным, полученными от AAC. Будучи объединенным таким образом, поток HE-AAC содержит достаточный объем данных для воссоздания исходного сигнала.
Например, для получения сжатого при помощи HE-AAC потока стереозвука 48 кбит/с кодер генерирует два сигнала: сигнал MPEG AAC со скоростью около 42 кбит/с и сигнал SBR со скоростью около 6 кбит/с. Затем сигнал SBR помещается в дополнительные поля сигнала MPEG AAC в соответствии с тем, как это определено стандартом MPEG-4, и результирующий сигнал передается уже как полный поток MPEG-4 HE-AAC 48 кбит/с (рис. 4).
![]() |
| Рис.4. Структура кодека MPEG-4 aacPlus показывает интеграцию SBR и AAC |
Поскольку данные SBR располагаются в дополнительных полях AAC, улучшенный сигнал может быть принят как существующими декодерами AAC, так и новыми декодерами HE-AAC. Если поток отправляется на декодер AAC, то опознан и декодирован будет только низкочастотный звуковой сигнал. Если же получателем выступает декодер HE-AAC, оба сигнала (SBR и AAC) будут декодированы с воссозданием полного исходного сигнала. Эта технология делает новый профиль прямо совместимым с AAC. Кроме того, поскольку HE-AAC содержит полнофункциональный декодер AAC, есть возможность декодирования потоков, соответствующих как «простому» AAC, так и High Efficiency AAC профилям MPEG-4 Audio. Эта комбинация делает HE-AAC обратно совместимым с AAC.




