Основные критерии оценки систем нелинейного
видеомонтажа на базе персональных компьютеров
Игорь Витиорец
Multilayering
Этот специальный термин достаточно трудно кратко перевести на русский
язык. Дословно он переводится как "многослойность". Применительно
к видеомонтажу его можно интерпретировать так: есть несколько "слоев"
видеоизображения, поступающих с видеомагнитофонов и "слой" титров,
управляемое наложение которых и образует конечное изображение.
Стандартная студия линейного монтажа поддерживает режимы "А/В"
либо "А/В/С Roll". Это означает, что студия может управлять двумя
или тремя видеомагнитофонами-источниками и одним магнитофоном-"мастером"
для записи. Вариант с тремя магнитофонами лучше, так как он позволяет
опытному монтажеру создавать намного более сложные и изощренные
видеоэффекты. Таким образом, студия линейного монтажа обычно имеет
3 или 4 одновременных слоя (не следует забывать о возможных перезаписях).
По своей организации системы компьютерного монтажа позволяют иметь,
в принципе, бесконечное число слоев. Но, из-за некоторых ограничений
в аппаратном и программном обеспечении различные системы реализуют
от 3 до 32 слоев (например, Media Composer фирмы Avid Technology).
Способ сжатия (или отсутствие сжатия)
Этот пункт определяет две важнейшие и противоречащие друг другу
характеристики системы: качество записываемого на диск видеоматериала
и длительность видеоматериала, хранимого в системе. Системы без
компрессии имеют максимальное качество. Его определяют два фактора:
производительность дисковой подсистемы и качество исходного видеоматериала.
Для системы разверток 625/25, принятой в Европе, используют два
основных разрешения: 576 строк по 720 элементов (pixel) - соответствует
телевизионному стандарту CCIR601, либо 576 строк по 768 элементов
- "стандарт де факто" для видеографики, поскольку в этом случае
элемент имеет квадратную форму. Поток данных при этом равен 20,25
и 22 мегабайта в секунду соответственно. Легко подсчитать, что на
один гигабайт дисковой подсистемы можно записать примерно 45-50
секунд живого видео. При этом дисковая подсистема должна обладать
соответствующей пропускной способностью. К сожалению, такие системы
стоят недешево. Популярный сейчас в сфере компьютерного видеомонтажа
жесткий диск Barracuda имеет производительность 3Мбайт/с.
Единственный способ избежать столь расточительного использования
жестких дисков - применение компрессии видеоданных. В настоящее
время в компьютерном видеомонтаже применяются несколько основных
способов компрессии: JPEG; Motion JPEG; MPEG; DVI; Wavelete; статистическое
сжатие фирмы SoftLab.
Про JPEG и Motion JPEG написано достаточно много. Степень сжатия
у них варьируется от 3 до 100. Каждый кадр сжимается сам по себе,
независимо от других кадров, поэтому любой кадр может быть распакован
в любой момент времени, независимо от того, какой кадр показывался
перед этим. Именно эта возможность и определяет широкое использование
данных методов в системах нелинейного монтажа. Эти методы имеют
характерные искажения: при больших степенях сжатия проявляется клетчатая
структура изображения, с выраженными границами клеток. Микросхемами,
реализующими данный способ сжатия, являются: "старый" C-cube-550
- достаточно старый комплект микросхем, обеспечивающий в общем случае
качество S-VHS; LSI Logic - наиболее часто используемые на настоящий
момент микросхемы, позволяющие достигнуть качества Betacam SP; "новый"
C-cube-560 - анонсирован как очень мощный и качественный кристалл,
но до сих пор не запущенный в серию.
Способ сжатия Wavelete в принципе аналогичен JPEG. Поскольку в
качестве ячейки изображения используются круговые волны - Wave,
искажения исходного изображения имеют менее заметную структуру при
больших степенях сжатия. Из-за большего объема вычислений в настоящий
момент степень сжатия ограничивается диапазоном 6-30. Кроме этого,
разработчики кристалла решили "облегчить" жизнь программистам и
"зашили" в микросхему неотключаемую автоматическую систему динамического
изменения степени сжатия. Из-за этого возникают проблемы с видеосигналами,
имеющими нестабильный уровень черного. Характерными для этого случая
искажениями изображения является достаточно неприятное биение мелкой
структуры изображения на однотонно закрашенных изображениях и изображениях,
имеющих плавный градиент цвета.
В основе способа сжатия MPEG лежат следующие основные концепции:
использование разностного кодирования между кадрами с последующим
сжатием разностных кадров. В поток данных включаются также исходные,
"ключевые" или опорные кадры, для более быстрого позиционирования
в массиве кодированных видеоданных. По состоянию дел на текущий
момент качество получаемого таким способом видеоизображения больше
подходит для области multimedia, чем для профессионального видео.
Однако более совершенный алгоритм MPEG-2 используется в каналах
передачи телепрограмм, в том числе через спутник.
Разработанный еще в 90-м году комплект Intel 750, использующий
для сжатия технологию DVI, сейчас уже нельзя считать достойным конкурентом
перечисленных выше систем. Но, тем не менее, на нем успешно работают
как минимум 3 системы нелинейного монтажа. Степень сжатия для данной
технологии находится в пределах от 15 до 160. Существенный недостаток
данного комплекта - для системы PAL максимальное разрешение не превышает
240 строк по 256 элементов, что не позволяет говорить о каком-либо
профессиональном применении систем, использующих эту технологию.
В конце обзора стоит остановиться на совершенно новой для области
цифрового видеомонтажа технологии сжатия - компрессии с использованием
статистических методов. К сожалению, в последнее 3-4 года из открытой
прессы совершенно исчезли статьи по этим методам, что дает основание
предположить предстоящий в ближайшее время бум систем, использующих
эту технологию. У нас в России существует фирма SoftLab, активно
использующая данную технологию в своих оригинальных системах видеографики.
Из полученных от данной фирмы материалов следует, что степень компрессии
без потерь качества и математически точном воспроизведении оригинального
изображения, на среднестатическом "живом" видео колеблется в интервале
от 1,5 до 2,5. При использовании сжатия с потерей качества
этот интервал имеет значение от 2,5 до 6.
Экспорт/импорт графики
Первоначально союз компьютера и видео использовался только для
покадрового ввода в компьютер видеоинформации и покадрового вывода
обработанных изображений и компьютерной графики. Поэтому для большинства
специалистов эта черта систем компьютерного видеомонтажа имеет большое
значение. Действительно, очень удобно, если система умеет переводить
оцифрованное видео в последовательность файлов TIFF, TGA, РIСТ или
еще в какой-нибудь стандартный для данного компьютера тип графических
файлов. Это позволяет обрабатывать полученные кадры каким-либо специализированным
графическим редактором или программой создания специальных эффектов
и фильтрации. Например, если желательно сделать оцифрованный видеоклип
похожим на нарисованный карандашом, достаточно получить из "живого"
видео последовательность кадров в виде файлов TARGA и обработать
их в редакторе Picture Man фильтром Hand Drawing - карандашный набросок,
а затем экспортировать полученную последовательность кадров в систему
компьютерного монтажа в виде файла, содержащего видео.
Slow/Fast и Reverse motion
К сожалению сторонников традиционного видеомонтажа, только малая
часть профессиональных видеомагнитофонов может выполнять замедленное
или ускоренное воспроизведение видеозаписи с вещательным качеством
получаемого видеосигнала. Еще меньшая часть может воспроизводить
видео в обратном направлении. При использовании систем компьютерного
видеомонтажа эти функции могут быть введены в систему достаточно
легко. К сожалению, лишь немногие системы реализуют эти функции.
А как приятно бывает показать в рекламном ролике замедленное падение
чашки или ускоренное движение человека задом наперед...
Разрешение кадра по размеру и цвету. Количество кадров/полей.
Характеристики выборки
Как известно, качество компьютерного изображения зависит от пространственного
разрешения вводимого/выводимого видеосигнала. Ниже приведена таблица
соответствия разрешения видеоизображения и качества видеосигнала.
| Качество (формат) |
NTSC |
PAL |
| VHS |
256x240 |
320x288 |
| S-VHS |
360x243 |
400x288 |
| U-matic |
360x486* |
400x576* |
| Betacam SP |
500x486* |
550x576* |
| CCIR 601 |
720x486* |
720x576* |
| Компьютерная графика |
640x486* |
768x576* |
звездочкой (*) помечены значения разрешающей способности
при использовании разных полей в кадре.
Помимо собственно пространственного разрешения видеоизображения,
существует еще цветовое разрешение. Оно показывает максимальное
количество цветов, из которого выбирается цвет конкретного элемента
(pixel). В компьютерной графике цветовое разрешение характеризуется
8 бит на элемент означает, что на экране одновременно
может отображаться не более 256 различных цветов;
16 бит на элемент дает возможность одновременного
отображения 65536 цветов;
и, наконец, 24 бита на элемент расширяет диапазон
возможных цветов до 16,7 миллионов.
Из исследований по физиологии человеческого зрения известно, что
человек может различать всего около 5500 различных оттенков. В то
же время человеческий глаз способен различать около 700 различных
оттенков синего цвета. Отсюда можно сделать вывод, что для "естественной
цветопередачи" необходимо, чтобы каждому элементу можно было присвоить
цвет из палитры 5500 цветов и при этом достигалась достаточно тонкая
градация по отдельным составляющим цвета. В принципе для этих целей
подходит кодирование как 24, так и 16 бит на элемент. Но из-за сложности
выбора палитры (и необходимой неодинаковости разрешения по компонентам
цвета) вариант 16 бит используется значительно реже. Системы вещательного
качества обрабатывают видеоинформацию в формате 25/50 и 30/60 кадров/полей
для PAL и NTSC соответственно. В некоторых системах изображение
кодируется только кадрами, без использования полей - в кадре используются
два поля с одинаковым содержанием. Это позволяет сохранять в два
раза больше видео, чем в аналогичных системах, использующих различные
поля. Такие системы классифицируют как 25/25 и 30/30. К сожалению,
эти системы имеют в два раза меньшую разрешающую способность по
вертикали и гораздо хуже передают движение. Кроме этого, из-за физиологии
зрения такие системы создают недостаточно сильную иллюзию непрерывности
движения, и часть зрителей наблюдает эффект "стробирования" изображения,
особенно при использовании систем телевидения PAL/SECAM (25/25).
В силу особенностей реализации систем цветного телевидения для
характеристики полноты оцифровки исходного видеоматериала используют
так называемую систему выборок. Например, 4:4:4 обозначает, что
на 4 выборки по яркости приходятся по 4 выборки цветоразностных
сигналов. Из полученной информации каждый элемент может иметь свои
уникальные значения по красному, зеленому и голубому цветам. На
самом деле из-за специфичности кодирования цвета в системах цветного
телевидения выборка 4:4:4 является избыточной, т.к. на аналоговом
уровне информация передается как выборка 4:2:2 - это соответствует
в два раза большей разрешающей способности по яркости по сравнению
с разрешением по цветовым составляющим видеоизображения. Кроме этого,
иногда применяется выборка 4:1:1 На сегодняшний день такая выборка
не обеспечивает достаточного качества.
Системы телевидения, поддерживаемые системой монтажа
Система компьютерного монтажа приобретается для обработки видеоматериала,
предназначенного для одной или нескольких стран. При этом необходимо,
чтобы система поддерживала стандарты телевидения, используемые в
этих странах.
Например, в общем-то неплохая система VideoCube на настоящий момент
выпускается только в системе NTSC и поэтому вряд ли может использоваться
для работы в России (система в стандарте PAL объявлена к выпуску).
Система AVID Media Composer выпускается в обоих вариантах. А станции
на основе Тагда 2000 являются мультисистемными и позволяют обрабатывать
как PAL, так и NTSC.
Из-за ряда принципиальных технических сложностей при комбинировании
видеосигналов системы SECAM и при построении кодеков, а также относительно
малого распространения на Западе, эта система практически не поддерживается
в качестве выходного формата ни одним из известных производителей
(хотя поддерживается в качестве входного формата системой VideoMachine).
Для создания видеоматериалов стандарта SECAM приходится использовать
кодер, входящий в состав видеомагнитофона Betacam.
Видеоэффекты
Современный видеомонтаж невозможно представить без различных видеоэффектов.
Для того, чтобы достаточно быстро прикинуть возможности конкретной
системы, необходимо задать несколько вопросов:
1. Осуществляет ли система представленные в ней эффекты в реальном
времени, или соответствующая обработка производится покадрово, за
большее время?
2. Имеет ли система трехмерные видеоэффекты (листание страницы,
вращающиеся кубики с "натянутым на грани" живым видео и т.п.)?
3. Какие двумерные эффекты имеет система? (Шторки, кадр в кадре
(picture-in-picture), микширование, и т.д.)?
4. Имеется ли возможность регулировки параметров встроенных видеоэффектов
и/или создания новых?
5. Какую обработку изображения позволяет производить данная система
(соляризация, постеризация, расфокусировка, повышение четкости...)?
6. Какие типы рир-проекции присутствуют в системе (цветовая, яркостная,
по внешнему силуэтному сигналу)?
7. Общее количество видеоэффектов, поставляемых с системой?
Для оценки ответов на эти вопросы существует простой принцип: чем
больше "Да", и чем более широкие возможности, тем лучше. Вопросы
расположены в порядке убывания значимости.
Возможности перекодировки изображения
Если система компьютерного монтажа является мультисистемной, то
большим плюсом для нее является наличие возможности транскодирования
из системы телевидения 625 строк/50 полей в 525/60 и обратно (то
есть преобразования разверток и/или преобразования разрешающей способности
по кадру).
Время создания видеоролика от момента изменения EDL (EDL - edit
decision list - монтажный лист)
Собственно по этому параметру системы компьютерного монтажа делятся
на "честные" системы нелинейного монтажа и псевдонелинейные. Первые
готовы выдавать смонтированный фильм практически сразу после внесения
последних изменений во внутренний EDL, вторые позволяют в любой
момент времени внести любые изменения в смонтированный материал,
но после этого следует занимающая значительное время фаза "Make"
- пересчета и перезаписи видеоролика. Понятно, что иметь систему
с мгновенной реакцией на любые изменения хорошо, а в некоторых случаях
просто необходимо (например, для создания передач "новостей"), но,
как правило, такие системы в 1,5-2 раза дороже псевдонелинейных
систем. Кроме относительной дешевизны, решающим фактором для покупки
систем "Make" может служить то, что для художественной работы менее
важно время, затраченное на создание конечного продукта - важнее
качество и возможности манипуляций и сложной обработки исходного
видеоматериала.
Компьютерная платформа, на которой работает система
На каком типе компьютеров основывается конкретная система? Существует
два подхода при конструировании таких систем. В первом используется
стандартный персональный компьютер общего назначения: IBM PC/AT
совместимый, Macintosh, Commodore Amiga или Silicon Graphics. В
другом - создатели системы используют свой собственный специализированный
компьютер (например, Quantel). Понятно, что первый подход в большинстве
случаев предпочтителен, так как позволяет стандартными средствами
расширять такую систему, использовать встроенный компьютер не только
для видеомонтажа, но и для других задач: создания трехмерной и классической
анимации, обработки звука и т.д., применяя распространенное программное
обеспечение. Однако специализированные системы, как правило, обладают
большим быстродействием и лучшим качеством обработки, обусловленным
именно узконаправленной архитектурой. Не случайно многие компании-производители
в настоящее время стараются аппаратно реализовать цифровые эффекты
в системах нелинейного монтажа.
Совместимость со стандартным программным интерфейсом
При использовании стандартного персонального компьютера общего
назначения важно, поддерживает ли монтажная программа стандартный
программный интерфейс (GUI - common user interface)? Приведем простейший
(нереальный) пример: на IBM PC-совместимых машинах в среде Windows
при нажатии на клавишу Del происходит уничтожение выбранного (текущего)
объекта. Предположим, что в какой-то монтажной программе под Windows,
нажатие на клавишу Del дублирует выбранный объект. Легко можно представить
мучения человека, имеющего опыт работы в Windows, начавшего работать
в такой системе и наоборот. Именно для этого и существует CUI -
common user interface. Если программа соответствует CUI, то человек
с опытом работы с другими программами с поддержкой CUI достаточно
быстро может научиться работать в такой системе.
Video IN/OUT - система подключения видеообору-довання. Система
управления видеомагнитофонами
Какие типы видеооборудования позволяет подключить система и в каком
количестве? Понятно, что если система продается как "обладающая
качеством Betacam SP", и при этом имеет только композитные входы/выходы,
то на такой системе технически невозможно оцифровать и вывести видеосигнал
с соответствующим качеством. Хорошие системы, как правило, имеют
все три возможных варианта входных и выходных разъемов: компонентный
(RGB); S-VHS и композитный - это делает систему более универсальной,
а значит и более работоспособной.
Для действительно высококачественной системы компьютерного видеомонтажа
является обязательным наличие средств управления внешними видеомагнитофонами.
Это позволяет вводить в компьютер исходный видеоматериал с точностью
до кадра (с соответствующим видеомагнитофоном), создавать стандартный
EDL и, в случае необходимости, достаточно быстро и точно переоцифровать
необходимый исходный видеоматериал с требуемым качеством.
Возможность работы в черновом/чистовом (off-line/on-line) режиме
Представьте себе, что у вас имеется на видеокассетах 9 часов исходного
видеоматериала, из которого вам нужно сделать одночасовую программу.
К сожалению, ваша система обладает способностью хранить только 1,5
часа видеоматериала с качеством Betacam SP (достаточно частая ситуация).
В этом случае очень пригодится возможность системы работать в off-line
режиме - вы оцифровываете исходный видеоматериал с заведомо низким
качеством (например, VHS). Это позволяет вам втиснуть на диск все
необходимое, затем смонтировать программу со всем нужным оформлением.
После этого компьютер, основываясь на монтажном листе программы,
оцифрует с высоким качеством только необходимую часть исходных видеоматериалов
- требуется лишь менять исходные кассеты по команде компьютера,
и потом, уже без участия человека смонтирует всю передачу с максимально
возможным качеством. Правда при такой работе очень важна культура
производства, ведь очень часто на одной кассете бывает несколько
одинаковых значений кода, или монтажер забудет внести в монтажный
лист номер кассеты... Но это тема другой статьи.
Звуковые возможности
Видеомонтаж подразумевает не только монтаж изображения, но и монтаж
звука. Минимальные возможности системы в данном случае должны быть
следующими, прямые склейки и автоматическое микширование исходного
звука. В более сложных системах существуют дополнительные возможности:
multilayering, эквалайзеры, фильтры, шумоподавители, специальные
временные обработки - сжатие/растяжение звука. Обычно такая изощренная
работа со звуком реализуется в специализированных звуковых монтажных
системах типа AVID, Sonic Solution и т.д.
(Продолжение следует)