Сферы нелинейного видеомонтажа
Георгий Бугрименко
Постоянные читатели журнала, должно быть, помнят азартную полемику на его страницах по поводу системы нелинейного видеомонтажа TurboCube фирмы ImMIX (см. №№ 1,4 за 1996г.). С тех пор много воды утекло: число систем фирмы ImMIX, установленных в странах СНГ, увеличилось в два раза, а сама эта фирма перестала существовать. Теперь ImMIX®, как впрочем, и широко известный Abekas® — это зарегистрированные марки новой фирмы Scitex Digital Video (SDV). А на смену системам VideoCube и TurboCube пришло новое семейство станций цифрового нелинейного видеомонтажа Sphere™, вобравшее в себя достижения двух вышеназванных фирм. Сам факт такого объединения способен вызвать у читателя интерес к его результатам. Надеемся, что, прочитав эту статью, Вы убедитесь, что такой интерес оправдан.

Краткая характеристика предыдущей продукции ImMIX

Системы VideoCube и TurboCube представляли собой полностью укомплектованные "под ключ" рабочие места для нелинейного видеомонтажа, к которым требовалось лишь добавить видеомагнитофон "по вкусу". Эти системы базировались на компьютерах Apple Macintosh, однако компьютер, по сути дела, играл лишь роль интерфейса между пользователем и остальным оборудованием. Поэтому особо высоких требований к его производительности не предъявлялось. Операции по монтажу и эффекты выполнялись дополнительным блоком собственной разработки — так называемым медиапроцессором. Высокое качество результата на выходе при работе в реальном времени со скоростью 50 полей в секунду обеспечивалось аппаратно реализованным алгоритмом компрессии Discreet Wavelet Transform. В отличие от Motion JPEG этот алгоритм использовал переменный коэффициент компрессии в пределах кадра (от 5 до 30), что позволяло при тех же объемах занимаемой дисковой памяти уменьшить артефакты, связанные с компрессией. Основной отличительной особенностью систем фирмы ImMIX было то, что называлось "Real Time — All the Time", т. е. выполнение абсолютно всех операций в реальном времени, без обсчета. Поясним это на примере, допустим, создания цифрового видеоэффекта (DVE): Вы перемещаете в соответствующем диалоговом окне на экране компьютерного монитора квадратик, обозначающий клип верхнего слоя, и тут же оцениваете результат на экране видеомонитора в полном разрешении. Далее Вы выбираете, допустим, цвет и ширину окантовки и видите измененный результат на видеомониторе. Результат любого действия готов к выводу на видеомагнитофон, как только Вы сами, а не компьютер, закончили это действие. Именно так работают на традиционных многопостовых монтажных линейках, но далеко не все выполняется "на лету" в системах нелинейного видеомонтажа и тем более, практически ничего не выполняется так в системах компьютерной анимации и спецэффектов.

TurboCube отличался от VideoCube дополнительной платой 3D эффектов: поворотов вокруг трех осей с перспективными искажениями и заворотов страниц.

Из всего перечисленного в новых решениях фирмы SDV сохранилось только одно, но самое важное - принцип "Все Время - Реальное Время".

Основные отличия Сфер от Кубов

Технические решения и номенклатура моделей Сфер рассчитаны в первую очередь на работу не отдельно взятого видеомонтажера, а целой студии. Другими словами, произошел переход от автономных решений к сетевым. Расширились возможности выбора: наряду с решениями "под ключ", появились подключаемые модули, наряду с универсальными - специализированные.

Улучшено качество выходного материала, как по видео, так и по звуку и, что не менее важно, добавлена возможность управления качеством. Произошло достаточно впечатляющее расширение возможностей по оформлению монтируемых программ разнообразными эффектами, и все эти эффекты создаются в реальном времени.

Далее остановимся на том, как все это реализовано.

Работа в сети

В своей политике SDV исходит из того, что использование компьютерной техники при подготовке телепередач и другой видеопродукции расширяется и будет расширяться. Компьютерная сеть представляет собой удобную среду, позволяющую коллективу разработчиков одновременно готовить различные составляющие (видеоряд, оформление с использованием компьютерной графики и анимации, фонограмму, титры, эффекты), а технология нелинейного монтажа позволяет включать их в монтируемую передачу сразу в момент их готовности вне зависимости от их местоположения в будущей передаче.

На рисунке показана схема подобной сетевой видеостудии. Технически такое решение обеспечивается тем, что в блоках медиапроцессоров станций Sphere находятся сетевые платы: стандартно для 10Base-T и 100Base-TX, опционально — для любой другой (более скоростной) сети. Таким образом, медиапроцессор соединен не только со "своим" компьютером и дисковым массивом, но и со всеми остальными устройствами внешней памяти в сети. Это и позволяет нескольким участникам разработки одновременно использовать один и тот же дисковый массив. Для каждого отдельного участника все данные (видео, звук и т.д.), находящиеся на всех дисках, равнодоступны. Заметим, что в сети 100Base-TX одновременно может перемещаться два потока оцифрованного видео в реальном времени, в сети ATM, например, три видеопотока, а в Fibre Channel — уже до восьми.

Варианты станций

 
Таблица 1. Состав систем линии Sphere
  MS DS VS SS
Компьютер * * PowerMac 7200 24/500 CPU PowerMac 7200 24/1,2G CPU
Монитор * * 15'' 20''
Клавиатура, мышь * * + +
Медиапроцессор - + + +
Дисковый массив * * StorageDock 440 StorageDock 440
Панель управления * + + +
Видеомонитор * * 14'' 20''
Звуковые колонки * * + +
Плата Targa 2000RTX + - - -
Плата DveousFX * - * *
SphereOUS (software) + + + +

Фирмой SDV предлагаются четыре модели: MicroSphere™, DigiSphere™, VideoSphere™ и StrataSphere™. Состав аппаратуры, поставляемой с каждой из моделей, приведен в Таблице 1. Знак "]" в таблице означает, что устройство может быть поставлено дополнительльно. Текст, набранный курсивом, означает, что устройство при поставке может быть заменено по желанию заказчика на более мощное.

Прокомментируем особенности каждой модели.

MicroSphere - это сборное решение, предполагающее, что Вы используете:
 достаточно мощный компьютер фирмы Apple (как минимум PowerMac 9500 150МГц);
 поставляемую SDV плату Truevision Targa 2000RTX™;
 периферийные устройства "по вкусу";
 при желании — дополнительные устройства от SDV: панель управления, дисковые массивы и платы DveousFX™ и AdvancedFX™.

Самой фирмой SDV MicroSphere позиционируется как первая настольная станция нелинейного видеомонтажа в реальном времени. Возможности работы в сети определяются платой, установленной в компьютере, т.е. 10Base-T или 100Base-TX.

DigiSphere - это, пожалуй, единственная из Сфер, которая не имеет особого смысла в качестве автономного рабочего места. Зато в сети, обслуживающей рабочую группу, DigiSphere вместе с единственным, необходимым для такого решения видеомагнитофоном выполняет роль установки видеоввода/вывода коллективного пользования. Таким образом, на все рабочие места в принципе достаточно одного видеомагнитофона! Что, впрочем, не мешает при необходимости подключать видеомагнитофоны и к другим станциям монтажа. Собственные монтажные возможности у DigiSphere также имеются, однако они ограничены по сравнению с другими моделями Сфер.

VideoSphere - решение "под ключ" полностью в традициях ImMIX, по своим возможностям и по цене находящееся между MicroSphere и StrataSphere. Может рассматриваться и как полностью готовая автономная станция видеомонтажа и как рабочее место в сети. Обратим внимание на два момента, касающиеся также DigiSphere и StrataSphere:
 к основному компьютеру не предъявляется высоких требований, поскольку все операции по вводу, выводу, монтажу и т.д. выполняются медиапроцессором;
 скорость обмена данными в сети не зависит от платы, установленной в компьютере, а зависит от того, какая сеть используется для соединения медиапроцессоров (ATM, Fibre Channel и др.).

StrataSphere — самая мощная из систем как по стандартно поставляемой внешней памяти, так и по функциональным возможностям. Из Таблицы 2 Вы можете увидеть функции уникальные для StrataSphere:
 работа с альфа-каналом в реальном времени;
 возможность многослойного видеомонтажа с числом слоев до 50.

Оба этих свойства, в сочетании с функциями платы Dveous дают такие возможности для оформления передачи, которые были ранее невозможны для систем такого класса.

Любой компьютер с установленными на нем программами компьютерной графики, анимации, монтажа и эффектов, подключенный к общей сети рабочей группы, также может рассматриваться как рабочее место. А пользователь этого компьютера является полноправным участником общих работ по созданию передачи. Это обусловлено тем, что внутренним форматом для видео и звуковых данных в сети Сфер является стандартный QuickTime. Следовательно, оцифрованное видео и результаты компьютерной анимации хранятся, используются и обрабатываются абсолютно одинаковыми приемами и методами без перекодировок. Следовательно, все, что невозможно сделать с помощью Сфер, может быть выполнено с помощью разнообразного программного обеспечения, правда уже не в реальном времени. Попутно отметим, что ради идеи полной совместимости с любым программным обеспечением фирма SDV пожертвовала компрессией Wavelet и перешла на Motion JPEG.

Качество на выходе

Одно из основных отличий Сфер от предшествующих Кубов — возможность выбора степени компрессии, т.е. управления качеством оцифровки и, следовательно, качеством результата. Минимальная компрессия 1:3, что приближается к качеству Digital Betacam. Максимальная компрессия 1:25. Заметим, что возможность выбирать степень компрессии, сочетается с возможностью сохранения результата монтажа в виде "схемы" или внутреннего листа монтажных решений. Имея такую схему, видеомонтажер может удалить с дисков материал, введенный с высоким уровнем компрессии, и повторно поставить на оцифровку исходные видеопленки с минимальной компрессией. Фрагменты, вошедшие в смонтированную программу, будут выбраны автоматически, а все результаты действий монтажера с материалом низкого качества будут воспроизведены в высоком качестве. Таким образом, любая Сфера может использоваться для чернового и последующего чистового монтажа.

Цифровое представление видео с альфа-каналом - 4:2:2:4.

Звук в Сферах оцифровывается без компрессии с частотой 48 кГц, 16 бит.

Технические подробности

Возможности работы с внешними источниками и приемниками информации иллюстрируются на схеме, где по сути дела перечислены разъемы на задней панели медиапроцессора. Отметим, что возможности работы с цифровым видеоформатом предоставляются опционально.

Устройство, обозначенное в Таблице 1 как StorageDock 440, представляет собой внешний дисковый SCSI накопитель на 16 Гбайт в оригинальном "фирменном" корпусе. На StorageDock 440 может храниться от 35 минут до почти пяти часов видео и два часа стереофонического звука. Максимальный объем хранимого видео на одной рабочей станции при подключении 15 устройств 440 — около 70 часов, стереозвука — 30 часов.

Панель управления содержит jog-shuttle, клавиши управления, кнопки установки меток начала и конца фрагментов, регуляторы громкости: общий и по каждому каналу. Панель разработана с учетом преемственности навыков с традиционным аналоговым монтажным оборудованием и значительно ускоряет работу видеомонтажера.

Плата DveousFX™ — пожалуй, самый впечатляющий шаг вперед Сфер по сравнению с Кубами. Здесь в наибольшей степени воплотились результаты объединения ImMIX и Abekas. Эта плата создана из интегральных схем собственной разработки на основе широкоизвестного и, возможно, лучшего генератора цифровых эффектов Dveous™ . Пример его популярности, чаще всего цитируемый — закупка корпорацией NBC 25-и экземпляров Dveous для установки во всех своих подразделениях, освещавших летние Олимпийские игры 1996 года. Физически DveousFX для VideoSphere и StrataSphere представляет собой плату, устанавливаемую в медиапроцессор. Вариант для MicroSphere, c большим успехом продемонстрированный в январе на MacWorld, ожидается в продаже с марта и выглядит следующим образом: основная плата DveousFX устанавливается в компьютер и соединяется плоским кабелем с Targa 2000RTX, точнее с ее дочерней платой Greenstone. На основную плату может быть установлена дополнительная AdvancedFX. Эффекты, производимые с помощью DveousFX и AdvancedFX, перечисляются в Таблице 2 и комментируются ниже.

Функциональные возможности

Все модели Сфер, как и полагается нелинейным системам, выполняют в реальном времени удаления, перемещения, вставки и замены любых фрагментов монтируемой последовательности вплоть до отдельного кадра с визуальным поиском или по временному коду, а также операции "подрезки" (trim), точнее - перемещения начальной или конечной метки в уже вмонтированном фрагменте.

Работа со звуком включает такие операции, как частотная коррекция, регулировка реверберации, инверсия фаз. Управление уровнем громкости происходит "на лету", при этом система запоминает положения регуляторов, изменяемые в процессе проигрывания.

Титры могут вводиться из текстового файла или создаваться в самой системе. Генератор титров базируется на QuickDraw GX. Доступны все шрифты, установленные на компьютере, и все характеристики текста (шрифт, стиль, цвет и др.) регулируются для каждой буквы. Можно создавать титры типа "барабан", "бегущая строка", "телетайп". В титры может быть помещена любая картинка в формате PICT со своим альфа-каналом. Впрочем, все вышеперечисленное можно было сказать и про Кубы. Рассмотрим то новое, что появилось в Сферах.

Любые 2D цифровые эффекты перехода создаются в Сферах установкой в определенные моменты времени положения, углов поворота и размеров кадра для клипа. Система интерполирует заданные значения внутри временного интервала. При этом VideoSphere и StrataSphere формируют последовательность так называемых "ключей" (термин, хорошо знакомый тем, кто занимается компьютерной анимацией), т.е. отметок об изменениях того или иного параметра в "ключевых" кадрах. Последовательности "ключей" представляются в графической форме и могут редактироваться (перестановка, копирование, добавление, удаление "ключей"). Это во многих случаях значительно упрощает создание и настройку цифровых эффектов, как опять-таки известно компьютерным аниматорам. Методом "ключевых кадров" могут задаваться практически все регулируемые параметры, а не только DVE.

Если в качестве одного из слоев используются результаты компьютерной анимации, которые включают в себя данные об областях прозрачности в каждом кадре (альфа-канал), то в StrataSphere этот альфа-канал может учитываться. Возможность работы с альфа-каналом в реальном времени до сих пор не была доступна системам нелинейного монтажа, сопоставимым по цене с StrataSphere.
Таблица 2. Функциональные возможности систем линии Sphere
  MS DS VS SS
Количество слоев в монтажном окне:        
видео 2 1 2 до 51
звук 4 4 4 4
титры и графика 1 - 1 1
Эффекты в реальном времени
Эффекты перехода
Микшер, уход в "черное" + + + +
Шторки 20* - 50 50
Управляемые параметры DVE:
положение в пространстве * - + +
размеры * - + +
поворот (по трем осям) * - + +
перспективные сокращения при повороте * - + +
"размывка по краям" * - + +
ширина и цвет окантовки * - + +
3D DVE:
Завороты страниц * - + +
Другие трехмерные DVE 30** - + +
Операции цветокоррекции +**   + +
Эффекты стилизации
Blur * - + +
Mosaic * - + +
Solarize ** - + +
Posterize ** - + +
Источники света (типы) 3** - 3* 3*
Текстуры (установленные) 10** - 10* 10*
Анимация параметров эффектов   - + +
Определение областей прозрачности
Рир-проекция по яркости * - + +
Рир-проекция по цвету ** - + +
Использование альфа-канала - - - +
Падающая тень при рир-проекции (и альфа) * - * *
*   Имеется при использовании опции DveousFX
** Имеется при использовании опций DveousFX + AdvancedFX для MicroSphere

Как следует из Таблицы 2, StrataSphere позволяет работать с множеством видеослоев (до 50). При создании многослойных композиций работа в реальном времени возможна только с одной парой: фоновым слоем и любым другим слоем, в том числе слоем эффекта, каналом титров или альфа-каналом. Далее необходимо перейти к работе в реальном времени с другой парой слоев и т.д.

Все дальнейшее уже требует просчета. При работе с каждым новым слоем часто желательно увидеть, как выглядят другие слои в композиции, а не только фоновый. В этом случае любой кадр композиции может быть получен достаточно быстро (менее секунды на слой), что частично компенсирует невозможность работы с множеством слоев в реальном времени.

Следует подчеркнуть, что многослойная композиция с множеством эффектов просчитывается "за один проход", т.е. без потерь качества от последовательных пересчетов и тем более без многократной перезаписи.

Эффекты DveousFX оставляют далеко позади то, что принято называть 3D-эффектами при видеомонтаже. Они скорее напоминают эффекты, характерные для 3D-анимации: объемные формы, пространственные деформации, рельефные текстурированные поверхности, источники света, меняющие освещенность поверхностей и создающие блики, падающие тени, и все это создается и регулируется в реальном времени! Среди трехмерных деформаций (warp): "обертывание" видео на сферу, бочку или цилиндр, волны, линза, спираль, зигзаг, "бабочка", таяние, вспышка, "разрывание на клочки", взрыв, "вихрь" и многие другие.

В системе имеется десяток готовых текстур, которые зрительно воспринимаются как "выдавливание" узора на "поверхности" видеокадров. В следующей версии предполагается возможность использования видео в качестве текстуры, где степень "выпуклости" определяется градациями яркости. Для каждого видеослоя может быть добавлен источник света одного из трех типов с регулируемыми положением, цветом и яркостью.

Примем во внимание, что:
 трехмерные эффекты настраиваются параметрически;
 параметры могут меняться во времени (анимируются);
 суммарный эффект может складываться из одновременных деформаций, текстуры и источника света;
 при многослойном монтаже эффекты могут использоваться в каждом из слоев.

С учетом сказанного нетрудно представить себе, сколь разнообразным может быть оформление передач с помощью Сферы с DveousFX, в особенности StrataSphere, и в сочетании с использованием альфа-канала. В заключении хочется еще раз отметить, что все эффекты, даже те, что напоминают результаты компьютерной 3D-анимации, создаются в реальном времени.