Звуковое приложение к материалам по захвату видео

Автор последних материалов по захвату видео Maxe Erte the Mad попросил меня написать небольшую часть, касающуюся аудио. Ну что ж, приступим, причем это не так уж сложно.

Четыре варианта


В принципе, получить аудиотрек к видео можно всевозможными путями: при оцифровке с аналогового источника, при снятии цифрового сигнала с цифрового источника, при отделении звука от видео в специализированных файлах, в том числе и с современных носителей цифровых камер, при записи аудио, воспроизводящегося в рамках видео на вашем компьютере, то есть "захвата на лету". У каждого из вариантов могут быть свои нюансы, но если смотреть на все в общем, то хотелось бы выделить один существенный момент, имеющий место для всех случаев: в бюджетных видеостудиях очень редко можно встретить дорогие и качественные звуковые платы и интерфейсы, а чаще всего вместо них вообще используется кодек АС'97. Но такой вариант говорит в первую очередь о двух очевидных проблемах с качеством: DC Offcet, то есть отклонение постоянной составляющей тока от нулевого положения, что дает массу неудобств и, к тому же, предполагает некоторые проблемы в последующем с воспроизводящей техникой, и большие шумы в рамках самих устройств. Например, в некоторых кодеках АС'97 уровень шумов может находиться и на -50 — -40 дБ. Это очень плохо. Как это проверить? Просто возьмите программу записи, посмотрите на индикаторы входного уровня, и увидите уровень шума, причем для множества таких кодеков и дешевых плат можно наблюдать и то, что эти уровни различны для каждого из каналов. Это совсем плохо. Потом запустите саму запись и рассмотрите записанную "тишину" на экране волны, а именно есть ли ее смещение относительно центральной оси. Если оно видно невооруженным глазом, вас можно поздравить и с присутствием значительного отклонения DC Offset. Что касается программ…

Audacity 1.3.0 (beta)

В принципе, вам даже не нужно ни за что платить. Есть достаточно продуктивная и мощная freeware-программа Audacity 1.3.0 (beta), которая скачивается с сайта audacity.sourceforge.net, и ее дистрибутив весит всего 2,5 Мб. Интерфейс выбираете русскоязычный. На данный момент мы рассмотрим случай, когда вы используете трек, полученный путем записи на линейный, цифровой вход, или снятый на лету с аудиовыхода вашей карты. Если вы получили этот трек из программы оцифровки видео, то с ним ничего не нужно делать — экспортируете его в WAV и потом открываете в Audacity. При этом не нужно использовать промежуточное кодирование в lossy-форматы типа MP3, OGG и т.п., поскольку теряется большая часть полезного сигнала, а с учетом того, что у вас может быть и дешевый вариант звуковой платы или кодека, с присутствием шумов и т.п., им сопутствующих, картина окажется плачевной. К тому же, вы можете просто записать аудиотрек отдельным образом прямо в Audacity, только потом его вам придется синхронизировать с видео в вашей программе, что, в принципе, нетрудно.

Практика + теория

Ну, а теперь мы рассмотрим все действия поэтапно. Практика:
. При записи аудиотрека очень важным параметром является настройка оптимального уровня. Если он будет низким, то полезный сигнал во многом смешивается с шумами звукового тракта, что не есть хорошо, если завышенным, то срезаются пики, что ведет к дополнительным искажениям и безвозвратному пропаданию части полезного сигнала. То есть пики должны быть приближены к максимуму.
. Открываем Audacity. Создаем новый проект с частотой дискретизации и разрядностью согласно техническим требованиям (чаще всего используется 16 бит/48 КГц). Это если вы записывали аудиотрек в другой программе.
. Главное меню: Проект —> Импортировать звуковой файл… Выбираете нужный файл, и появляется дорожка с ним.
. Рассматриваем звуковую волну при большом масштабе, глядим, есть ли видимое отклонение DC Offset. Если оно значительно, а пики расположены на максимуме, понижаем уровень путем Главное меню —> Эффекты —> Усиление сигнала...
. Делаем двойной клик на изображении волны — в результате весь файл закрашивается. Выбираем Главное меню —> Эффекты —> Нормализация... Ставим активным только один пункт: Удалить любое отклонение от оси (центр в ненулевой точке по вертикали). Нормализация до -3 дБ не нужна. . Эффекты —> Усиление сигнала. Новая пиковая амплитуда — -0,0 или -0,2 дБ.

Следующим действием может стать один из двух вариантов:
Первый, и самый простой:
. Эффекты —> Выравниватель... Данный модуль состоит из двух, а именно максимайзера и порогового удалителя шума. В первом случае вы выбираете вариант динамического сжатия от легкого до очень сильного, а в параметре Noise Threshold указываете порог шума.
Второй, более продвинутый:
. Выделяете некий небольшой фрагмент, ассоциирующийся с тишиной, для того, чтобы программа создала образец шума. После этого открываете модуль Эффекты —> Удаление шума… и нажимаете там кнопку Создать модель шума. Модуль автоматически закроется. После этого вы выделяете весь файл целиком (двойной клик мышью на звуковой волне) и снова заходите в Эффекты —> Удаление шума… Там вы увидите регулятор от Ничего до Больше. Выбираете подходящий вариант и удаляете шум.
. Эффекты —> Эквалайзер… В принципе, этот модуль важен, если вам нужно что-то подправить в частотной области — например, добавить или убавить какие-либо частоты. Плюс к этому, если вы записывали речь, то там тоже могут присутствовать некоторые артефакты. Взрывные "б" или "п" убираются путем среза на частоте 90 Гц, свистящие и шипящие регулируются в диапазоне 2-5 КГц. В данном эквалайзере уже есть множество подобранных вариантов настройки, и на самом деле имеет смысл посмотреть, как все будет звучать с их применением — может быть, вам что-то и подойдет из этого арсенала. Произведя такую обработку, обратите внимание на то, не появились ли срезы на пиках. Если да, то отмените последнее действие, уменьшите уровень исходного файла, а затем проведите обработку заново.
. Для финальной динамической обработки может удобно подойти тот же Выравниватель из меню эффектов, а также лимитеры оттуда же.
Все, файл готов — его можно возвращать к видеотреку либо синхронизировать с ним.

Дополнительные задачи

Прямо в Audacity, поскольку эта бесплатная программа является мультитреком, вы можете накладывать голосовой перевод, например, если речь идет о фильмах. Для этих целей просто запишите еще один файл с голосом и сведите его с иходным. Причем тут нужно сказать о том, что для того, чтобы он органично и понятно, т.е. отчетливо, слушался, на основном треке необходимо сделать частотную яму в диапазоне от 800 Гц до примерно 3 КГц. Если же вы хотите профессионального качества, то основной трек нужно размножить на два идущих параллельно, один из которых останется без изменений, а второй — с этой "ямой". Первый полноценно звучит в момент отсутствия голоса переводчика или актера, второй — в момент его присутствия. Все балансы между треками производятся за счет огибающих. Еще Audacity интересна тем, что в режиме снятия сигнала с аудиовыхода (то есть в момент воспроизведения вашего компьютера) она может оперировать аудиоканалами в количестве до 16. То есть тот же 5.1 она может снять без проблем.
А какие еще могут быть варианты?

Audacity интересна тем, что она легка в освоении, мощна по возможностям, при этом не требует от компьютера каких-либо особенных ресурсов и бесплатна. Но все-таки это freeware-продукт. Среди платных вариантов я бы выделил в первую очередь Steinberg WaveLab — это профессиональный звуковой редактор №1. При этом у Sony есть прекрасная линейка серии Vegas (аудио/видеомультитрек), о которой почему-то мало говорят именно видеоспециалисты, но для домашних и профессиональных нужд это очень удобное решение, а если еще в дополнение к ней взять Sony DVD Architect, то вы можете создавать DVD-диски со своими меню управления и внутренним наполнением. Что касается алгоритмов обработки, то есть очень дорогие плагины производства Waves Ltd., где можно найти абсолютно все, а их "максимайзеры" на данный момент являются лучшими в мире.

Кристофер, christopher@tut.by


Компьютерная газета. Статья была опубликована в номере 28 за 2006 год в рубрике мультимедиа

©1997-2024 Компьютерная газета