Системы шумоподавления. Часть 1

Модуляция шума

Понятие «модуляции шума» является фундаментальным при рассмотрении вопросов обработки аудиосигнала в целом и систем шумоподавления в частности. Поэтому начать рассказ стоит с разбора именно этой темы.

Модуляция шума исследуется начиная с середины XX века. Интерес к этому явлению возник после того, как были сделаны первые серьезные попытки создать систему шумоподавления.

Элементарная система шумоподавления

И грампластинка на 78 оборотов в минуту с плохим отношением «сигнал/шум», и наиболее высококачественные аудиосистемы производят шум, который не зависит от сигнала. Но когда уровень шума в результате внешнего воздействия начинает меняться в пределах одной фонограммы, появляется модуляция шума.

Это явление проще понять, представив себе магнитофон, осуществляющий запись на магнитной ленте и имеющий регулировки уровня записи и уровня воспроизведения.

При записи на подобный аппарат уровень входного сигнала настраивают таким образом, чтобы во время наиболее громких фрагментов фонограммы измеритель уровня находился «в красной зоне». Во время воспроизведения уровень громкости устанавливают так, чтобы эти же наиболее громкие фрагменты проигрывались с оптимальной громкостью. В результате, во время звучания громких частей записи шум пленки, даже когда он слышен, не мешает восприятию музыку. Зато во время звучания наиболее тихих пассажей он становится хорошо заметным и в какой-то момент может полностью перекрыть музыку. Дело в том, что уровень шума все еще остается постоянным на протяжении всей фонограммы.

Компрессия…

Чтобы избежать ситуации, когда на фоне шума тихая музыка почти не слышна, следует поднять уровень записи. Однако просто зафиксировать его в таком положении нельзя, так как при этом любой громкий музыкальный фрагмент вызовет слишком сильный скачок громкости и, следовательно, значительные искажения сигнала. Конечно, во время воспроизведения можно постоянно повышать уровень записи на тихих фрагментах и уменьшать на громких. Но это приведет к тому, что динамический диапазон музыкального произведения будет сильно сжат. Другими словами, разница между тихими и громкими фрагментами будет минимальной, а это в большинстве случаев противоречит замыслу композитора и исполнителя.

…и экспандирование

И все же предположим, что запись на магнитной ленте компрессирована. Можно ли в этом случае восстановить первоначальный динамический диапазон путем его расширения во время воспроизведения? Чтобы сделать это, нужно лишь уменьшить уровень громкости на тихих фрагментах записи (до соответствующего замыслам композитора и исполнителя) и затем поднять его при воспроизведении громких пассажей. При этом понижение уровня громкости на тихих фрагментах создаст эффект снижения шумов от магнитной ленты (ведь тихие фрагменты были записаны при повышенном уровне записи). В то же время при воспроизведении громких музыкальных фрагментов шум по-прежнему не будет мешать прослушиванию — он будет плохо слышен на фоне громкой музыки.

Таким образом, если проделать последовательно описанные операции компрессирования и экспандирования сигнала (то есть постоянно проводить регулировку уровня во время записи и воспроизведения), получится грубая ручная система шумоподавления. Фактически, она устраняет шум во время звучания тихих фрагментов произведения и оставляет исходный уровень шума, когда звучат громкие пассажи.

Электронное устройство, которое способно проводить такую работу, является наиболее простой системой шумоподавления. Его называют широкополосным компандером (компрессором/экспандером). Схемы работы такого устройства при записи и воспроизведении громких и тихих отрывков фонограммы соответственно показаны на рисунках 1 и 2.

Рис. 1. Работа широкополосного компандера на громких сигналах
Рис. 2. Работа широкополосного компандера на тихих сигналах

Широкополосный компандер имеет одну важную особенность: при его применении уровень шума начинает зависеть от входного сигнала. Использование этой системы шумоподавления приводит к тому, что уровень шума остается относительно высоким во время звучания громких фрагментов (хотя при этом он значительно тише, чем полезный сигнал) и снижается при воспроизведении тихих частей записи. Именно это явление и называют модуляцией шума.

О шуме природном и рукотворном

Важно понимать, что модуляции шума не происходит в природе. К примеру, шум водопада постоянен. Человек вскоре привыкает к присутствию звука бурлящей воды и замечает его только в случае, когда он значительно изменяется или вообще пропадает. Другими словами, мы чувствительны к переменам в тех случаях, когда их не ожидаем. (Есть теория, что такая особенность человеческого слуха сформировалась вследствие эволюционного развития — в подсознании зафиксировано, что внезапные изменения окружающих звуков могут предвещать опасность).

Какой бы ни была причина этого явления, но шум с изменяющимся уровнем при прослушивании аудиозаписи больше заметен и сильнее раздражает, чем шум постоянный. Любые слышимые изменения в присутствующем шуме, даже совсем незначительные, моментально воспринимаются человеческим ухом как что-то чужеродное.

В этом как раз и заключается основной недостаток элементарного широкополосного компандера. Когда изначальный уровень шума (постоянного для всей фонограммы) велик и появляется необходимость его понизить, применение широкополосного компандера непременно влечет за собой модуляцию шума, которая, в свою очередь, неприятна для слуха.

Если ограничиться только компандерами, основанными на простом управлении уровнем записи и громкостью при воспроизведении, решения этой проблемы найти не удастся, так как все подобные устройства рождают слышимую модуляцию шума. Однако существуют и другие конструкции систем шумоподавления, которые не вызывают это неприятное явление.

Идеальная система шумоподавления

Итак, если шум слышен без использования широкополосного компандера, то после его включения может появиться модуляция шума. При этом на «плотных» фонограммах (например, рок-музыка или звучание симфонического оркестра) данная система работает вполне эффективно, и модуляция шума будет почти не заметна. Однако при воспроизведении менее насыщенных музыкальных фрагментов (к примеру, запись кларнета или фортепиано) модуляция шума станет явной и помешает восприятию музыки. Причина в том, что «плотные» записи имеют более широкий спектр, в то время как сольные партии инструментов звучат в ограниченном диапазоне.

Маскирование

Чтобы лучше понять особенности работы широкополосного компандера и, следовательно, сделать вывод о том, какой должна быть идеальная система шумоподавления, рассмотрим такое явление, как маскирование.

Рис. 3. Порог слышимости: а) без сигнала,
б) с громким сигналом на частоте 500 Гц

Красная линия на рисунке 3 показывает уровень звукового давления, при котором человеку слышны соответствующие частоты. Иными словами, это — порог слышимости. Звуки, уровень которых выше этой кривой, слух воспринимает, ниже — нет. Отчетливо видно, что порог разный для разных частот. На частоте 4 кГц люди могут уловить гораздо более тихий звук, чем на частоте 50 Гц или 15 кГц. На 25 кГц граница вообще за пределами графика, то есть не важно, насколько громко будет звучать сигнал на этой частоте — человек все равно его не услышит.

Теперь рассмотрим ту же границу, но после того, как появился относительно громкий сигнал на частоте 500 Гц. Новая граница слышимости изображена на рисунке 3 в виде синей линии. Видно, что на частотах, соседних с указанной, граница поднялась очень сильно, и по мере удаления от 500 Гц порог слышимости изменяется все меньше и меньше. Наконец, на отдаленных частотах он вообще остался прежним — изменение уровня сигнала на частоте 500 Гц на эти области спектра не повлияло.

Предположим, изначально уровень шума был выше порога слышимости (то есть человек мог отчетливо его слышать). Тогда после усиления сигнала на частоте 500 Гц шум на соседних частотах оказывается вне порога слышимости, он пропадает. В таких случаях говорят, что шум маскирован громким сигналом. При этом на удаленных от 500 Гц частотах шум, который был слышен без громкого сигнала, будет слышен и после его появления.

Какое отношение имеет маскирование к шумоподавлению

Итак, маскирование зависит не только от присутствия громких сигналов, но и от того, на какой частоте появляются эти сигналы. То есть, чтобы избежать появления модуляции шума, система шумоподавления должна быть чувствительна не только к уровню, но и к частоте возникающих сигналов. Именно поэтому широкополосный компандер (который реагирует только на уровень сигнала) эффективно работает лишь при воспроизведении плотных фонограмм. Ведь в них уровень сигнала повышается сразу во всем спектре, вследствие чего, порог слышимости изменяется также по всему диапазону, и применения компандера достаточно, чтобы ликвидировать шум.

Но при воспроизведении сольных инструментальных партий ситуация будет совсем иной. Такие записи содержат относительно громкие звуки, сосредоточенные в узкой полосе спектра. Это делает кривую маскирования похожей на линию б на рисунке 3. Устройство при этом работает, как при воспроизведении плотной фонограммы (то есть поднимает уровень сигнала во всем спектре), и, следовательно, в некоторых частях диапазона шум не только не маскируется, но даже наоборот — усиливается.

Что должна делать идеальная система шумоподавления?

Итак, чтобы эффективно ликвидировать шум (без появления эффекта модуляции), идеальная система должна обеспечить шумоподавление на всех частотах, где нет громких сигналов и, следовательно, не происходит маскирования. Уровень шума может расти только на тех частотах, на которых он остается под порогом маскирования.

Рис. 4. Подъем в кодере: а) без сигнала,
б) с сигналом на частоте 500 Гц
Спад в декодере: а) без сигнала, б) с сигналом на частоте 500 ГЦ
Рис. 5. Спад в декодере: а) без сигнала,
б) с сигналом на частоте 500 ГЦ

При отсутствии сигнала во время записи идеальная система шумоподавления будет работать с фиксированным усилением входного сигнала и соответствующим понижением уровня во время воспроизведения. Благодаря этому в выходном сигнале шум будет отсутствовать. Когда звук будет усиливаться на определенной частоте, понижение его уровня при записи произойдет также на этой частоте и на соседних с ней (рисунок 4). Соответственно, во время воспроизведения уровень сигнала будет уменьшен в нужной области частотного диапазона. Это создаст эффект подавления шума в определенной части спектра, где не происходит маскирования, а на остальных частотах сигнал останется без изменения (рисунок 5). В результате, шум будет устранен без появления эффекта модуляции.

В американской компании Dolby Laboratories (которая является известным разработчиком систем шумоподавления) такой алгоритм работы системы называют «принципом наименьшего вмешательства».

Снова о природных шумах

Возникает вопрос: не будет ли маскирование шума во время присутствия громкого сигнала одной из форм модуляции шума? Да, будет. Но так как этот процесс естественный, он не раздражает слух человека. Действительно, ведь когда вы стоите недалеко от водопада и кто-то кричит в ваше ухо, голос маскирует шум воды в некоторых частях спектра, но вы не воспринимаете это как выключение водопада и не испытываете дискомфорта.

Проблема кратковременных выбросов

Основная задача компрессора состоит в том, чтобы усиливать тихие сигналы больше, чем громкие. Это означает, что, если уровень сигнала внезапно повысился, компрессор должен отреагировать и уменьшить усиление. Однако из-за того, что он заранее «не знает», когда именно сигнал станет громче, обычный компрессор допустит выброс сигнала. То есть прежде, чем прибор отреагирует на скачок, и уровень будет понижен, в течение очень короткого времени сигнал будет слишком громким — произойдет выброс.

Рис. 6. «Выброс» компрессора

Простейший случай такого выброса проиллюстрирован на рисунке 6. В верхней части изображения (рисунок 6а) показана ситуация, когда уровень синусоидального входного сигнала внезапно повысился на 10 дБ, то есть примерно в 3 раза относительно нормального уровня (на рисунке схематично изображена только огибающая сигнала). Предположим, что компрессор при этом должен ликвидировать этот скачок, понизив уровень до 6 дБ (на 4 дБ). На рисунке 6б изображена схема сигнала, который в идеале должен получиться после работы компрессора. Однако в действительности компрессор естественно запаздывает, в результате чего и происходит кратковременный выброс в 4 дБ по модулю (рисунок 6в).

Очевидно, выбросы на высокоуровневых сигналах могут привести к перегрузкам и заметным искажениям звука. Их длительность зависит от того, сколько времени нужно компрессору, чтобы среагировать (то есть от так называемого времени атаки).

Компрессор как амплитудный модулятор

На первый взгляд, проблема выбросов сигнала может быть решена путем уменьшения времени атаки до минимума, когда выбросы станут незаметными. Чтобы понять, будет ли такая схема работать, необходимо рассмотреть компрессор как амплитудный модулятор.

Когда единичная синусоида каким-то образом подвергается воздействию (например, изменяется ее амплитуда), она перестает быть единичной. Появляется спектрально более сложный сигнал, содержащий несколько частот. Чем сильнее воздействие на синусоиду, тем больше появляется дополнительных частот — боковых полос. Кроме того, чем выше скорость возмущения, тем дальше от изначальной частоты будут располагаться эти боковые полосы. Это — принцип амплитудной модуляции (АМ) в радиовещании, и он полностью применим к работе компрессора. Компрессирование повышает уровень входного сигнала, эквивалентного несущей частоте в АМ-вещании. Из-за того, что амплитуда каждого частотного компонента изменяется, к сигналу добавляются боковые полосы.

Рис. 7. Большое время атаки

На рисунке 7 схематически показан результат влияния управляющего напряжения на вид сигнала после изменения его уровня (спектр сигнала управляющего напряжения показан в нижней левой части рисунка). Если входной сигнал имеет частоту 10 кГц, выходной сигнал помимо той же частоты 10 кГц будет содержать боковые полосы, имеющие такую же форму, как и спектр управляющего напряжения. Каждый другой компонент входного сигнала будет иметь добавленные таким же образом боковые полосы. Если необходимо произвести уменьшение уровня до 6 дБ, сумма энергий сигналов высокочастотных боковых полос будет равна примерно 25% от уровня энергии всего выходного сигнала. Такой же будет и сумма энергий дополнительных низкочастотных колебаний. Таким образом, изменяя уровень сигнала, компрессор вносит 50% модуляционных искажений.

Изменение времени атаки

Выше было упомянуто, что чем больше скорость возмущения сигнала (и, соответственно, меньше время атаки компрессора), тем дальше от начальной частоты будут располагаться боковые полосы. Если время атаки слишком продолжительно — например десятки миллисекунд — сигнал управления усилением будет состоять только из низких частот. Таким образом, каждая пара боковых полос близка к соответствующей компоненте входной частоты (рисунок 7). Вспомним, что низкоуровневые нежелательные составляющие, близко расположенные к нужным компонентам, маскируются. Получается, что из-за медленной атаки компрессора происходит заметный выброс, но работа самого прибора при этом почти не слышна.

Рис. 8. Малое время атаки

Если атака быстрая, сигнал контроля уровня содержит высокие частоты (рисунок 8). Боковые полосы распространяются на большое расстояние от частот входного сигнала и вполне могут быть не маскированы. Действительно, из-за того, что кратковременные искажения происходят во время уменьшения уровня и состоят из компонентов частот, широко распределенных по всему спектру, к сигналу при его изменении по уровню обычно добавляется слышимый щелчок. Таким образом, при малом времени атаки выброс почти не заметен, но отчетливо слышна работа компрессора (появляются хорошо заметные щелчки).

Отсюда, для обычного компрессора/лимитера выбор времени атаки является компромиссом между искажениями, вызванными выбросами, и щелчками, возникающими от работы самого прибора.

Можно предположить, что с дополнительной системой шумоподавления щелчки, вызванные стремительной атакой, можно устранить — все помехи от первой системы будет подавлять вторая. Однако для реализации этой идеи потребуется экспандер, который может генерировать одинаковые боковые полосы со строго противоположной полярностью. Щелчки будут устранены только в том случае, если в экспандер поступят именно те боковые полосы, которые сгенерирует компрессор. К сожалению, в реальности среда всегда вносит искажения в сигнал (например, изменение полосы пропускания и/или фазовые сдвиги). В результате, экспандер получает немного измененный сигнал и, следовательно, будет генерировать «неправильные» боковые полосы, которые не смогут компенсировать боковые полосы, образовавшиеся при компрессировании. Таким образом, используя две системы шумоподавления, решить проблему описанных выше искажений не получится.

Единственного решения нет

Искажений можно избежать путем комбинации нескольких приемов.

Первое. Выбросы низко- и среднеуровневых сигналов не перегрузят ни один из компонентов тракта, идущих после компрессора. Иными словами, такие выбросы вполне допустимы в сигнале, а значит, можно устанавливать продолжительное время атаки (десятки миллисекунд) и, соответственно, избежать модуляционных искажений.

Однако для высокоуровневых сигналов такой метод не подойдет. Здесь необходимо устанавливать время атаки, точно соответствующее характеру сигнала. Поэтому вторая мера, направленная на устранение искажений, состоит в том, чтобы минимизировать выбросы на высокоуровневых сигналах. Вспомним, что выбросы возникают только когда компрессор уменьшает уровень звука. Это означает, что для громких сигналов уровень усиления компрессора можно зафиксировать и вообще избежать выбросов.

В-третьих, можно ограничить скорость атаки только для тех случаев, когда результирующие модуляционные искажения будут маскированы. Для этого нужно выбрать время атаки, соответствующее спектру сигнала.

Переключение усиления при Zero-crossing

Переключение уровня при переходе через ноль (Zero-crossing) не предотвращает полностью появления щелчков при малом времени атаки. Такое переключение позволило бы устранить возможную отсечку кривой. Однако эта отсечка может все еще присутствовать при спаде. Получающаяся при этом помеха будет меньшей по уровню, но по-прежнему широкополосной.

Это явление легко обнаружить с помощью генератора импульсов, который позволяет менять точку переключения. Если послушать импульс на частоте, к примеру, 100 Гц, он останавливается и начинается с ясно слышимого щелчка, даже если начало и конец импульса находятся в точке Zero-crossing. Щелчок может быть устранен только путем растягивания начала и конца импульса на несколько периодов колебаний (то есть имитированием медленной атаки).

Журнал “Звукорежиссер”