Системи шумозаглушення. Частина 1

модуляція шуму

Поняття «модуляції шуму» є фундаментальним при розгляді питань обробки аудіосигналу в цілому і систем шумозаглушення зокрема. Тому почати розповідь варто з розбору саме цієї теми.

Модуляція шуму досліджується починаючи з середини XX століття. Інтерес до цього явища виник після того, як були зроблені перші серйозні спроби створити систему шумозаглушення.

Елементарна система шумозаглушення

І грамплатівка на 78 оборотів в хвилину з поганим ставленням «сигнал / шум», і найбільш високоякісні аудіосистеми виробляють шум, який не залежить від сигналу. Але коли рівень шуму в результаті зовнішнього впливу починає змінюватися в межах однієї фонограми, з'являється модуляція шуму.

Це явище простіше зрозуміти, представивши собі магнітофон, який здійснює запис на магнітній стрічці і має регулювання рівня запису і рівня відтворення.

При записи на подібний апарат рівень вхідного сигналу налаштовують таким чином, щоб під час найбільш гучних фрагментів фонограми вимірювач рівня перебував «у червоній зоні». Під час відтворення рівень гучності встановлюють так, щоб ці ж найбільш гучні фрагменти програвалися з оптимальною гучністю. В результаті, під час звучання гучних частин записи шум плівки, навіть коли він чути, не заважає сприйняттю музику. Зате під час звучання найбільш тихих пасажів він стає добре помітним і в якийсь момент може повністю перекрити музику. Справа в тому, що рівень шуму все ще залишається постійним протягом всього фонограми.

Компресія ...

Щоб уникнути ситуації, коли на тлі шуму тиха музика майже не чути, слід підняти рівень запису. Однак просто зафіксувати його в такому положенні не можна, так як при цьому будь-який голосний музичний фрагмент викличе занадто сильний стрибок гучності і, отже, значні спотворення сигналу. Звичайно, під час відтворення можна постійно підвищувати рівень запису на тихих фрагментах і зменшувати на гучних. Але це призведе до того, що динамічний діапазон музичного твору буде сильно стиснутий. Іншими словами, різниця між тихими і гучними фрагментами буде мінімальною, а це в більшості випадків суперечить задумом композитора і виконавця.

... і експандуванні

І все ж припустимо, що запис на магнітній стрічці компрессированного. Чи можна в цьому випадку відновити первісний динамічний діапазон шляхом його розширення під час відтворення? Щоб зробити це, потрібно лише зменшити рівень гучності на тихих фрагментах записи (до відповідного задумам композитора і виконавця) і потім підняти його при відтворенні голосних пасажів. При цьому зниження рівня гучності на тихих фрагментах створить ефект зниження шумів від магнітної стрічки (адже тихі фрагменти були записані при підвищеному рівні запису). У той же час при відтворенні голосних музичних фрагментів шум як і раніше не буде заважати прослуховуванню - він буде погано чути на тлі гучної музики.

Таким чином, якщо виконати послідовно описані операції компрессирования і експандуванні сигналу (тобто постійно проводити регулювання рівня під час запису і відтворення), вийде груба ручна система шумозаглушення. Фактично, вона усуває шум під час звучання тихих фрагментів твору і залишає вихідний рівень шуму, коли звучать гучні пасажі.

Електронний пристрій, який здатний проводити таку роботу, є найбільш простою системою шумозаглушення. Його називають широкосмуговим компандером (компресором / експандером). Схеми роботи такого пристрою під час запису і відтворення гучних і тихих уривків фонограми відповідно показані на малюнках 1 і 2.

Мал. 1. Робота широкосмугового компандер на гучних сигналах
Мал. 2. Робота широкосмугового компандер на тихих сигналах

Широкосмуговий компандер має одну важливу особливість: при його застосуванні рівень шуму починає залежати від вхідного сигналу. Використання цієї системи шумозаглушення призводить до того, що рівень шуму залишається відносно високим під час звучання гучних фрагментів (хоча при цьому він значно тихіше, ніж корисний сигнал) і знижується при відтворенні тихих частин записи. Саме це явище і називають модуляцією шуму.

Про шумі природному і рукотворному

Важливо розуміти, що модуляції шуму не відбувається в природі. Наприклад, шум водоспаду постійний. Людина незабаром звикає до присутності звуку вируючої води і зауважує його тільки в разі, коли він значно змінюється або взагалі пропадає. Іншими словами, ми чутливі до змін в тих випадках, коли їх не очікуємо. (Є теорія, що така особливість людського слуху сформувалася внаслідок еволюційного розвитку - в підсвідомості зафіксовано, що раптові зміни навколишніх звуків можуть провіщати небезпека).

Якою б не була причина цього явища, але шум із змінним рівнем при прослуховуванні аудіозаписи більше помітний і сильніше дратує, ніж шум постійний. Будь-які чутні зміни в присутньому шумі, навіть зовсім незначні, моментально сприймаються людським вухом як щось чужорідне.

В цьому якраз і полягає основний недолік елементарного широкосмугового компандер. Коли початковий рівень шуму (постійного для всієї фонограми) великий і з'являється необхідність його знизити, застосування широкосмугового компандер неодмінно тягне за собою модуляцію шуму, яка, в свою чергу, неприємна для слуху.

Якщо обмежитися тільки компандер, заснованими на простому управлінні рівнем записи і гучністю при відтворенні, вирішення цієї проблеми знайти не вдасться, так як всі подібні пристрої народжують яку було чути модуляцію шуму. Однак існують і інші конструкції систем шумозаглушення, які не викликають це неприємне явище.

Ідеальна система шумозаглушення

Отже, якщо шум чути без використання широкосмугового компандер, то після його включення може з'явитися модуляція шуму. При цьому на «щільних» фонограмах (наприклад, рок-музика або звучання симфонічного оркестру) дана система працює цілком ефективно, і модуляція шуму буде майже не помітна. Однак при відтворенні менш насичених музичних фрагментів (наприклад, запис кларнета або фортепіано) модуляція шуму стане явною і перешкодить сприйняттю музики. Причина в тому, що «щільні» записи мають більш широкий спектр, в той час як сольні партії інструментів звучать в обмеженому діапазоні.

маскування

Щоб краще зрозуміти особливості роботи широкосмугового компандер і, отже, зробити висновок про те, якою має бути ідеальна система шумозаглушення, розглянемо таке явище, як маскування.

Мал. 3. Поріг чутності: а) без сигналу,
б) з гучним сигналом на частоті 500 Гц

Червона лінія на малюнку 3 показує рівень звукового тиску, при якому людині чути відповідні частоти. Іншими словами, це - поріг чутності. Звуки, рівень яких вище цієї кривої, слух сприймає, нижче - немає. Чітко видно, що поріг різний для різних частот. На частоті 4 кГц люди можуть вловити набагато більш тихий звук, ніж на частоті 50 Гц або 15 кГц. На 25 кГц межа взагалі за межами графіка, тобто не важливо, наскільки голосно звучатиме сигнал на цій частоті - людина все одно його не почує.

Тепер розглянемо ту ж кордон, але після того, як з'явився відносно гучний сигнал на частоті 500 Гц. Нова межа чутності зображена на малюнку 3 у вигляді синьої лінії. Видно, що на частотах, сусідніх з вказаною, межа піднялася дуже сильно, і в міру віддалення від 500 Гц поріг чутності змінюється все менше і менше. Нарешті, на віддалених частотах він взагалі залишився колишнім - зміна рівня сигналу на частоті 500 Гц на ці області спектра не вплинуло.

Припустимо, спочатку рівень шуму був вище порога чутності (тобто людина могла чітко його чути). Тоді після посилення сигналу на частоті 500 Гц шум на сусідніх частотах виявляється поза порога чутності, він пропадає. У таких випадках кажуть, що шум маскувати гучним сигналом. При цьому на віддалених від 500 Гц частотах шум, який було чути без гучного сигналу, буде чути і після його появи.

Яке відношення має маскування до шумозаглушення

Отже, маскування залежить не тільки від присутності гучних сигналів, але і від того, на якій частоті з'являються ці сигнали. Тобто, щоб уникнути появи модуляції шуму, система шумозаглушення повинна бути чутлива не тільки до рівня, але і до частоту побічних дій сигналів. Саме тому широкосмуговий компандер (який реагує тільки на рівень сигналу) ефективно працює лише при відтворенні щільних фонограм. Адже в них рівень сигналу підвищується відразу у всьому спектрі, внаслідок чого, поріг чутності змінюється також по всьому діапазону, і застосування компандер досить, щоб ліквідувати шум.

Але при відтворенні сольних інструментальних партій ситуація буде зовсім іншою. Такі записи містять щодо гучні звуки, зосереджені у вузькій смузі спектра. Це робить криву маскування схожою на лінію б на малюнку 3. Пристрій при цьому працює, як при відтворенні щільною фонограми (тобто піднімає рівень сигналу в усьому спектрі), і, отже, в деяких частинах діапазону шум не тільки не маскується, але навіть навпаки - посилюється.

Що повинна робити ідеальна система шумозаглушення?

Отже, щоб ефективно ліквідувати шум (без появи ефекту модуляції), ідеальна система повинна забезпечити шумозаглушення на всіх частотах, де немає гучних сигналів і, отже, не відбувається маскування. Рівень шуму може рости тільки на тих частотах, на яких він залишається під порогом маскування.

Мал. 4. Підйом в кодере: а) без сигналу,
б) з сигналом на частоті 500 Гц
Спад в декодере: а) без сигналу, б) з сигналом на частоті 500 ГЦ
Мал. 5. Спад в декодере: а) без сигналу,
б) з сигналом на частоті 500 ГЦ

При відсутності сигналу під час запису ідеальна система шумозаглушення буде працювати з фіксованим посиленням вхідного сигналу і відповідним зниженням рівня під час відтворення. Завдяки цьому у вихідному сигналі шум буде відсутній. Коли звук буде посилюватися на певній частоті, зниження його рівня при записі відбудеться також на цій частоті і на сусідніх з нею (рисунок 4). Відповідно, під час відтворення рівень сигналу буде зменшений в потрібній області частотного діапазону. Це створить ефект придушення шуму в певній частині спектра, де не відбувається маскування, а на інших частотах сигнал залишиться без зміни (малюнок 5). В результаті, шум буде усунутий без появи ефекту модуляції.

В американській компанії Dolby Laboratories (яка є відомим розробником систем шумозаглушення) такий алгоритм роботи системи називають «принципом найменшого втручання».

Знову про природні шуми

Виникає питання: чи не буде маскування шуму під час присутності гучного сигналу однієї з форм модуляції шуму? Так буде. Але так як цей процес природний, він не дратує слух людини. Дійсно, адже коли ви стоїте недалеко від водоспаду і хтось кричить під час вашої вухо, голос маскує шум води в деяких частинах спектра, але ви не сприймаєте це як виключення водоспаду і не відчуваєте дискомфорту.

Проблема короткочасних викидів

Основне завдання компресора полягає в тому, щоб посилювати тихі сигнали більше, ніж гучні. Це означає, що, якщо рівень сигналу раптово підвищився, компресор повинен відреагувати і зменшити посилення. Однак через те, що він заздалегідь «не знає», коли саме сигнал стане голосніше, звичайний компресор допустить викид сигналу. Тобто перш, ніж прилад відреагує на стрибок, і рівень буде знижений, протягом дуже короткого часу сигнал буде занадто гучним - відбудеться викид.

Мал. 6. «Викид» компресора

Найпростіший випадок такого викиду проілюстрований на малюнку 6. У верхній частині зображення (малюнок 6а) показана ситуація, коли рівень синусоїдального вхідного сигналу раптово підвищився на 10 дБ, тобто приблизно в 3 рази відносно нормального рівня (на малюнку схематично зображено тільки огинає сигналу). Припустимо, що компресор при цьому повинен ліквідувати цей стрибок, знизивши рівень до 6 дБ (на 4 дБ). На малюнку 6б зображена схема сигналу, який в ідеалі повинен вийти після роботи компресора. Однак насправді компресор природно запізнюється, в результаті чого і відбувається короткочасний викид в 4 дБ по модулю (малюнок 6в).

Очевидно, викиди на високорівневих сигналах можуть привести до перевантажень і помітних спотворень звуку. Їх тривалість залежить від того, скільки часу потрібно компресора, щоб зреагувати (тобто від так званого часу атаки).

Компресор як амплітудний модулятор

На перший погляд, проблема викидів сигналу може бути вирішена шляхом зменшення часу атаки до мінімуму, коли викиди стануть непомітними. Щоб зрозуміти, чи буде така схема працювати, необхідно розглянути компресор як амплітудний модулятор.

Коли одинична синусоїда якимось чином піддається впливу (наприклад, змінюється її амплітуда), вона перестає бути одиничною. З'являється спектрально більш складний сигнал, що містить кілька частот. Чим сильніше вплив на синусоїду, тим більше з'являється додаткових частот - бічних смуг. Крім того, чим вище швидкість обурення, тим далі від початкової частоти будуть розташовуватися ці бічні смуги. Це - принцип амплітудної модуляції (АМ) в радіомовленні, і він цілком прийнятний до роботи компресора. Компрессирование підвищує рівень вхідного сигналу, еквівалентного несучої частоті в АМ-мовленні. Через те, що амплітуда кожного частотного компонента змінюється, до сигналу додаються бічні смуги.

Мал. 7. Велике час атаки

На малюнку 7 схематично показаний результат впливу керуючої напруги на вигляд сигналу після зміни його рівня (спектр сигналу керуючого напруги показаний в нижній лівій частині малюнка). Якщо вхідний сигнал має частоту 10 кГц, вихідний сигнал крім тієї ж частоти 10 кГц буде містити бічні смуги, які мають таку ж форму, як і спектр керуючого напруги. Кожен другий компонент вхідного сигналу буде мати додані таким же чином бічні смуги. Якщо необхідно провести зменшення рівня до 6 дБ, сума енергій сигналів високочастотних бічних смуг буде дорівнює приблизно 25% від рівня енергії всього вихідного сигналу. Такий же буде і сума енергій додаткових низькочастотних коливань. Таким чином, змінюючи рівень сигналу, компресор вносить 50% модуляційних перекручувань.

Зміна часу атаки

Вище було згадано, що чим більше швидкість обурення сигналу (і, відповідно, менше час атаки компресора), тим далі від початкової частоти будуть розташовуватися бічні смуги. Якщо час атаки занадто довго - наприклад десятки мілісекунд - сигнал управління посиленням складатиметься тільки з низьких частот. Таким чином, кожна пара бічних смуг близька до відповідної компоненті вхідний частоти (малюнок 7). Згадаймо, що низькорівневі небажані складові, близько розташовані до потрібних компонентів, маскуються. Виходить, що через повільну атаки компресора відбувається помітний викид, але робота самого приладу при цьому майже не чути.

Мал. 8. Малий час атаки

Якщо атака швидка, сигнал контролю рівня містить високі частоти (малюнок 8). Бічні смуги поширюються на велику відстань від частот вхідного сигналу і цілком можуть бути не маскувати. Дійсно, через те, що короткочасні спотворення відбуваються під час зменшення рівня і складаються з компонентів частот, широко розподілених по всьому спектру, до сигналу при його зміні за рівнем зазвичай додається чутний клацання. Таким чином, при малому часу атаки викид майже не помітний, але виразно чути робота компресора (з'являються добре помітні клацання).

Звідси, для звичайного компресора / лімітера вибір часу атаки є компромісом між спотвореннями, викликаними викидами, і клацанням, що виникають від роботи самого приладу.

Можна припустити, що з додатковою системою шумозаглушення клацання, викликані стрімкою атакою, можна усунути - все перешкоди від першої системи буде придушувати друга. Однак для реалізації цієї ідеї буде потрібно експандер, який може генерувати однакові бічні смуги зі строго протилежному полярністю. Клацання будуть усунені тільки в тому випадку, якщо в експандер надійдуть саме ті бічні смуги, які згенерує компресор. На жаль, в реальності середовище завжди вносить спотворення в сигнал (наприклад, зміна смуги пропускання і / або фазові зрушення). В результаті, експандер отримує трохи змінений сигнал і, отже, буде генерувати «неправильні» бічні смуги, які не зможуть компенсувати бічні смуги, що утворилися при компрессирования. Таким чином, використовуючи дві системи шумозаглушення, вирішити проблему описаних вище спотворень не вийде.

Однозначної відповіді немає

Спотворень можна уникнути шляхом комбінації декількох прийомів.

Перше. Викиди низько- і среднеуровневих сигналів не перенавантажуватимуть жоден з компонентів тракту, що йдуть після компресора. Іншими словами, такі викиди цілком припустимі в сигналі, а значить, можна встановлювати тривалий час атаки (десятки мілісекунд) і, відповідно, уникнути модуляційних перекручувань.

Однак для високорівневих сигналів такий метод не підійде. Тут необхідно встановлювати час атаки, точно відповідає характеру сигналу. Тому друга міра, спрямована на усунення спотворень, полягає в тому, щоб мінімізувати викиди на високорівневих сигналах. Згадаймо, що викиди виникають тільки коли компресор зменшує рівень звуку. Це означає, що для гучних сигналів рівень посилення компресора можна зафіксувати і взагалі уникнути викидів.

По-третє, можна обмежити швидкість атаки тільки для тих випадків, коли результуючі модуляційні спотворення будуть маскуватися. Для цього потрібно вибрати час атаки, відповідне спектру сигналу.

Перемикання посилення при Zero-crossing

Перемикання рівня при переході через нуль (Zero-crossing) не запобігає повністю появи клацань при малому часу атаки. Таке переключення дозволило б усунути можливу відсічення кривої. Однак ця відсічення може все ще бути присутнім при спаді. Що виходять при цьому перешкода буде меншою за рівнем, але як і раніше широкосмугового.

Це явище легко виявити за допомогою генератора імпульсів, який дозволяє змінювати точку перемикання. Якщо послухати імпульс на частоті, наприклад, 100 Гц, він зупиняється і починається з ясно чутного клацання, навіть якщо початок і кінець імпульсу знаходяться в точці Zero-crossing. Клацання може бути усунутий тільки шляхом розтягування початку і кінця імпульсу на кілька періодів коливань (тобто імітацією повільної атаки).

Журнал "Звукорежисер"