1. СИГНАЛЫ И КАНАЛЫ ЗВУКОВОГО ВЕЩАНИЯ
1.1.Особенности организации системы звукового вещания в России
Радиовещание в нашей стране всегда рассматривалось, как средство централизованного идеологического воздействия. Поэтому
иныне существующая в России система вещания по-прежнему централизована и построена по радиально-узловой схеме: от центра – к региональным узлам, от которых затем сигнал передается на районные узлы с постепенным снижением требований к качеству передачи. Для повышения «живучести» системы узлы соединены между собой, а первая программа, которая используется для передачи сигналов оповещения, передается только по кабельным магистралям, что снижает возможность воздействия помех при внезапном надземном ядерном взрыве, с которого принято начинать боевые действия для выведения из строя систем связи противника.
Преимуществом такой системы является, в частности, простота оповещения населения о действиях в условиях чрезвычайных ситуаций. Однако централизованность организации вещания одновременно является и недостатком, поскольку позволяет прекратить передачу с помощью одного рубильника, что невозможно при децентрализованной системе вещания, принятой в большинстве стран. Появление независимых и коммерческих радиостанций пока незначительно изменило ситуацию, так как большинство из них не имеют своих передающих средств и арендуют их у государственных предприятий.
Программы вещания формируются в специальных производственных предприятиях – радиодомах. Структурная схема радиодома приведена на рис. 1.1. В состав радиодома входят главные редакции (ГР), которые определяют содержание передач, их планирование
изапись; отдел выпуска (ОВ), в котором из отдельных передач формируется программа; отдел контроля (ОК), где осуществляется контроль за техническим качеством и содержанием передач. С помощью вещательной системы (ВС) производится распределение программ по стране и доведение их до слушателя [8, 17, 43, 44].
Согласно ГОСТ 11515–91 [8], формирование и доведение программ до слушателей осуществляется с помощью специального комплекса технических средств, образующих электрический канал
6 |
Цифровая обработка сигналов в трактах звукового вещания |
Рис. 1.1. Структурная схема радиодома
звукового вещания (ЭКЗВ). По ЭКЗВ сигналы звукового вещания передаются с выхода микрофона до антенны радиовещательного передатчика или абонентской розетки тракта проводного вещания. Структурная схема канала вещания приведена на рис. 1.2.
Вещательный сигнал, сформированный в радиодоме (РД) с использованием аппаратно-студийных комплексов (АСК), трансляционной аппаратной (ТА), аппаратной записи (АЗ), с выхода центральной аппаратной (ЦА) радиодома подается на вход центральной ком- мутационно-распределительной аппаратной (ЦКРА), которая осуществляет распределение программ через соединительные линии (СЛ) на входы местных трактов вторичного распределения, состоящих из радиовещательных станций (РВС) и главного радиотрансляционного узла сети проводного вещания (ГРТУ).
Кроме того, с выхода ЦКРА сигнал может быть подан на тракты его первичного распределения по стране – центральную междугородную вещательную аппаратную (ЦМВА) или междугородную вещательную аппаратную (МВА), образующие междугородный канал звукового вещания (МКЗВ). Как правило, МКЗВ организуется на основе кабельных и радиорелейных линий. Для организации вещательных трактов используются и спутниковые каналы, включающие земные станции (ЗС) и искусственные спутники земли (ИСЗ). Путь сигнала заканчивается у слушателя, имеющего либо абонентское устройство (АУ), либо радиоприемник (Пр).
Из структурной схемы на рис. 1.2 следует, что ЭКЗВ состоит из трех трактов:
тракта формирования программ (ТФП) – от студийного мик-
рофона до выхода ЦА;
тракта первичного распределения (ТПРП) –- от выхода ЦА до выхода ЦКРА (или КРА);
тракта вторичного распределения (ТВРП) – от входа со-
единительной линии от ЦКРА (или КРА) до антенны передатчика или абонентской розетки проводного вещания.
1. Сигналы и каналы звукового вещания |
7 |
Рис. 1.2. Структурная схема канала звукового вещания
8 |
Цифровая обработка сигналов в трактах звукового вещания |
1.2.Звуковой вещательный сигнал: описание и основные свойства
Звуковым вещательным сигналом s(t) называют колебание, соответствующее речи, музыке или их сочетанию. Для исследователей было удобно считать ЗВС случайным процессом, характеризующие который акустические или электрические величины непрерывно изменяются во времени (рис. 1.3). Как случайный процесс, звуковой вещательный сигнал характеризуется законом распределения его мгновенных значений, заданным плотностью вероятности W(х) или функцией распределения F(х) [43, 44].
U 
t
Рис. 1.3. Осциллограмма звукового вещательного сигнала
Для получения стабильных распределений анализ проводят на достаточно продолжительных отрывках одинаковых по характеру программ. Минимальное время наблюдения Т0, дальнейшее увеличение которого не приводит к изменению распределения, называется
интервалом стационарности. Принято, что для речи Т0 = 2…3 мин,
а для музыки – от 20 мин до нескольких часов – в зависимости от характера звуковой программы.
На рис. 1.4 приведены типичные экспериментальные результаты, полученные для речевого (а) и музыкальных (б) ЗВС. Здесь по оси ординат отложено произведение W(х) , где – среднеквадратическое отклонение (СКО); по оси абсцисс – отношение его мгновенных значений х к . Характер кривых на рис. 1.4,б указывает на зависимость распределений от типа звучаний: область 1 – вокал, эстрадная и симфоническая музыка, область 2 – хор с оркестром, джазовая музыка.
Уровень ЗВС характеризует сигнал в определенный текущий момент и представляет собой выраженное в децибелах выпрямленное и усредненное за некоторый предшествующий промежуток времени напряжение вещательного сигнала, отнесенное к некоторой условной величине U0: N (t, ) = 20 lg u (t, ) / U0.
1. Сигналы и каналы звукового вещания |
9 |
Рис. 1.4. Распределение плотности вероятности мгновенных значений речевого (а) и музыкального (б) ЗВС во времени
Здесь U0 – среднеквадратическое значение сигнала, принятое за начало отсчета уровней; ему приписывается уровень 0 дБ. Международными рекомендациями установлены нулевые уровни:
электрические: для напряжения 0,775 В (напряжение на нагрузке 600 Ом, на которой выделяется мощность 1 мВт); для мощности 1 мВт;
акустические: для звукового давления 2 10–5 Па (это минимальное звуковое давление, соответствующее порогу слышимости
вобласти максимальной чувствительности уха 1…4 кГц); для интенсивности звука 10-12 Вт/м2.
График функции N(t, ) называется уровнеграммой сигнала s(t). Вид уровнеграммы (рис. 1.5) зависит от условий ее измерения, осо-
бенно от времени интеграции . На форму уровнеграммы влияют также вид детектирования (квадратичное, линейное или квазипиковое) и динамические характеристики измерительной цепи и измерительного механизма: время срабатывания и время восстановления (возврата).
Закон распределения уровней выражается плотностью W(N) или функцией вероятности F(N); он весьма стабилен (особенно для
больших ) и почти не зависит от характера звуковой программы на длительностях не менее интервала стационарности. Уровнеграммы для оценки состояния звукового тракта при передаче по нему ЗВС
измеряют при = 10…20 мс, а для оценки громкости выбирают около 200 мс. На рис. 1.6,а приведены три функции распределения уровней музыкальных программ (за 0 дБ принята медиана распреде-
10 |
Цифровая обработка сигналов в трактах звукового вещания |
Рис. 1.5. Пример уровнеграммы ЗВС
Рис. 1.6. Функции распределения уровней музыкальных программ (а) и речевого сигнала (б)
лений), а на рис. 1.6,б те же построения выполнены для речевого сигнала [44].
Удобными числовыми оценками распределений считаются квантили. Квантилем Ni (Fi) называется значение уровня Ni при заданном значении функции распределения Fi; случайная величина N с вероятностью Fi не превосходит своего квантиля Ni. Можно также
сказать, что уровень N (t, ) не превосходит величины Ni на протяжении доли (или процента) Fi времени наблюдения. Квантиль N (0,5), соответствующий значению F = 0,5, называется медианой распределения и характеризует наивероятнейшее значение уровня в данной звуковой программе.
Пределы изменения уровня определяют динамический диапазон Dс сигнала. При теоретическом определении динамического диапазо-
на сигнала вводят понятия квазимаксимального и квазиминимального
уровней:
1. Сигналы и каналы звукового вещания |
11 |
-вероятность превышения квазимаксимального значения доста-
точно мала (0,01…0,02);
-квазиминимального – достаточно велика и составляет
0,98…0,99.
Динамический диапазон определяется разностью квантилей:
-для речевого сигнала Dс.реч = N (0,99) – N (0,01),
-для музыкальных передач Dс.муз = N (0,98) – N (0,02).
Динамический диапазон натуральных звучаний, дБ:
Речь диктора ............................................................................. |
25…35 |
Разговорная речь ...................................................................... |
35…40 |
Эстрадная музыка .................................................................... |
35…40 |
Актерская речь (художественное чтение)................................ |
35…45 |
Малые ансамбли, хор ............................................................... |
45…55 |
Симфоническая музыка ........................................................... |
65…75 |
Разность между квазимаксимальным и усредненным за длительный промежуток времени уровнями называют пик-фактором: Пф = = Nкв.макс – Nср. Для музыкальных сигналов он может достигать 20…28 дБ, а для речи – в среднем 12 дБ. Для ЗВС результаты измерений уровней будут устойчивы, если время наблюдения достаточно велико и средняя мощность сигнала постоянна. Минимальное время усреднения, при котором средняя мощность не зависит от момента начала измерения, приблизительно равно интервалу стационарности.
Важной характеристикой ЗВС является его частотный диапазон. Сопоставляя его с полосой пропускания звукового тракта, судят о наличии или отсутствии частотных искажений выходного сигнала. За верхнюю и нижнюю границы спектра источника звука принимают частоту среза обрезного фильтра, при которой ограничение частотного диапазона замечает 75% слушателей. В табл. 1.1 приведены сведения о частотных диапазонах некоторых источников звука.
На рис. 1.7 – статистические кривые заметности ограничения полосы частот звукового тракта сверху и снизу для разговорной (кривая 1) и вокальной (2) речи.
На практике спектральные характеристики ЗВС чаще всего используются в виде его энергетического спектра, а именно – ус-
редненной на интервале времени спектральной плотности мощности S2 (среднего квадрата фильтрованного сигнала), отнесенной
к полосе пропускания фильтра F, Гц (В2 / Гц):
|
|
f |
|
f |
|
|
|
|
|
G(f0,t, ) |
2 0 |
|
2 |
|
S(jf,t, ) |
|
2 df. |
||
|
|
||||||||
|
|
|
|||||||
f f |
f |
||||||||
|
|
|
|
|
|
||||
|
0 |
|
2 |
|
|
|
|
||
12 |
Цифровая обработка сигналов в трактах звукового вещания |
|||
Т а б л и ц а 1.1. Частотные диапазоны некоторых источников звука |
||||
|
|
|
|
|
Источник звука |
Граничные частоты |
|
||
|
|
|
||
нижняя, Гц |
верхняя, кГц |
|
||
|
|
|
||
|
|
|
|
|
Мужской голос |
|
100 |
7 |
|
Женский голос |
|
200 |
9 |
|
Рояль |
|
100 |
5 |
|
Скрипка |
|
200 |
14 |
|
Шум шагов |
|
100 |
10 |
|
Аплодисменты |
|
150 |
15 |
|
Рис. 1.7. Статистические кривые заметности ограничения полосы частот звукового тракта сверху и снизу для разговорной (1) и вокальной (2) речи
Это не что иное, как средний (по полосе пропускания фильтра) квадрат модуля мгновенного амплитудного спектра во временном окне , то есть результат двух усреднений: по частоте – спектральным окном F и по времени – временным окном . У однородной звуковой программы при Т0 значение G не зависит от времени.
1. Сигналы и каналы звукового вещания |
13 |
Спектральная плотность мощности русской речи (рис. 1.8) характеризуется максимумом в окрестности частоты 400 Гц и спадом со скоростью приблизительно 9 дБ/окт на частотах выше указанной. На рисунке приведены усредненные данные для мужского и женского голосов. График получен при использовании гребенки полосовых фильтров.
Рис. 1.8. Спектральная плотность мощности русской речи
1.3. Основы восприятия звуковых сигналов
Проблемы восприятия информации по всем сенсорным каналам человека занимают умы многих поколений исследователей. Тот факт, что закономерности восприятия являются общими для всех сенсорных каналов, позволяет исследователям распространять результаты, полученные при изучении одного органа чувств (например, обоняние), на другие (например, зрение). Существенным является ограничение числа одновременно воспринимаемых стимулов по любому каналу восприятия – около 7 стимулов в секунду. Здесь под стимулами понимаются гармонические составляющие сигнала.
Основной теорией, используемой при объяснении закономерностей восприятия смысловой информативности ЗС, остается формантная теория, согласно которой положение локальных максимумов огибающей амплитудного спектра на шкале частот определяет распознаваемость отдельного звучания. Именно на основе этой теории построен ряд алгоритмов компактного представления (разд. 4).
К настоящему времени не создано модели работы слухового анализатора, которая включала бы все свойства слуха. На практике полезна следующая механическая аналогия. Покровная мембрана, раскачивание поперечно натянутых волокон которой вызывает возбуждение расположенных вдоль нее нервных окончаний, может быть представлена набором разновеликих маятников, слабо связанных между собой. При раскачивании одного из маятников под внешним воздействием приходят в движение и остальные, в меньшей степени тяжелые (низкочастотные), в большей – легкие (высокочастотные) (рис. 1.9).
14 |
Цифровая обработка сигналов в трактах звукового вещания |
Порог слышимости в тишине, представляющий собой минимальное осознаваемое возбуждение, показан жирной линией на рис. 1.10. Порог слышимости при наличии сигнала – пунктиром. Увеличение уровня интенсивности тона (сигнала) в конце концов приводит к появлению ощущения боли, наступает болевой порог. Между болевым порогом и порогом слышимости несколько сотен элементарных скачков ощущения, причем на низких и высоких частотах их значительно меньше, чем на средних. Дискретность восприятия слуха по частоте и амплитуде дает около 22 000 элементарных градаций во всей области слухового восприятия, ограниченных снизу порогом слышимости, сверху – болевым порогом и охватывающей диапазон частот 20…20000 Гц. Явление незаметности слабых звуковых сигналов на фоне близких по частоте сильных называется частотной маскировкой (см. рис.1.10).
Как и в других органах чувств, приращение ощущения связано с увеличением раздражения логарифмической зависимостью. Минимальное приращение раздражения, вызывающее изменение ощущения по любому каналу восприятия, составляет приблизительно 1 дБ, такова и разрешающая способность слухового анализатора по изменению уровня звука в среднем по всему диапазону звуковых частот (закон Вебера–Фехнера). Человек способен различить около 600 градаций частоты по абсолютной величине; высока чувствительность слухового анализатора и к изменению частоты: до 500 Гц
– 1,5 Гц, выше 500 – 1,5% от абсолютной величины частоты [2].
Рис. 1.9. К понятию модели слухового восприятия
