94 |
Цифровая обработка сигналов в трактах звукового вещания |
Увеличение (или уменьшение) частоты дискретизации достигается отбрасыванием (или добавлением) нулевых коэффициентов БПФ. При этом добавляются (или отбрасываются) частотные коэффициенты, расположенные в диапазоне частот выше 20 кГц и обладающие минимальной энергией, что существенно снижает искажения преобразования. С появлением алгоритмов вычисления БПФ не только на длительностях 2n преимуществом способа стала также существенно меньшая вычислительная сложность, так как для реализации его основы – БПФ – существуют готовое программное обеспечение и микропроцессорные платы.
3.7.Влияние цифрового тракта на качество передачи звуковых сигналов. Маскировка
Искажения 3ВС возникают не только при аналого-цифровом и цифро-аналоговом преобразованиях, но и при передаче по цифровым трактам. Это могут быть ошибки в отдельных символах или кодовых словах цифрового сигнала, фазовые дрожания цифрового сигнала, проскальзывания, т.е. выпадения (или вставки) части цифровых символов или кодовых слов. Все эти искажения, свойственные цифровой передаче, преобразуются на аналоговом выходе системы связи в искажения сигнала 3В, которые могут быть заметны на слух.
Цифровым системам передачи присущ пороговый эффект, т.е. резкое нарастание искажений, когда параметры цифрового тракта передачи выходят за допустимые пределы. В противном случае передача осуществляется практически без искажений. Для избежания влияния цифрового тракта на качество передачи 3ВС достаточно допустимые искажения цифрового сигнала трансформировать в искажения на аналоговом выходе, лежащие ниже порога чувствительности человеческого слуха.
При передаче цифровых сигналов по линии связи могут возникать ошибки, вызванные несоответствием между принятыми и переданными символами цифрового сигнала. Эти ошибки могут быть одиночными или группироваться в пакеты. Обычно при цифровой передаче вещательных сигналов принимают меры против влияния пакетов ошибок – так называемое перемежение символов и кодовых слов на стороне передачи и их деперемежение на приемной стороне [43, 46]. В результате ошибки рассредоточиваются и воспринимаются как ряд одиночных ошибок.
Одиночная ошибка в кодовом слове вызывает на приемной стороне системы передачи неправильное восстановление отсчета, т.е. искажение выходного аналогового сигнала, которое субъективно может восприниматься как щелчок. Величина искажения и громкость
3. Цифровое представление звуковых вещательных сигналов |
95 |
щелчка зависят от веса искаженного разряда кодового слова, а громкость, кроме того, зависит от уровня и характера маскирующего сигнала. Не все одиночные ошибки заметны на слух. При попадании ошибки в младшие разряды щелчок не отмечается даже при отсутствии маскировки. В то же время ошибки в пяти-шести старших разрядах кодовых слов вызывают глубокие изменения уровня сигнала и проявляются в виде громких щелчков, сильно ухудшающих качество звукопередачи. В зависимости от веса разряда громкость щелчка будет различной (рис. 3.14) [11]. Пороговая заметность щелчка составляет 0,6 сона. Следовательно, как это видно из приведенного графика, ошибки в 4 старших разрядах будут уверенно заметны, до 6-го – слышны, а начиная с 7-го – практически незаметны (ниже порога слышимости).
Кривая на рис. 3.14 получена в паузе звуковой программы и, следовательно, при отсутствии маскировки. Ясно, что на фоне сигнала заметность одиночных ошибок будет меньше. В табл. 3.2 приведены данные о заметности ошибок на фоне фрагментов звуковых программ разных жанров [11]. Данные получены при 12-разрядном представлении ЗВС. Видно, что заметность искажений на фоне сигнала гораздо ниже – в силу маскировки по частоте и времени, т.е. маскирующий эффект сигнала снижает число опасных разрядов примерно до четырех-пяти.
Рис. 3.14. Зависимость громкости щелчка от веса ошибочного разряда при отсутствии маскировки
Ошибки в старших разрядах путем интерполяции сводятся к ошибкам в младших разрядах, а увеличение ошибок в младших разрядах эквивалентно увеличению шумов квантования и уменьшает защищенность ЗВ от шумов.
96 |
Цифровая обработка сигналов в трактах звукового вещания |
Т а б л и ц а 3.2. Заметность искажений от жанра звуковой программы
Характер передачи |
Замеченные щелчки, % |
Эквивалентное число |
|
|
разрядов |
|
|
|
Симфонический оркестр |
34 |
4,1 |
Женское пение |
36 |
4,3 |
Женская речь (диктор) |
34 |
4,1 |
Пауза |
50 |
6,0 |
Среднее значение коэффициента ошибок (Рош) для стандартных цифровых каналов большой протяженности (более 25 000 км), как
правило, не превышает 1 10-6. Если предположить, что каждая вторая ошибка воспринимается на аналоговом выходе как щелчок, то при цифровой скорости передачи сигнала 3В около 300 кбит/с среднее время между щелчками составит примерно 6 с, что недопустимо для высококачественной передачи.
При расчете требуемой достоверности цифровой передачи сигналов ЗВ принято исходить из того, что при высококачественном звуковоспроизведении субъективно допустимо появление не более одного щелчка в час. Исходя из этого, определяется величина долговременной максимально допустимой вероятности ошибок в канале
передачи [11, 43, 46]: (Рош)доп 1,5 10–9. Естественно, что при Рош < < (Рош)доп качество звукопередачи повышается (щелчки будут слыш-
ны реже), однако это требует весьма дорогостоящих решений по улучшению энергетических характеристик системы передачи.
Для устранения влияния ошибок на качество звукопередачи необходимо принимать специальные меры, которые состоят в обнаружении и последующем маскировании либо исправлении ошибок. При этом, как отмечалось выше, допустимые искажения цифрового сигнала достаточно трансформировать в искажения на аналоговом выходе, лежащие ниже порога чувствительности человеческого слуха. На основе этого принципа и реализуется маскирование – замена искаженного отсчета ЗВС другим отсчетом, минимально отличающимся от истинного. При этом инерционность слуха человека позволяет эффективно маскировать ошибки, если их число не превышает пяти-десяти в секунду.
Для коэффициента ошибок в стандартных цифровых трактах передачи допускаются кратковременные превышения по сравнению
с величиной 1 10–6. Такое увеличение приведет к дальнейшему снижению качества передачи 3ВС. Во всех цифровых системах передачи сигналов 3В для уменьшения влияния цифровых ошибок приме-
3. Цифровое представление звуковых вещательных сигналов |
97 |
няют избыточные (помехоустойчивые) коды, в которых избыточность используют для обнаружения или исправления ошибок. Если обнаружен ошибочный отсчет, то его, как правило, маскируют – восстанавливают путем
экстраполяции по предыдущему неискаженному отсчету или интерполяции по предыдущим и последующим неискаженным отсчетам. Кривые заметности ошибок интерполяции от ее порядка приведены на рис. 3.15 [11].
Рис. 3.15. Заметность ошибок интерполяции от ее порядка
Очевидно, что эти методы эффективны лишь при большой корреляции между отсчетами сигнала.
Из графиков следует, что даже интерполяция нулевого порядка (замена искаженного отсчета предыдущим) – кривая 1 – позволяет снизить заметность искажений. Односторонняя интерполяция первого порядка – кривая 2, двусторонняя – кривая 3 и т.д. позволяют свести искажения к ошибкам в младших разрядах с подпороговой громкостью.
При группировании ошибок в цифровом тракте передачи характер искажений на аналоговом выходе аппаратуры может несколько измениться. Эти изменения касаются прежде всего эффективности работы системы помехоустойчивого кодирования, в частности системы обнаружения ошибок в старших разрядах кодового слова. Если ошибка не обнаружена, то, как и обычно, она приводит к щелчку на выходе аппаратуры 3В, однако амплитуда импульса помехи и соответствующая громкость щелчка, как правило, значительно больше, чем при интерполяции. При этом недопустимые искажения возникают при более низких коэффициентах ошибки. Поэтому в каналах передачи ЗВС всегда принимаются меры по уменьшению группирования ошибок (см. выше).
При передаче цифрового сигнала по линейному тракту нередко возникает фазовое дрожание цифрового сигнала (джиттер), т.е. отклонение значащих моментов сигнала от их идеальных положений. При передаче по длинной цепочке регенераторов происходит увеличение амплитуды фазового дрожания. Фазовое дрожание цифрового сигнала возникает также при асинхронном объединении цифровых сигналов, в частности при асинхронном сопряжении цифрового сигнала 3В с цифровыми сигналами первичной ЦСП [11]. Фазовые
98 |
Цифровая обработка сигналов в трактах звукового вещания |
дрожания цифрового сигнала приводят к соответствующим фазовым флуктуациям импульсов дискретизации 3ВС, а отклонение моментов дискретизации от идеальных положений – к искажениям переданного аналогового сигнала.
По результатам субъективно-статистических экспертиз предложена граница допустимой амплитуды дрожания АИМ сигнала, которая составляет 50 нс. Пороговые по слышимости амплитуды дрожания приведены на рис. 3.16 [11]. Как видно из рисунка, пороговая амплитуда дрожания зависит от частоты сигнала и дрожания. На ее заметность влияет также уровень звукового давления при воспроизведении искаженных сигналов. Наиболее существенно пороговая амплитуда зависит от частоты дрожания.
Рис. 3.16. Пороговые по слышимости амплитуды дрожания
Величина фазовых дрожаний, возникающих в цифровом линейном тракте, определяется способом построения регенераторов и структурой цифрового сигнала. Низкочастотные фазовые дрожания накапливаются при прохождении цифровым сигналом цепочки регенераторов, возрастая примерно пропорционально квадратному корню из числа регенераторов. Однако на выходе цифрового линейного тракта имеется возможность их уменьшения путем записи принятого цифрового сигнала в запоминающее устройство и считывания со стабильной частотой. Этот способ уменьшения фазового дрожания реализуется в цифровых системах 3В, в которых цифровой 3ВС асинхронно сопрягается с цифровым сигналом первичной ЦСП.
3. Цифровое представление звуковых вещательных сигналов |
99 |
Заметим, что критической точкой цифрового тракта 3В является ввод-вывод цифрового сигнала в тракт первичной ЦСП.
Проскальзывания могут возникать вследствие неправильного приема команд согласования скоростей в аппаратуре группообразования, при переключении основного и резервного трактов передачи. Связанное с проскальзыванием выпадение или вставка цифровых символов при передаче цифрового сигнала 3В вызывает, как правило, нарушение цикловой синхронизации при условии, что цифровой 3ВС снабжен собственным цикловым синхросигналом. В этом случае проскальзывание вызывает на аналоговом выходе аппаратуры щелчок, эквивалентный щелчку, появляющемуся при нарушении циклового синхронизма.
В заключение кратко рассмотрим ряд оригинальных методов маскирования пакетов ошибок и выпадений цифрового сигнала.
Как отмечалось выше, в настоящее время для борьбы с достаточно большими пакетами ошибок используют помехоустойчивое кодирование в совокупности с перемежением символов, позволяющим превратить ошибки большой кратности во множество одиночных (или двойных) ошибок. При этом удается исключить влияние пакетов ошибок, насчитывающих до 32 символов. Более длительные выпадения возникают при замираниях сигнала, например при приеме на подвижном объекте сигналов цифрового радиовещания в условиях многолучевости.
Однако, помимо собственно цифрового тракта передачи, существуют источники некомпенсируемого группирования ошибок и в самом исправляющем декодере, где, в частности, возможны сбои по переполнению. Объем таких пакетов ошибок зависит от длины применяемого кода и может составлять несколько тысяч символов. Таким образом, исправление пакетов цифровых ошибок большой длительности сопряжено с известными практическими трудностями, существенным увеличением цифровой скорости передачи и может приводить к размножению ошибок. Проблема усугубляется при ограниченности энергетических ресурсов, например в спутниковых каналах вещания, а также жесткими ограничениями на сложность и стоимость бытового цифрового радиоприемника [46].
Методы маскирования отсчетов (кодовых слов) основаны на их обнаружении и замене другими, полученными из неискаженных слов. При этом основное различие известных методов заключается в способе получения замещающих отсчетов. Так, возможно маскирование пакетов ошибок и выпадений с использованием представления ЗВС в частотной области. Суть такого метода маскирования заключается в том, что при обнаружении группы ошибочных отсчетов она заменяется синтезированной из группы интерполированных
100 |
Цифровая обработка сигналов в трактах звукового вещания |
значений по неискаженным предыдущим и последующим спектральным составляющим. При этом точность восстановления (замещения) зависит от характера сигнала и порядка интерполяции.
На длительности существования звукового объекта спектр сигнала квазистационарен, а изменение уровня спектральных составляющих происходит по известным законам, определяемым физикой звукоизвлечения. Так, если зазвучал фортепианный аккорд, то входящие в него спектральные составляющие должны обеспечить достаточно крутую фазу атаки, быстрого нарастания, фазу поддержки – относительной стабильности уровня и мягкий спад. При этом сами спектральные составляющие изменяются достаточно медленно на длительности в среднем около 200 мс. Представление сигнала
вчастотной области осуществляется обычно кадрами длительностью 8…20 мс, а выпадение отдельного кадра достаточно успешно маскируется путем интерполяции в частотной области.
Маскирование ошибок может быть основано на использовании избыточности сигнала ЗВ, определяемой его многоканальностью,
вчастности, для стереофонического сигнала – двухканальностью. Такое маскирование основано на использовании корреляции между сигналами левого и правого каналов, а также на свойстве слуха не различать переход от стереофонического звуковоспроизведения к монофоническому на коротких, значительно меньше секунды, временных интервалах [47].
Принципиальная возможность маскирования ошибок при цифровой передаче ЗВС объясняется, с одной стороны, фактом избыточности представления вещательного сигнала в цифровой форме, а с другой – инерционностью слухового восприятия. При этом важно знать «масштабы» такой избыточности, т.е. ресурс времени, в течение которого те или иные манипуляции с цифровым вещательным сигналом останутся незаметными для квалифицированных экспертов на критических к этим искажениям фрагментах звуковой программы.
Оценка так называемой азимутальной инерционности слуха составляет 150...180 мс. Следовательно, можно предположить, что приблизительно на таком временном интервале пространственные искажения в стереопанораме останутся незаметными для слушателей. Очевидно, что окончательные суждения о предельно допустимой длительности искажений стереосигнала можно сделать лишь на основании субъективно-статистических испытаний (ССИ).
Воригинальном цифровом устройстве маскирования в стереофонических радиовещательных каналах (ЦУМСК) используется
временное представление ЗВС [47]. Суть этого способа маскирова-
ния состоит в том, что при появлении искажений сигнала в одном из
3. Цифровое представление звуковых вещательных сигналов |
101 |
каналов стереопары искаженный отрезок сигнала заменяется специально обработанным отрезком сигнала другого канала, причем оба отрезка – искаженный и замещающий – должны соответствовать одному и тому же фрагменту стереосигнала, а обработка предназначена для устранения щелчков в момент переключения и сохранения панорамы звучания на время замещения.
Во всех современных системах передачи правый и левый каналы стереопары передаются одновременно, и, следовательно, в этом случае помеха большой длительности поражает сразу оба канала. Во избежание этого правый и левый каналы должны передаваться со сдвигом (задержкой) на время Тз, большее, чем максимальная
продолжительность маскируемого пакета ошибок ( п)м. На рис. 3.17 обозначены основные параметры, характеризующие процедуру маскирования. Условием ее осуществимости, определяемым механизмом функционирования, является наличие задержки Тз между канальными кодовыми последовательностями (КП), отвечающего неравенству
Тз > ( п)м + з,
где з – интервал времени, характеризующий инерционность процедуры обнаружения пакета ошибок или выпадения. Очевидно, что
выбор величины ( п)м должен отвечать результатам ССИ на заметность искажений при реализации данного способа маскирования.
Рис. 3.17. Иллюстрация механизма функционирования ЦУМСК
Для реализации маскирующего эффекта при одновременном поражении помехой обоих каналов задержка Тз в одном из каналов реализуется как сумма задержек: Тз` – на передающей стороне и Тз" – на приемной стороне цифровой системы передачи стереосигналов. В конечном счете, равный временной сдвиг КП обоих каналов гарантирует их синфазность на выходе декодера.
102 |
Цифровая обработка сигналов в трактах звукового вещания |
Рис. 3.18. Фрагмент структурной схемы ЦУМСК
С учетом изложенного, структурная схема ЦУМСК имеет вид, приведенный на рис. 3.18. Собственно, замена пораженных помехой участков КП осуществляется в канальных блоках переноса (БП) под управляющим воздействием сигнала ошибки (в одном канале – после задержки на время Тз` в блоке задержки сигнала ошибки – БЗСО) и с учетом корректирующего действия блоков адаптивной коррекции нескольких старших разрядов кодовых слов замещающего сигнала (БАК).
Отсюда видно, что каждая из канальных КП, идущих на замещение, разделяется на два неравных параллельных потока: больший содержит информацию о младших разрядах кодового слова, а меньший – об mk, корректируемых старших разрядах того же кодового слова (на схеме прохождение этой части разрядов кодовых слов показано жирными линиями). Часть m-разрядной КП, содержащая m – mk младших разрядов, подается непосредственно на блоки переноса БП, а другая, меньшая часть, подвергается адаптивной коррекции в БАК. При воздействии сигнала ошибки на блок переноса на его выход проходит канальная КП из не пораженного помехой канала, состоящая из двух частей: не изменяющейся, содержащей m – mk младших разрядов, и скорректированной, состоящей из mk старших разрядов, которая поступает из БАК канала, пораженного помехой.
Как отмечалось выше, обосновать количество старших разрядов кодовых слов, адаптировать которые необходимо в процессе маскирования, установить минимально допустимый интервал Тп следования пакетов ошибок (или выпадений) и определить с точки зрения
эффективного маскирования величину ( п)м, очевидно, можно лишь по результатам ССИ на критических к таким искажениям фрагментах звуковых программ. Необходимые ССИ выполнены путем полуна-
3. Цифровое представление звуковых вещательных сигналов |
103 |
турного моделирования процедуры маскирования в стереоканалах на программной модели, реализованной на ПК. В результате таких исследований установлена принципиальная возможность маскирования цифрового стереосигнала, характеризуемого пакетами ошибок
(выпадениями) с длительностью ( п)м < 0,1...0,16 с – в зависимости от жанра программы и при условии, что интервал следования таких
помех отвечает условию (Тп )мин > 3...4 с. На рис. 3.19 построены кри-
вые заметности искажений стереосигнала от длительности «па-
кета ошибок» Р( п) для разных уровней адаптивной коррекции ряда старших разрядов кодовых слов. Кривые 1, 2 соответствуют заметности искажения аналогового стереосигнала с межканальным замещением (маскированием), причем 1 – для экспертов, не прошедших предварительную тренировку, 2 – для квалифицированных экспертов; кривые 3, 4 – маскированию цифрового стереосигнала без коррекции старших разрядов, соответственно во время паузы и при наличии сигнала; кривые 5, 6 –
Рис. 3.19. Заметность искажений стереосигнала как функция длительности «пакета ошибок»
то же, но при маскировании с адаптивной коррекцией четырех старших разрядов.
Анализ приведенных данных свидетельствует о высокой эффективности цифрового маскирования пакетов ошибок и выпадений в
стереоканалах, по крайней мере в пределах ( п)м ~ 0,1...0,15 с, при использовании адаптивной коррекции ряда старших разрядов кодовых слов.
Таким образом, возможность применения ЦУМСК (как, впрочем, и простейшей процедуры маскирования одиночных ошибок путем интерполяции) определяется практически исключительно интервалом Тп между смежными интервалами маскирования с длительностью каждого Тмаск. Очевидно, величина Тп должна превышать 0,1...0,5 с, если учитывать интегральный эффект от воздействия на слух процедуры маскирования пакетов ошибок и выпадений.
При использовании ЦУМСК в цифровом стереоканале стратегия повышения помехозащищенности заключается в том, чтобы вместо
