Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

семестр 1 / лабы / лаба 3 / лаба_3_3_фипоз_метода

.pdf
Скачиваний:
0
Добавлен:
13.05.2026
Размер:
915.9 Кб
Скачать

46

Цифровая обработка сигналов в трактах звукового вещания

коэффициентов оценки. Фурье-преобразование обеспечит абсолютно правильную оценку при анализе бесконечной последовательности, а в случае анализа короткой выборки данных анализируется бесконечная последовательность этих выборок, вместе с точками разрыва. В результате в «спектре» оценки возникают коэффициенты, отображающие эти разрывы. То же самое на «научном языке» выглядит следующим образом.

Выбор конечного временного интервала длительностью NT секунд и ортогонального тригонометрического базиса (непрерывного или дискретного) на этом интервале обусловливает интересную особенность спектрального разложения. Из континуума возможных частот только совпадающие с частотами базиса будут проецироваться на единственный базисный вектор, а все остальные частоты будут иметь ненулевые проекции на любой из векторов базисного множества. Это явление, которое обычно называют «размыванием» или просачиванием спектральных составляющих, возникает из-за конечной длительности обрабатываемых записей. Хотя частота отсчетов и влияет на степень размывания, сама по себе дискретизация не является его причиной.

Чтобы понять причину размывания, достаточно заметить, что сигналы с частотами, отличными от базисных, не периодичны в окне наблюдения. Если естественный период сигнала несоизмерим с продолжительностью интервала наблюдения, периодическое продолжение сигнала будет иметь разрывы на границах интервала. Эти разрывы дают спектральные вклады на всех базисных частотах – особенно велики эти вклады на высоких частотах, а появление постоянной составляющей искажает оценку низких частот сигнала, т.е. происходит размывание (рис. 2.2).

Рис. 2.2. В интервале наблюдения периодическое продолжение синусоиды не периодично

2. Некоторые математические процедуры анализа звуковых сигналов

47

Большим напряжением научной мысли было достигнуто чисто инженерное решение, позволившее уменьшить влияние разрывов на оценку спектра. Если разрывы мешают – их уничтожают простым сведением функции к нулю в начале и конце последовательности! Для этого функцию достаточно умножить на коэффициент передачи, спадающий к нулю по краям выборки, т.е. на так называемую «оконную функцию» (см. Приложение). Таких оконных функций разработано множество, и с самыми разными свойствами. Придумавшие их ученые даже присвоили одним и тем же окнам разные имена, причем обычно свои…

Конечно, при использовании окон часть энергии сигнала теряется, и, следовательно, падает разрешающая способность анализа. Поэтому, чтобы избежать потерь информации, приходится анализировать сигнал с перекрытиями, но зато сводится к минимуму влияние разрывов, паразитная амплитудная модуляция оценки, которая без окна может достигать 4 дБ, и т.д. В приложении на рис. П.5 приведены типичные дискретно-временные функции окна и логарифм модуля их ДВПФ. Для анализа используются частоты, расположенные в наихудшем положении, – между двумя частотными коэффициентами, когда на длительности анализа укладывается нецелое число периодов гармонического колебания.

Стратегия выбора окна диктуется компромиссом между смещением из-за помех в области близких боковых лепестков и смещением из-за помех в области дальних боковых лепестков. Например, если достаточно сильные компоненты сигнала расположены вблизи и на отдалении от слабой компоненты сигнала, то следует выбирать окно с одинаковым уровнем боковых лепестков около главного лепестка, с тем, чтобы обеспечить малое смещение. Если же имеется одна сильная компонента, удаленная от слабой компоненты сигнала, то следует выбирать окно с быстро спадающим уровнем боковых лепестков, причем их уровень в непосредственной близости к главному лепестку в данном случае не имеет большого значения. В том случае, когда необходимо обеспечить высокое разрешение между очень близкими компонентами сигнала и удаленные компоненты отсутствуют, вполне приемлемым может оказаться окно даже с увеличивающимся уровнем боковых лепестков, но зато с очень узким главным лепестком. Если динамический диапазон сигнала ограничен, то характеристики боковых лепестков не имеют особого значения и потому можно выбирать окно, которое проще для численной реализации.

Правильный выбор окна особенно важен для обнаружения с помощью ДПФ отдельных тонов в сигнале, содержащем несколько гармоник. Для того чтобы динамический диапазон обнаружимых сиг-

48

Цифровая обработка сигналов в трактах звукового вещания

налов был максимален, преобразование окна должно иметь узкий главный лепесток и очень низкий уровень боковых лепестков.

Применение оконных функций приводит к необходимости использования перекрытий временной функции, чтобы избежать потерь информации о сигнале. Величина перекрытий достигает 50%, что, соответственно, увеличивает объем передаваемой информации.

Избежать необходимости использования перекрытий и уменьшить объем передаваемой информации за счет большей концентрации энергии в меньшем наборе коэффициентов позволяет ис-

пользование дискретного косинусного преобразования (ДКП). Осо-

бенностью ДКП является то, что, в отличие от преобразования Фурье, в ходе его вычисления анализируется бесконечная последовательность зеркально отраженных отрезков сигнала, что уменьшает влияние разрывов анализируемой функции. Кроме того, функция косинуса симметрична (не имеет постоянной составляющей) на полупериоде колебания, поэтому частотные коэффициенты оценки располагаются через половину периода, в результате чего разрешающая способность повышается вдвое.

ДКП исходного массива данных X(m), m = 0, 1, …, N–1 определяется:

 

1

 

N 1

 

 

LX(0)

 

 

 

X(m) ,

 

 

 

 

 

 

 

 

 

N m 0

 

 

 

2

 

N 1

(2m 1)k

 

LX (k)

 

 

 

X(m) cos

2N

, k 1,2,...,N 1,

 

 

 

 

 

N m 0

 

LX (k) – где k – коэффициент ДКП.

На рис. 2.3 сравниваются некоторые ортогональные преобразования. Здесь представлены результаты сравнения БПФ с окном и ДКП, а также приведены данные о преобразовании Карунена–Лоева, считающегося идеальным.

ДКП обеспечивает высокую концентрацию энергии в ограниченном наборе частотных коэффициентов, поэтому используется в большинстве кодирующих устройств, предназначенных для устранения статистической избыточности ЗВС. В то же время в задачах анализа ЗВС и устранения психофизиологической избыточности неудобством ДКП является потеря наглядности информации о фазе колебания, которая замаскирована в амплитудных соотношениях двуполярных коэффициентов оценки.

Остановимся далее на общих недостатках ортогональных преобразований при их использовании для оценки мгновенных спектров звукового сигнала.

2. Некоторые математические процедуры анализа звуковых сигналов

49

Рис. 2.3. Кривая, соединяющая n максимумов лепестков спектра сложной функции, для следующих ортогональных преобразований:

a – ДПФ (прямоугольное окно); b – преобразование Карунена–Лоева (прямоугольное окно); c – ДКП (прямоугольное окно); d – ДПФ (косинусно-прямоугольное окно)

1.Прежде всего, это сам принцип замены реального сигнала, содержащего спадающие, нарастающие, смещающиеся спектральные составляющие, набором стационарных на времени анализа гармонических колебаний. В разд. 2.2 уже подчеркивалась важность НЧ модуляций спектральных составляющих звукового сигнала, а именно они исчезнут в оценке за счет усреднения на длительности выборки.

2.Недостаточная разрешающая способность, определяемая длительностью наблюдения. Для оценки с прямоугольным окном ширина полосы, в пределах которой оценивается энергия каждым

коэффициентом преобразования, составляет Fд/T или Fд/N, где N – число отсчетов дискретной функции. При минимальной длительно-

сти выборки около 8 мс (256 точек) и Fд = 44100 Гц ширина полосы составит 160 Гц. Введение любой оконной функции расширяет полосу, для некоторых окон до 2,8 раз. Такая разрешающая способность недостаточна для большинства практических применений. Для получения высокой разрешающей способности необходимо увеличение длительности наблюдения, однако при этом производится усредненная оценка нескольких совершенно разных звуковых объектов.

3.Анализ производится на регулярной гармонической шкале частот, что совершенно не совпадает с нелинейной, «высотной» шкалой слуха.

4.Оценка производится с паразитной амплитудной модуляцией (АМ), зависящей от положения исследуемой спектральной составляющей на шкале частот, ее начального фазового положения и ис-

50

Цифровая обработка сигналов в трактах звукового вещания

пользуемой оконной функции. Амплитуда паразитной АМ может достигать 4 дБ, что делает сомнительным применимость закономерности восприятия спектральных составляющих к коэффициентам БПФоценки (точность оценки амплитуды гармонического колебания око-

ло 0,4 дБ).

Реальный сигнал нестационарен как по уровню, так и по частоте, поскольку нестационарна каждая спектральная составляющая. Поэтому закономерен вопрос: как нарастание одной спектральной составляющей будет отображено преобразованием Фурье? Ответ: как минимум двумя стационарными частотными оценками, разнос частот которых и фазовые соотношения обеспечат при суммировании описание исходного сигнала, а в общем случае – достаточно большим набором коэффициентов оценки. Еще сложнее описание смещающегося по частоте тона, когда в пределах каждой полоски оценки он как бы меняется по уровню. Дальнейшие попытки интерпретировать полученные оценки как реальные спектральные составляющие и использовать закономерности восприятия приводят к появлению искажений. Например, при компактном представлении в предельном случае вместо плавно меняющегося тон будет представлен отрезками дискретно меняющегося.

Исследования заметности искажений, возникающих в результа-те подмены плавно изменяющегося по частоте и уровню тона ступенчато изменяющимся, показали, что при использовании временных отрезков, меньших или равных 8 мс, заметность подмены минимальна. Это позволяет передать сигнал ограниченным числом дискретных составляющих для последующего его воспроизведения.

Тем не менее, несмотря на перечисленные недостатки, ДПФ при определенных условиях может быть использовано для формирования достаточно точной оценки спектра ЗВС.

2.1.5.Повышение точности БПФ-анализа звуковых сигналов

При оценке звуковых сигналов особый интерес вызывают периодические компоненты, для выявления которых используется классическое преобразование Фурье. Однако конечная длительность интервала наблюдения при реализации дискретного преобразования Фурье или его быстрого алгоритма вычисления (БПФ) влияет на различимость близко расположенных тонов и точность оценок параметров сигнала.

Ранее было отмечено, что максимально верная оценка может быть получена для колебаний, укладывающихся на длительности анализа целое число раз, совпадающее с номером коэффициента

2. Некоторые математические процедуры анализа звуковых сигналов

51

преобразования. При фиксированной длительности анализируемой последовательности сдвинуть по частоте коэффициенты преобразования невозможно, а вот сдвинуть спектр самого сигнала вполне реально. Эта идея и была использована для повышения точности формирования спектральных оценок ЗВС, про который нам заведомо известно, что разнос спектральных составляющих не может быть меньше основного тона, а основной тон голоса или музыкальных инструментов редко бывает ниже 50…70 Гц.

Для формирования оценки используется, кроме результатов БПФ-анализа самого сигнала, параллельный анализ набора сигналов, транспонированных по частоте в пределах бина (частотного разноса между двумя ближайшими коэффициентами ДПФ). А именно – максимальный по амплитуде коэффициент из набора, относящегося к коэффициенту с данным номером, принимается в качестве коэффициента оценки. При этом оценка формируется на нерегулярной частотной шкале с максимальной концентрацией энергии в каждой частной оценке.

В табл. 2.1 приведены основные результаты оценивания при использовании различных окон; там же, в колонке «сочетание окон Хэмминга и прямоугольного», приведены их значения при использовании для формирования оценки информации, полученной из набора сдвинутых по частоте сигналов. Оценки приведены для разного числа сдвигов: 16, 32, 64.

В таблице использованы следующие характеристики:

-когерентное усиление – оценивает отношение суммы отсчетов сигнала, умноженных на окно, к их сумме (прямоугольное окно);

-эквивалентная шумовая полоса – величина, обратная

когерентному усилению;

-корреляция перекрывающихся участков – вводится для уменьшения потерь информации в результате наложения окна в начале и конце анализируемой последовательности;

-паразитная АМ спектра – равна отношению когерентного

усиления тона, расположенного посредине между двумя бинами ДПФ, к когерентному усилению тона, совпадающего с одним из бинов ДПФ;

-максимальные потери преобразования - сумма максимальных потерь из-за паразитной АМ спектра для данного окна (в дБ) и потерь преобразования, определяемых формой окна;

-максимальный уровень боковых лепестков (по отношению к

главному лепестку);

-скорость спадания боковых лепестков (дБ/октава);

-полоса по уровню 3 и 6 дБ.

52 Цифровая обработка сигналов в трактах звукового вещания

Т а б л и ц а 2.1. Результаты оценивания спектра при использовании

различных окон

Параметры

 

 

Окна

 

 

 

 

 

 

 

 

 

 

прямо-

треу-

Хем-

сочетание окон Хемминга

 

уголь-

гольное

минга

и прямоугольного

 

ное

 

 

 

 

 

Число сдвигов

 

0

 

16

32

64

Максимальный уровень

–13

–27

–43

–43

–43

–43

боковых лепестков, дБ

 

 

 

 

 

 

Скорость спада боковых

–6

–12

–18

–6

–6

–6

лепестков, дБ/октава

 

 

 

 

 

 

Когерентное усиление

1,00

0,50

0,54

1,00

1,00

1,00

Эквивалентная шумовая

1,00

1,33

1,28

1,00

1,00

1,00

полоса, бин

 

 

 

 

 

 

Полоса по уровню

0,89

1,28

1,30

1,30

1,30

1,30

3,0 дБ, бин

 

 

 

 

 

 

Паразитная АМ, дБ

3,92

1,82

1,78

0,02

0,0074

0,0028

 

 

 

 

 

 

 

Максимальные потери

3,92

3,07

3,10

3,92

3,92

3,92

преобразования, дБ

 

 

 

 

 

 

Полоса по уровню

1,21

1,78

1,81

1,81

1,81

1,81

6,0 дБ, бин

 

 

 

 

 

 

 

 

 

 

 

 

 

Корреляция

50,0

25,0

23,5

50,0

50,0

50,0

перекрывающихся

 

 

 

 

 

 

участков с 50%-ным

 

 

 

 

 

 

перекрытием, %

 

 

 

 

 

 

Формирование оценки с помощью сдвига спектра может производиться в два этапа: на первом этапе определяется положение спектральных составляющих на шкале частот с использованием окна, снижающего влияние боковых лепестков, а на втором – оценивание их параметров на прямоугольном окне. Параметры, характеризующие разрешающую способность анализа с помощью сдвига, определяются первым окном, а параметры оценки – вторым. Данные, приведенные в таблице, получены с использованием окна Хемминга и прямоугольного окна.

По результатам измерений тестовых сигналов на ПК, приведенным в таблице, используя при формировании спектральной оценки информацию о промежуточных ее значениях между бинами, полученную врезультате анализанаборатранспонированных сигналов, удается:

2. Некоторые математические процедуры анализа звуковых сигналов

53

-повысить точность определения частоты спектральной составляющей – для однокомпонентного сигнала максимальная погрешность составит величину, обратно пропорциональную удвоенному количеству сдвигов, в частности при N = 256, F = 16 кГц

и64 сдвигах ошибка не превышает 0,49 Гц;

-повысить точность определения амплитуды при тех же условиях до 0,03% (следует учитывать, что в данном случае отсутствует ошибка округления, поскольку гармонический тестовый сигнал синтезирован непосредственно в ходе проведения оценки);

-практически устранить паразитную АМ;

-реализовать теоретически достижимую разрешающую способность окна, приведенную в таблице, которая при БПФ-оценке реализуется только при определенном сочетании фаз и частот спектральных составляющих, для составляющих с произвольными параметрами.

Кроме того, появляется возможность формирования оценки, соответствующей фазе спектральной составляющей (для приведенных выше условий), с точностью до 0,02 рад.

В заключение отметим, что пока ни один из известных способов спектрального оценивания не обеспечивает согласования полученной оценки со свойствами периферического слухового анализатора

иперечисленным выше требованиям. Именно этим можно объяснить недостаточную эффективность алгоритмов кодирования с представлением звукового сигнала в частотной области.

2.2.Преобразование Гильберта в задачах обработки сигнала звукового вещания

2.2.1. Общие сведения

Представление широкополосного звукового сигнала в комплексном виде, как произведения амплитуды (огибающей) на косинус мгновенной фазы (приращение которой – мгновенная частота) встречается в научных публикациях достаточно часто. В частности, предлагается решение целого ряда проблем с использованием понятий «огибающая» и «мгновенная частота». Так, предлагается разделять эмоциональную и смысловую информацию, заключенную, по мнению авторов, в огибающей и мгновенной частоте; распознавать речевой сигнал; обратимо сжимать динамический и частотный диапазоны сигнала в каналах передачи, не замечая нарушения при этом теоремы Котельникова, и т.д. И все это при реализации точного комплексного представления звукового сигнала. Другие ставят под сомнение само право на существование понятия «огибающая» для

54

Цифровая обработка сигналов в трактах звукового вещания

широкополосного ЗВС и справедливо перечисляют источники ряда искажений, возникающих при попытках использования комплексного представления в задачах обработки и представления ЗС. Скорее всего, истина, как всегда, находится посередине. Комплексное представление или преобразование Гильберта (ПГ) полезно при решении ряда задач обработки и представления ЗВС, но имеет целый ряд ограничений, которые необходимо учитывать.

В настоящее время в практических приложениях применяются два основных способа реализации преобразования Гильберта. В первом используется перенос ЗС в область высоких частот, где его можно считать узкополосным, что позволяет достаточно просто синтезировать сигнал, ортогональный исходному. Недостатки такого способа определяются необходимостью многократной фильтрации в процессе модуляции, что снижает точность представления. Второй способ основан на использовании ортогональных преобразований, например ДПФ, и при корректной реализации достаточно точен. Ниже (в разделах 5 и 6) будут рассмотрены вопросы практического применения преобразования Гильберта на примере автоматических регуляторов уровня (АРУР) звуковых вещательных сигналов.

Синженерной точки зрения, ПГ переводит сумму косинусоид f(t)

всумму синусоид f~(t) с сохранением амплитуд и фазовых углов, что

вэлектрических цепях выполняется фазовращателями. Сигналы f(t) и f~(t) имеют одинаковые амплитудные, но разные фазовые спектры:

все спектральные составляющие сигнала f~(t) отстают от одноименных составляющих сигнала f(t) на 90о. Это означает, что ПГ сдвигает

все составляющие спектра по фазе на величину – /2 на положи-

тельной полуоси частот и /2 – на отрицательной полуоси. Преобразование Гильберта позволяет любой широкополосный

ЗС представить произведением двух функций – огибающей и коси-

нуса мгновенной фазы:

t

f(t) A(t) cos (t) A(t) cos (t1) dt1 ,

 

 

 

 

 

0

 

 

где A(t) = f2 (t)+

f ~2 (t) ;

f~(t) A(t) sin (t) ;

(2.3)

(t) arctg f~(t) .

 

 

 

 

 

 

f(t)

 

 

 

 

 

 

Мгновенную частоту определяют как производную фазы

 

 

f(t)f ~

 

 

 

 

 

 

 

(t) f (t)f ~ (t)

.

 

(t) (t)

f2 (t) f ~2

(t)

 

 

 

 

Модуляционный анализ звукового сигнала состоит в определе-

2. Некоторые математические процедуры анализа звуковых сигналов

55

нии двух его модулирующих функций: огибающей A(t) и мгновенной

частоты (t). Математически оценки этих функций тесно связаны со спектральными и статистическими свойствами сигнала. Однако время обработки сигнала в модуляционном анализе много меньше, чем, например, в спектральном. Это объясняется тем, что обработка производится не в узкой, а в широкой полосе частот – в полном частотном диапазоне сигнала.

2.2.2.Реализация преобразования Гильберта с помощью ДПФ

Преобразование Гильберта – отображение функционального пространства в себя, т.е. особый вид фильтрации, при которой форма сигнала меняется без изменения размерности множества сигна-

лов [48].

Преобразования Гильберта при комплексном базисе носят наиболее общий характер и позволяют говорить о любой действительной функции и ее трансформанте Гильберта как о действительной и мнимой частях некоторого гильбертова сигнала. Сопряженные по Гильберту сигналы ортогональны, равномощны, имеют одинаковые амплитудные и энергетические спектры, в случае базиса из комплексных экспоненциальных функций обладают одной и той же автокорреляционной функцией. В этом случае ПГ, определяющее функцию f~(t), сопряженную к исходной f(t), записывается в форме:

 

1 f( )

1

 

 

f ~ (t)

 

 

 

d f(t)

 

,

(2.4)

 

t

t

где интеграл понимается в смысле главного значения Коши в точке разрыва подынтегральной функции.

Преобразование Фурье импульсной характеристики ПГ h t 1

t

 

1

H j j sign w .

(2.5)

F

 

 

 

 

t

 

 

Это означает, что ПГ сдвигает все составляющие спектра по

фазе на /2.

Так как импульсная характеристика ПГ в (2.4) не ограничена во времени, то идеальное ПГ физически нереализуемо. В связи с этим возникает задача приближенного описания ПГ и определения погрешностей такого приближения. Практическая реализация преобразования требует ограничения по длительности импульсной характеристики. При конечной длительности Т импульсной характеристики

Соседние файлы в папке лаба 3