Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

семестр 1 / лабы / лаба 2 / лаба_2_2_фипоз_метода

.pdf
Скачиваний:
0
Добавлен:
13.05.2026
Размер:
915.9 Кб
Скачать

66

Цифровая обработка сигналов в трактах звукового вещания

 

 

Графики зависимости ОСКО

 

 

от N (размерности БПФ, использо-

 

 

ванного для фильтрации), полу-

 

 

ченные при разных скоростях из-

 

 

менения мгновенной частоты, сли-

 

 

ваются, поскольку временные па-

 

 

раметры фильтра f1(k) и f2(k) изме-

 

 

няются с теми же скоростями, что и

 

 

компоненты сигнала (рис. 2.12).

 

 

Поэтому качество фильтрации от

 

 

скорости

изменения

мгновенной

 

 

частоты не зависит. С увеличени-

 

 

ем длины выборки

фильтрации

 

 

качество

разделения

полезных и

Рис. 2.12. ОСКО фильтрованного

мешающих компонентов улучша-

сигнала от тестового «полезного»

ется – в связи с увеличением раз-

(фильтр с нелинейным транспони-

решающей способности использо-

 

рованием спектра)

ванного преобразования – и ОСКО

сигнала достигает сотой доли процента при выборкев 8192 отсчета.

Для сравнения были проведены оценки точности разделения компонентов сигнала с помощью фильтра на базе ДПФ с постоянной длиной выборки и непосредственным изменением полосы пропускания на каждой выборке. В фильтре использовалась та же оконная функция, что и в предыдущем случае. Полоса пропускания фильтра на каждой выборке определялась по значениям f1(k) и f2(k) в ее середине. Результаты вычислений ОСКО фильтрованного сигнала от полезных компонентов исходного представлены на рис.2.13 для двух пар значений крутизны мгновенной частоты: 0,6…1,2 кГц/с и 9,6…19,2 кГц/с. Вычисления производились при разных коэффициентах перекрытия смежных выборок. Принятые значения коэффициентов перекрытия указаны на рисунке. Отметим, что в фильтре с нелинейным транспонированием спектра использовалось перекрытие 0,5.

Графики на рис. 2.13 иллюстрируют улучшение фильтрации с увеличением коэффициента перекрытия. Однако близкие к единице коэффициенты не приводят к значительному выигрышу по ОСКО вследствие возрастающего «шума» оконной функции – в особенности на коротких выборках. С ростом N, с одной стороны, увеличивается разрешающая способность преобразования, а с другой – ухудшается точность следования за изменяющимся сигналом. Эти процессы обусловливают наличие минимума на графиках. Из рисунка видна зависимость ОСКО от скорости изменения мгновенной частоты: с увеличением крутизны минимум ОСКО смещается в область малых

2. Некоторые математические процедуры анализа звуковых сигналов

67

значений длины выборки, а минимальное значение ОСКО – увеличивается.

Таким образом, при данном способе фильтрации точности разделения сигналов, как в фильтре с произвольно перестраиваемой полосой, в принципе недостижимы. Следует также отметить относительно невысокую вычислительную сложность фильтра, содержащего на N/2

отсчетов 4NlogN+12N+6N опера-

ций умножения, где первый член суммы соответствует операциям БПФ, второй – транспонирования сигнала, третий – наложения оконных функций.

Рис. 2.13. ОСКО фильтрованного сигнала от тестового «полезного»

(фильтр на основе БПФ)

Отметим, что измерения проводились на тестовых сигналах с заранее известными параметрами. На практике качество адаптации параметров фильтра к сигналу зависит от функций f1(k) и f2(k). Выбор этих функций определяется конкретными практическими условиями и является самостоятельной задачей.

Изложенный способ адаптивной фильтрации вещательных сигналов позволяет формировать непрерывный сигнал в полосе, центральная частота которой смещается в соответствии со смещением максимума огибающей амплитудного спектра, а полоса пропускания изменяется в соответствии с заложенными в алгоритм закономерностями. При этом скорость перестройки параметров фильтра ограничена только скоростью дискретизации входного сигнала.

При анализе звукового сигнала полосу пропускания фильтра можно выбрать соответствующей критической, то есть изменяющейся по ширине в зависимости от центральной частоты выделяемой полосы. Это позволит использовать данный способ фильтрации в задачах анализа звукового сигнала, распознавания и компактного его представления – с учетом свойств слухового анализатора.

Для адаптации параметров фильтра к свойствам сигнала можно использовать два способа «ориентирования» полосы пропускания: по НЧ составляющим мгновенной частоты и по средним значениям частоты сигнала на каждом квазипериоде. Первый способ обладает преимуществом по оценке ВЧ компонентов. Во втором – сегментация сигнала на интервалах стационарности производится по модулирующим функциям сигнала: по изменению мгновенной фазы на

68

 

Цифровая обработка сигналов в трактах звукового вещания

n2 ,

n Z ,

i i mT n2 и близости значений огибающей:

Ai Ai mT , где mT – количество точек на квазипериоде, – от-

клонение огибающих, может адаптивно изменяться в зависимости от сигнала. Второй способ позволяет более точно отслеживать низкочастотные составляющие спектра ЗВС.

Вышеописанный метод лишен многих недостатков существующих систем, но обладает рядом собственных недостатков, обусловленных самими принципами использованной адаптации. Применение в качестве опорной «мгновенной частоты» приводит к появлению искажений в момент смены звуковых объектов или сигналов малого уровня с шумовым составом. Низкая точность спектрального анализа с помощью полосовой фильтрации, а также необходимость более детального изучения спектрального состава ЗВС привела

кпопыткам использовать самые разные математические подходы

кего реализации.

2.4.Практическое занятие: спектральный анализ

и искажения, обусловленные неверной

интерпретацией его результатов

1. Запишите отрезок дикторского текста и измерьте длительность отдельных звуковых объектов (фонем), входящих в сообщение. Для этого выделите курсором интересующий вас участок сигнала (рис. 2.14). В правом нижнем углу экрана вы увидите отметки Begin (начало), End (конец) и Length (длительность). Данные приводятся в миллисекундах (верхняя строчка) и числе отсчетов (нижняя строчка). Послушайте, как звучит выделенный участок при непрерыв-

ном воспроизведении (символ на панели управления проигрывателем, нижний правый угол). Уточните границы звукового объекта по его спектральной картинке – сонограмме (опция View, Spectral View).

Рис. 2.14. Отрезок дикторского текста с выделенным участком сигнала

2. Некоторые математические процедуры анализа звуковых сигналов

69

Сегментация непрерывного звукового сигнала остается трудной задачей для автоматизации, особенно остро она стоит в задачах распознавания сигнала.

2. Согласно теории, минимально воспринимаемый как отдельное звуковое событие звуковой объект должен иметь длительность около 40 мс – обычно это взрывные согласные «п», «ц» и т.д. Попробуйте в этом убедиться, найдя в речевом сигнале короткую согласную фонему и последовательно изменяя ее длительность без изменения тональности (опция Transform, Time/Pitch, Stretch). В меню вам предлагаются три вида обработки:

1)изменение скорости воспроизведения без изменения высоты

тона;

2)изменение высоты тона без изменения длительности;

3)одновременное, независимое изменение высоты тона и скорости воспроизведения выделенного фрагмента.

Увеличивая скорость, доведите длительность фонемы до невозможности ее распознавания – для среднестатистического слушателя это 20…30 мс.

Заметим, что такой метод обработки РС широко используется при передаче речевых информационных программ. Скорость речеобразования, даже у женщин-дикторов, не превышает 7–8 фонем в секунду, хотя, как уже отмечалось ранее, речевой центр женщин вдвое больше мужского. Мудрая природа предусмотрела, что скорость восприятия речевого сообщения составляет около 12 фонем

всекунду. Это и используется большинством радиостанций для сокращения времени передачи осмысленного текста и освобождения места для бессмысленной, но очень дорогостоящей рекламы. Попробуйте самостоятельно изменить скорость воспроизведения до потери качества сообщения. Критериями оценки могут быть заметность изменения сигнала, предпочтительность звучания или относительная потеря разборчивости.

Итак, ясно, что длительность звукового объекта невелика. Однако, как отмечалось выше, точность спектрального анализа определяется длительностью анализируемой последовательности, причем анализировать несколько объектов одновременно бессмысленно. Выделите интересующий вас звуковой объект и проведите его спектральный анализ, используя опцию Analyse, Freqyensi analise (рис. 2.15). В окне интерфейса необходимо задать: логарифмическую шкалу по частоте, которая удобна при рассмотрении свойств ЗС; количество отсчетов в выборке БПФ-анализа и вид оконной функции, накладываемой на каждую выборку. Напомним, что раз-

решающая способность БПФ-анализа определяется как Fд/N, где N – длина выборки в отсчетах. Очевидно, что чем больше N, тем точнее

70

Цифровая обработка сигналов в трактах звукового вещания

анализ, но длина выборки, превышающая длину объекта, не имеет смысла.

Убедитесь в изменении точности анализа в зависимости от заданного числа отсчетов.

Рис. 2.15. Спектральный анализ звукового объекта

3. Существенное влияние на точность анализа оказывает и используемая оконная функция, задача которой устранить разрывы функций на краях исследуемой последовательности. Предлагаемые

вменю окна имеют разную величину боковых лепестков и ширину главного лепестка (сверху вниз – уровень боковых лепестков уменьшается, а ширина главного увеличивается). Интересная особенность БПФ-анализа – осцилляция оценки амплитуды в зависимости от фазового положения начального отсчета. Даже для лучших оконных функций она составляет несколько дБ, т.е. превышает разрешающую способность слуха. При выборе числа точек БФП-преобразования приходиться ориентироваться на максимальную разрешающую способность слуха, хотя она и реализуется только до 500 Гц.

Убедитесь в наличии боковых лепестков и колебании оценки

взависимости от начального фазового положения анализируемой последовательности. Для этого в опции Generate сформируйте гар-

монический сигнал низкой частоты в меню Tones (рис. 2.16). Проведите спектральный анализ мгновенных спектров сигнала

при разных фазовых положениях, переводя курсор вдоль анализируемого сигнала (рис. 2.17). Вы сможете убедиться, что и сама оценка, и боковые лепестки существенно изменяются. Это ограничивает применимость таких оценок для компактного представления и некоторых алгоритмов обработки сигнала.

2. Некоторые математические процедуры анализа звуковых сигналов

71

Рис. 2.16. Формирование гармонического сигнала в меню «Tones»

Рис. 2.17. Спектральный анализ мгновенных спектров сигнала

4. Напомним, что ДПФ, БПФ-анализ – это способ представления сигнала набором стационарных на времени анализа комплексных синусоид. И если вы описываете сигнал, состоящий из одной гармоники колебания, изменяющейся по амплитуде, то в БПФ-оценке будет несколько коэффициентов (частот), сумма которых обеспечит это изменение (как минимум две близкорасположенные частоты с биениями). Такое же положение возникает при описании одной гармоники, изменяющейся по частоте. А теперь подумайте: можно ли отбрасывать часть коэффициентов в соответствии с закономерностями частотной маскировки в периферическом слуховом анализа-

72

Цифровая обработка сигналов в трактах звукового вещания

торе? Создайте соответствующие сигналы, используя возможности опций Analyse и Transform, и убедитесь в необходимости бережного отношения к коэффициентам БПФ-оценки.

5. Во многих современных алгоритмах компактного представления используется субполосное представление сигнала (см. гл/ 4). При этом возникает проблема искажений сигналов за счет «просачивания», когда часть энергии сигнала попадает вместе с боковыми лепестками в соседнюю полосу, а там ее отбрасывают как неслышимую из-за частотной маскировки. Обработка сигнала, находящегося в зоне расфильтровки и попадающего в разные субполосные сигналы, по разным алгоритмам (а они обязательно разные), приводит к появлению искажений при обратной «сборке» сигнала. Напомним, что длительность кадра при субполосном представлении невелика и исключает возможность качественной фильтрации, а число фильтров велико.

Оцените качество фильтрации на стыке полос. Для этого синтезируйте частоту, расположенную на стыке и рядом, и убедитесь в факте «просачивания». Покажите искажения в случае отбрасывания части энергии сигнала. Напоминаем, что при синтезе фильтров надо задавать конечную их крутизну и перекрытия.

6. В большинстве алгоритмов компактного представления используется понятие критических полосок слуха. Попробуйте убедиться в их существовании. Для этого синтезируйте опорное тональное колебание, например в области 600 Гц. Затем синтезируйте колебание, медленно изменяющееся по частоте от 200 до 1000 Гц с амплитудой, составляющей половину от амплитуды опорного. Смешайте эти два колебания, используя опцию Edit, Mix Past. Прослушайте полученный сигнал и отметьте частоты, на которых вы перестаете слышать второй сигнал. Проведите это исследование на разных частотах и убедитесь в том, что ширина критических полосок слуха растет с частотой. Оцените «смелость» авторов формата MP3, которые используют «критические полоски» единого размера 750 Гц для всего спектра сигнала, при реальном их изменении от

50до 3000 Гц!

7.Много авторов бьется над проблемой повышения точности спектрального анализа и адекватности получаемых оценок реальным свойствам звукового сигнала. При этом они «упираются» либо в вычислительную сложность, либо в неоднозначность формируемой оценки.

Одним из простых и широко используемых способов повышения точности БПФ-оценки является дополнение исходной временной последовательности нулями. При этом, однако, не следует забывать, что способ не обеспечивает повышения разрешающей способ-

2. Некоторые математические процедуры анализа звуковых сигналов

73

ности анализа! Действительно, ведь проводится анализ АИМ – последовательности с соответствующим обогащением спектра. Сформируйте такую последовательность и убедитесь в вышесказанном.

Контрольные вопросы

2.1.Какая длительность существования звукового объекта обеспечивает возможность приемлемого по точности спектрального анализа его периферическим слуховым анализатором?

2.2.Как зависит разборчивость или распознаваемость звукового сигнала от качества передачи отдельных временных интервалов звукового объекта – атаки, фазы поддержки, спада?

2.3.Какова длительность процесса внутренней реверберации слухового анализатора?

2.4.В каком диапазоне частот слушатель способен наиболее точно определить абсолютную частоту сигнала?

2.5.Какое число полосовых фильтров используется в «субполосных» системах передачи и почему?

2.6.Какой из способов формирования оценок спектра звукового сигнала наиболее близок к оценке, формируемой слуховым анализатором человека?

2.7.Чем объясняется популярность ДПФ при формировании спектральных оценок?

2.8.Зачем используются оконные функции при формировании спектральных оценок с использованием ортогональных преобразований?

2.9.Как повысить точность формирования оценок квазистационарного сигнала с помощью БПФ?

2.10.На каких частотах будут наблюдаться наибольшие искажения при осуществлении преобразования Гильберта с помощью преобразования Фурье?

Соседние файлы в папке лаба 2