Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
DSP_CP.doc
Скачиваний:
83
Добавлен:
02.12.2018
Размер:
209.41 Кб
Скачать

2. Обоснование выбранного метода

Для решения поставленной задачи был выбран простейший метод перцептивного кодирования на основе преобразования Фурье. Метод дает достаточную степень сжатия (в 3-7 раз по отношению к исходному сигналу) без достаточно ощутимой потере качества и простой схеме системы сжатия и восстановления. Также метод не требователен к ресурсам и может быть реализован программно в реальном времени.

3. Разработка структурной схемы системы

Выбранный метод основании на частотном маскировании, суть которого заключается в том, что человек воспринимает гармоники, если их амплитуда меньше, чем у гармоники близкой по частоте. Т.о. эти гармоники могут быть отброшены без изменения восприятия звукового сигнала.

Рисунок 3.1 – Частотное маскирование

Исследователями было выявлено, что человек имеет критические полосы восприятия, так называемые барки. Рекомендованная MPEG схема разбиения слышимого частотного диапазона на барки приведена в таблице 3.1. Т.к. формула построения порога слышимости очень сложная, то в рамках курсовой работы метод упрощен и считается, что человек в каждой критической полосе слышит только гармонику с максимальной амплитудой.

Схема кодера показана на рисунке 3.2. Кодер функционирует следующим образом:

1) Входной сигнал разбивается на блоки по 1024 отсчетов. Для предотвращения ошибок восстановления на границах блоков разбиение выполняется с перекрытием.

2) Блок отсчетов подвергается преобразованию Фурье.

3) В каждой критической полосе выбирается гармоника с максимальной амплитудой (шаг соответствует блоку психоакустического анализа на схеме).

4) Сохраняется частота и амплитуда полученных на предыдущем этапе гармоник.

Т.к. в ходе преобразования отбрасываются некоторые гармоники, то энергия сигнала уменьшается (громкость). Чтобы после восстановления громкость не изменилась, вычисляется энергия сигнала и восстановленный сигнал нормируется в соответствии с полученным коэффициентом.

Таблица 3.1 – Разбиение на барки

Рисунок 3.2 – Схема кодера

Декодер функционирует по схеме рисунка 3.3. Считанные значения амплитуд гармоник расставляются по соответствующим значениям частот, после чего полученный блок частотных отсчетов сигнала подвергается обратному преобразованию Фурье, после чего временной сигнал

Рисунок 3.3 – Схема декодера

нормируется для соответствия уровня громкости выходного сигнала исходному. Значения, попавшие в область перекрытия соседних блоков вычисляются как среднее арифметическое соответствующих отсчетов.

4. Разработка и тестирование модели

Для анализа особенностей выбранного алгоритма и качества его результатов разработана модель системы в среде MATLAB. Полный текст приложения представлен в приложении А.

Модель позволяет управлять следующими параметрами:

- размером блока, на которые разбивается входной сигнал;

- размером области перекрытия смежных блоков.

При тестировании модели получены следующие результаты:

  1. Увеличение размера блока, на которые разбивается входной сигнал приводит к ухудшению качества восстанавливаемого сигнала, поэтому был выбран оптимальный размер в 1024 отсчета, который обеспечивает достаточную степень сжатия и приемлемое качество.

  2. Размер перекрытия смежных блоков существенно влияет на наличие треска в восстановленном сигнале. Т.о. при окончательной реализации системы размер перекрытия установлен в размере половины размера блока, на которые разбивается сигнал, и составляет 512 отсчетов.

Учитывая указанные обстоятельства можно оценить степень сжатия, которая составит примерно 6.3 раза (из каждого блока выбирается 27 комплексных значений гармоник с соответствующими им частотами, т.о., учитывая перекрытие, получим (1024-512)/(27*3)=6.3 ).

Выявлено, что используемый алгоритм не позволяет добиться приемлемого качества звука. Особенно плохо методом обрабатываются шумовые звуки (например, шум моря), это объясняется тем, что спектр шума имеет равномерное распределение составляющих с примерно равной амплитудой по всему диапазону и не соответствует первоначальному предположению о маскировании максимальной составляющей всех других гармоник в критической полосе; также плохо обрабатываются звуки, основная часть спектра которых приходится на высокочастотные составляющие, где ширина критических полос наиболее велика, а следовательно основная часть спектра становится отброшенной.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]