
- •Лекция №1
- •Анализ речевых сигналов в частотной области
- •Гомоморфная обработка речевых сигналов
- •Анализ речи на основе линейного предсказания.
- •Сжатие речевых сигналов
- •Обработка речевых и аудио сигналов
- •Свойства речевых сигналов
- •Дискретизация и квантование речевых сигналов
- •Анализ речевых сигналов во временной области
- •Лекция №2
- •Сжатие аудио сигналов.
- •Перцептивное кодирование аудио сигналов
- •Упрощенная схема перцептивного кодера аудио сигнала на основе дискретно - косинусного преобразования (дкп)
- •Обработка изображений
- •Устройство компьютерной системы обработки изображение
- •Последовательность операций видеокамер
- •Основные действия, выполняемые в видеопроцессоре
- •Операции над изображениями
- •Основные характеристики цифрового изображения
- •Лекция №3
- •1. Сжатие полутоновых, черно-белых, цветных изображений. Кодирование изображения с частичной потерей информации.
- •Кодирование изображения методом импульсно-кодовой модуляции(икм) и дифференциальной икм(дикм)
- •Структурная схема цифрового дикм
- •Кодирование изображения с преобразованием
- •Стандартная процедура кодирования изображения jpeg»
- •«Цифровые процессоры обработки сигналов (цпос – дсп) и их классификация»
- •Лекция №4
- •Область применения и основные функции организованные на базе dsp
- •Мас операции и другие операции при обработке цпос
- •3. Архитектурные особенности dsp Motorola.
- •Инструментальные средства разработки систем на основе цпос.
- •Системная плата
Дискретизация и квантование речевых сигналов
Дискретизация непрерывных речевых сигналов осуществляется в соответствии с теоремой Котельникова и при этом осуществляется импульсная кодовая модуляция ИКМ. Выбор частоты дискретизации обусловлен условием задачи. Количество действий, выполняемых при обработке речевых сигналов, зависит от частоты дискретизации, которую необходимо по возможности снижать. Для этого перед дискретизацией регулируется сигнал, его предварительно обрабатывают аналоговым ФНЧ, устраняются высокочастотные составляющие речевого сигнала.
Для кодирования отсчета речевого сигнала решается задача выборки. Характеристика точности представления сигнала с помощью ИКМ называется шум квантования.
x[n] – исходная речевая последовательность
Q{x[n]} – оператор квантования
Перед квантованием речевой сигнал обрабатывается в компрессоре, а при восстановлении исходного сигнала применяется экспандер. Совокупность этих двух устройств – колепандр.
- восстановленный сигнал, отличается
от x[n] на величину шума квантования
разностного сигнала
Для предсказания речевого сигнала используется нерекурсивный цифровой фильтр.
Анализ речевых сигналов во временной области
Одним из главных параметров речевых сигналов есть энергия.
Лекция №2
Схема анализа и синтеза с обратной связью.
Д
ля
повышения натуральности воспроизводимой
речи используется схема анализа и
синтеза с обратной связью. В этой схеме
формируется возбуждающая последовательность
путем минимизации ошибки восстановления
речевого сигнала.
^S[n] S[n]
Ф1 Ф2
Восстановление речевого сигнала формируется с помощью фильтров Ф1 и Ф2.
Ф1- функционирует с учетом квазипериода вокализованных участков речи.
Ф2- моделирует форматную структуру речи.
ФВ- генератор функции возбуждения.
W(z)- фильтр с периодической функцией позволяющий учесть особенности слухового восприятия.
Принцип работы схемы заключается в выборе функции возбуждения. ФВ минимизирует квадрат ошибки (МКО) восстановления звукового сигнала.
Сжатие аудио сигналов.
В сравнении с речевыми сигналами аудио сигналы более широкий частотный диапазон от 10 -22 Гц.
Внутреннее ухо человека выполняет кратковременный спектральный анализ, который можно представить в виде механизма критических частотных полос. Если в критической частотной полосе несколько спектральных составляющих, то при этом наблюдается явление частотного маскирования. Его суть заключается в том, что спектральная составляющая с низким уровнем может не прослушиваться, если в этой же критической полосе имеется спектральная составляющая звука с более высоким уровнем, который повышает порог слышимости, и маскирует присутствие составляющих с низким уровнем.
Повышенный порог слышимости называется порогом маскирования. Все спектры составляющих сигналов, уровень которых ниже порога маскирования не прослушиваются. Зависимость порога маскирования от частоты определенных уровнем и частотой маскировочной составляющей, а также уровнем и частотами маскируемых спектральных составляющих.
Порог маскирования имеет максимальное значение на частоте маскирующей спектральной составляющей и снижает с преувеличений или уменьшений частоты.