
- •Лекция №1
- •Анализ речевых сигналов в частотной области
- •Гомоморфная обработка речевых сигналов
- •Анализ речи на основе линейного предсказания.
- •Сжатие речевых сигналов
- •Обработка речевых и аудио сигналов
- •Свойства речевых сигналов
- •Дискретизация и квантование речевых сигналов
- •Анализ речевых сигналов во временной области
- •Лекция №2
- •Сжатие аудио сигналов.
- •Перцептивное кодирование аудио сигналов
- •Упрощенная схема перцептивного кодера аудио сигнала на основе дискретно - косинусного преобразования (дкп)
- •Обработка изображений
- •Устройство компьютерной системы обработки изображение
- •Последовательность операций видеокамер
- •Основные действия, выполняемые в видеопроцессоре
- •Операции над изображениями
- •Основные характеристики цифрового изображения
- •Лекция №3
- •1. Сжатие полутоновых, черно-белых, цветных изображений. Кодирование изображения с частичной потерей информации.
- •Кодирование изображения методом импульсно-кодовой модуляции(икм) и дифференциальной икм(дикм)
- •Структурная схема цифрового дикм
- •Кодирование изображения с преобразованием
- •Стандартная процедура кодирования изображения jpeg»
- •«Цифровые процессоры обработки сигналов (цпос – дсп) и их классификация»
- •Лекция №4
- •Область применения и основные функции организованные на базе dsp
- •Мас операции и другие операции при обработке цпос
- •3. Архитектурные особенности dsp Motorola.
- •Инструментальные средства разработки систем на основе цпос.
- •Системная плата
Лекция №1
Анализ речевых сигналов в частотной области
Основные способы формирования речевого сигнала в частотной области называются кратковременным спектральным анализом, который может быть реализован с использованием гребенки полосовых фильтров, либо с помощью ДПФ(дискретное преобразование Фурье).
Гомоморфная обработка речевых сигналов
Речевой сигнал является сверткой случайного шума и импульсной характеристики сигнала голосового тракта. Схема гомоморфной обработки речи имеет вид:
Где D{} – оператор нелинейного преобразования
T{} – соответствует линейной инвариантной системе.
Считается, что сигнал х[n] является сверткой двух последовательностей x1[n] и x2[n], тогда: x[z] = x1[z]* x2[z]. Линейная инвариантная система пропускает на выход либо x1[z], либо x2[z].
D-1{} – обратное преобразование. В результате Y[n] = x1[n], либо Y[n]=x2[n].
Гомоморфная обработка речи разделяет входные компоненты речи x1[n] и x2[n], соединенные во входном сигнале.
Анализ речи на основе линейного предсказания.
Анализ основывается на использовании модели речевого сигнала. Основная задача анализа речи в том, чтобы для последовательности отсчетов речевого сигнала S[n] определить коэффициент a[k] цифрового фильтра указанной модели. Этот коэффициент еще называют коэффициентом линейного предиктивного кодирования ЛПК. Они определяются при нахождении частоты основного тона при кодировании речи в соответствии с адаптивной дифференциальной импульсной кодовой модуляцией в задачах распознавания синтеза речи.
Основное допущение при использовании метода в том, что речевой сигнал на выходе голосового тракта S[n] может быть представлен в виде линейной комбинации своих предыдущих значений и значений сигналов a[k]:
, где G – коэффициент
усиления, p – порядок
линейного предсказания.
В этом случае передаточная функция фильтра соответствует ПФ рекурсивного фильтра.
Сжатие речевых сигналов
Данный принцип используется в схемах низкочастотной передачи речи и в мультимедийных системах. Он основывается на использовании методов линейного предсказания речи. Сжатие речевых сигналов осуществляется по схеме:
УО – устройство оценивания, с его помощью определяются коэффициенты линейного инверсного фильтра;
ВОТ – выделитель основного тона;
Т-Ш – анализатор тон-шум.
Кодер используется для кодирования коэффициентов фильтра и параметров функции возбуждения.
Обработка речевых и аудио сигналов
Свойства речевых сигналов
1 – генератор импульсной последовательности (ГИП)
2 – генератор случайных чисел (ГСЧ)
3 – цифровой фильтр с переменными параметрами
В соответствии с моделью вокализованные (звонкие) звуки формируются с помощью ГИП. Фрикативные (шумовые) формируются с помощью ГСЧ. Период следования импульсов на выходе ГИП соответствует основному периоду звуков, возбуждаемых голосовыми связками. ГСЧ формирует шумовой сигнал с равномерной спектральной плотностью. Амплитуда входного сигнала U[n] в цифровом фильтре определяется коэффициентом усиления G. Вокализованный звук – квазипериодические сигналы. Фрикативные звуки имеют случайный характер и более широкий частотный диапазон. Вокализованные звуки имеют большую энергию
Данная модель характеризуется:
использованием классификатора вокализованного и фрикативного звуков;
периодом основного тона;
коэффициентом усиления G;
параметрами цифрового фильтра.
Выбор способов представления речевого сигнала зависит от решаемой задачи и бывает 3-х классов:
задачи анализа речи
синтез речи по тексту
анализ сжатия речевых сигналов в схеме для передачи по компьютерным сетям.