- •1.1. Введение. Роль информационных технологий.
- •1.2. Компьютеризированные системы цифровой обработки
- •1.3. Классификация сигналов. Их характеристики.
- •Энергетические характеристики сигналов:
- •2.1. Обобщенный ряд Фурье и системы базисных функций.
- •2.2. Разложение в ряд Фурье.
- •2.3. Примеры разложения в ряд Фурье.
- •Б) Пилообразный сигнал.
- •3.1 Преобразование Фурье.
- •3.2. Свойства преобразования Фурье.
- •4.1. Аналоговые, дискретные и цифровые сигналы.
- •4.2. Частота Найквиста.
- •4.3. Спектр дискретного сигнала.
- •4.4. Теорема Котельникова.
- •Частота дискретизации
- •5.1. Функции окна.
- •5.2. Виды окон.
- •5.3. Особенности функций окна.
- •6.1. Нерекурсивные фильтры
- •6.1.1. Алгоритм.
- •6.1.2. Импульсная характеристика.
- •6.1.3. Передаточная функция.
- •6.1.4. Определение параметров нерекурсивного фильтра низкой частоты.
- •6.1.5. Синтез нрф с использованием окон.
- •6.1.5. Расчет коэффициентов фильтра.
- •6.2. Явление Гиббса.
- •7.1. Коэффициенты для высокочастотных, полосовых и
- •7.2. Расчет вч, пф и рф.
- •Преобразование фнч в пф.
- •Преобразование фнч в режекторный фильтр.
- •8.1. Корреляционный анализ.
- •9.1. Основные свойства речевых сигналов.
- •9.2. Дискретизация и квантование речевых сигналов.
- •Обработке речевых и аудио сигналов.
- •10.1. Анализ речевых сигналов во временной области.
- •Одним из важных параметров речевого сигнала является его энергия:
- •Энергия может служить хорошей мерой отличия вокализованных и невокализованных участков речи. Энергия невокализованных участков речи намного меньше, чем вокализованных.
- •10.2. Анализ речевых сигналов в частотной области.
- •10.3. Гомоморфная обработка речи.
- •10.4. Психоакустическая модель восприятия звука.
- •Технологии при обработке и анализе изображений.
- •11.1. Обработка изображений, предназначенных для зрительного
- •Применение обработки изображений в задачах анализа.
- •Теоретические основы обработки изображений.
- •11.2. Сигналы во временной и пространственной областях.
- •12.1. Модель реставрации изображений.
- •12.2. Методы повышения контраста.
- •13.1. Операторы сглаживания.
- •Низкочастотные операторы с усреднением.
- •Низкочастотные гауссовские операторы.
- •12.2. Другие методы сглаживания.
- •Пороговое сглаживание.
- •Сигнально-адаптивные сглаживающие операторы.
- •Подчеркивание контуров низкочастотным оператором.
- •Подчеркивание контуров дифференциальным оператором.
- •Градиентные операторы.
- •Операторы Лапласа.
- •Специальные методы обострения контуров.
- •14.1. Основные требования к алгоритмам сжатия изображений. Класс изображений.
- •Примеры приложений, использующих алгоритмы компрессии графики
- •Требования к алгоритму.
- •Критерии оценки алгоритмов сжатия изображений.
- •14.2. Алгоритмы архивации без потерь.
- •14.2.1. Алгоритм rle.
- •14.2.2. Алгоритм lzw.
- •14.2.3. Алгоритм Хаффмана.
- •15.1. Алгоритм jpeg.
- •Работа алгоритма.
- •Характеристики алгоритма jpeg.
- •15.2. Рекурсивный (волновой) алгоритм.
- •Заключение.
9.1. Основные свойства речевых сигналов.
Голосовой аппарат человека представляет собой акустическую систему, состоящую из ротового и носового каналов, возбуждаемую квазипериодическими импульсными колебаниями голосовых связок и турбулентным шумом. Турбулентный шум образуется путем проталкивания воздуха через сужения в определенных областях голосового тракта. Голосовой аппарат, возбуждаемый указанными источниками, действует как линейный фильтр с изменяющимися во времени параметрами, на выходе которого формируется речевой сигнал. На коротких интервалах времени речевой сигнал можно аппроксимировать сверткой возбуждающего сигнала с импульсной характеристикой голосового тракта. На рис.1. изображена упрощенная модель формирования речевого сигнала. В соответствии с этой моделью вокализованные (звонкие) звуки формируются с помощью генератора импульсной последовательности, а фрикативные (шумовые) - с помощью генератора случайных чисел.
Рис.1. Цифровая модель формирования речевого сигнала.
Период
следования импульсов на выходе генератора
импульсной последовательности
соответствует основному
периоду
возбуждения
голосовыми связками. Генератор случайных
чисел формирует шумовой сигнал с
равномерной спектральной плотностью.
Цифровой
фильтр
(ЦФ) с переменными параметрами
аппроксимирует передаточные свойства
голосового тракта. На временном интервале
порядка
мс форма голосового тракта не меняется,
поэтому характеристики ЦФ на данном
интервале остаются постоянными. Амплитуда
входного сигнала
цифрового фильтра определяется
коэффициентом усиления
.
Вокализованные
звуки
представляют собой квазипериодические
сигналы, гармоническая структура которых
хорошо видна на графике кратковременного
спектра. Фрикативные
звуки
имеют случайный характер и занимают
более широкий частотный диапазон.
Энергия вокализованных звуков речи
намного больше, чем энергия фрикативных
звуков. Структура кратковременного
спектра вокализованных участков речи
характеризуется наличием медленно
меняющейся и быстро меняющейся
составляющих. Быстро меняющаяся или
пульсирующая составляющая обусловлена
квазипериодическими колебаниями
голосовых связок. Медленно меняющаяся
составляющая связана с собственными
(резонансными) частотами голосового
тракта – формантами.
В среднем насчитывается
формант. Первые три форманты оказывают
существенное влияние на синтез и
восприятие вокализованных участков
речи. Их частоты находятся ниже
кГц.
Форманты с более высокими частотами
оказывают влияние на синтез и представление
фрикативных звуков.
Рассмотренная цифровая модель формирования речевого сигнала характеризуется следующими параметрами: наличием классификатора вокализованных и невокализованных звуков (переключатель тон/шум), периодом основного тона, коэффициентом усиления , параметрами (коэффициентами) ЦФ.
На рассмотренной модели базируются многочисленные способы представления речевых сигналов: от простейшей периодической дискретизации речевого сигнала до оценок параметров модели, представленной на рис.1.
Выбор того или иного способа представления речевого сигнала определяется решаемой задачей, которые разделяются на три класса:
1. К первому классу относят задачи, связанные с анализом речи. Анализ речи является неотъемлемой частью систем распознавания речевых сигналов, а также систем идентификации дикторов по голосу.
2. Ко второму классу относят задачи, связанные с синтезом речи по тексту. Задачи такого типа возникают в многочисленных информационно-справочных системах.
3. В задачах, относящихся к третьему классу, выполняется анализ системы сжатия речевых сигналов с целью передачи речи по компьютерным сетям или по традиционным линиям связи.
Одним из перспективных направлений применения обработки речевых сигналов являются системы распознавания речи в сети Internet. В этом случае пользователь сети, используя телефон, может соединиться с программой распознавания речи, находящейся на сервере и транслирующей диалог в команды Web-сервера. Это позволяет получить доступ к распределенным информационным ресурсам сети по телефону. Данная технология, использующая методы цифровой обработки сигналов, базируется на использовании специального языка программирования Web-серверов VoxML (Voice Markup Language).
В дальнейшем рассмотрим основные способы цифрового представления и обработки речевых сигналов, применяемые как в задачах анализа речевых сигналов, так и в задачах синтеза.
