- •1.1. Введение. Роль информационных технологий.
- •1.2. Компьютеризированные системы цифровой обработки
- •1.3. Классификация сигналов. Их характеристики.
- •Энергетические характеристики сигналов:
- •2.1. Обобщенный ряд Фурье и системы базисных функций.
- •2.2. Разложение в ряд Фурье.
- •2.3. Примеры разложения в ряд Фурье.
- •Б) Пилообразный сигнал.
- •3.1 Преобразование Фурье.
- •3.2. Свойства преобразования Фурье.
- •4.1. Аналоговые, дискретные и цифровые сигналы.
- •4.2. Частота Найквиста.
- •4.3. Спектр дискретного сигнала.
- •4.4. Теорема Котельникова.
- •Частота дискретизации
- •5.1. Функции окна.
- •5.2. Виды окон.
- •5.3. Особенности функций окна.
- •6.1. Нерекурсивные фильтры
- •6.1.1. Алгоритм.
- •6.1.2. Импульсная характеристика.
- •6.1.3. Передаточная функция.
- •6.1.4. Определение параметров нерекурсивного фильтра низкой частоты.
- •6.1.5. Синтез нрф с использованием окон.
- •6.1.5. Расчет коэффициентов фильтра.
- •6.2. Явление Гиббса.
- •7.1. Коэффициенты для высокочастотных, полосовых и
- •7.2. Расчет вч, пф и рф.
- •Преобразование фнч в пф.
- •Преобразование фнч в режекторный фильтр.
- •8.1. Корреляционный анализ.
- •9.1. Основные свойства речевых сигналов.
- •9.2. Дискретизация и квантование речевых сигналов.
- •Обработке речевых и аудио сигналов.
- •10.1. Анализ речевых сигналов во временной области.
- •Одним из важных параметров речевого сигнала является его энергия:
- •Энергия может служить хорошей мерой отличия вокализованных и невокализованных участков речи. Энергия невокализованных участков речи намного меньше, чем вокализованных.
- •10.2. Анализ речевых сигналов в частотной области.
- •10.3. Гомоморфная обработка речи.
- •10.4. Психоакустическая модель восприятия звука.
- •Технологии при обработке и анализе изображений.
- •11.1. Обработка изображений, предназначенных для зрительного
- •Применение обработки изображений в задачах анализа.
- •Теоретические основы обработки изображений.
- •11.2. Сигналы во временной и пространственной областях.
- •12.1. Модель реставрации изображений.
- •12.2. Методы повышения контраста.
- •13.1. Операторы сглаживания.
- •Низкочастотные операторы с усреднением.
- •Низкочастотные гауссовские операторы.
- •12.2. Другие методы сглаживания.
- •Пороговое сглаживание.
- •Сигнально-адаптивные сглаживающие операторы.
- •Подчеркивание контуров низкочастотным оператором.
- •Подчеркивание контуров дифференциальным оператором.
- •Градиентные операторы.
- •Операторы Лапласа.
- •Специальные методы обострения контуров.
- •14.1. Основные требования к алгоритмам сжатия изображений. Класс изображений.
- •Примеры приложений, использующих алгоритмы компрессии графики
- •Требования к алгоритму.
- •Критерии оценки алгоритмов сжатия изображений.
- •14.2. Алгоритмы архивации без потерь.
- •14.2.1. Алгоритм rle.
- •14.2.2. Алгоритм lzw.
- •14.2.3. Алгоритм Хаффмана.
- •15.1. Алгоритм jpeg.
- •Работа алгоритма.
- •Характеристики алгоритма jpeg.
- •15.2. Рекурсивный (волновой) алгоритм.
- •Заключение.
9.2. Дискретизация и квантование речевых сигналов.
Простейшее
цифровое представление речи заключается
в непосредственной дискретизации
непрерывного речевого сигнала в
соответствии с теоремой
Котельникова
(см. Лекцию №4 «Дискретные сигналы»).
Такое представление речевого сигнала
соответствует импульсно-кодовой
модуляции
(ИКМ).
Выбор частоты дискретизации зависит
от конкретных условий решаемой задачи.
Фрикативные звуки речи занимают
сравнительно широкую полосу частот
(примерно до
кГц).
Вокализованные звуки, значительно
влияющие на разборчивость речи, занимают
полосу частот до
кГц.
Таким образом, обычно используемая
частота дискретизации выбирается в
пределах от
до
кГц.
Следует отметить, что количество операций, выполняемое при обработке речи, находится в прямой зависимости от частоты дискретизации. Поэтому в соответствии с условиями решаемой задачи необходимо по возможности снижать частоту дискретизации. Для этого перед дискретизацией речевой сигнал предварительно обрабатывают с помощью аналогового ФНЧ, устраняя нежелательные высокочастотные составляющие.
Выбор
числа двоичных единиц
для
кодирования одного отсчета речевого
сигнала определяется задачей обработки.
Объективной характеристикой точности
представления сигнала посредством ИКМ
является шум
квантования:
,
(1)
где
– исходная речевая последовательность;
– оператор квантования.
Можно показать, что при равномерном квантовании отношение сигнал шум (ОСШ), выраженное в децибелах, будет равно:
.
(2)
Например,
если
,
то
,
что служит мерой
качества хорошего
телефонного канала связи. Добавление
одного двоичного разряда для представления
отсчета речевого сигнала увеличивает
на
дБ.
Таким образом, для представления речевых
сигналов посредством ИКМ требуется
скорость передачи в пределах от
до
бит/с.
Это необходимо учитывать при компьютерном
хранении и обработке речи. Например,
речевой сигнал длительностью
с
будет занимать объём памяти примерно
в
Мбайт.
Для снижения скорости передачи речевых сигналов и, соответственно, уменьшения объемов требуемой памяти сокращают число двоичных единиц, выделяемых на один отсчет. Ключом к решению задачи является учет того обстоятельства, что для вокализованных участков речи, имеющих большую амплитуду, можно использовать большой шаг квантования, а для невокализованных – мелкий, т.е. квантование должно выполняться с неравномерным шагом. Это стабилизирует отношение сигнал/шум и делает его, не зависящим от уровня сигнала.
Чтобы относительная ошибка квантования оставалась постоянной при изменении амплитуды речевого сигнала, уровни квантования должны быть распределены по логарифмическому закону. Вместо распределения уровней квантования по логарифмическому закону можно выполнять квантование логарифма речевого сигнала. В этом случае перед квантованием речевой сигнал обрабатывают в компрессоре, а при восстановлении исходного речевого сигнала используют экспандер. Совокупность этих двух устройств называют компандером. Одной из часто используемых характеристик компрессии является функция:
.
(3)
Функция
компрессии (3) называется
-законом.
Экспандер
реализует соответствующую обратную
функцию:
.
(4)
При
использовании компрессора, функционирующего
на основе (3), для обеспечения
дБ
достаточно
бит
на один отсчет речевого сигнала, т.е.
скорость
передачи
может быть снижена по сравнению с
равномерным квантованием в
раз. Отметим, что формулы (3) и (4) требуют,
чтобы все отсчеты
находились
в интервале
.
Любой
отсчет, не принадлежащий указанному
интервалу, полагается равным
.
Значения
константы
обычно равны
;
;
.
Другой
подход к снижению скорости передачи
основан на учете избыточности
речевого сигнала.
Соседние отсчеты речевого сигнала,
дискретизированного в соответствии с
теоремой Котельникова, имеют сравнительно
высокую корреляцию. Это позволяет по
предыдущим отсчетам предсказать текущее
значение речевого сигнала. Предположим,
что
является
предсказанным значением речевого
сигнала
.
Если
это предсказание является достаточно
точным, то ошибка
предсказания:
(5)
должна иметь небольшую величину, и, следовательно, дисперсия ошибки квантования разностного сигнала будет меньше, чем дисперсия ошибки квантования отсчетов речи . Таким образом, квантователь с заданным количеством уровней обеспечит меньшую погрешность при квантовании разностного сигнала, чем при квантовании исходного сигнала. Поэтому для представления разностного сигнала требуется меньшее число двоичных разрядов.
Квантователь,
построенный на использовании указанного
подхода, называется дифференциальным
(разностным)
импульсно-кодовым модулятором
(ДИКМ).
Схема его показана на рис.2. Здесь
представляет восстановленный сигнал,
образуемый путем добавления квантованного
разностного сигнала
к
.
Кодер: Декодер:
Рис.2. Общая схема ДИКМ.
Покажем, что восстановленный сигнал будет отличаться от на величину шума квантования разностного сигнала:
.
(6)
Заметим, что:
.
(7)
Тогда, подставляя (5) и (7) в (6), получим искомый результат:
.
(8)
Для
предсказания значений речевого сигнала
в схеме используется нерекурсивный ЦФ
с передаточной функцией
,
реализующей уравнение:
(9)
В простейшем случае для предсказания используют фильтр первого порядка.
В том случае, когда для кодирования разностного сигнала используется один бит, рассматриваемый модулятор называется дельта-модулятором. Обычно дельта модулятор функционирует на более высоких частотах дискретизации, чем ДИКМ.
Для уменьшения ошибки квантования в ДИКМ может применяться адаптивное изменение шага квантования и коэффициентов предсказывающего фильтра. Такие модуляторы называются адаптивными дифференциальными импульсно-кодовыми модуляторами (АДИКМ). Коэффициенты предсказывающего фильтра вычисляются в устройстве оценивания (УО) так, чтобы минимизировать дисперсию ошибки предсказания (5). Оценивание коэффициентов предсказывающего фильтра возможно как по входной речевой последовательности , так и по восстановленной последовательности . Основные принципы вычисления коэффициентов линейного предсказания будут рассмотрены ниже.
АДИКМ
позволяет снизить скорость передачи
до
.
Благодаря этому АДИКМ широко применяется
для представления речевых сигналов в
компьютерных системах.
Тема: ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В
