- •1.1. Введение. Роль информационных технологий.
- •1.2. Компьютеризированные системы цифровой обработки
- •1.3. Классификация сигналов. Их характеристики.
- •Энергетические характеристики сигналов:
- •2.1. Обобщенный ряд Фурье и системы базисных функций.
- •2.2. Разложение в ряд Фурье.
- •2.3. Примеры разложения в ряд Фурье.
- •Б) Пилообразный сигнал.
- •3.1 Преобразование Фурье.
- •3.2. Свойства преобразования Фурье.
- •4.1. Аналоговые, дискретные и цифровые сигналы.
- •4.2. Частота Найквиста.
- •4.3. Спектр дискретного сигнала.
- •4.4. Теорема Котельникова.
- •Частота дискретизации
- •5.1. Функции окна.
- •5.2. Виды окон.
- •5.3. Особенности функций окна.
- •6.1. Нерекурсивные фильтры
- •6.1.1. Алгоритм.
- •6.1.2. Импульсная характеристика.
- •6.1.3. Передаточная функция.
- •6.1.4. Определение параметров нерекурсивного фильтра низкой частоты.
- •6.1.5. Синтез нрф с использованием окон.
- •6.1.5. Расчет коэффициентов фильтра.
- •6.2. Явление Гиббса.
- •7.1. Коэффициенты для высокочастотных, полосовых и
- •7.2. Расчет вч, пф и рф.
- •Преобразование фнч в пф.
- •Преобразование фнч в режекторный фильтр.
- •8.1. Корреляционный анализ.
- •9.1. Основные свойства речевых сигналов.
- •9.2. Дискретизация и квантование речевых сигналов.
- •Обработке речевых и аудио сигналов.
- •10.1. Анализ речевых сигналов во временной области.
- •Одним из важных параметров речевого сигнала является его энергия:
- •Энергия может служить хорошей мерой отличия вокализованных и невокализованных участков речи. Энергия невокализованных участков речи намного меньше, чем вокализованных.
- •10.2. Анализ речевых сигналов в частотной области.
- •10.3. Гомоморфная обработка речи.
- •10.4. Психоакустическая модель восприятия звука.
- •Технологии при обработке и анализе изображений.
- •11.1. Обработка изображений, предназначенных для зрительного
- •Применение обработки изображений в задачах анализа.
- •Теоретические основы обработки изображений.
- •11.2. Сигналы во временной и пространственной областях.
- •12.1. Модель реставрации изображений.
- •12.2. Методы повышения контраста.
- •13.1. Операторы сглаживания.
- •Низкочастотные операторы с усреднением.
- •Низкочастотные гауссовские операторы.
- •12.2. Другие методы сглаживания.
- •Пороговое сглаживание.
- •Сигнально-адаптивные сглаживающие операторы.
- •Подчеркивание контуров низкочастотным оператором.
- •Подчеркивание контуров дифференциальным оператором.
- •Градиентные операторы.
- •Операторы Лапласа.
- •Специальные методы обострения контуров.
- •14.1. Основные требования к алгоритмам сжатия изображений. Класс изображений.
- •Примеры приложений, использующих алгоритмы компрессии графики
- •Требования к алгоритму.
- •Критерии оценки алгоритмов сжатия изображений.
- •14.2. Алгоритмы архивации без потерь.
- •14.2.1. Алгоритм rle.
- •14.2.2. Алгоритм lzw.
- •14.2.3. Алгоритм Хаффмана.
- •15.1. Алгоритм jpeg.
- •Работа алгоритма.
- •Характеристики алгоритма jpeg.
- •15.2. Рекурсивный (волновой) алгоритм.
- •Заключение.
10.3. Гомоморфная обработка речи.
Речевой сигнал является сверткой функции возбуждения (случайного шума либо квазипериодической последовательности импульсов) и импульсной характеристики голосового тракта. Гомоморфный анализ речи позволяет разделить эти компоненты. Поэтому, используя гомоморфный анализ, можно определить период основного тона и частотные свойства голосового тракта. Общая схема гомоморфной обработки приведена на рис. 3.
Рис. 3. Общая схема гомоморфной обработки.
В
соответствии с этой схемой сначала
выполняется нелинейное преобразование
сигнала
,
которое определяется отношением:
.
(6)
Затем
выполняется оператор
,
который соответствует линейной
инвариантной системе. В конце реализуется
преобразование
.
Пусть
сигнал
является сверткой двух последовательностей
и
.
Тогда:
. (7)
Подставив (7) в (6), получим:
. (8)
Линейная
инвариантная система пропускает на
выход только одну из компонент
или
.
Соответственно обратное преобразование
дает
или
.
Следовательно, гомоморфная обработка
разделяет входные компоненты
и
,
содержащиеся во входном сигнале.
Рис. 4. Гомоморфная система анализа речи.
Гомоморфная система анализа речи показана на рис. 4. Здесь на первом этапе вычисляется логарифм модуля кратковременного преобразования Фурье. Если предположить, что сигнал в точке А является сверткой функции возбуждения и импульсной характеристики голосового тракта, то в точке С мы получим сумму логарифмов спектра функции возбуждения и импульсной характеристики голосового тракта. Сигнал в точке D, полученный с помощью обратного дискретного преобразования Фурье, называется кепстром. Кепстр в точке D равен сумме кепстров функции возбуждения и импульсной характеристики голосового траста.
10.4. Психоакустическая модель восприятия звука.
По
сравнению с речевыми сигналами
аудиосигналы характеризуются более
широким частотным диапазоном (
Гц), большим динамическим диапазоном,
большей изменчивостью спектральных
свойств, многоканальностью (стерео
звук). Частота дискретизации аудиосигналов
обычно равна
кГц. Данная частота используется при
обработке звука в цифровых магнитофонах,
при записи звука на компакт диски. Каждый
отсчет звукового сигнала представляется
-ти
разрядным двоичным кодом. В случае
стерео звука это создает цифровой поток
со скоростью передачи
Мбит/с.
На практике из-за наличия дополнительной
служебной информации скорость передачи
оказывается существенно выше. Так, при
считывании отсчетов звукового сигнала
с компакт диска формируется цифровой
поток со скоростью
Мбит/с. Ограниченная пропускная
способность каналов связи, ограниченная
емкость запоминающих устройств
требуют сжатия аудиосигналов.
Сжатие аудиосигналов основано на учете особенностей слуха человека. Ухо человека воспринимает звуковой сигнал в изолированном от внешних шумов помещении, если звуковое давление превышает некоторый порог, называемый абсолютным порогом слышимости (АПС). Зависимость АПС от частоты аппроксимируется нелинейной функцией:
дБ. (9)
Как отмечалось выше, внутренне ухо человека выполняет кратковременный спектральный анализ на основе механизма критических частотных полос. Если в критической частотной полосе находится несколько спектральных составляющих, то наблюдается явление частотного маскирования. Суть его состоит в том, что спектральная составляющая (тон) с низким уровнем может не прослушиваться, если в этой же критической полосе имеется спектральная составляющая звука с более высоким уровнем. Спектральная составляющая с высоким уровнем повышает порог слышимости и маскирует присутствие, составляющих с низким уровнем. Повышенный порог слышимости называется порогом маскирования. Все спектральные составляющие, уровень которых ниже порога маскирования, не прослушиваются.
Зависимость порога мшиваются.
Зависимость порога мтся уровнем и частотой маскирующей составляющей, а также уровнями и частотами маскируемых спектральных составляющих. Порог маскирования имеет максимальное значение на частоте маскирующей спектральной составляющей и снижается при уменьшении или увеличении частоты. При уменьшении частоты относительно частоты маскирующей составляющей порог маскирования снижается быстрее, чем при её увеличении, т.е. составляющие, частоты которых лежат выше частоты маскирующей частотной составляющей, маскируются в большей степени.
На практике наблюдается присутствие маскирующих спектральных составляющих во многих полосах. Такие составляющие оказывают взаимное влияние на пороги маскирования в соседних полосах. В результате этого образуется суммарный порог маскирования. Частотные составляющие, уровень которых ниже суммарного порога маскирования, не воспринимаются на слух и, соответственно, могут быть исключены из спектра сигнала при его записи и хранении в запоминающих устройствах или при передаче по каналам связи. Это позволяет снизить требования к емкости запоминающих устройств или пропускной способности каналов связи.
Помимо частотного маскирования, описанного выше, важную роль в восприятии звука играет временное маскирование. Временное маскирование наблюдается в том случае, когда два звука появляются через короткий интервал времени. Тогда звук, характеризующийся большим уровнем звукового давления, может частично или полностью маскировать присутствие звука с меньшим звуковым давлением, даже в том случае, если маскируемый звук предшествует маскирующему. Это связано с переходными процессами во внутреннем ухе, которые формируются маскирующим звуком.
Продолжительность
эффекта временного маскирования до
восприятия маскирующего звука равна
примерно
мс. Продолжительность маскирующего
эффекта после окончания восприятия
маскирующего звука равна
мс. Временное маскирование используется
для подавления предварительного
эхо, которое наблюдается при восстановлении
сжатых звуковых сигналов. Предварительное
эхо
прослушивается до появления
восстановленного звукового сигнала
и обусловлено шумами квантования,
распространяющими свое действие на
весь блок данных, подвергшийся сжатию,
в том числе и на ту его часть, которая
предшествовала звуку.
Тема: КОМПЬЮТЕРНЫЕ ИНФОРМАЦИОННЫЕ
