Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Teoria_informatsii / Лекция 4.ppt
Скачиваний:
156
Добавлен:
22.03.2016
Размер:
325.12 Кб
Скачать

Сжатие звуковой информации

При сжатии звуковой информации широкой применение получили методы компрессии, основанные на нелинейной ИКМ.

Основная идея рассматриваемых методов заключается в том, что слух человека устроен так, что практически нечувствителен к небольшим искажениям громких звуков, зато очень хорошо замечает те же искажения в более тихих звуках. Для обеспечения такой чувствительности можно воспользоваться логарифмическими преобразованиями.

Сжатие звуковой информации

Наиболее широко используются методы - и A-типа.

Метод -типа основан на применении формулы (s и s – исходное и преобразованное значения выборки, при этом s представляет собой дробное число в диапазоне от –1 до +1 ):

s 18 sign(s)log(1 255 | s |),

1, s 0, sign(s) 1, s 0.

Сжатие звуковой информации

В методе A-типа используется коэффициент A, чаще всего имеющий значение 87.6. Для выборок, значения которых лежат в диапазоне от 0 до 1, метод задается следующей формулой (s и sA – исходное и преобразованное значения выборки ):

 

 

 

As

, s

1

,

 

 

 

 

 

 

1

ln A

A

 

 

 

 

 

 

 

 

 

sA

1

ln(As)

 

1

 

 

 

,

 

s 1.

1 ln A

A

Сжатие речи

Для компрессии речи разработаны специальные методы. Самый простой метод кодирования речи называется кодированием пауз. Он основан на том, что в речи человека присутствует много пауз. Часть их – короткие паузы между словами и фразами, остальное – более длинные паузы между предложениями или репликами разных людей. Часто, выделяя эти паузы и заменяя их компактными кодами, в которых указывается длительность паузы, за счет сжатия удается сэкономить до 50% первоначального объема речевой информации.

Сжатие речи

Более изощренные алгоритмы состоят из двух частей.

Первая – это математическая модель голосового тракта человека. Она представляет собой последовательность уравнений, в которых используется информация о гортани, горле, языке и губах человека для получения звуков, подобных тем, что издает человек.

Вторая часть – анализирующий механизм, на основании считанного звука подготавливающий параметры для этой модели.

При компрессии разговора используется анализирующее устройство, формирующее последовательность параметров.

При декомпрессии записанные параметры передаются в модель голосового тракта и получаются звуки. С помощью подобной технологии удается сжать речь человека в 100 раз и более, сохранив при этом хорошее качество звучания.

Соседние файлы в папке Teoria_informatsii