Сжатие звуковой информации

При сжатии звуковой информации широкой применение получили методы компрессии, основанные на нелинейной ИКМ.

Основная идея рассматриваемых методов заключается в том, что слух человека устроен так, что практически нечувствителен к небольшим искажениям громких звуков, зато очень хорошо замечает те же искажения в более тихих звуках. Для обеспечения такой чувствительности можно воспользоваться логарифмическими преобразованиями.

Сжатие звуковой информации

Наиболее широко используются методы - и A-типа.

Метод -типа основан на применении формулы (s и s – исходное и преобразованное значения выборки, при этом s представляет собой дробное число в диапазоне от –1 до +1 ):

s 18 sign(s)log(1 255 | s |),

1, s 0, sign(s) 1, s 0.

Сжатие звуковой информации

В методе A-типа используется коэффициент A, чаще всего имеющий значение 87.6. Для выборок, значения которых лежат в диапазоне от 0 до 1, метод задается следующей формулой (s и sA – исходное и преобразованное значения выборки ):

		As	, s			1	,

	1	ln A				A


sA	1	ln(As)			1
				,			s 1.
1 ln A					A

Сжатие речи

Для компрессии речи разработаны специальные методы. Самый простой метод кодирования речи называется кодированием пауз. Он основан на том, что в речи человека присутствует много пауз. Часть их – короткие паузы между словами и фразами, остальное – более длинные паузы между предложениями или репликами разных людей. Часто, выделяя эти паузы и заменяя их компактными кодами, в которых указывается длительность паузы, за счет сжатия удается сэкономить до 50% первоначального объема речевой информации.

Сжатие речи

Более изощренные алгоритмы состоят из двух частей.

Первая – это математическая модель голосового тракта человека. Она представляет собой последовательность уравнений, в которых используется информация о гортани, горле, языке и губах человека для получения звуков, подобных тем, что издает человек.

Вторая часть – анализирующий механизм, на основании считанного звука подготавливающий параметры для этой модели.

При компрессии разговора используется анализирующее устройство, формирующее последовательность параметров.

При декомпрессии записанные параметры передаются в модель голосового тракта и получаются звуки. С помощью подобной технологии удается сжать речь человека в 100 раз и более, сохранив при этом хорошее качество звучания.

<<< < Предыдущая 1 2 3 4 5 67 / 77

Соседние файлы в папке Teoria_informatsii

#
22.03.2016415.74 Кб94Лекция 1.ppt
#
22.03.201699.84 Кб111Лекция 2.ppt
#
22.03.2016266.24 Кб118Лекция 3.ppt
#
22.03.2016325.12 Кб156Лекция 4.ppt
#
22.03.2016109.57 Кб186Лекция 5.ppt
#
22.03.201660.93 Кб205Лекция 6.ppt