Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
CSTM / METOD / Сведения--zстm.doc
Скачиваний:
231
Добавлен:
07.02.2016
Размер:
2.18 Mб
Скачать
      1. 3.1.1. Прямое аналого-цифровое преобразование

Первым из предложенных решений кодирования речи является метод - прямого аналого-цифрового преобразования. На основе этого метода построенные алгоритмы группыимпульсно-кодовой модуляции, которая в свою очередь разделяется нанекомпандировануюикомпандировануюИКМ . К некомпандированным ИКМ относитсялинейная ИКМ. В состав компандированых ИКМ входят алгоритмы импульсно кодовой модуляции с компандированием по - законуи по -закону. Все перечисленные алгоритмы ИКМ входят в состав единого стандарта на ИКМITU (CCITT) G.711.

На рисунке 1 представлена классификация алгоритмов кодирования речи разработанных на основе метода прямого аналого-цифрового преобразования.

Рисунок 1 – Классификация кодеков прямого аналого-цифрового преобразования

      1. 3.1.2. Эффективное кодирование речи

Следующим, в разработанной обобщенной методологии кодирования речи, является метод - эффективное кодирование речи, основанный на уплотнении исходного сигнала, посредством устранения избыточности речи. Классификация рассматриваемых кодеков приведена на рисунке 2. Кодеки данного класса устраняют избыточность, связанную с наличием корреляции между соседними отсчетами речевого сигнала. Для этого используется аппроксимация речевого сигнала на определенном промежутке заданной функцией. На момент написания данной работы, наибольшее распространение получила аппроксимация линейной функцией, применяемая в так называемыхлинейных предсказателях [2].Однако, при составлении классификации не следует исключать возможности появления, распространения и стандартизации в будущем алгоритмов кодирования, использующих нелинейные аппроксимирующие функции.

      1. 3.1.3. Моделирование речеобразующего аппарата человека

Многие современные кодеки с линейным предсказанием включают в свой состав синтезирующие ЛП – фильтры [2]. С точки зрения методологии, такие алгоритмы можно отнести к смешанным, так как в них, наряду с методом эффективного кодирования речи, применяетсямоделирование речеобразующего аппарата человека. Таким образом, ЛП – кодеки делятся по признаку наличия синтезирующего фильтра.

К группе алгоритмов с отсутствием синтезирующего ЛП – фильтра относятся кодеки семейства дифференциальной импульсно-кодовой модуляции (ДИКМ).Которые в свою очередь делятся по признаку наличия адаптации шага квантования в зависимости от значений отсчетов речевого сигнала на:неадаптивныеиадаптивные.

Кнеадаптивным относятся:ДИКМи ее частный случай, выделяемых в отдельную группу, кодекДельта – модуляция (ДМ). Алгоритмы данной группы включены в единый стандартITU (CCITT) G.721.

Рисунок 2 – Классификация алгоритмов эффективного кодирования

      1. 3.1.4.Адаптивные кодеки

В группу адаптивных кодеков входят: адаптивная ДИКМиадаптивная ДМ, которые включены в стандартыITU (CCITT) G.726 и ITU (CCITT) G.727.

Кодеки семейства ДИКМ могут быть поделены по порядку линейного предсказания или другими словами по величине т.н. окна просмотра. Но, по мнению автора, этот признак не является существенным и по этому разделение по нему не включено в предлагаемую классификацию.

Алгоритмы кодирования речи с наличием синтезирующего ЛП – фильтра разделяются по принципу формирования сигнала возбуждающего речесинтезирующий фильтр на кодеки [3]:

с усеченным возбуждением;

с многоимпульсным возбуждением;

с кодовым возбуждением.

Кроме этого кодеки данной группы могут делиться по признаку наличия блока длительного линейного предсказания(long term prediction), который выполняет функции дополнительного предсказания на достаточно длительном промежутке речевого сигнала с целью выявления и устранения избыточности речи, связанную с ее фонемным составом. Именно, наличие этого блока является одним из основных отличительных признаков этой группы кодеков. Как отмечалось ранее, не существует строго определенной границы между вокодерами и кодеками с наличием синтезирующего ЛП – фильтра, поэтому кодеки с отсутствием добавочного длительного линейного предсказания, по мнению авторов, относятся к вокодерам.

В группу кодеков с наличием длительного линейного предсказания и усеченным возбуждением входит алгоритм кодирования включенный с стандарт GSM 06.10.

Примером реализации кодеков с многоимпульсным возбуждением являются стандартизированные кодеки FS1016иInmarsat-М (Рисунок 2).

Алгоритмы кодирования речи с линейным предсказанием и кодовым возбуждениемнаиболее широко представлены в настоящий момент. Они делятся по принципу построения матриц кодовых последовательностей [2,4].Методы построения матриц, как правило, хранятся производителями в тайне, потому не является возможных их классифицировать в рамках данной работы. Алгоритмы данной группы стандартизованы в кодеках: ITU G.723.1, ITU G.728 и ITU G.729 (рисунок 2).

Соседние файлы в папке METOD