Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Книга бельфер.docx
Скачиваний:
229
Добавлен:
20.09.2019
Размер:
9.74 Mб
Скачать
      1. 21.3.1. Кодер речи

Кодер речи является первым элементом цифрового участка передающего тракта, следующим после АЦП. На вход кодера речи поступает поток информации со скоростью 64 Кбит/c. Основная задача кодера (encoder) речи – уменьшение скорости передачи, т.е. предельно возможное сжатие сигнала речи, но при сохранении приемлемого качества передачи речи. В приемном тракте перед АЦП размещен декодер речи. Задача декодера (decoder) – восстановление обычного цифрового сигнала речи. В GSM используется кодирование речи на основе линейного предсказания LPC (Liner Predictive Coding). Суть этого метода заключается в том, что по каналу связи передаются не параметры речевого сигнала, а параметры некоторого фильтра, эквивалентного голосовому сигналу, и параметры возбуждения этого фильтра. Задача кодирования на передающем конце канала связи заключается в оценке параметров фильтра и параметров сигналов возбуждения, а задача декодирования на приемном конце – в пропускании сигнала возбуждения через фильтр, на выходе которого получается восстановленный сигнал речи. Метод линейного предсказания заключается в том, что очередная выборка речевого сигнала с некоторой степенью точности предсказывается линейной комбинацией m предшествующих выборок. Для каждого 20-миллисекундного сегмента оцениваются параметры фильтра кратковременного линейного предсказания, составляющие 260 бит информации. Таким образом, кодер речи осуществляет сжатие информации в 4.92 раза – (64 Кбит/с*20 мс)/260 бит, а скорость потока данных на выходе речевого кодера уменьшается с 64 Кбит/c до 13Кбит/c. При оценке качества кодирования и сопоставлении кодеров оцениваются разборчивость речи и качество синтеза (качество звучания) речи. Для оценки разборчивости речи используют метод DRT (Diagnostic Rhyme Test – диагностический рифмованный тест). В этом методе подбираются пары близких по звучанию слов, отличающихся отдельными согласными (типа «дот – кот», «кол – гол»), которые многократно произносятся рядом дикторов, и по результатам испытаний оценивается доля искажений. Метод позволяет получить как оценку разборчивости отдельных согласных, так и общую оценку разборчивости речи.

Для оценки качества звучания используется критерий DAM (Diagnostic Acceptability Measure – диагностическая мера приемлемости). Испытания заключаются в чтении несколькими дикторами мужчинами и женщинами, ряда специально подобранных фраз, которые прослушиваются на выходе тракта связи рядом экспертов-слушателей, выставляющих свои оценки по пятибалльной шкале. Результатом является средняя субъективная оценка, или средняя оценка мнений (Mean Opinion Score – MOS). Хотя этот метод является субъективным по своей сути, его результаты по сопоставлению различных типов кодеков при проведении испытаний одними и теми же группами дикторов и экспертов- слушателей являются достаточно объективными. В качестве примера в табл. 21.3 приведены результаты оценки используемого в GSM кодека по сравнению с импульсно-кодовой модуляцией без использования сжатия методом линейного предсказания.

Таблица 21. 3. Оценка кодеков речи по шкале MOS

Тип кодека

Скорость передачи информации, Кбит/с

Оценка MOS

ИКМ

64

4.12

RPE-LTP (стандарт GSM)

13

3.58