5.3. Кодування мовних сигналів
Історично склалися два напрями кодування мови:
1) кодування форми сигналу (waveform coding), засноване на використанні статистичних характеристик сигналу. При цьому забезпечується висока якість передачі мови (хороша розбірливість, натуральність мови), але має місце недостатня економічність;
2) кодування джерела сигналу (source coding), яке здійснюється одним з трьох способів кодування:
– імпульсно-кодова модуляція (ІКМ, по англ. Pulse Code Modulation - PCM). ІКМ відповідає цифровий сигнал безпосередньо з виходу АЦП, в ньому зберігається вся надмірність аналогового мовного сигналу;
– диференціальна ІКМ - ДІКМ (Differential PCM - DPCM). При ДІКМ надмірність аналогового мовного сигналу дещо зменшується за рахунок того, що квантуванню з подальшим кодуванням і передачею по лінії зв'язку піддається різниця між початковим мовним сигналом і його передбаченим значенням, а при прийомі різницевий сигнал складається з передбаченим значенням, отриманим по тому ж алгоритму прогнозу;
– дельта-модуляція (ДМ, по англ. Delta Modulation - DM).
Шкала квантування може бути рівномірною, нерівномірною або такою, що адаптивно змінюється; прогноз сигналу може бути не залежним від форми останнього або ж залежати від форми сигналу, тобто бути адаптивним. Якщо при кодуванні сигналу використовуються елементи адаптації, то відповідний різновид ДІКМ називають адаптивною ДІКМ - АДІКМ (Adaptive DPCM - ADPCM).
ДМ – це ДІКМ з однобітовим квантуванням, вона також може бути адаптивною (АДМ).
В стільниковому зв'язку використовується виключно другий метод кодування як більш економічний, – коефіцієнт стиснення порядка 5...8 із збільшенням його в перспективі ще удвічі.
5.4. Кодери мови
Перейдемо безпосередньо до кодерів мови, що використовуються в стільниковому зв'язку, і розглянемо наступні питання: принцип побудови кодерів мови на основі методу лінійного прогнозу; сутність методу лінійного прогнозу тощо.
Сутність кодування мови на основі методу лінійного прогнозу (Linear Predictive Coding - LPC) полягає в тому, що по лінії зв'язку передаються не параметри мовного сигналу, як такого, а параметри деякого фільтру, в певному смислі еквівалентного голосовому тракту, і параметри сигналу збудження цього фільтру.
В якості такого фільтру використовується фільтр лінійного прогнозу. Задача кодування на передавальному кінці лінії зв'язку полягає в оцінці параметрів фільтру і параметрів сигналу збудження, а задача декодування на приймальному кінці – в пропусканні сигналу збудження через фільтр, на виході якого виходить відновлений сигнал мови. Різні варіанти алгоритмів кодування відрізняються один від одного набором передаваних параметрів фільтру, методом формування сигналу збудження тощо.
Метод лінійного прогнозу полягає в тому, що чергова вибірка мовного сигналу Sn з деякою мірою точності передбачається лінійною комбінацією М попередніх вибірок:
де
– коефіцієнти лінійного прогнозу, М
– порядок прогнозу. Різниця між істинним
і передбаченим значеннями вибірки
визначає помилку прогнозу (залишок
прогнозу):
В результаті z-пертворення цього різницевого рівняння одержуємо
де функція А(z)
інтерпретується як передавальна характеристика деякого фільтру (інверсного фільтру або фільтру-аналізатора), частотна характеристика якого зворотна по відношенню до частотної характеристики голосового тракту.
При подачі мовного сигналу на вхід інверсного фільтру на виході фільтру виходить сигнал збудження, подібний (з точністю до помилок, які визначаються скінченністю порядку прогнозу М і погрішністю оцінки коефіцієнтів прогнозу) сигналу збудження на вході фільтру голосового тракту.
Значення коефіцієнтів прогнозу, які є постійними на інтервалі кодованого сегменту мови (на практиці його тривалість складає 20 мс), знаходяться з умови мінімізації средньо квадратичного значення залишку прогнозу на інтервалі сегменту.
