
- •Глава 1. Механизмы речевого общения 2
- •Глава 1. Общие положения и терминология 26
- •Глава 3. Преобразование речи в цифровую форму 76 предисловие
- •Глава 1. Механизмы речевого общения
- •1.1. Речь
- •1.1.1 Общие сведения
- •1.1.2 Спектр речи
- •Речевой сигнал.
- •1.1.3 Спектр формант
- •Форманты
- •1.1.4 Амплитудное распределение. Динамический диапазон. Пик-фактор.
- •1.1.5 Распределение формант
- •1.1.6 Временные характеристики речи
- •1.1.7 Распределение уровней речи перед ртом говорящего
- •1.2 Слух
- •1.2.1 Общие сведения
- •1.2.2 Пороги слышимости
- •1.2.3 Логарифмическая ширина критической полосы слуха
- •1.2.4 Маскировка звуков
- •1.2.5 Адаптация слуха
- •Адаптация
- •1.2.6 Биноуральный эффект
- •1.2.7 Громкость звука
- •Заключение
- •Контрольные вопросы
- •Литература к главе 1.
- •Глава 2. Местные аналоговые телефонные системы
- •2.1.Общие сведения
- •2.2.Телефонные аппараты с микротелефонными трубками
- •2.2.1.Разговорная схема
- •2.3.Микрофоны
- •2.3.1. Назначение
- •2.3.2. Характеристики
- •2.3.3. Нелинейные искажения
- •2.3.4. Шумы
- •2.4.Телефоны
- •2.4.1. Назначение
- •2.4.2. Характеристики
- •.2.5.Микротелефонные трубки
- •2.5.1. Назначение
- •2.5.2. Основные параметры
- •.2.6.Частотные характеристики передачи и приема та
- •Заключение
- •Контрольные вопросы
- •Литература к главе 2.
- •Глава 1. Общие положения и терминология
- •1.1. Оконечные устройства, системы передачи и коммутации
- •Организации по разработке стандартов в области электросвязи.
- •1.2.Аналоговая телефонная сеть
- •1.2.1. Иерархия сети
- •1.2.2. Системы коммутации
- •Электромеханические системы коммутации.
- •Управление по программе.
- •1.2.3. Системы передачи
- •Воздушная линия связи.
- •Кабельные пары.
- •Двухпроводная и четырехпроводная передача.
- •Переход с двухпроводной цепи на четырехпроводную.
- •Дуплекс и полудуплекс.
- •1.2.7. Факторы, влияющие на качество передачи
- •Затухание сигнала.
- •Помехи.
- •. Искажения.
- •Эхо и самовозбуждение.
- •1.2.8. Уровни мощности
- •1.2.9. Сигнализация
- •Функции сигнализации.
- •Внутриканальная сигнализация.
- •Межстанционная сигнализация по общему каналу.
- •1.2.10.Устройства сопряжения
- •Устройство сопряжения абонентского шлейфа (абонентский комплект).
- •1.2.11. Специальные виды обслуживания
- •Передача данных.
- •1.3. Введение в цифровую связь
- •1.3.1. Преобразование речи в цифровую форму
- •1.3.2. Временное группообразование
- •Иерархия систем с временным группообразованием.
- •1.3.5.Цифровая коммутация
- •1.3. Цифровые телефонные сети
- •1.3.1. Преимущества цифровых сетей передачи речи
- •Простота группообразования
- •Простота сигнализации
- •Использование современной технологии
- •Цифровая обработка сигналов.
- •Интеграция систем передачи и коммутации
- •Возможность работы при малых значениях отношения сигнал-шум (помеха)
- •Регенерация сигнала
- •Приспосабливаемость к другим видам обслуживания
- •Возможность контроля рабочих характеристик
- •Простота засекречивания
- •1.3.2. Недостатки цифровых сетей передачи речи
- •Расширение полосы частот
- •Аналого-цифровое преобразование
- •Необходимость временнби синхронизации
- •Топологические ограничения группообразования
- •Несовместимость с существующими аналоговыми устройствами
- •1.4. Экономические аспекты
- •Заключение
- •3.1. Классификация алгоритмов кодирования речи
- •3.1.1. Прямое аналого-цифровое преобразование
- •3.1.2. Эффективное кодирование речи
- •3.1.3. Моделирование речеобразующего аппарата человека
- •3.1.4.Адаптивные кодеки
- •3.1.5. Синтезаторы речи
- •3.1.6. Ортогональное преобразование речевого сигнала
- •3.2. Алгоритмы кодирования
- •3.2 Импульсно-кодовая модуляция
- •3.2.1 Шум квантования
- •3.2.2 Шумы незагруженного канала
- •3.2.3 Импульсно-кодовая модуляция с равномерным квантованием
- •3.2.4 Компандирование
- •3.2.5 Кодирование с простой линеаризацией
- •3.2.6 Адаптивная регулировка усиления
- •3.3 Избыточность речи
- •3.3.1 Неравномерное распределение амплитуд
- •3.3.2 Корреляция между дискретами
- •3.3.3 Корреляция, связанная с периодичностью в сигнале
- •3.3.4 Корреляция между периодами основного тона
- •3.3.5 Избыточность, связанная с неактивностью речи
- •3.3.6 Неравномерный усредненный спектр
- •3.3.7 Кратковременный спектр
- •3.4 Дифференциальная импульсно-кодовая модуляция
- •3.4.1 Варианты реализации дикм
- •3.4.2 Предсказание более высокого порядка
- •3.5 Дельта-модуляция
- •3.5.1 Перегрузка по крутизне
- •3.5.2 Линейная дельта-модуляция
- •3.5.3 Слоговое компандирование
- •3.5.4 Адаптивная дельта-модуляция
3.1.1. Прямое аналого-цифровое преобразование
Первым из предложенных
решений кодирования речи является
метод - прямого аналого-цифрового
преобразования. На основе
этого метода построенные алгоритмы
группыимпульсно-кодовой модуляции,
которая в свою очередь разделяется нанекомпандировануюикомпандировануюИКМ . К некомпандированным ИКМ относитсялинейная ИКМ. В состав компандированых
ИКМ входят алгоритмы импульсно кодовой
модуляции с компандированием по
- законуи по
-закону.
Все перечисленные алгоритмы ИКМ входят
в состав единого стандарта на ИКМITU
(CCITT) G.711.
На
рисунке 1 представлена классификация
алгоритмов кодирования речи разработанных
на основе метода прямого аналого-цифрового
преобразования.
Рисунок 1 – Классификация кодеков прямого аналого-цифрового преобразования
3.1.2. Эффективное кодирование речи
Следующим, в разработанной обобщенной методологии кодирования речи, является метод - эффективное кодирование речи, основанный на уплотнении исходного сигнала, посредством устранения избыточности речи. Классификация рассматриваемых кодеков приведена на рисунке 2. Кодеки данного класса устраняют избыточность, связанную с наличием корреляции между соседними отсчетами речевого сигнала. Для этого используется аппроксимация речевого сигнала на определенном промежутке заданной функцией. На момент написания данной работы, наибольшее распространение получила аппроксимация линейной функцией, применяемая в так называемыхлинейных предсказателях [2].Однако, при составлении классификации не следует исключать возможности появления, распространения и стандартизации в будущем алгоритмов кодирования, использующих нелинейные аппроксимирующие функции.
3.1.3. Моделирование речеобразующего аппарата человека
Многие современные кодеки с линейным предсказанием включают в свой состав синтезирующие ЛП – фильтры [2]. С точки зрения методологии, такие алгоритмы можно отнести к смешанным, так как в них, наряду с методом эффективного кодирования речи, применяетсямоделирование речеобразующего аппарата человека. Таким образом, ЛП – кодеки делятся по признаку наличия синтезирующего фильтра.
К группе алгоритмов с отсутствием синтезирующего ЛП – фильтра относятся кодеки семейства дифференциальной импульсно-кодовой модуляции (ДИКМ).Которые в свою очередь делятся по признаку наличия адаптации шага квантования в зависимости от значений отсчетов речевого сигнала на:неадаптивныеиадаптивные.
Кнеадаптивным относятся:ДИКМи ее
частный случай, выделяемых в отдельную
группу, кодекДельта – модуляция
(ДМ). Алгоритмы данной группы включены
в единый стандартITU (CCITT) G.721.
Рисунок 2 – Классификация алгоритмов эффективного кодирования
3.1.4.Адаптивные кодеки
В группу адаптивных кодеков входят: адаптивная ДИКМиадаптивная ДМ, которые включены в стандартыITU (CCITT) G.726 и ITU (CCITT) G.727.
Кодеки семейства ДИКМ могут быть поделены по порядку линейного предсказания или другими словами по величине т.н. окна просмотра. Но, по мнению автора, этот признак не является существенным и по этому разделение по нему не включено в предлагаемую классификацию.
Алгоритмы кодирования речи с наличием синтезирующего ЛП – фильтра разделяются по принципу формирования сигнала возбуждающего речесинтезирующий фильтр на кодеки [3]:
с усеченным возбуждением;
с многоимпульсным возбуждением;
с кодовым возбуждением.
Кроме этого кодеки данной группы могут делиться по признаку наличия блока длительного линейного предсказания(long term prediction), который выполняет функции дополнительного предсказания на достаточно длительном промежутке речевого сигнала с целью выявления и устранения избыточности речи, связанную с ее фонемным составом. Именно, наличие этого блока является одним из основных отличительных признаков этой группы кодеков. Как отмечалось ранее, не существует строго определенной границы между вокодерами и кодеками с наличием синтезирующего ЛП – фильтра, поэтому кодеки с отсутствием добавочного длительного линейного предсказания, по мнению авторов, относятся к вокодерам.
В группу кодеков с наличием длительного линейного предсказания и усеченным возбуждением входит алгоритм кодирования включенный с стандарт GSM 06.10.
Примером реализации кодеков с многоимпульсным возбуждением являются стандартизированные кодеки FS1016иInmarsat-М (Рисунок 2).
Алгоритмы кодирования речи с линейным предсказанием и кодовым возбуждениемнаиболее широко представлены в настоящий момент. Они делятся по принципу построения матриц кодовых последовательностей [2,4].Методы построения матриц, как правило, хранятся производителями в тайне, потому не является возможных их классифицировать в рамках данной работы. Алгоритмы данной группы стандартизованы в кодеках: ITU G.723.1, ITU G.728 и ITU G.729 (рисунок 2).