- •Глава 1. Механизмы речевого общения 2
- •Глава 1. Общие положения и терминология 26
- •Глава 3. Преобразование речи в цифровую форму 76 предисловие
- •Глава 1. Механизмы речевого общения
- •1.1. Речь
- •1.1.1 Общие сведения
- •1.1.2 Спектр речи
- •Речевой сигнал.
- •1.1.3 Спектр формант
- •Форманты
- •1.1.4 Амплитудное распределение. Динамический диапазон. Пик-фактор.
- •1.1.5 Распределение формант
- •1.1.6 Временные характеристики речи
- •1.1.7 Распределение уровней речи перед ртом говорящего
- •1.2 Слух
- •1.2.1 Общие сведения
- •1.2.2 Пороги слышимости
- •1.2.3 Логарифмическая ширина критической полосы слуха
- •1.2.4 Маскировка звуков
- •1.2.5 Адаптация слуха
- •Адаптация
- •1.2.6 Биноуральный эффект
- •1.2.7 Громкость звука
- •Заключение
- •Контрольные вопросы
- •Литература к главе 1.
- •Глава 2. Местные аналоговые телефонные системы
- •2.1.Общие сведения
- •2.2.Телефонные аппараты с микротелефонными трубками
- •2.2.1.Разговорная схема
- •2.3.Микрофоны
- •2.3.1. Назначение
- •2.3.2. Характеристики
- •2.3.3. Нелинейные искажения
- •2.3.4. Шумы
- •2.4.Телефоны
- •2.4.1. Назначение
- •2.4.2. Характеристики
- •.2.5.Микротелефонные трубки
- •2.5.1. Назначение
- •2.5.2. Основные параметры
- •.2.6.Частотные характеристики передачи и приема та
- •Заключение
- •Контрольные вопросы
- •Литература к главе 2.
- •Глава 1. Общие положения и терминология
- •1.1. Оконечные устройства, системы передачи и коммутации
- •Организации по разработке стандартов в области электросвязи.
- •1.2.Аналоговая телефонная сеть
- •1.2.1. Иерархия сети
- •1.2.2. Системы коммутации
- •Электромеханические системы коммутации.
- •Управление по программе.
- •1.2.3. Системы передачи
- •Воздушная линия связи.
- •Кабельные пары.
- •Двухпроводная и четырехпроводная передача.
- •Переход с двухпроводной цепи на четырехпроводную.
- •Дуплекс и полудуплекс.
- •1.2.7. Факторы, влияющие на качество передачи
- •Затухание сигнала.
- •Помехи.
- •. Искажения.
- •Эхо и самовозбуждение.
- •1.2.8. Уровни мощности
- •1.2.9. Сигнализация
- •Функции сигнализации.
- •Внутриканальная сигнализация.
- •Межстанционная сигнализация по общему каналу.
- •1.2.10.Устройства сопряжения
- •Устройство сопряжения абонентского шлейфа (абонентский комплект).
- •1.2.11. Специальные виды обслуживания
- •Передача данных.
- •1.3. Введение в цифровую связь
- •1.3.1. Преобразование речи в цифровую форму
- •1.3.2. Временное группообразование
- •Иерархия систем с временным группообразованием.
- •1.3.5.Цифровая коммутация
- •1.3. Цифровые телефонные сети
- •1.3.1. Преимущества цифровых сетей передачи речи
- •Простота группообразования
- •Простота сигнализации
- •Использование современной технологии
- •Цифровая обработка сигналов.
- •Интеграция систем передачи и коммутации
- •Возможность работы при малых значениях отношения сигнал-шум (помеха)
- •Регенерация сигнала
- •Приспосабливаемость к другим видам обслуживания
- •Возможность контроля рабочих характеристик
- •Простота засекречивания
- •1.3.2. Недостатки цифровых сетей передачи речи
- •Расширение полосы частот
- •Аналого-цифровое преобразование
- •Необходимость временнби синхронизации
- •Топологические ограничения группообразования
- •Несовместимость с существующими аналоговыми устройствами
- •1.4. Экономические аспекты
- •Заключение
- •3.1. Классификация алгоритмов кодирования речи
- •3.1.1. Прямое аналого-цифровое преобразование
- •3.1.2. Эффективное кодирование речи
- •3.1.3. Моделирование речеобразующего аппарата человека
- •3.1.4.Адаптивные кодеки
- •3.1.5. Синтезаторы речи
- •3.1.6. Ортогональное преобразование речевого сигнала
- •3.2. Алгоритмы кодирования
- •3.2 Импульсно-кодовая модуляция
- •3.2.1 Шум квантования
- •3.2.2 Шумы незагруженного канала
- •3.2.3 Импульсно-кодовая модуляция с равномерным квантованием
- •3.2.4 Компандирование
- •3.2.5 Кодирование с простой линеаризацией
- •3.2.6 Адаптивная регулировка усиления
- •3.3 Избыточность речи
- •3.3.1 Неравномерное распределение амплитуд
- •3.3.2 Корреляция между дискретами
- •3.3.3 Корреляция, связанная с периодичностью в сигнале
- •3.3.4 Корреляция между периодами основного тона
- •3.3.5 Избыточность, связанная с неактивностью речи
- •3.3.6 Неравномерный усредненный спектр
- •3.3.7 Кратковременный спектр
- •3.4 Дифференциальная импульсно-кодовая модуляция
- •3.4.1 Варианты реализации дикм
- •3.4.2 Предсказание более высокого порядка
- •3.5 Дельта-модуляция
- •3.5.1 Перегрузка по крутизне
- •3.5.2 Линейная дельта-модуляция
- •3.5.3 Слоговое компандирование
- •3.5.4 Адаптивная дельта-модуляция
3.3.7 Кратковременный спектр
Спектр речи, показанный на рис. 3.24, усреднен за большой период времени. В течение более коротких периодов времени спектры существенно изменяются и в них становятся видны структуры, специфические для звуков с пиками энергии (резонансами) на одних частотах и провалами энергии – на других. Частоты, на которых возникают резонансы, называются частотами формант, или просто формантами. Гласные и звонкие согласные звуки речи обычно содержат от трех до четырех четко определяемых формант. Эти свойства кратковременного спектра иллюстрирует спектрограмма на рис. 3.25. Спектрограмма – это представление энергии речи в виде функции времени и частоты. Горизонтальная ось представляет время, вертикальная – частоту, а яркость отметки соответствует уровню энергии. Таким образом, более темные участки на рис. 3.25 указывают на относительно высокий уровень энергии (форманты) в конкретный момент времени.
Кодеры речи в частотной области улучшают эффективность преобразования за счет кодирования наиболее важных компонент спектра на динамической основе. С изменением звуков кодируются различные части (форманты) полосы частот. Период между сменами формант в типовом случае составляет от 10 до 20 мс. Некоторые высококачественные вокодеры вместо использования периодических изменений спектра непрерывно с высокой скоростью следят за постепенным изменением спектра. Вокодеры в частотной области часто требуют меньшей скорости передачи, чем кодеры во временной области, но обычно создают речь с менее натуральным звучанием.
3.4 Дифференциальная импульсно-кодовая модуляция
Дифференциальная импульсно-кодовая модуляция (ДИКМ) специально разработана для реализации преимуществ, которые дает использование корреляции между дискретами в типовом речевом сигнале. Поскольку диапазон разностей значений дискретов меньше диапазона самих значений дискретов, для кодирования разности величин дискретов требуется меньше разрядов. Частота дискретизации часто берется той же, что и в сравниваемой ИКМ-системе. Вследствие этого ограничивающий полосу фильтр в кодере и сглаживающий фильтр в декодере в основном такие же, как и в обычных ИКМ-системах.
Простейшими средствами получения разности значений дискретов для ДИКМ-кодера являются запоминание предыдущего входного дискрета непосредственно в аналоговой памяти и использование аналогового вычитающего устройства для измерения изменения. Изменения сигнала затем квантуются и кодируются для передачи. Однако структура системы с ДИКМ, показанная на рис. 3.26, является более сложной, так как предыдущая входная величина восстанавливается с помощью цепи обратной связи, в которой накапливаются кодированные разности значений дискретов. По существу, сигнал в цепи обратной связи представляет собой оценку входного сигнала, которая получена путем интегрирования кодированных разностей дискретов. Вследствие этого сигнал обратной связи, полученный таким же образом, используется в декодере для восстановления формы исходного сигнала.
Преимущество реализации с цепью обратной связи состоит в том, что при этом ошибки квантования не накапливаются неограниченно. Если сигнал в цепи обратной связи отклоняется от входного в результате накопления ошибок квантования, то при следующей операции кодирования разностного сигнала это отклонение автоматически компенсируется. В системе без обратной связи выходной сигнал, формируемый декодером на противоположном конце линии, может неограниченно накапливать ошибки квантования.
Как и в системах с ИКМ, процесс аналого-цифрового преобразования может осуществляться с компандированием и без него. В некоторых из систем с ДИКМ используют также технику адаптации для подстройки размеров шагов квантования в соответствии с уровнем средней мощности сигнала. (См. обзор различных способов в [18].) Эти способы адаптации часто называют слоговым компандированием в соответствии с интервалом времени между подстройками усиления. Слоговое компандирование рассматривается в разделе, посвященном системам дельта-модуляции, где оно наиболее часто применяется.
Пример 3.4Качество устройства, преобразования речи в цифровую форму иногда измеряется с помощью синусоидального колебания с частотой 800 Гц, используемого как типовой испытательный сигнал. Предполагая, что имеется система с ИКМ и равномерным квантованием, способная кодировать синусоиду в заданном динамическом диапазоне, определим, сколько разрядов на дискрет можно сэкономить, используя систему с ДИКМ и равномерным квантованием.
Решение. По существу, решение состоит в определении того, во сколько раз уменьшается динамический диапазон разностного сигнала по сравнению с динамическим диапазоном исходного сигнала. Предположим, что амплитуда синусоиды равнаА,так что
x(t)=-A sin2800t.
Амплитуду разностного сигнала можно получить путем дифференцирования и умножения на временной интервал между дискретами
dx/dt=A2800cos2800t;
|x(t)|max=A2800/8000=0,628 А.
Экономию числа разрядов на дискрет можно определить как
log2(1/0,628)=0,67 разряда.
Пример 3.4 показывает, что при одинаковом качестве в системе с ДИКМ можно использовать на 2/3 разряда меньше, чем в системе с ИКМ. В типовом случае система с ДИКМ уменьшает размер кодовой комбинации на один полный разряд. Может быть получена и большая экономия, поскольку в среднем сигналы речи имеют меньшую крутизну, чем тон с частотой 800 Гц (см. рис. 3.24).