- •Глава 1. Механизмы речевого общения 2
- •Глава 1. Общие положения и терминология 26
- •Глава 3. Преобразование речи в цифровую форму 76 предисловие
- •Глава 1. Механизмы речевого общения
- •1.1. Речь
- •1.1.1 Общие сведения
- •1.1.2 Спектр речи
- •Речевой сигнал.
- •1.1.3 Спектр формант
- •Форманты
- •1.1.4 Амплитудное распределение. Динамический диапазон. Пик-фактор.
- •1.1.5 Распределение формант
- •1.1.6 Временные характеристики речи
- •1.1.7 Распределение уровней речи перед ртом говорящего
- •1.2 Слух
- •1.2.1 Общие сведения
- •1.2.2 Пороги слышимости
- •1.2.3 Логарифмическая ширина критической полосы слуха
- •1.2.4 Маскировка звуков
- •1.2.5 Адаптация слуха
- •Адаптация
- •1.2.6 Биноуральный эффект
- •1.2.7 Громкость звука
- •Заключение
- •Контрольные вопросы
- •Литература к главе 1.
- •Глава 2. Местные аналоговые телефонные системы
- •2.1.Общие сведения
- •2.2.Телефонные аппараты с микротелефонными трубками
- •2.2.1.Разговорная схема
- •2.3.Микрофоны
- •2.3.1. Назначение
- •2.3.2. Характеристики
- •2.3.3. Нелинейные искажения
- •2.3.4. Шумы
- •2.4.Телефоны
- •2.4.1. Назначение
- •2.4.2. Характеристики
- •.2.5.Микротелефонные трубки
- •2.5.1. Назначение
- •2.5.2. Основные параметры
- •.2.6.Частотные характеристики передачи и приема та
- •Заключение
- •Контрольные вопросы
- •Литература к главе 2.
- •Глава 1. Общие положения и терминология
- •1.1. Оконечные устройства, системы передачи и коммутации
- •Организации по разработке стандартов в области электросвязи.
- •1.2.Аналоговая телефонная сеть
- •1.2.1. Иерархия сети
- •1.2.2. Системы коммутации
- •Электромеханические системы коммутации.
- •Управление по программе.
- •1.2.3. Системы передачи
- •Воздушная линия связи.
- •Кабельные пары.
- •Двухпроводная и четырехпроводная передача.
- •Переход с двухпроводной цепи на четырехпроводную.
- •Дуплекс и полудуплекс.
- •1.2.7. Факторы, влияющие на качество передачи
- •Затухание сигнала.
- •Помехи.
- •. Искажения.
- •Эхо и самовозбуждение.
- •1.2.8. Уровни мощности
- •1.2.9. Сигнализация
- •Функции сигнализации.
- •Внутриканальная сигнализация.
- •Межстанционная сигнализация по общему каналу.
- •1.2.10.Устройства сопряжения
- •Устройство сопряжения абонентского шлейфа (абонентский комплект).
- •1.2.11. Специальные виды обслуживания
- •Передача данных.
- •1.3. Введение в цифровую связь
- •1.3.1. Преобразование речи в цифровую форму
- •1.3.2. Временное группообразование
- •Иерархия систем с временным группообразованием.
- •1.3.5.Цифровая коммутация
- •1.3. Цифровые телефонные сети
- •1.3.1. Преимущества цифровых сетей передачи речи
- •Простота группообразования
- •Простота сигнализации
- •Использование современной технологии
- •Цифровая обработка сигналов.
- •Интеграция систем передачи и коммутации
- •Возможность работы при малых значениях отношения сигнал-шум (помеха)
- •Регенерация сигнала
- •Приспосабливаемость к другим видам обслуживания
- •Возможность контроля рабочих характеристик
- •Простота засекречивания
- •1.3.2. Недостатки цифровых сетей передачи речи
- •Расширение полосы частот
- •Аналого-цифровое преобразование
- •Необходимость временнби синхронизации
- •Топологические ограничения группообразования
- •Несовместимость с существующими аналоговыми устройствами
- •1.4. Экономические аспекты
- •Заключение
- •3.1. Классификация алгоритмов кодирования речи
- •3.1.1. Прямое аналого-цифровое преобразование
- •3.1.2. Эффективное кодирование речи
- •3.1.3. Моделирование речеобразующего аппарата человека
- •3.1.4.Адаптивные кодеки
- •3.1.5. Синтезаторы речи
- •3.1.6. Ортогональное преобразование речевого сигнала
- •3.2. Алгоритмы кодирования
- •3.2 Импульсно-кодовая модуляция
- •3.2.1 Шум квантования
- •3.2.2 Шумы незагруженного канала
- •3.2.3 Импульсно-кодовая модуляция с равномерным квантованием
- •3.2.4 Компандирование
- •3.2.5 Кодирование с простой линеаризацией
- •3.2.6 Адаптивная регулировка усиления
- •3.3 Избыточность речи
- •3.3.1 Неравномерное распределение амплитуд
- •3.3.2 Корреляция между дискретами
- •3.3.3 Корреляция, связанная с периодичностью в сигнале
- •3.3.4 Корреляция между периодами основного тона
- •3.3.5 Избыточность, связанная с неактивностью речи
- •3.3.6 Неравномерный усредненный спектр
- •3.3.7 Кратковременный спектр
- •3.4 Дифференциальная импульсно-кодовая модуляция
- •3.4.1 Варианты реализации дикм
- •3.4.2 Предсказание более высокого порядка
- •3.5 Дельта-модуляция
- •3.5.1 Перегрузка по крутизне
- •3.5.2 Линейная дельта-модуляция
- •3.5.3 Слоговое компандирование
- •3.5.4 Адаптивная дельта-модуляция
3.3.5 Избыточность, связанная с неактивностью речи
Анализ телефонных переговоров показал, что активная часть разговора в типовом случае состаляет около 40% его длительности. Большая часть неактивных участков является результатом того, что один человек слушает, когда другой говорит. В результате этого обычное дуплексное соединение (при коммутации каналов) существенно недоиспользуется. Метод TASI(TimeAssignmentSpeechInterpolation) реализует улучшение использования каналов дорогих аналоговых линий. Термин "цифровое статистическое уплотнение речевого сигнала" представляет собой термин, применяемый, когда речь идет об аналоге методаTASIдля цифровых каналов. По сути, цифровое статистическое уплотнение речевого сигнала включает в себя: определение речевой активности, занятие канала, кодирование и передачу отрезков речи и освобождение канала по завершению каждого отрезка.
Очевидно, что цифровое статистическое уплотнение речевого сигнала можно применить к цифровым системам запоминания речи, где длину паузы можно закодировать и передать более эффективно, чем саму паузу. Однако в записанных сообщениях длительности пауз, как правило, невелики, так как здесь нет "полудуплексного" разговора. Цифровое статистическое уплотнение речевого сигнала было предложено для многочисленных систем передачи, описанных в гл. 8.
3.3.6 Неравномерный усредненный спектр
Виды избыточности во временной области, описанные в предыдущих разделах, указывают на такие характеристики в частотной области, которые можно в определенной мере использовать для уменьшения скорости передачи кодированного сигнала. Избыточность в частотной области не является независимой от избыточности во временной области. Способы, основанные на обработке в частотной области, просто являются другим подходом к анализу и обработке избыточности.
Полностью независимый или непредсказуемый сигнал во временной области создает плоский частотный спектр во всей полосе, представляющей интерес. Таким образом, для сигнала, в котором дискреты не коррелированы во временной области, полоса используется в максимальной степени. С другой стороны, неравномерный спектр сигнала соответствует неэффективному использованию полосы и указывает на избыточность в сигнале во временной области. На рис. 3.24 представлен спектр речевого сигнала, усредненный для мужчин и женщин [17]. Отметим, что уровни мощности на верхних частотах полосы шириной 3 кГц, предоставляемой телефонной сетью, значительно уменьшаются. Пониженные уровни мощности на верхних частотах являются прямым следствием рассмотренной выше корреляции между дискретами во временной области. Сигналы с большими амплитудами не могут быстро изменяться, поскольку в среднем в них преобладают низкочастотные составляющие.
Подход, обеспечивающий более эффективное кодирование в частотной области, включает в себя уплощение спектра перед кодированием сигнала. Уплощение может быть получено в результате прохождения сигнала через цепь, осуществляющую подъем верхних частот. Исходный сигнал восстанавливается при передаче декодированного сигнала через цепь, имеющую дополняющую характеристику с подъемом низких частот. Важным аспектом этого процесса является то, что цепь с подъемом верхних частот имеет во временной области такие же характеристики, как и дифференцирующая цепь, а цепь с подъемом низких частот во временной области имеет характеристики, аналогичные характеристикам интегратора. Таким образом, процесс уплощения спектра, по существу, означает, что на передающей стороне кодируются крутизна сигнала, а на приемной сигнал восстанавливается путем интегрирования – это та же процедура, которая была описана ранее для устранения корреляции между дискретами во временной области.
При изучении рис. 3.24 обычно считают, что существенное снижение уровня энергии сигнала на высоких частотах (от 2 до 3,4 кГц) означает, что для передачи речевого сигнала предоставляется полоса, большая, чем необходимо в действительности. Ошибочность такого вывода заключается в том, что существует разница между содержанием энергии и информации в спектре речевого сигнала. Как вскоре узнает любой начинающий программист, содержание переменных в программе может быть сохранено, даже если их обозначения сокращаются за счет удаления всех гласных. В речи гласные требуют большей части энергии и занимают в основном нижнюю часть полосы частот. Согласные, с другой стороны, содержат большую часть информации, но имеют намного меньшую энергию и в общем случае более высокие частоты. Следовательно, простого воспроизведения большей части исходной энергии речевого сигнала недостаточно для цифровых систем передачи и запоминания речи.