- •Глава 1. Механизмы речевого общения 2
- •Глава 1. Общие положения и терминология 26
- •Глава 3. Преобразование речи в цифровую форму 76 предисловие
- •Глава 1. Механизмы речевого общения
- •1.1. Речь
- •1.1.1 Общие сведения
- •1.1.2 Спектр речи
- •Речевой сигнал.
- •1.1.3 Спектр формант
- •Форманты
- •1.1.4 Амплитудное распределение. Динамический диапазон. Пик-фактор.
- •1.1.5 Распределение формант
- •1.1.6 Временные характеристики речи
- •1.1.7 Распределение уровней речи перед ртом говорящего
- •1.2 Слух
- •1.2.1 Общие сведения
- •1.2.2 Пороги слышимости
- •1.2.3 Логарифмическая ширина критической полосы слуха
- •1.2.4 Маскировка звуков
- •1.2.5 Адаптация слуха
- •Адаптация
- •1.2.6 Биноуральный эффект
- •1.2.7 Громкость звука
- •Заключение
- •Контрольные вопросы
- •Литература к главе 1.
- •Глава 2. Местные аналоговые телефонные системы
- •2.1.Общие сведения
- •2.2.Телефонные аппараты с микротелефонными трубками
- •2.2.1.Разговорная схема
- •2.3.Микрофоны
- •2.3.1. Назначение
- •2.3.2. Характеристики
- •2.3.3. Нелинейные искажения
- •2.3.4. Шумы
- •2.4.Телефоны
- •2.4.1. Назначение
- •2.4.2. Характеристики
- •.2.5.Микротелефонные трубки
- •2.5.1. Назначение
- •2.5.2. Основные параметры
- •.2.6.Частотные характеристики передачи и приема та
- •Заключение
- •Контрольные вопросы
- •Литература к главе 2.
- •Глава 1. Общие положения и терминология
- •1.1. Оконечные устройства, системы передачи и коммутации
- •Организации по разработке стандартов в области электросвязи.
- •1.2.Аналоговая телефонная сеть
- •1.2.1. Иерархия сети
- •1.2.2. Системы коммутации
- •Электромеханические системы коммутации.
- •Управление по программе.
- •1.2.3. Системы передачи
- •Воздушная линия связи.
- •Кабельные пары.
- •Двухпроводная и четырехпроводная передача.
- •Переход с двухпроводной цепи на четырехпроводную.
- •Дуплекс и полудуплекс.
- •1.2.7. Факторы, влияющие на качество передачи
- •Затухание сигнала.
- •Помехи.
- •. Искажения.
- •Эхо и самовозбуждение.
- •1.2.8. Уровни мощности
- •1.2.9. Сигнализация
- •Функции сигнализации.
- •Внутриканальная сигнализация.
- •Межстанционная сигнализация по общему каналу.
- •1.2.10.Устройства сопряжения
- •Устройство сопряжения абонентского шлейфа (абонентский комплект).
- •1.2.11. Специальные виды обслуживания
- •Передача данных.
- •1.3. Введение в цифровую связь
- •1.3.1. Преобразование речи в цифровую форму
- •1.3.2. Временное группообразование
- •Иерархия систем с временным группообразованием.
- •1.3.5.Цифровая коммутация
- •1.3. Цифровые телефонные сети
- •1.3.1. Преимущества цифровых сетей передачи речи
- •Простота группообразования
- •Простота сигнализации
- •Использование современной технологии
- •Цифровая обработка сигналов.
- •Интеграция систем передачи и коммутации
- •Возможность работы при малых значениях отношения сигнал-шум (помеха)
- •Регенерация сигнала
- •Приспосабливаемость к другим видам обслуживания
- •Возможность контроля рабочих характеристик
- •Простота засекречивания
- •1.3.2. Недостатки цифровых сетей передачи речи
- •Расширение полосы частот
- •Аналого-цифровое преобразование
- •Необходимость временнби синхронизации
- •Топологические ограничения группообразования
- •Несовместимость с существующими аналоговыми устройствами
- •1.4. Экономические аспекты
- •Заключение
- •3.1. Классификация алгоритмов кодирования речи
- •3.1.1. Прямое аналого-цифровое преобразование
- •3.1.2. Эффективное кодирование речи
- •3.1.3. Моделирование речеобразующего аппарата человека
- •3.1.4.Адаптивные кодеки
- •3.1.5. Синтезаторы речи
- •3.1.6. Ортогональное преобразование речевого сигнала
- •3.2. Алгоритмы кодирования
- •3.2 Импульсно-кодовая модуляция
- •3.2.1 Шум квантования
- •3.2.2 Шумы незагруженного канала
- •3.2.3 Импульсно-кодовая модуляция с равномерным квантованием
- •3.2.4 Компандирование
- •3.2.5 Кодирование с простой линеаризацией
- •3.2.6 Адаптивная регулировка усиления
- •3.3 Избыточность речи
- •3.3.1 Неравномерное распределение амплитуд
- •3.3.2 Корреляция между дискретами
- •3.3.3 Корреляция, связанная с периодичностью в сигнале
- •3.3.4 Корреляция между периодами основного тона
- •3.3.5 Избыточность, связанная с неактивностью речи
- •3.3.6 Неравномерный усредненный спектр
- •3.3.7 Кратковременный спектр
- •3.4 Дифференциальная импульсно-кодовая модуляция
- •3.4.1 Варианты реализации дикм
- •3.4.2 Предсказание более высокого порядка
- •3.5 Дельта-модуляция
- •3.5.1 Перегрузка по крутизне
- •3.5.2 Линейная дельта-модуляция
- •3.5.3 Слоговое компандирование
- •3.5.4 Адаптивная дельта-модуляция
3.3.2 Корреляция между дискретами
Высокий коэффициент корреляции порядка 0,85 показывает, что при любой попытке существенно уменьшить скорость передачи необходимо учитывать корреляцию между соседними дискретами. Фактически при частоте дискретизации 8 кГц существует также значительная корреляция между дискретами, расположенными через один и через два дискрета. Единственно, что корреляция между дискретами возрастает с увеличением частоты дискретизации.
Простейшим спрособом использования корреляции между дискретами речи является кодирование только разностей между соседними дискретами. Результаты измерений накапливаются затем в декодере для восстановления сигнала. По существу, эти системы кодируют крутизну или производную сигнала на передающей стороне и восстанавливают сигнал путем интегрирования на приемной стороне. Алгоритмы аналогово-цифровых преобразований такого типа рассматриваются в последующих разделах.
3.3.3 Корреляция, связанная с периодичностью в сигнале
Хотя для передачи речевого сигнала и требуется вся полоса от 300 до 3400 Гц, предоставляемая каналом ТЧ, в любой конкретный момент времени определенные звуки могут быть построены только из колебаний нескольких частот в пределах этой полосы. Если звук имеет только несколько основных частот, то в сигнале наблюдается сильная корреляция между болшим числом дискретов, относящихся к нескольким периодам колебаний. Периодический характер гласных и звонких согласных звуков виден на рис. 3.22.
Кодеры, использующие избыточность, обусловленную периодичностью речи, являются существенно более сложными устройствами, чем кодеры, предназначенные только для удаления избыточности в соседних дискретах. Фактически эти кодеры представляют собой более или менее превосходную форму от кодеров сигнала, работающих с относительно высокой скоростью передачи и обеспечивающих натуральное звучание, к вокодерам, работающим с относительно низкой скоростью передачи и дающим синтетическое звучание.
3.3.4 Корреляция между периодами основного тона
По способам генерации звуки человеческой речи часто относят к одной из двух категорий. Первая категория охватывает звуки, которые создаются в результате вибрации голосовых связок. При каждой вибрации поток выдыхаемого воздуха пропускается из легких в речеобразующий тракт. Интервал времени между прохождением струй воздуха, возбуждающих речеобразующий тракт, называется периодом основного тона, или, более просто: частота возбуждения соответствует основному тону. В общем смысле такие звуки возникают пригенерации гласных звуков и некоторой части согласных. Пример реализации такого звука представлен на рис. 3.22.
Вторая категория звуков включает в себя щелевые, или глухие звуки. Глухие звуки возникают при непрерывном протекании воздуха от легких через речеобразующий тракт, суженный в некоторой точке для образования тублентностей воздуха. Глухие звуки относятся к некоторым согласным, таким как ф, с. Пример сигнала глухого звука представлен на рис. 3.23. Отметим, что глухой звук существенно больше похож на случайный сигнал, чем гласный или звонкий согласный.
Как показано на рис. 3.22, на гласных или звонких согласных звуках заметна не только избыточность, связанная с периодичностью в сигнале и упомянутая в разд. 3.3.3, но и долговременная периодичность, относящаяся к основному тону. Вследствие этого одним из наиболее эффективных способов кодирования звонких отрезков речи является кодирование сигнала на одном периоде основного тона и использование результатов этого кодирования как шаблона на каждом последующем периоде основного тона в одном и том же звуке. Периоды основного тона составляют обычно от 5 до 20 мс для мужчин и от 2,5 мс до 10 мс для женщин. Поскольку типовой гласный или звонкий согласный звук длится примерно 100 мс, в один звук может уложиться 20-40 периодов основного тона. Хотя кодирование на периоде основного тона может значительно уменьшить скорость передачи, иногда основной тон очень трудно выделить. (Отнюдь не все звонкие согласные звуки содержат четко идентифицируемый период основного тона, какой показан на рис. 3.22). Если же закодировать сигнал на периоде основного тона с ошибками, то это приводит к созданию необычных звуков.
Интересный аспект кодирования на периоде основного тона состоит в том, что это дает средства для ускорения речи при сохранении разборчивости. При удалении некоторой части периодов основного тона из каждого звука (фонемы) частота генерации речи существенно возрастает, что в некоторой степени аналогично более быстрому формированию слов. Основной тон звуков остается неизменным. В противоположность этому, если просто увеличить скорость восстановления, то все частоты, включая и основной тон, пропорционально увеличатся. Небольшое ускорение дает заметные искажения, а при значительном ускорении речь становится неразборчивой. Устройства, предназначенные для имитации ускоренного формирования слов, показали, что люди способны воспринимать речевую информацию намного быстрее, чем нормально ее воспроизводят.