
- •Глава 1. Механизмы речевого общения 2
- •Глава 1. Общие положения и терминология 26
- •Глава 3. Преобразование речи в цифровую форму 76 предисловие
- •Глава 1. Механизмы речевого общения
- •1.1. Речь
- •1.1.1 Общие сведения
- •1.1.2 Спектр речи
- •Речевой сигнал.
- •1.1.3 Спектр формант
- •Форманты
- •1.1.4 Амплитудное распределение. Динамический диапазон. Пик-фактор.
- •1.1.5 Распределение формант
- •1.1.6 Временные характеристики речи
- •1.1.7 Распределение уровней речи перед ртом говорящего
- •1.2 Слух
- •1.2.1 Общие сведения
- •1.2.2 Пороги слышимости
- •1.2.3 Логарифмическая ширина критической полосы слуха
- •1.2.4 Маскировка звуков
- •1.2.5 Адаптация слуха
- •Адаптация
- •1.2.6 Биноуральный эффект
- •1.2.7 Громкость звука
- •Заключение
- •Контрольные вопросы
- •Литература к главе 1.
- •Глава 2. Местные аналоговые телефонные системы
- •2.1.Общие сведения
- •2.2.Телефонные аппараты с микротелефонными трубками
- •2.2.1.Разговорная схема
- •2.3.Микрофоны
- •2.3.1. Назначение
- •2.3.2. Характеристики
- •2.3.3. Нелинейные искажения
- •2.3.4. Шумы
- •2.4.Телефоны
- •2.4.1. Назначение
- •2.4.2. Характеристики
- •.2.5.Микротелефонные трубки
- •2.5.1. Назначение
- •2.5.2. Основные параметры
- •.2.6.Частотные характеристики передачи и приема та
- •Заключение
- •Контрольные вопросы
- •Литература к главе 2.
- •Глава 1. Общие положения и терминология
- •1.1. Оконечные устройства, системы передачи и коммутации
- •Организации по разработке стандартов в области электросвязи.
- •1.2.Аналоговая телефонная сеть
- •1.2.1. Иерархия сети
- •1.2.2. Системы коммутации
- •Электромеханические системы коммутации.
- •Управление по программе.
- •1.2.3. Системы передачи
- •Воздушная линия связи.
- •Кабельные пары.
- •Двухпроводная и четырехпроводная передача.
- •Переход с двухпроводной цепи на четырехпроводную.
- •Дуплекс и полудуплекс.
- •1.2.7. Факторы, влияющие на качество передачи
- •Затухание сигнала.
- •Помехи.
- •. Искажения.
- •Эхо и самовозбуждение.
- •1.2.8. Уровни мощности
- •1.2.9. Сигнализация
- •Функции сигнализации.
- •Внутриканальная сигнализация.
- •Межстанционная сигнализация по общему каналу.
- •1.2.10.Устройства сопряжения
- •Устройство сопряжения абонентского шлейфа (абонентский комплект).
- •1.2.11. Специальные виды обслуживания
- •Передача данных.
- •1.3. Введение в цифровую связь
- •1.3.1. Преобразование речи в цифровую форму
- •1.3.2. Временное группообразование
- •Иерархия систем с временным группообразованием.
- •1.3.5.Цифровая коммутация
- •1.3. Цифровые телефонные сети
- •1.3.1. Преимущества цифровых сетей передачи речи
- •Простота группообразования
- •Простота сигнализации
- •Использование современной технологии
- •Цифровая обработка сигналов.
- •Интеграция систем передачи и коммутации
- •Возможность работы при малых значениях отношения сигнал-шум (помеха)
- •Регенерация сигнала
- •Приспосабливаемость к другим видам обслуживания
- •Возможность контроля рабочих характеристик
- •Простота засекречивания
- •1.3.2. Недостатки цифровых сетей передачи речи
- •Расширение полосы частот
- •Аналого-цифровое преобразование
- •Необходимость временнби синхронизации
- •Топологические ограничения группообразования
- •Несовместимость с существующими аналоговыми устройствами
- •1.4. Экономические аспекты
- •Заключение
- •3.1. Классификация алгоритмов кодирования речи
- •3.1.1. Прямое аналого-цифровое преобразование
- •3.1.2. Эффективное кодирование речи
- •3.1.3. Моделирование речеобразующего аппарата человека
- •3.1.4.Адаптивные кодеки
- •3.1.5. Синтезаторы речи
- •3.1.6. Ортогональное преобразование речевого сигнала
- •3.2. Алгоритмы кодирования
- •3.2 Импульсно-кодовая модуляция
- •3.2.1 Шум квантования
- •3.2.2 Шумы незагруженного канала
- •3.2.3 Импульсно-кодовая модуляция с равномерным квантованием
- •3.2.4 Компандирование
- •3.2.5 Кодирование с простой линеаризацией
- •3.2.6 Адаптивная регулировка усиления
- •3.3 Избыточность речи
- •3.3.1 Неравномерное распределение амплитуд
- •3.3.2 Корреляция между дискретами
- •3.3.3 Корреляция, связанная с периодичностью в сигнале
- •3.3.4 Корреляция между периодами основного тона
- •3.3.5 Избыточность, связанная с неактивностью речи
- •3.3.6 Неравномерный усредненный спектр
- •3.3.7 Кратковременный спектр
- •3.4 Дифференциальная импульсно-кодовая модуляция
- •3.4.1 Варианты реализации дикм
- •3.4.2 Предсказание более высокого порядка
- •3.5 Дельта-модуляция
- •3.5.1 Перегрузка по крутизне
- •3.5.2 Линейная дельта-модуляция
- •3.5.3 Слоговое компандирование
- •3.5.4 Адаптивная дельта-модуляция
3.5.2 Линейная дельта-модуляция
В наиболее простом дельта-модуляторе используются шаги постоянного размера для всех уровней сигнала, поэтому он называется равномерным, или линейным дельта-модулятором. Расчет линейного дельта-модулятора в основном связан с выбором размера постоянного шага и частоты дискретизации и направлен на удовлетворение двух критериев. Во-первых, отношение сигнал-гранулярный шум должно иметь определенное минимальное значение при наиболее низком уровне кодируемого сигнала. Во-вторых, отношение сигнал-шум перегрузки по крутизне должно иметь некое минимальное значение для самого высокого уровня сигнала, подлежащего кодированию.
Для удовлетворения критерия, связанного с перегрузкой по крутизне, удобно использовать выражение (3.12) и рассчитывать систему таким образом, чтобы перегрузка по крутизне наступала как раз на границе самого высокого уровня входного сигнала. Вследствие этого размер шага для самого большого уровня сигнала не является оптимальным в смысле качества восприятия или даже в смысле минимизации суммы гранулярного шума и шума перегрузки. Однако, когда имеется только гранулярный шум, характеристика ОСШК для дельта-модулятора может быть соответствующим образом сопоставлена с характеристикой ОСШК системы с ИКМ. Сопоставление этих двух методов кодирования при других условиях, например, тогда когда происходит перегрузка в любой из этих систем, требует оценки слушателями.
Уровень ожидаемой энергии от одиночной (без перегрузки) ошибки квантования в системе с дельта-модуляцией определяется из выражения (3.2) как q2/12 гдеq– размер шага. Однако вследствие относительно высокой частоты дискретизации в системе с ДМ спектр ошибок квантования занимает более широкую полосу, чем в системе с ИКМ. Благодаря этому выходной фильтр ДМ-декодера подавляет более высокий процент шума квантования, чем выходной фильтр ИКМ-декодера. Для частот дискретизации, которые более чем в 6 раз превышают максимальную частоту входного фильтра, шум квантования на выходе, по существу, пропорционален отношению частоты среза фильтра к частоте дискретизации. Вследствие этого мощность шума квантования линейного дельта-модулятора может быть аппроксимирована следующим образом:
Мощность шума квантования линейной ДМ = (Kfc/fs)q2, (3.13)
где fc– частота среза выходного фильтра,fs– частота дискретизации, q – размер шага, К = 0,32.
Величина К в формуле (3.13) определялась многочисленными исследователями, получившими такие значения, как 0,18 [23]; 0,32 [24]; 0,51 [25] и 0,67 [26]. Нами выбрано значение 0,32, поскольку оно чаще всего используется и является исходным значением, полученным де Ягером в его основополагающей работе в области дельта-модуляции [24]. Было предложено множество разновидностей дельта-модуляторов, что привело к появлению множества других выражений для мощности шума квантования.
Если в качестве входного использовать синусоидальный сигнал с частотой f, то можно объединить выражения (3.12) и (3.13) и получить для отношения сигнал-шум квантования линейного дельта-модулятора следующее обычно используемое выражение:
ОСШК = (A2/2) / [(K fc / fs)(2fA/fs)2], (3.14)
где в качестве входного сигнала принята синусоида Asin2ft, а размер шага выбран так, чтобы предотвратить перегрузку по крутизне [см. (3.12)].
При пользовании выражением (3.14) не следует забывать некоторые важные предположения, принятые при его выводе. Во-первых, выражение (3.14) относится только к гранулярному шуму. Во-вторых, размеры шагов в этом выражении подогнаны к перегрузке по крутизне для конкретного синусоидального входного сигнала. Если размер шага согласно выражению (3.14) используется для входного сигнала с той же амплитудой, но с более высокой частотой, наступит перегрузка по крутизне. Кроме того, для сигналов с пониженными уровнями получается меньшее ОСШК, если шаг имеет тот же размер. Наиболее обманчивый аспект формулы (3.14) состоит в том, что из нее следует, будто линейный дельта-модулятор дает более высокое значение ОСШК для низкочастотных сигналов, чем для высокочастотных. Это предположение справедливо, если размер шага подстроен под меньшую величину низкочастотного сигнала.
Зависимость (3.14) отображена на рис. 3.32 для различных частот входного сигнала. Отметим, что ОСШК улучшается на 9 дБ на октаву (удвоение) частоты дискретизации. В отличие от этого в системе с ИКМ ОСШК улучшается на 6 дБ с каждым добавочным разрядом. Вследствие этого системы с ИКМ дают лучшее качество при высоких скоростях передачи, а дельта-модуляторы – при низких скоростях передачи около 40 кбит/с.
При использовании синусоидального колебания с частотой 800 Гц в качестве испытательного сигнала из выражения (3.14) определяем (это же показывает и рис. 3.32), что для получения ОСШК, равного 26 дБ при линейной дельта-модуляции требуется частота дискретизации порядка 28 кГц. Соответствующую скорость передачи порядка 28 кбит/с следует сопоставить с четырьмя разрядами на дискрет, или со скоростью передачи 32 кбит/с линейной системы с ИКМ, для которой ранее было вычислено то же самое ОСШК.
Выражение (3.14) определяет ОСШК для синусоидального сигнала с постоянной амплитудой. Следующее соотношение определяет частоту дискретизации (скорость передачи), необходимую для получения конкретного ОСШК, и содержит также коэффициент динамического диапазона R:
fs= (25Rf2fс*ОСШК)1/3, (3.15)
где R—динамический диапазон (Amax/Аmin)2,f– частота входного сигнала,fc– частота среза выходного фильтра, ОСШК — требуемое минимальное значение отношения сигнал-шум квантования.
Выражение (3.15) справедливо при предложении, что размер шага выбран исходя из отсутствия перегрузки по крутизне для сигнала с наивысшим уровнем:
q = 2Amax(f/fs). (3.16)
Отметим снова, что выражения (3.15) и (3.16) соответствуют расчету дельта-модулятора с большим запасом, поскольку они не допускают перегрузки по крутизне. Однако они полезны, так как согласуются с расчетом ИКМ без перегрузки, представленным ранее.
Пример 3.5.Используя синусоидальное колебание с частотой 800 Гц в качестве входного сигнала, определите размер шага и частоту дискретизации в линейном дельта-модуляторе, необходимые для получения при кодировании речи ОСШК, равного 398 (26 дБ), и динамического диапазона порядка 1000 (30 дБ). Предположим, что частота среза выходного фильтра равна 3,4 кГц.
Решение.Формулы (3.15) и (3.16) дают соответственно следующие значения для частоты дискретизации и размера шага:
q= 2Аmax*800/279000 = 0,018 Аmax= 0,56 Аmax.
Скорость передачи 279 кбит/с следует сопоставить с 9 разрядами на дискрет и скоростью передачи 72 кбит/с, полученной ранее для ИКМ с равномерным шагом.
Размер шага, полученный в примере 3.5, достаточен лишь для того, чтобы только-только предотвратить перегрузку при максимальном уровне входного сигнала с частотой 800 Гц. Вследствие этого сигнал с более высокой частотой и той же амплитудой вызовет перегрузку кодера. Оценка усредненного спектра речи на рис. 3.24 показывает, однако, что частота 800 Гц находится вблизи частот составляющих с максимальной амплитудой, а на более высоких частотах в среднем мощность, значительно меньше. Вследствие этого единственный размер шага приблизительно подходит для передачи всего диапазона частот без перегрузки по крутизне. И действительно, на рис. 3.24 показано, что амплитуда составляющей с частотой порядка 2400 Гц обычно снижается примерно в 5,6 раза (на 15 дБ), в то время как требуется снизить ее только в 3 раза, чтобы получить крутизну меньше крутизны сигнала с частотой 800 Гц. Отсюда входной сигнал с частотой 800 Гц с достаточной точностью определяет размер шага, необходимый для исключения перегрузки по крутизне.
Довольно неожиданным результатом, полученным в примере 3.5, является относительно грубый шаг (0,56 Amin) используемый для кодирования синусоидального сигнала с минимальной амплитудой. Несмотря на это, дельта-модулятор дает ОСШК, равное 26 дБ, вследствие удаления входным фильтром большой части шумов квантования. На рис. 3.33 изображена часть грубо закодированной синусоиды с частотой 800 Гц при использовании частоты дискретизации и размера шага, полученных в примере 3.5. Показано также среднее за короткий период времени значение кодированного сигнала, которое для всех практических целей является эквивалентным входным сигналом для выходного фильтра. Отметим что высокая частота дискретизации дает очень тонкое разрешение для момента времени, когда сигнал пересекает границу квантования. Таким образом, дельта-модулятор кодирует сигнал с грубым квантованием по амплитуде, но с тонким квантованием по времени. В противоположность этому в системе с ИКМ используется относительно тонкое разрешение по амплитуде, но грубое квантование по времени.
Основной недостаток линейной дельта-модуляции, подобно ИКМ с равномерным шагом, состоит в том, что сигналы и с низким и высоким уровнями кодируются шагом одного и того же размера. Вследствие этого сигналы с высоким уровнем кодируются с избыточным качеством, что приводит к повышению скорости передачи. Решение, естественно, состоит в том, чтобы изменять размер шага в какой-то зависимости от крутизны входного сигнала. Обычно размер шага подстраивается постепенно в соответствии с усредненным за короткое время значением крутизны сигнала.
При реализации дельта-модулятора большое значение имеет поддержание в кодере и декодере равенства шагов в положительную и отрицательную сторону. Если размеры шагов различаются в декодере, то в восстановленном сигнале накапливается смещение за счет постоянной составляющей, что может привести к насыщению цепей. Как будет показано в следующем разделе, с небольшим различием размеров шагов в декодере можно сравнительно легко примириться. В то же время различие размеров шагов в кодере доставляет больше неприятностей и требует пристального внимания.
Когда в дельта-модуляторе кодируется сигнал незагруженного канала (пауза речи), выходной цифровой сигнал с идеальной точностью меняется между 0 и 1. Если происходит именно такое изменение, выходной фильтр декодера устраняет относительно высокочастотные шумы дискретизации. Однако, если размеры шагов различаются, как показано на рис. 3.34, то случайно могут появиться две последовательные единицы или два последовательных нуля. Поскольку пары нулей или единиц появляются относительно редко, они создают низкочастотные искажения, которые не отфильтровываются и проявляются в виде шумов незагруженного канала. Шумы незагруженного канала представляют особую проблему при разработке дельта-модуляторов из-за относительно больших шагов квантования (см. пример 3.5). Одним из средств балансировки размеров шагов в кодере является вычитание смещения, получаемого низкочастотной фильтрацией (интегрированием) сигнала в цепи обратной связи в течение длительного периода времени [20].