- •Глава 1. Механизмы речевого общения 2
- •Глава 1. Общие положения и терминология 26
- •Глава 3. Преобразование речи в цифровую форму 76 предисловие
- •Глава 1. Механизмы речевого общения
- •1.1. Речь
- •1.1.1 Общие сведения
- •1.1.2 Спектр речи
- •Речевой сигнал.
- •1.1.3 Спектр формант
- •Форманты
- •1.1.4 Амплитудное распределение. Динамический диапазон. Пик-фактор.
- •1.1.5 Распределение формант
- •1.1.6 Временные характеристики речи
- •1.1.7 Распределение уровней речи перед ртом говорящего
- •1.2 Слух
- •1.2.1 Общие сведения
- •1.2.2 Пороги слышимости
- •1.2.3 Логарифмическая ширина критической полосы слуха
- •1.2.4 Маскировка звуков
- •1.2.5 Адаптация слуха
- •Адаптация
- •1.2.6 Биноуральный эффект
- •1.2.7 Громкость звука
- •Заключение
- •Контрольные вопросы
- •Литература к главе 1.
- •Глава 2. Местные аналоговые телефонные системы
- •2.1.Общие сведения
- •2.2.Телефонные аппараты с микротелефонными трубками
- •2.2.1.Разговорная схема
- •2.3.Микрофоны
- •2.3.1. Назначение
- •2.3.2. Характеристики
- •2.3.3. Нелинейные искажения
- •2.3.4. Шумы
- •2.4.Телефоны
- •2.4.1. Назначение
- •2.4.2. Характеристики
- •.2.5.Микротелефонные трубки
- •2.5.1. Назначение
- •2.5.2. Основные параметры
- •.2.6.Частотные характеристики передачи и приема та
- •Заключение
- •Контрольные вопросы
- •Литература к главе 2.
- •Глава 1. Общие положения и терминология
- •1.1. Оконечные устройства, системы передачи и коммутации
- •Организации по разработке стандартов в области электросвязи.
- •1.2.Аналоговая телефонная сеть
- •1.2.1. Иерархия сети
- •1.2.2. Системы коммутации
- •Электромеханические системы коммутации.
- •Управление по программе.
- •1.2.3. Системы передачи
- •Воздушная линия связи.
- •Кабельные пары.
- •Двухпроводная и четырехпроводная передача.
- •Переход с двухпроводной цепи на четырехпроводную.
- •Дуплекс и полудуплекс.
- •1.2.7. Факторы, влияющие на качество передачи
- •Затухание сигнала.
- •Помехи.
- •. Искажения.
- •Эхо и самовозбуждение.
- •1.2.8. Уровни мощности
- •1.2.9. Сигнализация
- •Функции сигнализации.
- •Внутриканальная сигнализация.
- •Межстанционная сигнализация по общему каналу.
- •1.2.10.Устройства сопряжения
- •Устройство сопряжения абонентского шлейфа (абонентский комплект).
- •1.2.11. Специальные виды обслуживания
- •Передача данных.
- •1.3. Введение в цифровую связь
- •1.3.1. Преобразование речи в цифровую форму
- •1.3.2. Временное группообразование
- •Иерархия систем с временным группообразованием.
- •1.3.5.Цифровая коммутация
- •1.3. Цифровые телефонные сети
- •1.3.1. Преимущества цифровых сетей передачи речи
- •Простота группообразования
- •Простота сигнализации
- •Использование современной технологии
- •Цифровая обработка сигналов.
- •Интеграция систем передачи и коммутации
- •Возможность работы при малых значениях отношения сигнал-шум (помеха)
- •Регенерация сигнала
- •Приспосабливаемость к другим видам обслуживания
- •Возможность контроля рабочих характеристик
- •Простота засекречивания
- •1.3.2. Недостатки цифровых сетей передачи речи
- •Расширение полосы частот
- •Аналого-цифровое преобразование
- •Необходимость временнби синхронизации
- •Топологические ограничения группообразования
- •Несовместимость с существующими аналоговыми устройствами
- •1.4. Экономические аспекты
- •Заключение
- •3.1. Классификация алгоритмов кодирования речи
- •3.1.1. Прямое аналого-цифровое преобразование
- •3.1.2. Эффективное кодирование речи
- •3.1.3. Моделирование речеобразующего аппарата человека
- •3.1.4.Адаптивные кодеки
- •3.1.5. Синтезаторы речи
- •3.1.6. Ортогональное преобразование речевого сигнала
- •3.2. Алгоритмы кодирования
- •3.2 Импульсно-кодовая модуляция
- •3.2.1 Шум квантования
- •3.2.2 Шумы незагруженного канала
- •3.2.3 Импульсно-кодовая модуляция с равномерным квантованием
- •3.2.4 Компандирование
- •3.2.5 Кодирование с простой линеаризацией
- •3.2.6 Адаптивная регулировка усиления
- •3.3 Избыточность речи
- •3.3.1 Неравномерное распределение амплитуд
- •3.3.2 Корреляция между дискретами
- •3.3.3 Корреляция, связанная с периодичностью в сигнале
- •3.3.4 Корреляция между периодами основного тона
- •3.3.5 Избыточность, связанная с неактивностью речи
- •3.3.6 Неравномерный усредненный спектр
- •3.3.7 Кратковременный спектр
- •3.4 Дифференциальная импульсно-кодовая модуляция
- •3.4.1 Варианты реализации дикм
- •3.4.2 Предсказание более высокого порядка
- •3.5 Дельта-модуляция
- •3.5.1 Перегрузка по крутизне
- •3.5.2 Линейная дельта-модуляция
- •3.5.3 Слоговое компандирование
- •3.5.4 Адаптивная дельта-модуляция
1.1.3 Спектр формант
Форманты
Формантаминазываются усиленные частотные области спектра данного звука, позволяющие отличать его при слуховом восприятии от других звуков. Таким образом, оказывается, что звуки речи по своему спектральному составу отличаются друг от друга как число формант, так и их расположением в частотном спектре.
Под спектром формантпонимается зависимость наивероятнейшего в течение длительного времени спектрального уровня формант В'pот частоты f. При этом следует иметь в виду, что понятия спектрального уровня речи Ври спектрального уровня формант В'pнесколько различаются. В первом случае определяется средний в течение длительного времени энергетический уровень речи, а во втором случае – наиболее вероятное значение уровня формант, которое отличается от среднего энергетического уровня формантных составляющих.
Формантный спектр речи не может быть получен непосредственными изменениями интенсивности формант в ограниченных частотных полосах, так как нет возможности каким-либо образом отделить чисто формантные составляющие речи от неформантных. Формантный спектр русской речи с суммарным уровнем 97,5 дБ (рис. 1.3) был получен косвенным путем на основе артикуляционных изменений в различных частотных полосах и уже известного спектра речи
Рис.1.3. Форматный спектр русской речи
1.1.4 Амплитудное распределение. Динамический диапазон. Пик-фактор.
Регистрируя появление различных энергетических уровней речи в целом или в отдельных частотных полосах, можно установить относительную частость их появления. При этом оказывается, что уровни, близкие к среднему, имеют наибольшую частость. Более высокие и более низкие уровни появляются значительно реже, причем частость появления их тем меньше, чем больше они отклоняются от среднего уровня. Распределение уровней подчиняется закону, весьма близкому к нормальному.
На рис. 1.4 приведена усредненная характеристика амплитудного состава речи, представляющая собой интегральное распределение относительного числа случаев (Z), в которых превышается тот или иной уровень (B), причем за условный нуль принят средний уровень речи.
Приведенное на рис. 1.4 амплитудное распределение позволяет выявить еще две важные характеристики речи – динамический диапазон и пик-фактор.
Из рисунка видно, что средний уровень Вр, условно обозначенный нулем, достигается лишь в 19% интервалов времени длительного наблюдения и превышается на 12 дБ в 1% интервалов. Если теперь этот уровень условно считать максимальным Вр max(считая более высокие уровни случайными редкими выбросами), а в качестве минимального уровня Вр minпринять уровень, превышаемый в 99% интервалов, то динамический диапазон речи, определяемый как разность между максимальным и минимальным уровнями, можно принять равным приблизительно 45 дБ. Разность между максимальным и средним уровнями речи, равная 12 дБ, называется ее пик-фактором РF.
Рис.1.4. Усредненная характеристика амплитудного состава русской речи
Отметим, что иногда пользуются другими значениями пик-фактора, а именно 16 дБ. Это величина превышения среднего уровня речи в 0,1% интервалов наблюдения.
1.1.5 Распределение формант
Под распределением формантбудем понимать зависимость разборчивости формант от граничной частоты передаваемого спектра, т.е. функцию А =(f). Это распределение характеризует частость встречаемости формант в различных участках спектра и позволяет определить границы и средние частоты равноартикуляционных полос, необходимые для расчета разборчивости.
Рис.1.5. Частная зависимость разборчивости формант
Рис.1.6. Частотная зависимость относительного числа формант в полосках шириной 100 Гц
На рис. 1.5 приведено распределение А = (f) для русской речи в интегральной форме, а на рис. 1.6 – в дифференциальной форме. Каждая ордината кривой на рис. 1.6 представляет относительное число формант, содержащихся в полосе шириной 100 Гц, отложенное по средней частоте этой полосы.