- •Глава 1. Механизмы речевого общения 2
- •Глава 1. Общие положения и терминология 26
- •Глава 3. Преобразование речи в цифровую форму 76 предисловие
- •Глава 1. Механизмы речевого общения
- •1.1. Речь
- •1.1.1 Общие сведения
- •1.1.2 Спектр речи
- •Речевой сигнал.
- •1.1.3 Спектр формант
- •Форманты
- •1.1.4 Амплитудное распределение. Динамический диапазон. Пик-фактор.
- •1.1.5 Распределение формант
- •1.1.6 Временные характеристики речи
- •1.1.7 Распределение уровней речи перед ртом говорящего
- •1.2 Слух
- •1.2.1 Общие сведения
- •1.2.2 Пороги слышимости
- •1.2.3 Логарифмическая ширина критической полосы слуха
- •1.2.4 Маскировка звуков
- •1.2.5 Адаптация слуха
- •Адаптация
- •1.2.6 Биноуральный эффект
- •1.2.7 Громкость звука
- •Заключение
- •Контрольные вопросы
- •Литература к главе 1.
- •Глава 2. Местные аналоговые телефонные системы
- •2.1.Общие сведения
- •2.2.Телефонные аппараты с микротелефонными трубками
- •2.2.1.Разговорная схема
- •2.3.Микрофоны
- •2.3.1. Назначение
- •2.3.2. Характеристики
- •2.3.3. Нелинейные искажения
- •2.3.4. Шумы
- •2.4.Телефоны
- •2.4.1. Назначение
- •2.4.2. Характеристики
- •.2.5.Микротелефонные трубки
- •2.5.1. Назначение
- •2.5.2. Основные параметры
- •.2.6.Частотные характеристики передачи и приема та
- •Заключение
- •Контрольные вопросы
- •Литература к главе 2.
- •Глава 1. Общие положения и терминология
- •1.1. Оконечные устройства, системы передачи и коммутации
- •Организации по разработке стандартов в области электросвязи.
- •1.2.Аналоговая телефонная сеть
- •1.2.1. Иерархия сети
- •1.2.2. Системы коммутации
- •Электромеханические системы коммутации.
- •Управление по программе.
- •1.2.3. Системы передачи
- •Воздушная линия связи.
- •Кабельные пары.
- •Двухпроводная и четырехпроводная передача.
- •Переход с двухпроводной цепи на четырехпроводную.
- •Дуплекс и полудуплекс.
- •1.2.7. Факторы, влияющие на качество передачи
- •Затухание сигнала.
- •Помехи.
- •. Искажения.
- •Эхо и самовозбуждение.
- •1.2.8. Уровни мощности
- •1.2.9. Сигнализация
- •Функции сигнализации.
- •Внутриканальная сигнализация.
- •Межстанционная сигнализация по общему каналу.
- •1.2.10.Устройства сопряжения
- •Устройство сопряжения абонентского шлейфа (абонентский комплект).
- •1.2.11. Специальные виды обслуживания
- •Передача данных.
- •1.3. Введение в цифровую связь
- •1.3.1. Преобразование речи в цифровую форму
- •1.3.2. Временное группообразование
- •Иерархия систем с временным группообразованием.
- •1.3.5.Цифровая коммутация
- •1.3. Цифровые телефонные сети
- •1.3.1. Преимущества цифровых сетей передачи речи
- •Простота группообразования
- •Простота сигнализации
- •Использование современной технологии
- •Цифровая обработка сигналов.
- •Интеграция систем передачи и коммутации
- •Возможность работы при малых значениях отношения сигнал-шум (помеха)
- •Регенерация сигнала
- •Приспосабливаемость к другим видам обслуживания
- •Возможность контроля рабочих характеристик
- •Простота засекречивания
- •1.3.2. Недостатки цифровых сетей передачи речи
- •Расширение полосы частот
- •Аналого-цифровое преобразование
- •Необходимость временнби синхронизации
- •Топологические ограничения группообразования
- •Несовместимость с существующими аналоговыми устройствами
- •1.4. Экономические аспекты
- •Заключение
- •3.1. Классификация алгоритмов кодирования речи
- •3.1.1. Прямое аналого-цифровое преобразование
- •3.1.2. Эффективное кодирование речи
- •3.1.3. Моделирование речеобразующего аппарата человека
- •3.1.4.Адаптивные кодеки
- •3.1.5. Синтезаторы речи
- •3.1.6. Ортогональное преобразование речевого сигнала
- •3.2. Алгоритмы кодирования
- •3.2 Импульсно-кодовая модуляция
- •3.2.1 Шум квантования
- •3.2.2 Шумы незагруженного канала
- •3.2.3 Импульсно-кодовая модуляция с равномерным квантованием
- •3.2.4 Компандирование
- •3.2.5 Кодирование с простой линеаризацией
- •3.2.6 Адаптивная регулировка усиления
- •3.3 Избыточность речи
- •3.3.1 Неравномерное распределение амплитуд
- •3.3.2 Корреляция между дискретами
- •3.3.3 Корреляция, связанная с периодичностью в сигнале
- •3.3.4 Корреляция между периодами основного тона
- •3.3.5 Избыточность, связанная с неактивностью речи
- •3.3.6 Неравномерный усредненный спектр
- •3.3.7 Кратковременный спектр
- •3.4 Дифференциальная импульсно-кодовая модуляция
- •3.4.1 Варианты реализации дикм
- •3.4.2 Предсказание более высокого порядка
- •3.5 Дельта-модуляция
- •3.5.1 Перегрузка по крутизне
- •3.5.2 Линейная дельта-модуляция
- •3.5.3 Слоговое компандирование
- •3.5.4 Адаптивная дельта-модуляция
1.1.6 Временные характеристики речи
Временные характеристики речи имеют важное значение при решении ряда задач, связанных с проектированием целого ряда устройств и аппаратуры телефонной связи, например таких, действие которых управляется речевым сигналом, а точнее, его наличием или отсутствием. Для решения таких задач необходимо знать среднестатистические временные характеристики. К ним можно отнести длительность пауз между элементами речи, среднюю скорость речи, относительную длительность пауз в непрерывной речи.
Установлено, что длительность отдельных звуков речи составляет 20 – 350 мс. При этом гласные имеют большую длительность, чем согласные. С учетом максимальной длительности звуков 350 мс паузой в речи считается ее отсутствие в течение более чем 350 мс. В целом средняя длительность пауз в непрерывной речи равна приблизительно 16%, а средняя скорость речи равна 12 – 15 звуков/с.
1.1.7 Распределение уровней речи перед ртом говорящего
Во время телефонного разговора микрофон аппарата может занимать перед ртом говорящего различное положение, зависящее, например, от размеров головы говорящего, геометрии микротелефонной трубки, манеры держать микротелефонную трубку и т.п. Однако в любом случае микрофон будет находиться на относительно небольшом расстоянии от губ говорящего. В связи с этим, а также с учетом необходимости объективной оценки характеристик микрофонов важно знать распределение уровней речи перед ртом говорящего в ближнем свободном акустическом поле.
Рис.1.7. Распределение звукового давления перед ртом в горизонтальной плоскости
Рис.1.8. Распределение звукового давления перед ртом в вертикальной плоскости
На рис. 1.7 представлено распределение звукового давления перед ртом по оси излучения и в горизонтальной плоскости на расстоянии до 4 см от линии губ и до 4 см от оси излучения. Аналогичное распределение в вертикальной плоскости представлено на рис. 1.8
1.2 Слух
1.2.1 Общие сведения
Механизм восприятия человеком простых и сложных звуков, а также осмысленной речи – весьма сложный процесс и до настоящего времени является объектом биопсихологических и физических исследований. Установлено, что слуховой аппарат человека представляет собой комплексное анализирующее устройство, работающее как частотный, временной и пространственный анализатор звуков. Этот анализатор разделен на две части – периферическую, состоящую из наружного, среднего и внутреннего уха, и центральную, в которую входят слуховые нервы и два слуховых центра (правый и левый) головного мозга. Периферическая часть выполняет роль приемника и амплитудно-частотного анализатора. Центральная часть выполняет временной и пространственный анализы и синтезирует результирующий слуховой образ.
Более детальное описание устройства слухового анализатора и механизма слухового восприятия, а также результаты фундаментальных исследований различных характеристик слуха можно найти, например, в [1,5-7]. Отметим лишь, что знание процессов слухового восприятия и в особенности таких, как физические и психофизиологические характеристики слухового анализатора (пороги слышимости, частотный и амплитудный диапазоны слухового восприятия, маскировка слуха, временные характеристики, восприятие громкости звуков, адаптация слуха к раздражителю, биноуральная локализация и др.) необходимо для решения целого ряда технических задач как по проектированию средств речевой связи, так и по разработке методов и приборов оценки качества передачи речевых сообщений.
В целях достижения ясности при последующем изложении рассмотрим такие основные физические характеристики звуков, как звуковое давление и интенсивность звуков. Звуковое давление Р связано со скоростью колебаний частиц воздуха , плотностью воздухаи скоростью распространения звуковых волн в плоском поле следующим соотношением:
Р = С. (1.3)
Единицей измерения звукового давления является паскаль (Па), имеющий размерность Ньютон на метр квадратный (Н/м2).
Интенсивность звука связана со звуковым давлением соотношением
I = P2/( С) (1.4)
и имеет размерность Н/(м*с) = Вт/м2.
Под интенсивностью звука понимается поток энергии, проходящей через единицу площади, расположенной перпендикулярно к направлению распространения звука за единицу времени.
Средняя минимальная интенсивность звука, которая ощущается слухом человека при частоте звуковых колебаний 1000 Гц, составляет 10-12Вт/м2, а средняя максимальная интенсивность, воспринимаемая без болевых ощущений, – порядка 1 Вт/м2. Соответствующие звуковые давления равны 2,03*10 Па.
Оперировать столь обширным диапазоном интенсивностей и звуковых давлений неудобно, особенно при графических построениях. Поэтому обычно пользуются не самими величинами интенсивностей и звуковых давлений, а их абсолютными уровнями. За абсолютный нулевой уровень интенсивности принято значение 10-12Вт/м2, а за абсолютный нулевой уровень звукового давления – значение 2,03*10-5Па, которое для практических расчетов округляется до 2*10-5Па.
Уровни интенсивности звука, а также звукового давления выражаются в децибелах и определяются по формуле
N = 10 lg(I/I0) = 20 lg(P/P0), (1.5)
где I0= 10-12 Вт/м2; Р0= 2*10-5Па; I и Р – соответственно интенсивность звука и его звуковое давление.
На рис. 1.9 графически представлены граничные области слухового восприятия в зависимости от частоты и уровня интенсивности (звукового давления). Нижняя граница (кривая 1) представляет собой усредненный порог слышимости, верхняя (кривая 2) – порог осязания, или болевой порог. Вертикальной штриховкой выделена область, занимаемая музыкальными звуками, горизонтальной – область, занимаемая звуками речи.
Рис.1.9. Граничные области слухового восприятия