Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1 половина.doc
Скачиваний:
33
Добавлен:
18.11.2019
Размер:
4.2 Mб
Скачать

Глава 3. Восприятие и распознавание речевых образов

3.1 Роль речевого общения

Человек воспринимает окружающую действительность через органы чувств. Они в совокупности с центральной нервной системой образуют по терминологии великого русского ученого физиолога И.П.Павлова первую сигнальную систему. Вторая сигнальная система по учению И.П.Павлова образуется на ос­нове речевого общения. Он писал: "Человек прежде всего вос­принимает действительность через вторую сигнальную сис­тему". И.П.Павлов подчеркивал важную роль второй сигнальной системы во взаимоотношениях людей. Известно выражение "Речь лечит, но речь и ранит". Каждый испытал на себе спра­ведливость этого утверждения.

Вопросы формирования речи, ее свойств, ее восприятия важные составляющие изучаемого курса. На основе понимания этих процессов выдвигают технические требования к трактам передачи сигналов, к построению систем и устройств электрической связи, звукового и телевизионного вещания, зву­коусиления, перевода речей (в том числе, автоматического), пе­реговорных устройств, средств анализа и синтеза речи (вокоде­ров), аппаратуры управления голосом различных машин и при­боров, слушающих, печатающих, говорящих автоматов, уст­ройств кодирования и скрытной передачи речевых сообщений, опознания человека "по голосу" и некоторых других устройств.

3.2. Речевое сообщение и речевой сигнал

Приступая к рассмотрению вопросов формирования речи, напомним некоторые определения, прежде всего, содержание понятий "речевое сообщение" и "речевой сигнал".

Речевое сообщение создается в мозгу человека. Затем оно превращается в команды нервной системы. Они управляют движениями органов речи. Эти движения формируют в речеобразующем тракте акустические речевые сигналы. Возникшие сигналы излучаются в окружающее человека пространство в виде акустических (звуковых) волн.

В электрических трактах связи, звукового и телевизионного вещания сигналы передаются переменными электрическими токами или электромагнитными полями, воспроизводятся громкоговорителями или головными телефонами и воздействуют на органы слуха человека. Далее акустические колебания воздуха преобразуются в механические колебания барабанной перепонки, слуховыми косточками среднего уха и во внутреннем ухе, вращаются в нервные раздражения, передаваемые в мозг. Центральная нервная система расшифровывает нервные импульсы и воссоздает первоначальное сообщение.

Из изложенного видно, что понятия "сообщение" и "сигнал" отличаются. Сообщение имеет смысловой (семантический) актер, а сигнал является его отображением в виде акустических или электромагнитных процессов.

Для получения шумозащищенного рече­вого сигнала используют гортань как источ­ник речевых колебаний. Эти колебания соз­даются при произнесении звуков речи и явля­ются чисто механическими колебаниями тканей, прилегающих к гортани. Наиболее интенсивные колебания получаются на низ­ких частотах. Скорость колебаний этих тка­ней уменьшается к высоким частотам по квадратичному закону. При увеличении частоты вдвое скорость колебаний уменьшается вчетверо, что соответствует снижению уровня на 12 дБ/окт

Рисунок 3.1. Процесс образования первичного речевого сообщения

Процесс образования первичного речевого сообщения может быть представлен упрощенной схемой рис.3.1. Здесь 1 -источник потока воздуха (легкие), 2 - голосовые связки, 3 и 5 -полости гортани и рта, 4 - соединяющий их проход, 6 - губы говорящего. В формировании некоторых звуков участвуют полости и проходы носа. В форме, более привычной для инженера, речеобразующие органы представлены схемой рис.3.2, на нем 1 - источник потока воздуха (легкие), 2 - своеобразный регулятор потока - голосовые связки, 3 - полость гортани, 4 -полость рта, 5 - полости носа, 6 и 7 соответственно ротовой и носовой выходы.

Рисунок 3.2. Процесс образования первичного речевого сообщения

.3.3. Речевые форманты

Характер первичного речевого сигнала зависит от интенсивности потока воздуха и состава возбуждаемых колебаний. В большинстве случаев спектр речевого сигнала занимает область частот 0,15...7 кГц. Колебания голосовых связок в пер­вом приближении можно считать периодическими колебаниями сложной формы, образующими кроме низшей частоты - час­тоты основного тона - гармоники, (рис. 3.3,а). Их число в неко­торых случаях превышает 40. На линейчатый спектр колебаний голосовых связок накладывается передаточная функция речеобразующего тракта (рис. 3.3,б).

Рисунок 3.3. Спектр речевого сигнала и передаточная функция.

Форма передаточной функции определяется конфигурацией и объемами полостей гортани, рта, носа, положением нижней челюсти, языка, зубов, губ. На нижних частотах линей­ные размеры полостей много меньше длины волны возбуждае­мых колебаний. Поэтому полости представляют собой колеба­тельные системы с сосредоточенными параметрами. В области нескольких тысяч герц линейные размеры полостей и длины волн возбуждаемых колебаний становятся соизмеримыми. То­гда полости следует рассматривать как колебательные системы с распределенными параметрами. В общем случае значения резонансных частот зависит от положения названных выше час­тей речообразующего тракта. Гармоники, возбужденные колебаниями голосовых связок и попадающие в области резонансных частот, усиливаются, другие гармоники ослабляются (рис 3.3,в).

Области максимумов спектра называют речевыми формантами. Заметим, что некоторые исследователи называют формантами только те спектральные максимумы, которые оп­ределяют конкретные звуки речи. Второе определение фор­мант, по-видимому, более точно, т.к. для некоторых голосов огибающая спектра в пределах одной формантной области, особенно второй, не имеет формы одногорбой кривой. Поэтому говорят о нескольких формантах в одной формантной области. Такова позиция ученых-фонетиков. Однако и ученые технического профиля придерживаются первого определения формант. Заметим, что центральная частота формантной области и ре­зонансная частота (мода) полости речеобразующего тракта не являются синонимами. Первая лежит ниже второй. Формантные области звуков русской речи представлены таблице 3.1.

Из приведенных данных ясно, почему звуки С и Ф совершенно не передаются по телефонным каналам. Частоты их формантных областей лежат за пределами верхней частоты ка­нала 3400 Гц. Это замечание в некоторой мере касается и зву­ка 3.

Речевые форманты по мере возрастания их частоты обозначаются как F1, F2 и т.д., а их центральные частоты обозначаются F1, F2 и т.д. Гласные звуки возбуждаются почти пе­риодическими колебаниями голосовых связок. В образовании согласных звуков главная роль принадлежит потоку воздуха с шумовым спектром. Голосовые связки в этом процессе почти не участвуют. Но и этом случае характер звука определяется положением и движениями нижней челюсти, языка, зубов и губ.

Таблица 3.1. Формантные области звуков русской речи

Звучание различных гласных определяется различным распределением формантных областей. Определяющую роль играет соотношение центральных частот первой и второй формантных областей. Связь этих частот в фонетике выражают графически так называемым четырехугольником гласных, который строят в виде функции центральной частоты второй формантной области от центральной частоты первой формантной области (рис.3.5). Слева вверху на этом графике расположена точка, соответствующая звуку И, левее и ниже - звуку Е. Затем график круто, почти вертикально спускается к точке, опреде­ляющей звук А, поворачивает влево к точкам О и У и, наконец, возвращается к точке звука И.

Рисунок 3.5. Четырехугольник гласных

Важная характеристика звуков речи - частота основного тона. Она определяется частотой следования импульсов воздуха, создаваемых голосовыми связками. Частоты основного тона у большинства людей лежат в пределах от 70 до 450 Гц. Если голосовые связки тонки или сильно напряжены, частота основного тона высока, если связки толсты или менее напряжены, частота основного тона ниже. Область частот основного тона индивидуальна. Изменения этой частоты лишь немного превышают диапазон одной октавы. При произношении звуков речи частота основного тона изменяется в зависимости от ударения и подчеркивания (акцентирова­ния) звуков и слов. Изменения частоты основного тона называют интонацией. По изменению частоты основного тона можно до некоторой степени судить об эмоциональном состоянии человека.

Основной тон, интонация, манера произношения ("устный почерк") говорящего и тембр (окраска) голоса служат для опознания личности человека. Степень достоверности опознания по голосу выше, чем по отпечаткам пальцев. Эти свойства речи используют в аппаратуре, срабатывающей только от опреде­ленного голоса, а также в криминалистике.