Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы по ФОЗИ / Лекции по вопроснику.doc
Скачиваний:
47
Добавлен:
02.05.2014
Размер:
327.17 Кб
Скачать

30. Первичный речевой сигнал

Речь с физической точки зрения состоит из последовательностей звуков с паузами между ними или их группами. При нормальном темпе речи паузы появляются между отрывками фраз, так как при этом слова произносятся слитно. При замедленном темпе речи, при диктовке паузы могут делаться между словами и их частями. Один и тот же звук речи каждый человек произносит по разному. Каждому свойственна своя манера произнесения звуков, но при всем разнообразии их произнесения, звуки являются физической реализацией ограниченного числа фонем. Фонема – то, что человек хочет произнести, а звук – то, что фактически произносит. В русском языке насчитывается 42 основных и 3 неопределенных фонемы. Звуки делятся на звонкие и глухие. Звонкие звуки образуются с участием голосовых связок, находящихся в напряженном состоянии. Импульсы потока воздуха, создаваемые голосовыми связками с достаточной степенью точности могут считаться периодическими. Соответствующий период повторения импульсов называется периодом основного тона. Обратная величина называется частотой основного тона. Если связки тонкие и сильно напряжены, то период получается коротким, а частота – высокой. Частота основного тона для всех голосов лежит в пределах: 70 – 450 Гц. При произнесении речи частота основного тона непрерывно изменяется в соответствии с ударением, подчеркиванием отдельных звуков и слов, а также при проявлении эмоций. Изменение частоты основного тона называется интонацией. У каждого человека совой диапазон изменения основного тона. Обычно бывает немногим более октавы. Интонация имеет большое значение для узнаваемости говорящего. Основной тон, интонация и тембр голоса служат для опознавания человека, причем достоверность опознавания выше, чем при отпечатках пальцев. Это свойство используют для создания аппаратуры, срабатывающей только для определенного голоса. Импульсы основного тона имеют пилообразную форму, и поэтому при их периодическом повторении получается дискретный спектр с большим числом гармоник (до 40) с частотами, кратными частотам основного тона. Огибающая спектра основного тона имеет спад в сторону высоких частот с крутизной около 6 дБ на октаву. Поэтому, например, для мужского голоса с частотой 3 кГц ниже уровня составляющих на 100 Гц примерно на 30 дБ. При произнесении глухих звуков связки находятся в расслабленном состоянии и поток воздуха из легких свободно проходит в полость рта. Встречая на своем пути различные преграды, он образует завихрения, создающие шум со сплошным спектром. При артикуляции в речеобразующем тракте создаются резонансные полости, определенные для каждой фонемы. При произнесении звуков речи через речевой тракт проходит или тональный импульсный сигнал, или шумовой, или оба вместе. Речевой тракт представляет собой сложный акустический фильтр с рядом резонансов, создаваемых полостями рта, носа, носоглотки, т.е. с помощью артикуляционных органов речи. Вследствие этого равномерный, тональный или шумовой спектр превращается в спектр с рядом максимумов (формант) и минимумов (антиформант). Для каждой фонемы огибающая спектра имеет индивидуальную и вполне определенную форму. При произнесении речи спектр ее непрерывно изменяется и образуются формантные переходы. Речь человека: от 70 до 7000 Гц. Звонкие звуки речи, особенно гласные, имеют высокий уровень интенсивности. Глухие согласные – самый низкий уровень интенсивности. При произнесении речи громкость ее непрерывно изменяется. При произнесения взрывных звуков речи – особенно резко. Динамический диапазон уровней речи находится в пределах 35 – 45 дБ. Гласные звуки имеют длительность 0,15 сек. Согласные – 0,08 сек. Самый короткий звук (П) – 30 мсек. Звуки речи неодинаково информативны. Гласные звуки – малоинформативные, а глухие согласные – наиболее информативны. Разборчивость речи снижается при действии шумов в первую очередь из-за маскировки глухих звуков. Известно, что для передачи одного и того же сообщения по телеграфу и по обычным линиям связи требуется различная пропускная способность трактов. Для телеграфного сообщения достаточно не более 100 бит/сек (бод). А для речевого – 100000 бод. При полосе 7000 Гц и динамическом диапазоне 42 дБ требуется семизначный код. Образование звуков речи происходит путем передачи команд мускульным артикуляционным органом от речевого центра мозга. Общий поток сообщений от мозга составляет в ср. 100 бод. Вся остальная информация – сопутствующая. Речевой сигнал – модулированная несущая. Его спектр может быть описан: p(ω)=E(ω)∙F(ω), где E(ω) – спектр генераторной функции, F(ω) – фильтровая функция речевого тракта – модулирующая кривая. Эта модуляция – спектральная. При ней несущая имеет широкополосный спектр, а в результате модуляции изменяется соотношение между частотными составляющими, т.е. изменяется форма огибающей спектра. Почти вся информация о звуках речи заключена в спектральной огибающей речи и ее временном изменении. Установлено, что избыточность самого речевого сигнала превышает избыточность телеграфного сигнал с таким же сообщением. Речевой сигнал отличается от телеграфного тем, что в последнем нет информации об эмоциях, личности говорящего, а также исключается сопутствующая информация. Для передачи смысла речи достаточно передавать следующие сведения: о форме огибающей спектра речи, о ее временном изменении в темпе изменения звуков речи, а также изменение основного тона речи и переходов тон-шум.

Соседние файлы в папке Материалы по ФОЗИ