
Кодзасов, Кривнова - Общая фонетика
.pdf

Общая оценка современного состояния автоматического распознавания речи
Несмотря на значительные успехи, достигнутые в пос леднее десятилетие, исследователям, которые занимаются разработкой систем, распознающих человеческую речь, еще многое предстоит сделать. На недавнем международном конгрессе фонетических наук известный специалист в этой области Атал подвел некоторые итоги проведенных иссле дований 1995]. На рис.
показаны оценки успешно сти и надежности распознавания речевых сообщений разно го типа в зависимости от размеров машинного словаря. На рисунке под диагональю помещены задачи, которые уже сейчас успешно и надежно решаются с помощью систем распознавания речи, а выше диагонали — задачи, которые находятся в стадии лабораторных разработок. Как видно из
542



физическая природа звуковых колебаний
результате в ближайшем слое воздух разрежается, но одно временно сжимается следующий наружный слой, который, в свою очередь расширяясь, сжимает следующий наружный слой и т. д. Так в воздухе образуется сферическая упругая волна: состояния сжатия и разрежения, возникшие в воздухе около источника звука, передаются как эстафета от одного слоя к другому, все более и более удаляясь от места первона чального возмущения. Образование и распространение зву ковых колебаний в воздухе обусловлено такими его свойст вами, как упругость (сопротивление сжатию) и инерцион ность (тенденция к сохранению имеющегося состояния).
В рассмотренном выше примере лопнувший шар соз дал в воздухе одиночный импульс избыточного давления. Если в воздухе длительное время колеблется какое-либо те ло, например камертон или струна, оно постоянно генери рует упругие волны. Колеблющееся тело при своем движе нии вперед сжимает воздух, находящийся перед ним, и это сжатие передается следующим слоям воздуха. При движении тела назад частицы воздуха из области сжатия начинают пе реходить вслед на ним в область меньшей плотности, и за сгущением начнет распространяться разрежение. Затем, ко гда тело движется опять вперед, снова распространяется сгу щение и т. д.
Упругие волны, т. е. волны сжатия и разрежения, рас пространяющиеся в воздухе при колебаниях тел или внезап ных изменениях его плотности, называют также звуковыми волнами. Они относятся к продольным волнам: частицы воздуха, смещенные с положения равновесия, движутся взад и вперед по направлению движения звуковой волны. Если бы частицы имели цвет, состояние воздуха при прохождении в нем звуковой волны выглядело бы приблизительно так, как это изображено на рис. где более темный цвет ли ний соответствует большим величинам плотности и давле ния в последовательных слоях воздуха.
Скорость распространения звука, длина волны и период колебаний
Звуковые волны, как мы видели, представляют собой колебания, которые передаются (распространяются) от од них частиц воздушной среды к другим. Это происходит не мгновенно, а с конечной скоростью. Это означает, что рас-
545


Физическая природа звуковых колебаний
ком расстоянии в распространяющейся волне находятся два последовательных сгущения или разрежения воздуха или, вообще, две ближайшие точки вдоль линии распространения волны, которые колеблются в одинаковой фазе.
В звуковой волне, таким образом, имеется двоякая пе риодичность. С одной стороны, в каждом месте среды, по которой распространяется волна, порожденная периодиче ским источником, положение частиц воздуха, а также плот ность и звуковое давление периодически изменяются во вре мени. С другой стороны, в каждый момент времени смеще ния всех частиц, а также плотность и звуковое давление в разных точках среды, расположенных вдоль направления движения волны, образуют кривую, форма которой перио дически повторяется в пространстве (см. рис. Длина волны X играет по отношению к форме волны в пространст ве ту же роль, какую период Г — по отношению к колеба нию во времени.
Механизм распространения звуковых колебаний, возни кающих в речи, не имеет ничего специфически речевого, по этому в акустической фонетике он почти не рассматривается. Колебания звукового давления, образующие речевой сигнал, фиксируются в определенном месте воздушной среды: там, где находится приемник звука — человеческое ухо или специ альное приемное устройство, например, микрофон. Однако при записи речевого материала для проведения фонетических исследований необходимо знать и важнейшие особенности распространения звуковой волны в пространстве.
Распространение звуков в пространстве
При проведении фонетических исследований с различ ным речевым материалом полезно иметь в виду следующие особенности распространения звуковой волны:
•при удалении от источника звуковые колебания посте пенно затухают. Ослабление звука происходит пропорцио нально квадрату расстояния от источника. До слушателя, на ходящегося на расстоянии 5 м от говорящего, будет доходить
в100 раз меньше звуковой энергии, чем до слушателя, нахо дящегося на расстоянии 0,5 м;
•звуки высоких частот при прохождении через воздух поглощаются (теряют энергию) в значительно большей сте пени, чем звуки низких частот. Опыт показывает, что поте-
547


сжатый газ, заключенный в определенном объеме (звук лопнувшего воздушного шара), колеблющийся поток воздуха или жидкости, выходящий под давлением из неко торого канала через узкое отверстие (звук свистка, сирены, кларнета, органной трубы, струи воды, вытекающей из во допроводного крана).
В речи непосредственным источником звуковых коле баний, которые мы слышим, является колеблющийся поток воздуха, выходящий из речевого тракта через рот и нос го ворящего. Колебания воздушного столба в речевом тракте создаются, в свою очередь, благодаря работе голосовых свя зок и образованию различных препятствий на пути выдыха емой воздушной струи.
1.3. Физический диапазон звуковых волн
Огромное разнообразие упругих воздушных волн, суще ствующих в природе, воспринимается человеком не полно стью. Поэтому собственно звуковой называется такая волна, физические характеристики которой принадлежат так назы ваемому звуковому диапазону. Границы звукового диапазона определяются чувствительностью человеческого слуха к час тотным и амплитудным характеристикам звуковых колеба ний. Человек способен воспринимать колебания воздушного давления, частота которых находится в диапазоне от 16 до 20 000 Гц. Это соответствует длинам волн в воздухе от 20 м до 1,7 см. Упругие колебания с частотами, превосходящими
549
