Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Аудиология и слухопротезирование. 2 часть.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.06 Mб
Скачать

2.3. Физиология восприятия речевых сигналов

2.3.1. Акустика речи

Речевые сигналы — это совокупность элементов акустической энергии с быстро меняющимися амплитудами и частотами.

Особенности звуков речи определяются различием их акустических свойств: высоты, силы, тембра и длительности. Волновой сигнал гласных звуков более прост по сравнению с волновой формой согласного звука, так как обладает значительной степенью периодичности. С точки зрения акустики гласные звуки отличаются от согласных подобно тому, как чистьте тональные сигналы отличаются от сложных звуков.

Спектры гласных звуков неравномерны и, как правило, имеют подъемы, которые называются формантами. Так, звуки у ш ы характеризуются низкими формантами — от 200 до 600 Гц. Звук а независимо от того, голосом какой высоты он произнесен, обладает своеобразной формантой в области от 1000 до 1400 Гц. Спектры согласных звуков имеют более сложные акустические характеристики. Наряду с периодическими колебаниями звонким согласным свойственны непериодические колебания высокой частоты. Для других согласных (п, ш и др.) характерны только непериодические колебания различной частоты.

Основная частота голоса Ро определяет частоту следования импульсов, генерируемых голосовыми связками. В среднем для мужского голоса Ро= 120 Гц, для женского — 140— 150 Гц. Первая и вторая форманты речи соответственно обозначаются как Р{ и Р2. Они определяют область частот, на которых в спектре речевых звуков обнаруживаются максимумы.

Чтобы звуковые колебания могли стать средством общения между людьми, они должны как-то отличаться и состоять из каких-либо отдельных звуковых единиц. Согласно современной теории речеобразования и восприятия речи, такими звуковыми единицами являются фонемы (Л.А.Чистович, 1976). Последовательность фонем образует слово, а последовательность слов — сообщение. Изменение порядка следования фонем или их числа приводит к изменению слова.

Для каждого языка характерно определенное число звуковых единиц. Так, в русском языке имеется 35 согласных и 6 гласных фонем, в немецком — 24 согласные и 15 гласных фонем, в английском насчитывается 33 согласных дифтонга и 12 гласных фонем. Каждая фонема имеет свой спектр, в котором форманты располагаются в определенном диапазоне частот. При этом, несмотря на наличие межиндивидуальных различий в спектральной картине отдельных звуков речи, произнесенных женщиной, мужчиной или ребенком, частотные и амплитудные соотношения между отдельными формантами, их длительность и характер изменений практически остаются стабильными. Именно поэтому звуки речи относительно легко распознаются человеком. Максимальное число формант в спектре речи может достигать семи, однако для распознавания отдельных фонем наиболее важными являются только первая, вторая и третья форманты.

Спектр согласных фрикативных звуков напоминает всплески «белого шума». Взрывные согласные очень неустойчивы по природе и представляют собой прерывистые изменения акустической волны. При этом их спектр распространяется преимущественно на область высоких частот.

Спектр звуков не остается постоянным, а изменяется во времени и зависит не только от самой фонемы, но и от того, какая фонема ей предшествует или следует за нею. В этой связи наибольшим изменениям подвержены спектры согласных. Указанное влияние одних фонем на другие, по-видимому, имеет важное информационное значение при распознавании звуков речи (Л. П. Павлова). Отдельные фонемы отличаются по длительности, причем у гласных она большая, чем у согласных. Длительность фонем так же, как и их спектр, изменяется в зависимости от соседствующих звуков (С. Е. Ре1ег8оп, 1.ЬеЫ81е).

Средний уровень спектра речи и динамический диапазон разговорной речи

Речевые сигналы ограничены частотным диапазоном 100 — 10 000 Гц и уровнями от 50 до 80 дБ. При этом основные голосовые тоны составляют диапазон частот 100 — 250 Гц. Энергия гласных фонем сосредоточена главным образом в диапазоне 200 — 1500 Гц, а энергия согласных звуков — в диапазоне 1000 — 6000 Гц. На частотах 200—1000 Гц содержится максимальная энергия звуков речи (гласные звуки), которая уменьшается примерно по 5 — 8 дБ на октаву при расширении речевого диапазона частот от 100 до 6000 Гц .

Фонемы отличаются не только по частотному составу, но и по уровню; гласные фонемы имеют большую интенсивность, чем согласные. Различия уровней гласных и согласных звуков достигают 25 — 30 дБ. Интенсивность речи обычно выражают через условный эквивалентный уровень, время суммирования которого составляет не менее 60 с (Р. Герлих, 1960). Средний или эквивалентный уровень речи может быть приближенно определен с помощью прецизионного шумомера измерением в режиме «быстро» или «медленно» с усреднением регистрируемых максимальных значений (соответственно за вычетом 3 дБ или с добавлением 2 дБ).

Пиковые амплитуды изменения речи приблизительно на 12 дБ выше, а минимальные «провалы» примерно на 18 дБ ниже среднего уровня речи. Диапазон изменения УЗД звуков речи в среднем равен 30 дБ. Наибольшие отклонения мгновенных пиковых значений обнаруживаются на более высоких частотах. Так, для области средних частот наибольшие различия между максимальными и минимальными мгновенными значениями уровня речи составляют приблизительно 14—16 дБ, а для частот 2000 — 4000 Гц они достигают 30 — 35 дБ (Г. Фант, 1970).