Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Аудиология и слухопротезирование. 2 часть.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.06 Mб
Скачать

2.3.2. Разборчивость речи

Распознавание речи, как следует из многочисленных экспериментальных и теоретических исследований, по-видимому, происходит последовательно в два этапа. Сначала слуховая система осуществляет перевод простых физических или акустических признаков речевого сигнала в дискретный ряд фонем. На втором этапе происходит непосредственный перевод фонем в языковую единицу (А. И. Соловьева, 1972; Н.А.Позин и др., 1972; И.А.Вартанян, 1978).

Чтобы речь была услышана, ее уровень должен быть выше порога слышимости или порога обнаружения. Только в этом случае слушающий начинает различать отдельные слова.

Основным методом количественной оценки разборчивости речевых сигналов является артикуляционный метод, согласно которому определяют количество слогов, слов или предложении, произнесенных диктором или записанных на магнитный носитель и правильно повторенных слушателем. Разборчивость речи выражают через коэффициент -разборчивости или в процентах.

Многочисленными экспериментами установлено, что с повышением интенсивности речевых сигналов их разборчивость повышается. Пороги разборчивости зависят как от фонемного состава речевого материала и количества слогов в слове, так и от частоты их употребления, а также от наличия и характера шумовой помехи. Разборчивость речи зависит не только от морфологических, синтаксических и лингвистических особенностей речевого материала, но также и от акустических условий и других физических факторов, влияющих на качество звука и его воспроизведение.

Оценка спектрального состава, а также амплитудных соотношений периодических звуков — наиболее важный ключ для распознавания речи. Хотя речевые сигналы содержат частоты от 500 до 10 000 Гц, однако в реальных условиях человек обычно воспринимает их в более узком диапазоне частот. Так, при разговоре по телефону достаточно высокая разборчивость речи обеспечивается при сохранении только части частотного диапазона, например от 300 до 3500 Гц.

Эксперименты по разборчивости речи, пропущенной через фильтры низких и высоких частот, позволили установить влияние различных участков частотного диапазона на качество звучания речи и разборчивость (Д. Ликлайдер, Д.Миллер, 1963; М.М.Эфрусси, 1975). Результаты этих исследований показали, что частоты выше 3400 Гц практически не вносят вклада в разборчивость, поскольку диапазон частот от 100 до 3400 Гц обеспечивает более 90 % разборчивости речи.

На разборчивость речи влияют также ее амплитудные ограничения. Типичным амплитудным искажением является клиппирование звуковых сигналов. При этом если ограничение пиковых амплитуд сигнала составляет 0-20 дБ от их максимальных значений, то разборчивость речи уменьшается незначительно и снижается до 90-96 % по сравнению с разборчивостью речи без клиппирования. Если же амплитуды речевого сигнала ограничиваются от 20 до 50 дБ, то разборчивость речи снижается до 70 % и остается на этом уровне практически до бесконечного клиппирования (Д. Ликлайдер). При этом форма сигнала становится практически прямоугольной с различными длительностями и интервалами между импульсами.

Один из видов амплитудных искажений — центральное ограничение речевого сигнала: форма пиковых значений сигнала сохраняется, но исключается информация о местах и времени пересечения звуковой волны с центральной осью. Именно такие виды искажений вызывают резкое снижение разборчивости речи. Однако наибольшее ее снижение происходит при суммации разных видов амплитудных искажений.

На форму речевого сигнала также влияет время реверберации, определяемое акустическими условиями помещений. С его повышением, начиная от 0,4 до 5 с, разборчивость речи снижается. Так, при увеличении времени реверберации от 2 до 8 с разборчивость речи понижается от 60 до 20 %.

Помимо указанных факторов на разборчивость речи влияет также скорость воспроизведения или произнесения говорящим слогов или слов. Нормальная скорость воспроизведения речи составляет 100— 140 слогов в минуту; разборчивость заметно снижается, если скорость воспроизведения достигает 180 — 200 слогов в минуту. Искажения возникают, если не совпадают скорость воспроизведения и скорость записи. При этом меняется тембровая окраска речевых звуков, что обусловлено изменением спектрального состава речи.

Аналогичные искажения речи происходят и при сдвиге спектра речевого сигнала в сторону высоких или низких частот (Ю. В. Крылов и др., 1980; Д.Ликлайдер, Д.Миллер, 1963). Такой вид частотных искажений иногда наблюдается при передаче и приеме речевых сигналов через приемопередающие системы. Линейный сдвиг спектра речи приводит к резкому нарушению ее разборчивости. При этом потеря разборчивости пропорциональна величине сдвига спектра речи.

Вопросы и задания

1. Дайте определение понятия «звук».

2. Какую форму имеет звуковая волна?

3. От чего зависят сила и интенсивность звука?

4. На какие группы можно разделить звуки?

5. Дайте определение понятия «область звукового восприятия».

6. В каких единицах принято выражать силу и частоту звука?

7. Дайте определение понятия «слуховая чувствительность».

8. Что такое маскировка? Какой звук является маскирующим?

9. Назовите преимущества бинаурального слуха.

10.Чем отличаются гласные звуки от согласных с точки зрения акус

тики?

11.Каков частотный диапазон речевых сигналов? Каков диапазон ос

новных голосовых тонов.

12.В каких диапазонах сосредоточена энергия гласных фонем, энер

гия согласных звуков?

13.От чего зависит разборчивость речи?