Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Музыкальная акустика 4 глава.docx
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
452.08 Кб
Скачать

Глава 4

Р,дБа

больше амплитуда). Кроме

акустических параметров,

о которых было сказано

t, мс

выше, из анализа этих спект-

рограмм может быть получена

информация о фонетической

сегментации речевого сигна-

ла. Для того чтобы произвес-

ти фонетическую сегментацию

—►

t, MC

[м] [л] [л'] [и] [н] [ъ] г> мс в сигнале, надо, во-первых,

но с их артикуляцией, а что — с коартикуляцией, ритмом, интона-

цией и т. д.

Пример такой сегментации спектрограммы (сонограммы)

и уровнеграммы при записи слова «малина» показан на рис.

4.6.23. Отчетливо видны увеличение интенсивности и выраженная

формантная структура на гласных звуках, значительное снижение

уровней интенсивности и уменьшение высокочастотных составля-

ющих на носовых согласных [109].

Исследование акустических характеристик в беглой речи пока-

зывает, что трудно выделить постоянные акустические участки

с неизменной формой, поскольку все время происходят коартику-

ляция и редукция, т. е. влияние соседних согласных на гласные

и наоборот (в быстрой речи не достигается полностью положение

артикуляционных органов, которое имеется при четком произнесе-

нии отдельных звуков); кроме того, обычно невозможно выделить

стационарные участки, т. к. происходит быстрая перестройка

артикуляции и, соответственно, быстрое изменение акустических

характеристик. Для того чтобы производить фонетическую сег-

ментацию отрезков речи, обычно изучаются акустические свойства

звуков в изолированном произношении (или в виде слогов) и вы-

деляются признаки, необходимые для их опознания в беглой речи.

Подробнее о фонетических признаках в трехмерных акустических

спектрах (спектрограммах) можно прочитать в литературе [104,

106-109, 111-116].

4.6.4. Субъективные и объективные методы оценки

разборчивости речи

Поскольку речевой сигнал имеет двойственную структуру (как

было отмечено в предыдущем разделе), т. е. кроме обычных аку-

стических признаков, которые вызывают определенные субъектив-

ные ощущения (громкости, высоты, тембра, локализации и др.), он

Рис. 4.6.23. Уровнеграмма

и спектрограмма слова «малина»

выделить акустические отрез-

ки, которые соответствуют

определенным фонемам; во-

вторых, определить, что связа-

Акустика музыкальных инструментов. Акустика речи и пения

417

передает закодированную смысловую информацию, то для него

используются особые методы оценки.

На протяжении уже нескольких десятилетий применяются

интегральные методы оценки правильной передачи смысловой

информации, заключенной в речевом сигнале (в т. ч. и в вокаль-

ной речи — пении), это методы оценки разборчивости.

Оценка разборчивости необходима как при разработке и ис-

пользовании различных систем звукоусиления, так и при оценке

акустического качества помещений (театральных и концертных

залов, студий, кинозалов и др.), поскольку в конечном итоге каче-

ство зала определяется тем, насколько слушатели хорошо понима-

ют смысловое содержание речи (и пения). Разумеется, понимание

смыслового содержания не исчерпывает всех аспектов восприятия

речи, в ряде случаев не менее важна передача ее эмоционального

содержания (тембра, интонации, темпа и др.). Вопрос о связи аку-

стических характеристик речи (особенно вокальной речи — пения)

с ее эмоциональным содержанием будет рассмотрен далее

(см. раздел 4.6.6).

В соответствии с международными стандартами, в частности

ISO/TR 4870, под разборчивостью понимается «степень, в кото-

рой речь может быть понята (расшифрована) слушателями»,

т. е. в которой слушатели могут идентифицировать фразы, слова,

слоги и фонемы (понять их смысл). В соответствии с этим разли-

чаются различные виды разборчивости: фонемная, слоговая, сло-

весная и фразовая, которые связаны друг с другом и могут быть

пересчитаны одна в другую, о чем будет сказано несколько позже.

Потеря информации при передаче речевого сигнала неизбежна,

и хотя последний обладает определенной избыточностью, она бла-

годаря различным шумам, искажениям и реверберационным поме-

хам может быть столь значительна, что это способно привести к

невозможности понимания смысла речи, т. е. снижению уровня

разборчивости.

Все известные в настоящее время методы оценок разборчиво-

сти могут быть разделены на две большие группы: субъективные

экспертные методы (стандарты ГОСТ 25902-83, ГОСТ 51061-97,

ANSI S3.2 и др. ) и объективные методы, оценивающие следую-

щие параметры: AI (articulation index) — индекс артикуляции;

SII (speech intelligibility index) — индекс разборчивости речи;

% ALCONS (percentage Articulation Loss of Consonants) — процент

артикуляционных потерь согласных; STI (speech transmission

index) — индекс передачи речи; RASTI (rapid speech transmission

index) — быстрый индекс передачи речи и др. (стандарты

ISO/TR-4870, ANSI S3.2, S3.5; IEC 268-16 и др.).

Субъективные методы оценки разборчивости зависят

от ряда факторов, основные из которых следующие: выбор эле-

ментов речи для прослушивания (звуки, слоги, слова, фразы),

418