Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

акустика лекции / Лекция 16. ПОНЯТНОСТЬ И РАЗБОРЧИВОСТЬ РЕЧИ

.doc
Скачиваний:
171
Добавлен:
20.02.2016
Размер:
1.13 Mб
Скачать

ЛЕКЦИЯ 16

Понятность и разборчивость речи

Понятность речи — основная характеристика, определяющая пригодность тракта для передачи речи. Непосредственное определение этой характеристики может быть осуществлено статистическим методом с привлечением большого числа слушателей и дикторов. Количественное определение понятности речи – разборчивость.

Разборчивостью речи называют относительное или процентное число правильно принятых элементов речи из общего числа переданных по тракту. Элементы речи – сложные звуки, слова, фразы, цифры. Соответственно различают слоговую, звуковую, словесную, смысловую и цифровую разборчивости. Между ними существует статистическая взаимосвязь. В практике преимущественно используют слоговую, словесную и смысловую разборчивости.

Для измерений разборчивости разработаны специальные таблицы слогов с учетом встречаемости их в русской речи. Эти таблицы называются артикуляционными. Разборчивость измеряют с помощью тренированной бригады слушателей без нарушений слуха и речи путем проведения субъективно-статистических экспертиз. При этом измерения могут проводиться различными методами, например, методом бальной оценки, методом определения процента правильно принятых слов и т.д.

Зависимость между разборчивостью речи и ее понятностью, приведена в табл. 16.1. В этой таблице понятность речи оценена четырьмя градациями:

1) отличная, если понятность полная, без переспросов;

2) хорошая, если у слушателей возникла необходимость в отдельных переспросах редко встречающихся слов или отдельных названий;

3) удовлетворительная, если слушатели сообщили, что им трудно понимать, имели место частые переспросы;

4) предельно допустимая, если требовались неоднократные переспросы одного и того же материала с передачей отдельных слов по буквам при полном напряжении слуха.

Таблица 16.1

Понятность

Разборчивость, %

слоговая

словесная

Предельно допустимая

Удовлетворительная

Хорошая

Отличная

25...40

40...50

50...80

80 и выше

75...87

87...93

93...98

98 и выше

Причинами снижения разборчивости являются акустические шумы в помещении, помехи от реверберации и диффузного звука, недостаточное усиление сигналов первичного источника звука.

Системы озвучения и звукоусиления должны обеспечивать требуемую понятность речи. При передаче информационных программ, проведении митингов и собраний необходима отличная понятность речи, которая обеспечивается при 80 % слоговой и 98 % словесной разборчивостях. Для диспетчерской связи полная разборчивость речи (удовлетворительная понятность) получается при 40...50 % слоговой и 87...93 % словесной разборчивостях. Поэтому при расчете диспетчерской связи ориентируются на меньшие величины разборчивости, чем при расчетах систем широкого применения.

Существует связь между разборчивостью речи, условиями приема и характеристиками трактов передачи, которую удалось установить при помощи формантной теории, разработанной Флетчером и Коллардом.

Области концентрации энергии в том или ином участке частотного диапазона называются формантами. Их расположение зависит как от положения звука в слове или фразе, так и от индивидуальных особенностей артикуляционного аппарата человека. Каждый звук имеет несколько формант. Форманты звуков речи заполняют частотный диапазон от 150 до 7000 Гц.

Этот диапазон частот условились поделить на 20 полос, в каждой из которых вероятность появления формант одинакова. Такие полосы частот назвали полосами равной разборчивости. Они определены для ряда языков, в том числе для русского. Установили, что вероятность появления фомант подчиняется правилу аддитивности. При достаточно большом количестве звукового материала вероятность появления формант в каждой полосе равна 0,05.

Форманты имеют различные уровни интенсивности: у звонких звуков они выше, чем у глухих. При увеличении уровня акустических шумов сначала маскируются форманты с низкими уровнями, а затем с более высокими. В результате маскировки уменьшается вероятность восприятия формант. Коэффициент, определяющий это уменьшение в к-й полосе, называют коэффициентом восприятия или разборчивости кф. Иначе говоря, в к-ой полосе вероятность приема формант

, (16.1)

где коэффициент восприятия формант кф зависит от уровня ощущения, который в свою очередь определяется разностью между средним спектральным уровнем речи Вр в полосе равной разборчивости и спектральным уровнем шумов и помех в той же полосе Вш:

Еф = Вр-Вш. (16.2)

Коэффициент восприятия (разбогрчивости) может быть определен по графику, представленному на рис. 16.1. На этом графике приведены уровни ощущения Еф и соответствующие им коэффициенты восприятия кф.

Для уровней ощущения 0-18 дБ кф может быть определен приближенно по формуле kф=(Е+6)/30.

Рисунок 16.1. Интегральное распределе­ние уровней речи.

В общем случае для каждой полосы равной разборчивости коэффициент восприятия будет разным. Общая формантная разборчивость в речевом диапазоне частот определяется из

(16.3)

Рисунок 16.2. Зависимость слоговой разборчивости от формантной.

Зависимость между формантной и другими видами разборчивости была найдена экспериментально. Такая зависимость для слоговой разборчивости показана на рис. 16.2. Из этого рисунка видно, что почти полная понятность речи (слоговая разборчивость равна 80 %) получается при приеме лишь половины всех формант (формантная разборчивость равна 0,5), что свидетельствует об избыточности речи и комбинационной способности мозга.

Определение разборчивости речи для озвучиваемых помещений прежде всего осуществляют для точек озвучиваемой поверхности с минимальным уровнем прямого звука и максимальным уровнем акустичеких шумов. Спектральный уровень прямого звука у слушателя, находящегося в такой точке,

, (16.4)

где Врм —спектральный уровень речи у микрофона (определяется из таблиц);

,

где rм - удаление микрофона от оратора; - спектральный уровень речи на расстоянии 1 м (определяется из справочных таблиц); — индекс усиления (индекс тракта - разность между уровнями звука, создаваемыми громкоговорителем системы звукоусиления у уха слушателя и первичным источником звука на входе микрофона).

Эти данные определяют для каждой полосы равной разборчивости. Для этих же полос спектральные уровни шумов и помех в месте слушания

(16.5)

где Ваш — спектральный уровень акустических шумов (определяется из справочных таблиц); Вп — спектральный уровень помех от речи (самомаскировка речи),

(16.6)

где — поправка на помехи от диффузного звука (R — акустическое отношение в расчетной точке); Nд — дифракционная поправка, поправка на отражение от головы слушателя (определяется из справочных таблиц); - поправка на реверберационные помехи (Тр — время реверберации).

Уровень акустических шумов не зависит от индекса тракта, в то время как уровень помех от речи растет с увеличением индекса тракта (16.4), (16.6). Поэтому для повышения уровня ощущения целесообразно увеличивать индекс тракта. После достижения условия

Вп = Ваш +6 (16.7)

дальнейшее увеличение индекса тракта не рационально, так как уровень ощущения в пределе может повыситься лишь на 1 дБ. Это условие с учетом (16.4), (16.6), (16.7) определяет индекс тракта

(16.8)

Такой индекс тракта называют рациональным. Он в основном определяется максимальным значением акустического отношения в расчетной точке и временем реверберации.

При рациональном усилении из (16.5) следует, что

Вш = Вп +1, (16.9)

т.е. вклад акустических шумов Ваш в общий уровень шумов и помех незначителен.

Полученные выражения позволяют определить разборчивость и понятность речи. Для этого по формулам (16.4), (16.6), (16.9) находят уровни речи, шумов и помех и далее по формуле (16.2) определяют уровень ощущения формант Еф для каждой полосы равной разборчивости. Графическая зависимость, представленная на рис. 16.1, позволяет найти коэффициенты разборчивости кф, соответствующие полученным значениям Еф. Общая формантная разборчивость А в речевом диапазоне частот находится из выражения (16.3), а соответствующая ей слоговая разборчивость определяется по рис. 16.2. Понятность речи определяется по табл. 16.1.

Методы повышения разборчивости речи

  1. Снижение уровней помех. (На практике этого достигнуть удается не всегда). Стараются увеличивать Lp у слушателя(приближение микрофона, увеличение уровня голоса говорящего).

  2. Повышение уровня звукового давления у слушателя по прямому звуку, приближением микрофона к источнику звука, повышением уровня голоса говорящего, увеличением индекса тракта.

  3. Сжатие D речевого сигнала — повышение уровней звукового давления слабых звуков при сохранении максимальных уровней звукового давления.

Предельным случаем сжатия D является амплитудное ограничение — клиппирование. При этом речевой сигнал превращается в последовательность импульсов постоянной амплитуды, но с меняющимися интервалами между нулевыми переходами (телеграфный режим работы). В результате все звуки речи будут иметь одинаковый (максимальный) уровень при приеме. Качество звучания в этом случае ухудшается, но разборчивость резко повышается, так как слабые звуки не клиппированной речи, маскирующиеся помехами, при таком способе передачи окажутся выше уровней помех.

  1. Применение вокодеров.

Вокодер представляет собой устройство, в передающей части которого из речевого сигнала выделяются параметры, определяющие информативность речи: спектральные огибающие звуков речи и параметры основного тона речи, т.е. медленно меняющиеся во времени признаки звуков речи.

В приемной части вокодера имеется сложный фильтр, имитирующий акустическую систему речевого тракта для звонких звуков речи и глухих. Уровнем синтезируемых звуков и параметрами фильтров управляют сигналы, выделенные на передающем конце вокодера, в результате чего восстанавливается спектральная огибающая речевого сигнала. Качество и разборчивость восстановленного сигнала получаются достаточно высокими.

  1. Увеличение средней мощности сигнала, а следовательно разборчивости, за счет разделения сигнала на огибающую и мгновенную фазы и их особая обработка.

Расчет разборчивости речи

  1. Вычисляем спектральные уровни речи с поправкой на расстояние от микрофона

, (16.10)

где В’p – спектральный уровень речи на расстоянии 1 м (определяется из справочных таблиц).

2. По заданному спектру и уровню акустических шумов находим его спектральные уровни Ва (определяется из справочных таблиц).

3. Определяем суммарную поправку ΣΔL.

4. Определяем фактический индекс тракта Qмс.

5. Все данные заносятся в таблицу.

6. Вычисляем спектральные уровни речи у слушателя

(16.11)

7. Вычисляем спектральные уровни помех

. (16.12)

8. Суммируем спектральные уровни помех со спектральными уровнями акустических шумов

. (16.13)

9. Вычитаем из спектрального уровня речи спектральный уровень суммарных помех и шумов и получаем уровень ощущения формант

. (16.14)

10. По найденному уровню ощущения находим коэффициент разборчивости kф;

для 0<E<18 дБ . (16.15)

или находим его точные значения по таблице. Все вычисленные значения заносим в сводную таблицу.

11. Суммируем полученные величины коэффициентов разборчивости и находим формантную разбочивость

. (16.16)

По формантной разборчивости определяем слоговую S и словестную W разборчивсти и понятность речи.

Из анализа данных коэффициента разборчивости следует, что нижние частоты передаются намного хуже верхних. Так как есть запас по предельному индексу тракта на этих частотах, то можно спроектировать их примерно на 4 дБ. Разборчивость от этого практически не изменится, но повысится качество звучания.

Для ориентировочного определения разборчивости речи можно воспользоваться сокращенной методикой расчета. Если спектры речи и шумов изменяются по частоте не очень резко,то нет смысла вычислять их для всехполос равной разборчивости, а достаточно расчитать из на октавных частотах.

Октаве 173-350 Гц соотетствует одна полоса равной разборчивости (200-350 Гц).

Октава 350-700 Гц охватывает три полосы (330-465);

(465-605);

(605-750).

Октава 700-1400 Гц включает в себя 4 полосы (750-900);

(900-1060);

(1060-1230);

(1230-1410).

Октава 1400-2800 Гц → 6 полос (1410-2840).

Октава 2800-5600 Гц → 5 полос (2840-5640).

Участок дапазона 5600-7000 Гц соответствует последней полосе равной разборчивости (5640-7000).

С учетом этого формантная разборчивость определяется по формуле

, (16.17)

где kф1- kф6 – коэффициенты разборчивости на октавных частотах.

7