Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
CSTM / METOD / Сведения--zстm.doc
Скачиваний:
231
Добавлен:
07.02.2016
Размер:
2.18 Mб
Скачать
      1. 1.1.3 Спектр формант

        1. Форманты

Формантаминазываются усиленные частотные области спектра данного звука, позволяющие отличать его при слуховом восприятии от других звуков. Таким образом, оказывается, что звуки речи по своему спектральному составу отличаются друг от друга как число формант, так и их расположением в частотном спектре.

Под спектром формантпонимается зависимость наивероятнейшего в течение длительного времени спектрального уровня формант В'pот частоты f. При этом следует иметь в виду, что понятия спектрального уровня речи Ври спектрального уровня формант В'pнесколько различаются. В первом случае определяется средний в течение длительного времени энергетический уровень речи, а во втором случае – наиболее вероятное значение уровня формант, которое отличается от среднего энергетического уровня формантных составляющих.

Формантный спектр речи не может быть получен непосредственными изменениями интенсивности формант в ограниченных частотных полосах, так как нет возможности каким-либо образом отделить чисто формантные составляющие речи от неформантных. Формантный спектр русской речи с суммарным уровнем 97,5 дБ (рис. 1.3) был получен косвенным путем на основе артикуляционных изменений в различных частотных полосах и уже известного спектра речи

Рис.1.3. Форматный спектр русской речи

      1. 1.1.4 Амплитудное распределение. Динамический диапазон. Пик-фактор.

Регистрируя появление различных энергетических уровней речи в целом или в отдельных частотных полосах, можно установить относительную частость их появления. При этом оказывается, что уровни, близкие к среднему, имеют наибольшую частость. Более высокие и более низкие уровни появляются значительно реже, причем частость появления их тем меньше, чем больше они отклоняются от среднего уровня. Распределение уровней подчиняется закону, весьма близкому к нормальному.

На рис. 1.4 приведена усредненная характеристика амплитудного состава речи, представляющая собой интегральное распределение относительного числа случаев (Z), в которых превышается тот или иной уровень (B), причем за условный нуль принят средний уровень речи.

Приведенное на рис. 1.4 амплитудное распределение позволяет выявить еще две важные характеристики речи – динамический диапазон и пик-фактор.

Из рисунка видно, что средний уровень Вр, условно обозначенный нулем, достигается лишь в 19% интервалов времени длительного наблюдения и превышается на 12 дБ в 1% интервалов. Если теперь этот уровень условно считать максимальным Вр max(считая более высокие уровни случайными редкими выбросами), а в качестве минимального уровня Вр minпринять уровень, превышаемый в 99% интервалов, то динамический диапазон речи, определяемый как разность между максимальным и минимальным уровнями, можно принять равным приблизительно 45 дБ. Разность между максимальным и средним уровнями речи, равная 12 дБ, называется ее пик-фактором РF.

Рис.1.4. Усредненная характеристика амплитудного состава русской речи

Отметим, что иногда пользуются другими значениями пик-фактора, а именно 16 дБ. Это величина превышения среднего уровня речи в 0,1% интервалов наблюдения.

      1. 1.1.5 Распределение формант

Под распределением формантбудем понимать зависимость разборчивости формант от граничной частоты передаваемого спектра, т.е. функцию А =(f). Это распределение характеризует частость встречаемости формант в различных участках спектра и позволяет определить границы и средние частоты равноартикуляционных полос, необходимые для расчета разборчивости.

Рис.1.5. Частная зависимость разборчивости формант

Рис.1.6. Частотная зависимость относительного числа формант в полосках шириной 100 Гц

На рис. 1.5 приведено распределение А = (f) для русской речи в интегральной форме, а на рис. 1.6 – в дифференциальной форме. Каждая ордината кривой на рис. 1.6 представляет относительное число формант, содержащихся в полосе шириной 100 Гц, отложенное по средней частоте этой полосы.

Соседние файлы в папке METOD