Кодзасов, Кривнова - Общая фонетика
.pdfГлава 3. Акустика речи
различных языках учитываются квантальные артикуляци- онно-акустические отношения: для разных звуков исполь зуются прежде всего те артикуляции, которым соответству ют квантальные акустические различия. Принцип квантальности действует и при произнесении звуковых после довательностей. При непрерывной и плавной перестройке артикуляционных органов в определенные моменты време ни либо резко изменяется акустическая картина речи (вне запно меняется источник звука и/или передаточная функ ция), либо какие-то важные акустические параметры (на пример, частоты формант) имеют локальные максимумы или минимумы. Подобные временные точки обладают осо бой значимостью для восприятия речи: их окрестности происходят такие изменения акустических параметров, ко торые несут наиболее существенную информацию о линг вистических признаках звуковых единиц, образующих ре чевое сообщение. По мнению Стивенса, организация зву ковых последовательностей с учетом квантальных артику- ляционно-акустических и акустико-слуховых отношений является основой формирования дискретных звуковых форм в языке.
Источники сведений о резонансной системе речевого тракта
Для получения сведений о передаточной функции ре чевого тракта используются рентгенографические и спектро графические данные.
Рентгенографические сведения служат основой для представления конфигурации речевого тракта в виде функ ции площади, характеризующей изменение поперечного се чения тракта вдоль его длины. Далее выбирается базовая акустическая модель резонаторной системы и, исходя из геометрических параметров тракта при произнесении рас сматриваемого звука, осуществляется количественный рас чет его передаточной функции. Иллюстрацией такого подхо да является исследование Г. Фанта [Фант 1964], выполнен ное на материале звуков русского языка. Оно может служить примером математического моделирования сложных акусти ческих процессов, происходящих в речевом тракте при арти куляции. Технические трудности, связанные с применением кинорентгена, накладывают сильные ограничения на ис-
142
Глава 3. Акустика речи
Рис. 3.19. Осциллограмма слова малина
зованы с помощью голосового источника. Здесь тоже мож но наметить границы между звуками, опираясь на различия в амплитуде и зная, что сонорные согласные обычно менее интенсивны, чем гласные. Очевидно, однако, что границы на этой осциллограмме менее резкие и отчетливые (см. ни же рис. на котором приводится членение осциллограм мы и спектрограммы этого слова).
Существенный недостаток осциллограмм состоит в том, что по ним трудно, а порой и невозможно определить акустические характеристики, которыми звуки одного клас са (с одним и тем же источником) отличаются друг от дру га. Такие характеристики задаются передаточной функцией речевого тракта и могут быть получены только из спектраль ного представления речевого сигнала.
3.3.2. Спектральное представление речевого сигнала
Спектрограммой (от лат. spectrum "видимое" грамма "запись") называется графическое изображение спектра зву ковых колебаний. В акустической фонетике рассматривают ся только амплитудно-частотные спектры звуков P(f) и соот ветствующие им Такие спектрограммы по казывают относительную амплитуду (или интенсивность) частотных составляющих звука или, что то же самое, распре деление общей энергии звукового колебания по частотам.
О роли фазовых характеристик составляющих сложного звука говорится в приложении.
146
Глава 3. Акустика речи
ны в 1946 г. в США et 1946], и это стало важным событием для фонетической науки. Чуть позже американ ские исследователи Р. Г. Копп и Г. Грин опублико вали книгу под названием "Видимая речь" [Potter et al.
в которой впервые были представлены динамические спектрограммы звуков, слогов, слов и фраз английского и ряда других языков. С помощью метода динамической спек трографии были получены все серьезные результаты в аку стической фонетике, а современные фонетические учебники содержат обычно много динамических спектрограмм в каче стве иллюстративного материала.
Динамическая спектрограмма — это трехмерное спект рально-временное изображение речевого сигнала. Горизон тальная ось изображения соответствует времени, вертикаль ная — частоте колебаний, а различия в интенсивности спек тральных составляющих отражаются в степени затемнения (яркости) изображения в соответствующих частотных облас тях. Динамические спектрограммы могут изображаться и в виде действительно трехмерных картинок, где интенсивно сти соответствует своя координатная ось. Однако в фонети ческой практике подобные трехмерные картинки использу ются редко.
Динамические спектрограммы в их классическом вари анте не дают представления о точных значениях интенсив ности спектральных составляющих на отдельных участках речевого сигнала. Для получения этой информации прихо дится обращаться к спектральным срезам. По срезу можно получить спектральную огибающую для анализируемого от резка сигнала, в которой выделяются отчетливые резонанс ные максимумы. Их относительная интенсивность может быть точно измерена. Современные средства спектрального анализа речи, в том числе компьютерные, дают возможность получать как динамические спектрограммы, так и мгновен ные спектры.
Узкополосные и широкополосные спектрограммы
Различие между узкополосными и широкополосными
спектрограммами связано с характеристикой основного тех нического элемента спектроанализатора — полосой пропус кания анализирующего фильтра.
В приборных спектроанализаторах фильтр представля ет собой электрический резонатор, функционирование кото-
148
Глава 3. Акустика речи
Рис. 3.20. Полосовая фильтрация рече вого сигнала
гласных и сонорных согласных. Если ширина фильтра мень ше расстояния между гармониками голосового источника, фильтр будет выделять каждую отдельную гармонику анали зируемого сигнала. Если же ширина фильтра больше этого расстояния, фильтр будет выделять все соседние гармоники, частоты которых попадут в полосу пропускания. Рис. 3.21 иллюстрирует различия в разрешающей способности по ча стоте узкополосного (45 Гц) и широкополосного (300 Гц) фильтров на примере анализа сложного периодического зву ка с основной частотой 100 Гц.
В фонетических исследованиях узкополосный спект ральный анализ обычно осуществляется с помощью фильт ра шириной 45 Гц. Основная частота голоса у людей, даже у мужчин с очень низким голосом, почти никогда не бывает меньше 50 Гц. такой фильтр позволяет полу чать информацию об отдельных гармониках речевого сигна ла для любого говорящего. Узкополосные спектрограммы удобны при анализе изменений основной частоты голоса, т. е. прежде всего в интонационных исследованиях. Однако они не очень подходят для анализа спектральных различий между звуками речи, так как гармоническая структура спек тра затемняет его формантную картину.
При широкополосном спектральном анализе обычно используют фильтр шириной 300 Гц. Фильтр с такой шири ной полосы не выделяет отдельных гармоник в сигнале, ес ли основная частота не превышает 300 Гц, что характерно
150