2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_
.pdfДоводом в пользу того, что однонаправленный частотный кон тур описывается в слухе своими краевыми точками, может слу жить также результат работ [9®’ 97], в которых вопрос о призна ках контура частоты основного тона jF0(Z) исследовался с помощью метода имитации. Синтетические гласные звуки с линейно воз растающей частотой основного тона предъявлялись испытуемым, задачей которых было имитировать интонацию стимулов. Опре деляющая роль краевых точек контура F0(t) устанавливалась по тому факту, что изменение FQ в ответном сигнале, как правило, начиналось и кончалось участками с постоянной частотой, равной в среднем начальной и конечной частотам исходного контура соответственно. При этом в исходном стимуле стационарных участ ков могло и не быть.
Таким образом, приведенные экспериментальные факты дают возможность утверждать, что при восприятии коротких сигналов с однонаправленным частотным контуром слуховыми призна ками контура могут служить результаты измерения частоты в начале и конце звука. Важно, что на основании этих данных мы удостоверяемся в способности слуховой системы измерять аб солютные значения параметра в некоторые определенные моменты времени, привязанные к входному стимулу.
12.2.2.ИЗМЕРЕНИЕ ЧАСТОТЫ
ВЭКСТРЕМАЛЬНЫХ ТОЧКАХ КОНТУРА f (t)
До сих пор речь шла о сигналах с самым простым контуром f(t), где частота изменяется только в одном направлении.
Более сложным случаем представляется |
восприятие звуков, |
у которых форма траектории включает |
смену направления |
изменения. Интуитивно понятно, что два сигнала, начало и конец которых имеют одинаковые значения по частоте, но изменение частоты внутри звука у одного из них осуществляется по выпук лой, а у другого по вогнутой траектории, должны восприниматься по-разному. Подобная форма траектории, например, присуща формантным контурам разных гласных звуков’между одинаковыми согласными в потоке речи [359480, 484 486].
Насколько известно, была сделана только одна попытка иссле довать восприятие звуков с формантным контуром такой формы
[set] |
в указанной работе использовались синтетические стимулы |
с тремя различными формами траекторий изменения частоты F2 |
|
и F3. |
1-й тип стимулов — стационарные гласные (Г), 2-й тип — |
звукосочетания [wl Г [wl с выпуклой формой контуров формант (рис. 12.5, Л), 3-й тип — звукосочетания [j] Г [j] с вогнутой формойжонтуров (рис. 12.5, В). Начальные, конечные и экстремальные"участки оформлялись в виде 20-миллисекундных стационар ных ’интервалов. Параметры стимулов (F2 и FJ приведены -на рис. 12.6. Кроме того, все стимулы имели два варианта временного масштаба: в случае медленного варианта переменная часть стимула
311
была равна 200 мс, в случае быстрого — 100 мс. Каждый из типов стимулов (всего 6) предъявлялся в виде отдельного теста.
Испытуемые (10 американцев) должны были классифицировать все звуки на две категории гласных (в слоге или в изолированном предъявлении) — [и] и [i]. Задача эксперимента состояла в том, чтобы путем сравнения положения фонемных границ, полученных для разных типов стимулов, проверить предположение о том, что восприятие фонетического качества определяется частотой фор-
Рис. 12.5. Динамические спектрограммы синтетических слогов. По [301].
По оси абсцисс — время; по оси ординат — частоты формант. На А — слоги [w] Г [w]; на Б — слоги [j] Г [j ].
мант в экстремальной точке контура. Если предположение верно, положение фонемной границы по F2 и F3 должно быть одинако вым для всех трех типов стимулов.
Результат получился следующий: средние для всех испытуемых значения границы (для обеих длительностей стимулов) для ста ционарных гласных и [j] Г [jl-звукосочетаний действительно до вольно похожи: для стационарных гласных F2 = 1644 Гц, F3 — = 2648 Гц, для [j] Г [j] - F2 = 1634 Гц, F3 = 2632 Гц (данные вычислены по таблицам, приведенным в статье). В то же время при классификации [w] Г [wl-стимулов совпадения границ с изо
лированным |
гласным в |
ответах |
большинства |
испытуемых (для |
7 из 10) не |
наблюдается |
(рис. |
12.7). Средние |
значения границ |
вэтом случае существенно ниже: F2 = 1474 Гц, F3 = 2553 Гц. Совпадение границ для изолированных гласных и слогов типа
[j] Г [j] можно рассматривать как доказательство использования человеком при распознавании гласных значений частоты формант в экстремальной точке.
312
1
Результаты обсуждаемой работы интересным образом перекли каются с данными опытов Люблинской и Слепокуровой по восприя тию дифтонгоидных гласных. Фонемная граница по параметру Fz между [i] и [и] для стимулов типа [j] Г [j] и между [i] и [и] для стимулов с однонаправленным нисходящим контуром описывается практически одним и тем же числом, только в первом случае оно соответствует экстремальной, а во-втором — конечной точке кон-
Рис. 12.6. Параметры синтетических стимулов, использованных в опытах по восприятию слогов [w] Г [w] и [j] Г [j]. По [361].
По оси абсцисс — частота третьей форманты; по оси ординат — частота второй форманты. Маленькие точки соответствуют значениям F2 и F3 на стационарном участке гласного; большие точки показывают значения F2 и F3 на участках согласного (нижняя — для [w];
верхняя — для [j]).
Рис. 12.7. Положение границы между [i] и [и] по частоте второй форманты (F2) в изолированных гласных (точки) и в слогах [w] Г [w] (крестики) у раз ных испытуемых. По [361].
Каждое значение на графике — результаты одного испытуемого при идентификации стимулов с двумя разными длительностями. По оси абсцисс — границы для гласных длительностью 200 мс; по оси ординат — для гласных длительностью 100 мс.
тура. Если такое совпадение не случайно, то этот факт указывает на возможность рассматривать конечное и экстремальное значе ния частоты как одну и ту же «особую точку» контура. Т. е. воз можно, что момент для измерения (считывания) частоты максимума в обоих случаях задается по некоторому общему правилу и ре зультат измерения одинаковым образом используется при фоне тическом анализе. Насколько реально такое предположение, решить можно только в результате специального исследования правил выделения особых точек в контуре.
В связи с высказанным предположением кажется возможным предложить следующее объяснение наблюдаемому смещению фо немной границы для [w] Г [wl-стимулов по отношению к границе изолированного гласного.
313
j
Как показывают опыты по восприятию дифтонгоидных глас ных, для стимулов с формой траектории формантных контуров, при которой начальные значения частоты Рг меньше конечных, а применительно к данному случаю меньше экстремальной частоты, для русских испытуемых существует не два, а три класса возмож ных решений о гласных: [u], [i] и [i], При этом граница по F% между [и] и [*] расположена ниже, чем граница между [i] и [i]. Поскольку есть основание считать (см. главу 4), что число вос принимаемых категорий гласных — психологических фонем —
влюбом языке больше числа лингвистических фонем и соответствует примерно числу вариантов, то возможно, что носители американ ского варианта английского языка, так же как и русские, разли чают три категории в наборе стимулов типа [w] Г [w]. При выборе решений относительно [и] испытуемые могли ориентироваться либо на одну, либо на другую границу, что в результате и должно приводить к такому сдвигу средней границы, который наблюдается
вопытах. Поддержкой данной версии может служить большой раз брос ответов испытуемых, регистрируемый при идентификации стимулов типа [w] Г [w].
12.2.3. РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ ПО ВОСПРИЯТИЮ ОДНОНАПРАВЛЕННЫХ КОНТУРОВ В ТОНАЛЬНЫХ СИГНАЛАХ
В ряде психоакустических работ, исследующих вос приятие изменяющихся по частоте сигналов [181; 198295- 402' 403], использовалась следующая простая логика рассуждений. Из вестно, что изолированный стационарный сигнал воспринимается человеком с определенной высотой. Очевидно, что сигнал с изме няющейся во времени частотой (при ограниченной области изме нения) также должен характеризоваться какой-то высотой. Ее можно экспериментально определить, заставив человека подо брать такое значение частоты стационарного тона {F^}, при котором его высота совпадает с высотой переменного стимула (стимул с изменяющейся частотой будем называть в дальнейшем глайдом). Статистические параметры распределения значений F^, которые испытуемый устанавливает при многократном выполнении этой задачи, могут служить в качестве характеристики восприятия глайда.
Следует сразу же сказать, что все авторы, использующие по добный метод, отмечают, что сравнение глайда и тона но высоте составляет довольно трудную задачу для испытуемых. В работе Набелека и др. [402] из 6 человек, приглашенных на опыты, двое вообще не могли справиться с этой задачей и были отстранены от участия в основных экспериментах. Ответы испытуемых в опы тах Бейли I184] имели весьма разнообразный характер и сопровож дались большим разбросом.
314
Рассмотрим результаты работы Набелека и др. I402], в которой наиболее подробно исследовалось восприятие переменных по частоте тонов с использованием указанной методики.
Впервой серии экспериментов использовались стимулы (тоны),
укоторых частота изменялась во времени по линейному закону вверх или вниз непрерывно от начала, F„, до конца посылки, Fv
(100%-ные глайды), в различных диапазонах (| Д75’| = |FK —
= 20 4- 1100 Гц) при одной и тойже средней частоте (F,p = 715 Гц) и при разной длительности стимулов, от 12 до 250 мс.
Для всех стимулов распределения значений FT (общее число ответов на каждый стимул равно примерно 20 при участии 4 испы туемых) имели одномодаль ную форму (рис. 12.9). Их средние значения (С.,), при веденные в работе [402] в виде таблицы, указаны на рис. 12.8 точками на вертикальных стрелках. Несколько точек
Рис. 12.8. Результаты опытов по уравниванию высоты непрерыв ного глайда п постоянного тона.
По оси абсцисс — частота в конце глайда FK; по оси ординат — частота тона. Остальные обозначения см.
в тексте.
(крестиков) на одной стрелке соответствуют результатам, получен ным при разных длительностях глайдов. Данные эти специально не выделены, так как не было обнаружено регулярного влияния длительности на Длина и направление стрелок соответствуют ве личине и знаку ДТ^, а их положение по оси абсцисс соответствует FK. На этом же рисунке в его верхней части приведены данные работы Хейнца и др. [295], в которой применялись аналогичные стимулы длительностью 20 и 50 мс при ДГ = 500 Гц. Средние значения обозначены крестиками. Штриховые горизонтальные линии для обеих групп дайных'указывают среднюю частоту глайдов (Л-р)-
Как видно из рисунка, в большинстве случаев FT близка к конечной частоте глайдов, причем близость эта в большей сте пени свойственна данным Хейнца и др., но и в результатах Набе лека и др. выражена вполне отчетливо. Существенно, что FT не рав на FC{I даже для самых коротких глайдов и самых малых Д75’. Ав
торы [402] показывают, что степень отличия Fr от средней частоты тем больше, чем больше &F: соблюдается примерное постоянство отношения (FT — F^lbF.
315
Данные аналогичного характера были получены ранее в опытах Брэди и др. [198], использовавших в качестве переменных сти мулов звуки гармонического спектра с одним максимумом, частот ное положение которого изменялось во времени. Стимулы созда вались путем импульсного возбуждения (с частотой следования импульсов 100 Гц) резонансною) контура с перестраиваемой сред ней частотой. Они предъявлялись испытуемым в паре с сигналами со стационарным спектром, в которых можно было изменять час тоту максимума, добиваясь близкого сходства обоих стимулов по тембру. В результате оказалось, что устанавливаемая частота в среднем равна конечной частоте спектрального максимума пе ременного сигнала.
Рассмотренные данные допускают вывод о том, что при уста новлении сходства между глайдом и стационарным тоном человек ис пользует в качестве признака глайда положение спектрального мак симума в момент окончания звука. Другими словами, характе ристикой контура f(t) служит результат измерения слухом его конечной частоты z^. Измерение конечной частоты сопровождается усреднением частоты на некотором временном интервале. Судя по тому, что даже для коротких (12 мс) глайдовГт =f= FC!>, интервал
усреднения не очень велик (не превышает 10 |
20 мс). |
Во второй серии экспериментов Набелека и др. использовались стимулы, контур f(t) которых соответствовал комбинации отрезков с постоянной и изменяющейся частотой, как показано на рис. 12.9. Присутствие в контуре стационарных участков изменяет характер распределений FT следующим образом:
1) если Л/-’ ДГ^где AFT — некоторая критическая величина), то независимо от соотношения длительностей стационарных участ ков и переходов распределение FT имеет одномодальную форму; удлинение одного стационарного отрезка за счет другого приво дит к сдвигу FT в направлении более длинного отрезка (рис. 12.9, А);
2) если AF > ДГП (где ДТц > А^г), то в зависимости от соотношения длительностей перехода и стационарных участков распределение FT имеет либо один, либо два максимума. По следнее наблюдается лишь при наличии двух стационарных участ ков по краям контура (рис. 12.9, В), и распределения концентри руются в областях Fa и FK.
Определенные в работе значения |
AF1 и ДГ1г для стимулов |
с двумя стационарными отрезками |
равной длительности и ко |
ротким (5% от общей длительности) переходом (контур ступен
чатой формы) в зависимости |
от общей |
длительности стимулов |
||
приведены на рис. 12.10 для случая, |
когда |
Г,р |
= 715 Гц. |
|
Подобная зависимость была |
определена |
также |
для |
стимулов |
с Гср = 2000 Гц. Оказалось, что значение ДГгг при длительностях, больших 40 мс, примерно соответствует’величинам критических полос на этих частотах [и5].
Можно утверждать, что для тех стимулов, для которых на блюдалось двухмодальное распределение, частотный контур ха-
316
рактеризуется не менее чем двумя признаками — значениями
Zh |
и Zr. |
Случаи, в которых наблюдается одномодальное ’ распре |
||
деление |
Fr, |
допускают две интерпретации. Либо слух |
выделяет |
|
и |
измеряет |
в контуре только одно значение частоты, |
которое |
однозначно характеризует высоту стимула, как и для стационар-
Рис. 12.9. Результаты опытов по уравниванию высот постоянного тона и стимулов с разной формой контуров изменения частоты. По [4оа].
На А и Б — распределения частот постоянного тона, равного по высоте переменным сти мулам длительностью 40 мс; по оси абсцисс — частота, стрелками отмечены начальные и конечные значения частоты контура, штрихпунктирными линиями указаны средние зна чения частоты контура; по оси ординат — число случаев установления данной частоты FT.
На В — форма контуров переменных стимулов.
ного тона, либо он выделяет два значения, г*, и Zk, но при срав нении такого глайда с чистым тоном человек по каким-то правилам ориентируется только на одно из них или на некоторую функцию от обоих.
Первая из этих интерпретаций кажется сомнительной по сле дующим соображениям. Стимулы, у которых короткий переход предшествует стационарному участку, при уравнивании их по высоте с чистым тоном характеризуются одномодальным распре делением со средним значением, равным частоте стационарного
3.17
участка. Пример этого рода данных наблюдается на рис. 12,9, В для контура подобного типа. Из этого должно следовать, что слух выделяет в таком контуре только одну конечную точку. В то же время, как можно видеть по данным о восприятии мягкости син тетических речевых сигналов, контур второй форманты которых имеет аналогичную форму, креме частоты стационарного участка, слухом измеряется и начальная частота перехода.
Против однозначности высоты глайдов с малым диапазоном изменения частоты (меньшим AFJ свидетельствует эффект увели-
Рис. 12.10. Условия обнаружения разницы между начальными и конечными значениями частоты (AF) в изменяющихся сигналах.
По оси абсцисс — длительность стимулов; по оси ординат'— разность между начальным
и конечным значениями частоты. 1 — критическое значение |
при котором наблюда |
ется одномодальная форма распределений значений частоты постоянного тона FT (см. рис. 12.9); 2 — критическое значение A^jp при котором распределения FT имеют двух
модальную форму. По [402]. 3 и 4 — пороговые значения AF, при которых обнаружива ются различия краевых частот в стимулах с непрерывной («з) или ступенчатой (4) формой контура. По [509].
чения разброса (стандартного отклонения) значений F?, наблюдав шийся Набелеком и др. для 100%-х глайдов при увеличении их длительности (для фиксированного AF). Заметим, что для воспри ятия стационарных тонов в аналогичной ситуации — при урав нивании двух тонов по высоте — характерна обратная законо мерность [101’ 395].
Учитывая эти факты, а также то, что процедура уравнивания высоты стационарного и переменного сигналов является трудной задачей для человека, допускающей сложные правила ее решения, следует скорее всего думать, что вторая интерпретация является более правильной.
Поддержкой этой точки зрения могут служить также резуль таты работ (473 5091, в которых исследовались свойства слухо
318
т
вого обнаружения изменений частоты в сигналах, изменяющихся по законам, близким к тем, что и в стимулах Набелека и др. В указанных экспериментах испытуемым предъявлялась последо вательность двух стимулов — стационарный тон и глайд, — при случайном порядке их следования. Управляя частотой FT постоян ного тона, испытуемые сначала добивались наибольшего сходства обоих сигналов по высоте, а затем должны были ответить, в каком из двух стимулов ощущается изменение.
Рис. 12.11. Зависимость порога обнаружения разницы краевых значений частоты в изменяющемся сигнале от длительности начального стационарного участка. По [509].
По оси абсцисс — длительность стационарного участка в начале стимула со ступенчатым контуром f (0; по оси ординат — пороговая разность краевых значений частоты. Пара метр кривых — полная длительность стимула (Г): 1 — 32,2 — 102, 3 — 302, 4 — 1000 мс. На графике приведены пороги обнаружения различий по частоте для'пары стационарных тонов в зависимости от длительности. По Г101] — -кружки и [51°] — незачерненные тре
угольники.
Экспериментатор устанавливал разные значения перепада частоты на переходах (ДГ) при постоянном значении Гн = 1000 Гц. По ответам испытуемых определялись пороги обнаружения из менений частоты — ДУ, при которых изменения правильно обна руживались в 75% случаев. Были определены пороги в зависимо сти от общей длительности стимулов (Г), от длительности перехода (Г2) и от длительности первого и второго стационарных участков (7\ и 7'3) в стимулах со ступенчатым контуром.
На рис. 12.10 приведены пороговые значения ДУ, определен ные для стимулов с непрерывными и ступенчатыми контурами. В последнем случае Т2 = 1/;, Т при Т\ = Тй. Видно, что все зна чения порогов AF лежат существенно ниже кривой Д/’/Г). Из этого следует, что в случаях, когда из результатов опытов по установлению сходства глайда и стационарного тона зависи
319
мость /(i) должна предположительно описываться только одним значением z*, на самом деле слух выделяет по крайней мере два последовательных значения z{ и z,.+1, не равных друг другу. Обнаружение изменений можно трактовать как результат сравне ния этих величин друг с другом, при котором решающая система регистрирует их неравенство. В цитируемых работах были полу чены также данные о том, ‘что пороги обнаружения изменений частоты для стимулов со ступенчатой формой контура (рис. 12.9, В) уменьшаются при увеличении длительности крайних стационар ных отрезков (рис. 12.11). При этом оказывается, что характер зависимости от Тг и значения порогов BF очень хорошо совпадают с известными данными о порогах обнаружения различий по частоте, определяемых в условиях сравнения двух последовательных ста ционарных стимулов. На основании этого факта можно сделать вывод о том, что обнаружение изменений в данном случае обус ловливается сравнением частоты начального и конечного участ ков контура, т. е. что г; = и z*+1 = г,(.
Таким образом, рассмотренные на протяжении трех предыду щих разделов данные заставляют предполагать, что в процессе обработки сигналов с изменяющимся во времени спектром слухо вая система выделяет и измеряет частоту спектрального максимума в начале и в конце отрезка сигнала, а также частоту в экстремаль ных точках контура f(t).
Определение моментов измерения краевых значений частоты, вероятнее всего, связано с процессом сегментации, осуществляемой в слухе при анализе огибающей интенсивности сигнала, а изме рение самих значений параметра сопровождается усреднением на некотором интервале времени.
Для дальнейшего понимания слухового описания контура f(t) наиболее важными представляются вопрос о механизме выделе ния экстремумов и выяснение величины интервалов, в течение которых измеряется частота.
12.3. СЛУХОВОЙ АНАЛИЗ «ПРОИЗВОДНОЙ» ЧАСТОТНОГО КОНТУРА
Специалисты по психоакустике уже давно выска зывают предположение о том, что скорость изменения спектраль ных составляющих в звуках типа «глиссандо» имеет свой слуховой коррелят — субъективную переменную, поддающуюся количествен ной оценке [464]. Экспериментальные данные, обсуждаемые в нас тоящем разделе, свидетельствуют о том, что человек в своих решениях об акустических сигналах с переменным спектром действительно основывается на данных о направлении или ве личине скорости изменения частоты спектральных максимумов.
Есть основания считать, что выделение такого признака сиг-
320