Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
13.47 Mб
Скачать

Доводом в пользу того, что однонаправленный частотный кон­ тур описывается в слухе своими краевыми точками, может слу­ жить также результат работ [9®’ 97], в которых вопрос о призна­ ках контура частоты основного тона jF0(Z) исследовался с помощью метода имитации. Синтетические гласные звуки с линейно воз­ растающей частотой основного тона предъявлялись испытуемым, задачей которых было имитировать интонацию стимулов. Опре­ деляющая роль краевых точек контура F0(t) устанавливалась по тому факту, что изменение FQ в ответном сигнале, как правило, начиналось и кончалось участками с постоянной частотой, равной в среднем начальной и конечной частотам исходного контура соответственно. При этом в исходном стимуле стационарных участ­ ков могло и не быть.

Таким образом, приведенные экспериментальные факты дают возможность утверждать, что при восприятии коротких сигналов с однонаправленным частотным контуром слуховыми призна­ ками контура могут служить результаты измерения частоты в начале и конце звука. Важно, что на основании этих данных мы удостоверяемся в способности слуховой системы измерять аб­ солютные значения параметра в некоторые определенные моменты времени, привязанные к входному стимулу.

12.2.2.ИЗМЕРЕНИЕ ЧАСТОТЫ

ВЭКСТРЕМАЛЬНЫХ ТОЧКАХ КОНТУРА f (t)

До сих пор речь шла о сигналах с самым простым контуром f(t), где частота изменяется только в одном направлении.

Более сложным случаем представляется

восприятие звуков,

у которых форма траектории включает

смену направления

изменения. Интуитивно понятно, что два сигнала, начало и конец которых имеют одинаковые значения по частоте, но изменение частоты внутри звука у одного из них осуществляется по выпук­ лой, а у другого по вогнутой траектории, должны восприниматься по-разному. Подобная форма траектории, например, присуща формантным контурам разных гласных звуков’между одинаковыми согласными в потоке речи [359480, 484 486].

Насколько известно, была сделана только одна попытка иссле­ довать восприятие звуков с формантным контуром такой формы

[set]

в указанной работе использовались синтетические стимулы

с тремя различными формами траекторий изменения частоты F2

и F3.

1-й тип стимулов — стационарные гласные (Г), 2-й тип —

звукосочетания [wl Г [wl с выпуклой формой контуров формант (рис. 12.5, Л), 3-й тип — звукосочетания [j] Г [j] с вогнутой формойжонтуров (рис. 12.5, В). Начальные, конечные и экстремальные"участки оформлялись в виде 20-миллисекундных стационар­ ных ’интервалов. Параметры стимулов (F2 и FJ приведены -на рис. 12.6. Кроме того, все стимулы имели два варианта временного масштаба: в случае медленного варианта переменная часть стимула

311

была равна 200 мс, в случае быстрого — 100 мс. Каждый из типов стимулов (всего 6) предъявлялся в виде отдельного теста.

Испытуемые (10 американцев) должны были классифицировать все звуки на две категории гласных (в слоге или в изолированном предъявлении) — [и] и [i]. Задача эксперимента состояла в том, чтобы путем сравнения положения фонемных границ, полученных для разных типов стимулов, проверить предположение о том, что восприятие фонетического качества определяется частотой фор-

Рис. 12.5. Динамические спектрограммы синтетических слогов. По [301].

По оси абсцисс — время; по оси ординат — частоты формант. На А — слоги [w] Г [w]; на Б — слоги [j] Г [j ].

мант в экстремальной точке контура. Если предположение верно, положение фонемной границы по F2 и F3 должно быть одинако­ вым для всех трех типов стимулов.

Результат получился следующий: средние для всех испытуемых значения границы (для обеих длительностей стимулов) для ста­ ционарных гласных и [j] Г [jl-звукосочетаний действительно до­ вольно похожи: для стационарных гласных F2 = 1644 Гц, F3 — = 2648 Гц, для [j] Г [j] - F2 = 1634 Гц, F3 = 2632 Гц (данные вычислены по таблицам, приведенным в статье). В то же время при классификации [w] Г [wl-стимулов совпадения границ с изо­

лированным

гласным в

ответах

большинства

испытуемых (для

7 из 10) не

наблюдается

(рис.

12.7). Средние

значения границ

вэтом случае существенно ниже: F2 = 1474 Гц, F3 = 2553 Гц. Совпадение границ для изолированных гласных и слогов типа

[j] Г [j] можно рассматривать как доказательство использования человеком при распознавании гласных значений частоты формант в экстремальной точке.

312

1

Результаты обсуждаемой работы интересным образом перекли­ каются с данными опытов Люблинской и Слепокуровой по восприя­ тию дифтонгоидных гласных. Фонемная граница по параметру Fz между [i] и [и] для стимулов типа [j] Г [j] и между [i] и [и] для стимулов с однонаправленным нисходящим контуром описывается практически одним и тем же числом, только в первом случае оно соответствует экстремальной, а во-втором — конечной точке кон-

Рис. 12.6. Параметры синтетических стимулов, использованных в опытах по восприятию слогов [w] Г [w] и [j] Г [j]. По [361].

По оси абсцисс — частота третьей форманты; по оси ординат — частота второй форманты. Маленькие точки соответствуют значениям F2 и F3 на стационарном участке гласного; большие точки показывают значения F2 и F3 на участках согласного (нижняя — для [w];

верхняя — для [j]).

Рис. 12.7. Положение границы между [i] и [и] по частоте второй форманты (F2) в изолированных гласных (точки) и в слогах [w] Г [w] (крестики) у раз­ ных испытуемых. По [361].

Каждое значение на графике — результаты одного испытуемого при идентификации стимулов с двумя разными длительностями. По оси абсцисс — границы для гласных длительностью 200 мс; по оси ординат — для гласных длительностью 100 мс.

тура. Если такое совпадение не случайно, то этот факт указывает на возможность рассматривать конечное и экстремальное значе­ ния частоты как одну и ту же «особую точку» контура. Т. е. воз­ можно, что момент для измерения (считывания) частоты максимума в обоих случаях задается по некоторому общему правилу и ре­ зультат измерения одинаковым образом используется при фоне­ тическом анализе. Насколько реально такое предположение, решить можно только в результате специального исследования правил выделения особых точек в контуре.

В связи с высказанным предположением кажется возможным предложить следующее объяснение наблюдаемому смещению фо­ немной границы для [w] Г [wl-стимулов по отношению к границе изолированного гласного.

313

j

Как показывают опыты по восприятию дифтонгоидных глас­ ных, для стимулов с формой траектории формантных контуров, при которой начальные значения частоты Рг меньше конечных, а применительно к данному случаю меньше экстремальной частоты, для русских испытуемых существует не два, а три класса возмож­ ных решений о гласных: [u], [i] и [i], При этом граница по F% между [и] и [*] расположена ниже, чем граница между [i] и [i]. Поскольку есть основание считать (см. главу 4), что число вос­ принимаемых категорий гласных — психологических фонем —

влюбом языке больше числа лингвистических фонем и соответствует примерно числу вариантов, то возможно, что носители американ­ ского варианта английского языка, так же как и русские, разли­ чают три категории в наборе стимулов типа [w] Г [w]. При выборе решений относительно [и] испытуемые могли ориентироваться либо на одну, либо на другую границу, что в результате и должно приводить к такому сдвигу средней границы, который наблюдается

вопытах. Поддержкой данной версии может служить большой раз­ брос ответов испытуемых, регистрируемый при идентификации стимулов типа [w] Г [w].

12.2.3. РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ ПО ВОСПРИЯТИЮ ОДНОНАПРАВЛЕННЫХ КОНТУРОВ В ТОНАЛЬНЫХ СИГНАЛАХ

В ряде психоакустических работ, исследующих вос­ приятие изменяющихся по частоте сигналов [181; 198295- 402' 403], использовалась следующая простая логика рассуждений. Из­ вестно, что изолированный стационарный сигнал воспринимается человеком с определенной высотой. Очевидно, что сигнал с изме­ няющейся во времени частотой (при ограниченной области изме­ нения) также должен характеризоваться какой-то высотой. Ее можно экспериментально определить, заставив человека подо­ брать такое значение частоты стационарного тона {F^}, при котором его высота совпадает с высотой переменного стимула (стимул с изменяющейся частотой будем называть в дальнейшем глайдом). Статистические параметры распределения значений F^, которые испытуемый устанавливает при многократном выполнении этой задачи, могут служить в качестве характеристики восприятия глайда.

Следует сразу же сказать, что все авторы, использующие по­ добный метод, отмечают, что сравнение глайда и тона но высоте составляет довольно трудную задачу для испытуемых. В работе Набелека и др. [402] из 6 человек, приглашенных на опыты, двое вообще не могли справиться с этой задачей и были отстранены от участия в основных экспериментах. Ответы испытуемых в опы­ тах Бейли I184] имели весьма разнообразный характер и сопровож­ дались большим разбросом.

314

Рассмотрим результаты работы Набелека и др. I402], в которой наиболее подробно исследовалось восприятие переменных по частоте тонов с использованием указанной методики.

Впервой серии экспериментов использовались стимулы (тоны),

укоторых частота изменялась во времени по линейному закону вверх или вниз непрерывно от начала, F„, до конца посылки, Fv

(100%-ные глайды), в различных диапазонах (| Д75’| = |FK —

= 20 4- 1100 Гц) при одной и тойже средней частоте (F,p = 715 Гц) и при разной длительности стимулов, от 12 до 250 мс.

Для всех стимулов распределения значений FT (общее число ответов на каждый стимул равно примерно 20 при участии 4 испы­ туемых) имели одномодаль­ ную форму (рис. 12.9). Их средние значения (С.,), при­ веденные в работе [402] в виде таблицы, указаны на рис. 12.8 точками на вертикальных стрелках. Несколько точек

Рис. 12.8. Результаты опытов по уравниванию высоты непрерыв­ ного глайда п постоянного тона.

По оси абсцисс — частота в конце глайда FK; по оси ординат — частота тона. Остальные обозначения см.

в тексте.

(крестиков) на одной стрелке соответствуют результатам, получен­ ным при разных длительностях глайдов. Данные эти специально не выделены, так как не было обнаружено регулярного влияния длительности на Длина и направление стрелок соответствуют ве­ личине и знаку ДТ^, а их положение по оси абсцисс соответствует FK. На этом же рисунке в его верхней части приведены данные работы Хейнца и др. [295], в которой применялись аналогичные стимулы длительностью 20 и 50 мс при ДГ = 500 Гц. Средние значения обозначены крестиками. Штриховые горизонтальные линии для обеих групп дайных'указывают среднюю частоту глайдов (Л-р)-

Как видно из рисунка, в большинстве случаев FT близка к конечной частоте глайдов, причем близость эта в большей сте­ пени свойственна данным Хейнца и др., но и в результатах Набе­ лека и др. выражена вполне отчетливо. Существенно, что FT не рав­ на FC{I даже для самых коротких глайдов и самых малых Д75’. Ав­

торы [402] показывают, что степень отличия Fr от средней частоты тем больше, чем больше &F: соблюдается примерное постоянство отношения (FT — F^lbF.

315

Данные аналогичного характера были получены ранее в опытах Брэди и др. [198], использовавших в качестве переменных сти­ мулов звуки гармонического спектра с одним максимумом, частот­ ное положение которого изменялось во времени. Стимулы созда­ вались путем импульсного возбуждения (с частотой следования импульсов 100 Гц) резонансною) контура с перестраиваемой сред­ ней частотой. Они предъявлялись испытуемым в паре с сигналами со стационарным спектром, в которых можно было изменять час­ тоту максимума, добиваясь близкого сходства обоих стимулов по тембру. В результате оказалось, что устанавливаемая частота в среднем равна конечной частоте спектрального максимума пе­ ременного сигнала.

Рассмотренные данные допускают вывод о том, что при уста­ новлении сходства между глайдом и стационарным тоном человек ис­ пользует в качестве признака глайда положение спектрального мак­ симума в момент окончания звука. Другими словами, характе­ ристикой контура f(t) служит результат измерения слухом его конечной частоты z^. Измерение конечной частоты сопровождается усреднением частоты на некотором временном интервале. Судя по тому, что даже для коротких (12 мс) глайдовГт =f= FC!>, интервал

усреднения не очень велик (не превышает 10

20 мс).

Во второй серии экспериментов Набелека и др. использовались стимулы, контур f(t) которых соответствовал комбинации отрезков с постоянной и изменяющейся частотой, как показано на рис. 12.9. Присутствие в контуре стационарных участков изменяет характер распределений FT следующим образом:

1) если Л/-’ ДГ^где AFT — некоторая критическая величина), то независимо от соотношения длительностей стационарных участ­ ков и переходов распределение FT имеет одномодальную форму; удлинение одного стационарного отрезка за счет другого приво­ дит к сдвигу FT в направлении более длинного отрезка (рис. 12.9, А);

2) если AF > ДГП (где ДТц > А^г), то в зависимости от соотношения длительностей перехода и стационарных участков распределение FT имеет либо один, либо два максимума. По­ следнее наблюдается лишь при наличии двух стационарных участ­ ков по краям контура (рис. 12.9, В), и распределения концентри­ руются в областях Fa и FK.

Определенные в работе значения

AF1 и ДГ1г для стимулов

с двумя стационарными отрезками

равной длительности и ко­

ротким (5% от общей длительности) переходом (контур ступен­

чатой формы) в зависимости

от общей

длительности стимулов

приведены на рис. 12.10 для случая,

когда

Г,р

= 715 Гц.

Подобная зависимость была

определена

также

для

стимулов

с Гср = 2000 Гц. Оказалось, что значение ДГгг при длительностях, больших 40 мс, примерно соответствует’величинам критических полос на этих частотах [и5].

Можно утверждать, что для тех стимулов, для которых на­ блюдалось двухмодальное распределение, частотный контур ха-

316

рактеризуется не менее чем двумя признаками — значениями

Zh

и Zr.

Случаи, в которых наблюдается одномодальное ’ распре­

деление

Fr,

допускают две интерпретации. Либо слух

выделяет

и

измеряет

в контуре только одно значение частоты,

которое

однозначно характеризует высоту стимула, как и для стационар-

Рис. 12.9. Результаты опытов по уравниванию высот постоянного тона и стимулов с разной формой контуров изменения частоты. По [4оа].

На А и Б — распределения частот постоянного тона, равного по высоте переменным сти мулам длительностью 40 мс; по оси абсцисс — частота, стрелками отмечены начальные и конечные значения частоты контура, штрихпунктирными линиями указаны средние зна­ чения частоты контура; по оси ординат — число случаев установления данной частоты FT.

На В — форма контуров переменных стимулов.

ного тона, либо он выделяет два значения, г*, и Zk, но при срав­ нении такого глайда с чистым тоном человек по каким-то правилам ориентируется только на одно из них или на некоторую функцию от обоих.

Первая из этих интерпретаций кажется сомнительной по сле­ дующим соображениям. Стимулы, у которых короткий переход предшествует стационарному участку, при уравнивании их по высоте с чистым тоном характеризуются одномодальным распре­ делением со средним значением, равным частоте стационарного

3.17

участка. Пример этого рода данных наблюдается на рис. 12,9, В для контура подобного типа. Из этого должно следовать, что слух выделяет в таком контуре только одну конечную точку. В то же время, как можно видеть по данным о восприятии мягкости син­ тетических речевых сигналов, контур второй форманты которых имеет аналогичную форму, креме частоты стационарного участка, слухом измеряется и начальная частота перехода.

Против однозначности высоты глайдов с малым диапазоном изменения частоты (меньшим AFJ свидетельствует эффект увели-

Рис. 12.10. Условия обнаружения разницы между начальными и конечными значениями частоты (AF) в изменяющихся сигналах.

По оси абсцисс — длительность стимулов; по оси ординат'— разность между начальным

и конечным значениями частоты. 1 — критическое значение

при котором наблюда­

ется одномодальная форма распределений значений частоты постоянного тона FT (см. рис. 12.9); 2 — критическое значение A^jp при котором распределения FT имеют двух­

модальную форму. По [402]. 3 и 4 — пороговые значения AF, при которых обнаружива­ ются различия краевых частот в стимулах с непрерывной («з) или ступенчатой (4) формой контура. По [509].

чения разброса (стандартного отклонения) значений F?, наблюдав­ шийся Набелеком и др. для 100%-х глайдов при увеличении их длительности (для фиксированного AF). Заметим, что для воспри­ ятия стационарных тонов в аналогичной ситуации — при урав­ нивании двух тонов по высоте — характерна обратная законо­ мерность [101’ 395].

Учитывая эти факты, а также то, что процедура уравнивания высоты стационарного и переменного сигналов является трудной задачей для человека, допускающей сложные правила ее решения, следует скорее всего думать, что вторая интерпретация является более правильной.

Поддержкой этой точки зрения могут служить также резуль­ таты работ (473 5091, в которых исследовались свойства слухо

318

т

вого обнаружения изменений частоты в сигналах, изменяющихся по законам, близким к тем, что и в стимулах Набелека и др. В указанных экспериментах испытуемым предъявлялась последо­ вательность двух стимулов — стационарный тон и глайд, — при случайном порядке их следования. Управляя частотой FT постоян­ ного тона, испытуемые сначала добивались наибольшего сходства обоих сигналов по высоте, а затем должны были ответить, в каком из двух стимулов ощущается изменение.

Рис. 12.11. Зависимость порога обнаружения разницы краевых значений частоты в изменяющемся сигнале от длительности начального стационарного участка. По [509].

По оси абсцисс — длительность стационарного участка в начале стимула со ступенчатым контуром f (0; по оси ординат — пороговая разность краевых значений частоты. Пара­ метр кривых — полная длительность стимула (Г): 1 — 32,2 — 102, 3 — 302, 4 — 1000 мс. На графике приведены пороги обнаружения различий по частоте для'пары стационарных тонов в зависимости от длительности. По Г101] — -кружки и [51°] — незачерненные тре­

угольники.

Экспериментатор устанавливал разные значения перепада частоты на переходах (ДГ) при постоянном значении Гн = 1000 Гц. По ответам испытуемых определялись пороги обнаружения из­ менений частоты — ДУ, при которых изменения правильно обна­ руживались в 75% случаев. Были определены пороги в зависимо­ сти от общей длительности стимулов (Г), от длительности перехода (Г2) и от длительности первого и второго стационарных участков (7\ и 7'3) в стимулах со ступенчатым контуром.

На рис. 12.10 приведены пороговые значения ДУ, определен­ ные для стимулов с непрерывными и ступенчатыми контурами. В последнем случае Т2 = 1/;, Т при Т\ = Тй. Видно, что все зна­ чения порогов AF лежат существенно ниже кривой Д/’/Г). Из этого следует, что в случаях, когда из результатов опытов по установлению сходства глайда и стационарного тона зависи­

319

мость /(i) должна предположительно описываться только одним значением z*, на самом деле слух выделяет по крайней мере два последовательных значения z{ и z,.+1, не равных друг другу. Обнаружение изменений можно трактовать как результат сравне­ ния этих величин друг с другом, при котором решающая система регистрирует их неравенство. В цитируемых работах были полу­ чены также данные о том, ‘что пороги обнаружения изменений частоты для стимулов со ступенчатой формой контура (рис. 12.9, В) уменьшаются при увеличении длительности крайних стационар­ ных отрезков (рис. 12.11). При этом оказывается, что характер зависимости от Тг и значения порогов BF очень хорошо совпадают с известными данными о порогах обнаружения различий по частоте, определяемых в условиях сравнения двух последовательных ста­ ционарных стимулов. На основании этого факта можно сделать вывод о том, что обнаружение изменений в данном случае обус­ ловливается сравнением частоты начального и конечного участ­ ков контура, т. е. что г; = и z*+1 = г,(.

Таким образом, рассмотренные на протяжении трех предыду­ щих разделов данные заставляют предполагать, что в процессе обработки сигналов с изменяющимся во времени спектром слухо­ вая система выделяет и измеряет частоту спектрального максимума в начале и в конце отрезка сигнала, а также частоту в экстремаль­ ных точках контура f(t).

Определение моментов измерения краевых значений частоты, вероятнее всего, связано с процессом сегментации, осуществляемой в слухе при анализе огибающей интенсивности сигнала, а изме­ рение самих значений параметра сопровождается усреднением на некотором интервале времени.

Для дальнейшего понимания слухового описания контура f(t) наиболее важными представляются вопрос о механизме выделе­ ния экстремумов и выяснение величины интервалов, в течение которых измеряется частота.

12.3. СЛУХОВОЙ АНАЛИЗ «ПРОИЗВОДНОЙ» ЧАСТОТНОГО КОНТУРА

Специалисты по психоакустике уже давно выска­ зывают предположение о том, что скорость изменения спектраль­ ных составляющих в звуках типа «глиссандо» имеет свой слуховой коррелят — субъективную переменную, поддающуюся количествен­ ной оценке [464]. Экспериментальные данные, обсуждаемые в нас­ тоящем разделе, свидетельствуют о том, что человек в своих решениях об акустических сигналах с переменным спектром действительно основывается на данных о направлении или ве­ личине скорости изменения частоты спектральных максимумов.

Есть основания считать, что выделение такого признака сиг-

320

Соседние файлы в папке Нормальная физиология