Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
13.47 Mб
Скачать

нала, как скорость изменения частоты, нельзя объяснить дейст­ вием какого-то одного, общего для всех случаев механизма. Поддержкой этому могут служить нейрофизиологические данные работы [®18].

Допустимы по крайней мере два разных способа слухового измерения скорости изменения частоты.

1.Поскольку слух выделяет и измеряет краевые значения частоты в отдельной посылке с однонаправленным контуром f(t)

иможет измерять ее длительность, то эти три величины могут служить исходными параметрами для определения диапазона, направления и скорости изменения частоты. В данном случае непрерывно изменяющийся сигнал подвергается такой же обра­ ботке, как последовательность из двух стационарных посылок. Как можно было видеть по предыдущему разделу, данные по обнаружению непрерывных изменений частоты в тональных стимулах [473 509] интерпретируются именно с точки зрения та­ кого способа анализа.

2.Второй способ предполагает в слуховой системе возмож­

ность вырабатывать некоторым аналоговым путем сигнал, пропор­

циональный производной частотного контура, f(t), независимо от измерения координат спектральных максимумов в краевых точ­ ках. Для этого предполагается наличие специализированных устройств, выполняющих действие, аналогичное дифференциро­ ванию. Входной информацией для них должен служить либо некоторый аналоговый сигнал, монотонно связанный с мгновен­ ным значением частоты (координаты) максимума (функцией z*(£)), либо непосредственно огибающая слухового спектра g(z, t).

В пользу предположения о выделении слухом аналоговой

переменной, близкой по смыслу к производной f(t), говорят результаты нейрофизиологических исследойаний (см. главу 9), которые показывают, что реакции отдельных нейронов центральной слуховой системы систематически изменяются в зависимости от величины и направления скорости изменения частоты тонов. Этим устанавливается возможность осуществления в слухе так

называемого измерительного преобразования для f(t). По типам наблюдаемых нейронных ответов можно предполагать, что слух

может измерять знак и величину производной f(t) и длительность участка, где производная не равна нулю, или фиксировать мо­ мент появления такого участка.

Естественно ожидать, что в результате психоакустических исследований должно быть выяснено, в какой мере при слуховом

восприятии реализуется возможность таких преобразований и каковы реальные количественные характеристики анализа произ­

водной f(t). К сожалению, существующие в настоящее время дан­ ные могут ответить только на очень немногие вопросы в этом плане.

321

12.3.1. ВОСПРИЯТИЕ НАПРАВЛЕНИЯ ИЗМЕНЕНИЯ СПЕКТРА В РЕЧЕВЫХ СИГНАЛАХ

Экспериментальные данные, свидетельствующие о том, что человек использует направление изменения частоты спектраль­ ного максимума в качестве полезного признака при распознавании фонем, были получены при исследовании восприятия формантных переходов — быстрых однонаправленных изменений частот фор­

мант

на

начальном или конечном участках гласного [22° 228 349 -

351 369

ill

481]

Рис. 12.12. Характеристики стимулов, применявшихся в опытах по иссле­ дованию восприятия формантных переходов. По [*61].

По оси ординат — частота формант (в Гц). На А — варианты переходов второй форманты (F2); на Б — два варианта переходов первой форманты (Fi); на В — комбинации значе­ ний Fi и F2 па стационарном участке сигнала и соответствующие им гласные.

При прослушивании естественных гласных звуков, выделенных из окружения согласных (обычно исключаются участки сигналов, предшествующие быстрому нарастанию амплитуды, если иссле­ дуются начальные переходы, или непосредственно следующие за спадом, если исследуются конечные), оказывается, что такие сиг­ налы воспринимаются как слоги, в которых хорошо распознается признак места образования согласного [95 171 4в5].

Различение согласных по начальным переходам формант под­ робно исследовалось в работах сотрудников Хаскинских лаборато­ рий на синтетических стимулах, параметры которых схематически представлены на рис. 12.12 (из работы [351]). Спектр стимулов имел двухформантную структуру, на рис. 12.12, В показаны зна­ чения и F2 на стационарном участке. Наличие перехода пер­ вой форманты определяет главным образом слогоподобный

322

характер звука, а направление перехода имеет значение для различения согласных по признаку глухости-звонкости (см. главу 6).

Место образования согласных зависит от характера перехода второй форманты, варианты которого приведены на рис. 12.12, А. Все предъявляемые стимулы испытуемые должны были иденти­

фицировать как

слоги, начинающиеся со звонкого согласного

[b],

[d]

или [g]

(левый вариант перехода

F1

на рис. 12.12, Б),

либо

с

глухого согласного

[р], It], [к]

(при правом варианте

перехода

Ь\)-

Результаты

идентификации

представлены на

рис. 12.13. Можно убедиться, что при возрастании Е2 на переходе

в

качестве

начального

согласного выбирается

губной

звук

[Ь]

или [р],

при обратном

направлении — язычный

Id], [t]

или

lg],

Ik].1

основании направления переходов Е2 человек отли­

 

Если на

чает группу губных согласных от язычных, то, как показывает ряд, экспериментов!293’ 298, 86в382], для различения язычных согласных между собой он использует характер перехода третьей форманты.

Интересно, что человек способен различать направление изме­ нения спектрального максимума независимо от того, с помощью периодического или шумового возбуждения образован этот мак­ симум. В экспериментах Кожевникова и др. [S1] в качестве сти­ мулов применялись последовательности, состоящие из короткой посылки полосового шума и следующего за ней гласноподобного звука с гармоническим спектром, характеризующимся одним максимумом.

Фонемная граница между [р] и It], определенная как среднее

значение центральной частоты полосового шума Еш,

совпадает

с частотой спектрального максимума гласного FT (рис.

12.14) —

факт, свидетельствующий о том, что в этих опытах

фонемная

классификация основывается на направлении различия между Fm и FT. Существенно, что наблюдаемые при этом небольшие откло­ нения границы от Fr носят закономерный характер, который говорит о том, что порог различения направления зависит от значений частоты центрального максимума на участке гласного.

На рис. 12.15, А приведены величины относительных откло­ нений границ ((Ег—Fm)/FT в %) в зависимости от частоты максимума гласного. Подобная закономерность проявляется также при анализе данных Либермана и др. [ЗБ1] о различении согласных по признаку губной—язычный на основании началь­ ных переходов Е2 (рис. 12.15, Б). При составлении этого гра­ фика анализировались кривые идентификации [р] или [Ь], при-

1 Сотрудники Хаскинских лабораторий попытались объяснить полу­ ченные данные с помощью чрезвычайно сложной гипотезы «локуса» [а96], которая, однако, имеет смысл лишь в плане выбора параметров переходов формант при синтезе согласных и не имеет реальных оснований рассматри­ ваться как один из способов слуховой обработки (описание гипотезы «ло­ куса» и критику ее см. [168]).

21 Физиология речи

323

Рис. 12.13. Результаты идентификации стимулов, показанных на рис. 12.12.

На А — для стимулов с явно выраженным переходом Ft. На Б — для стимулов с мало выраженным переходом J\. Левые части рисунков соответствуют случаю, когда испытуемым

было разрешено пользоваться в ответах согласными [Ъ], [d], [g], правые части — соглас­ ными [р], [t], [к]. Каждый столбец (три расположенных друг под другом прямоуголь­ ника) соответствует определенному гласному, фонетическое обозначение которого приве­ дено под столбцом. Внутри каждого прямоугольника показана зависимость между зна­ чением перехода второй форманты (цифры по вертикали в центре рисунка) и числом иден­ тификаций стимула (цифры по горизонтали) с тем согласным, который указан слева или справа у соответствующей строки. Так, рельеф в верхнем левом прямоугольнике (строка [Ъ] столбец [i] на Л) показывает, что при значении перехода, равном —4, испытуемые опо­ знают согласный как [Ь] в 66 случаях; при повышении значения перехода второй фор­

манты количество опознаний [Ъ] уменьшается.

веденные на рис. 12.13. Определялась разность между начальным и стационарным значениями F2, соответствующая 50% распозна­ вания [р] или [Ь], отнесенная к F2 на стационарном участке.

Направление изменения формантных переходов в конце глас­ ного также определяет признак места образования согласных [95]. При этом если человек слушает изолированные слоги, то конечные согласные опознаются по переходам более точно, чем началь­ ные [4вв]. Однако правила различения согласных на конце проти-

Рис. 12.14. Граница между [pj и [t]. По [я].

По оси абсцисс — частота спектрального максимума гласного; по оси ординат — средняя частота полосового шума. Точки и кружки — данные разных испытуемых.

Рис. 12.15. Отклонения средних значений фонетических границ при восприя­ тии признака места артикуляции согласных. По [81].

На А — отклонение среднего значения границы между [р] и [t] от частоты спектрального максимума гласного; по оси абсцисс — частота максимума в спектре гласного; по оси орди­ нат — отклонение среднего значения границы от Fr; данные 3 испытуемых. На Б — ве­ личина разности между значениями границы «губные-язычные согласные» и значениями частоты второй форманты на стационарном участке гласного (данные [Зб1]). По оси абс­

цисс — частота второй форманты; по оси ординат — значение (Г2я—2р2)/2р2.

воположны тем, которые наблюдаются в начале гласного: так, губные звуки характеризуются понижением частоты, а языч­ ные — повышением.

Направление изменения спектра на переходах выступает как специфический признак сигнала, а сам факт однонаправленного изменения, очевидно, выделяется слуховой системой как отдельное событие. Эта точка зрения иллюстрируется в следующем опыте Рэнда [438].

Рис. 12.16 показывает схематические характеристики стиму­ лов и способ их предъявления. На одно ухо, например на правое, подавался сигнал, состоящий из двух сегментов: первый сегмент характеризовался спектром с одним максимумом в области пер­

325

г

вой форманты гласного, спектр второго имел структуру, характер­ ную для трехформантного стационарного гласного [а] — схема 1 на рис. 12.16, А (такой звук сам по себе воспринимается как [Ьа]). На другое ухо — левое — поступала короткая посылка звука, спектр которой соответствовал начальным переходам F2 и F3, характерным для [Ьа] — 2, [dal — 3 и [ga] — 4.

В этих условиях испытуемые слышали в правом ухе совершенно отчетливо полный слог с согласным, соответствующим направле­ нию переходов F2 и F3, и дополнительно еще в левом ухе — ко­ роткий верещащий звук. При разных направлениях переходов F2 и F3 различение согласных по признаку места образования осуществлялось с вероятностью 100%. Распознавание было воз­

можным даже в том случае, когда нарушалась синхронность поступ­ ления обеих частей: посылку, со­ держащую переход, можно было сдвигать по отношению к началу сигнала на другом ухе в преде­ лах + 25 мс.

Однако фонетический признак места образования согласного

Рис. 12.16. Схематическое изображение параметров стимулов (Л) и способ их предъявления (Б) при дихотическом восприятии формантных переходов. По

По оси абсцисс — время; по оси ординат —

частоты формант. Остальные обозначения см. в тексте.

определяется не только таким простым событием, как направление изменения спектра. Требуется еще наличие других событий, таких, например, как начало и конец гласного. Известно, что если человеку предъявлять изолированный отрезок сигнала с та­ кими характеристиками, как на переходах, то он вообще не вос­ принимается как речевой [326].

Таким образом, существующие экспериментальные данные заставляют считать, что факт определения слухом направления временнбго изменения спектра не вызывает сомнения. Это обстоя­ тельство ставит исследователей непосредственно перед задачей выяснения конкретного способа его слухового измерения.

Можно указать пока только на одну работу Стивенса [483] как на первую попытку моделирования механизма определения направления изменения спектра на переходах. В основе модели Стивенса лежит механизм сравнения энергии в соседних частот­ ных полосах, производимого через малые (10 мс) интервалы вре­ мени. Эту функцию выполняет система детекторов трех типов,

326

один из которых должен срабатывать на такой сигнал, в котором концентрация энергии в низкочастотной полосе следует за концент­ рацией энергии в высокочастотной, другой — на сигнал с об­ ратным направлением спектра и третий — на сигнал с расходящимся спектром.

Насколько верна модель Стивенса, сказать пока трудно: слишком мало сведений мы имеем о реальном слуховом анализе временных изменений спектра. Для дальнейшего его количествен­ ного исследования наиболее удобным методическим приемом ка­ жется использование синтетических речеподобных стимулов, со­ держащих информацию о признаке места образования согласных.

12.3.2. ВОСПРИЯТИЕ СКОРОСТИ ИЗМЕНЕНИЯ ЧАСТОТЫ ТОНА

Психоакустические данные, показывающие, что ско­ рость изменения частоты тона может служить различительным при­ знаком сигналов, были получены в работах Поллака [429], Набе­ лека и Хирша [401].

В обеих работах в качестве стимулов использовались отдель­ ные посылки тонов, закон изменения частоты которых указан

Рис. 12.17. Схема параметров стимулов, используемых при измерении поро­ гов различения скорости изменения частоты.

На А — по на В — по [42#]. Т, — длительность перехода стандартного стимула; Г, — длительность перехода переменного стимула; F„, FK, Fcp — начальное, конечное и

среднее значения частоты соответственно.

на рис. 12.17. В экспериментах Поллака контур f(t) имел изме­ няющийся участок — переход — в центре посылки (рис. 12.17, Б), в экспериментах Набелека и Хирша переходом начинался сигнал (рис. 12.17, А).

Предъявляемые для сравнения стандартный и переменный стимулы (использовался классический метод парного сравнения) имели фиксированные значения Fa и FK, а различия их по ско­ рости перехода задавались за счет длительности перехода пере­ менного стимула (Г2). Дифференциальный порог определялся по

327

значению Д71=|712—7’1|, при котором испытуемые в 75% слу­ чаев обнаруживали различие стимулов. По этому значению

можно затем вычислить порог различения по скорости: Д/—AF/кТ. При такой процедуре не исключена возможность для испыту­ емых различать стимулы по длительности переходов, и вопрос о том, пользуется ли человек этой возможностью, может быть решен при анализе величин дифференциальных порогов по одному

идругому параметрам (Д71 и Д/).

Вопытах Поллака использовались стимулы только с возра­ стающим направлением переходов, параметры которых варьиро-

Рис. 12.18. Пороги различения скорости изменения частоты тонов.

По оси абсцисс — скорость изменения частоты на переходах в тестовом стимуле; по оси ординат — относительный порог различения скорости изменения частоты. Параметр кривых (сплошные линии) — длительность переходов (Т,): 0 — 2 мс, 1 и 1' — 10, 2 — 27, 2' — 30, 3 — 100, 3' — 200, 4 — 400, 5 — 870 мс. Штриховыми линиями обозначены отно­

сительные

пороги

различения

длительности

переходов,

ДТ/ТХ: а — для Тх = 27 мс,

 

б — для Тх—200

мс. Остальные обозначения см. в тексте.

 

вали в

широких пределах: Д7г=4 4- 512

Гц, 711=0.14-870

мс.

Средняя частота стимулов

была одна и та же (Fcp = 707 Гц), дли­

тельность стационарных

участков

равна

1000 мс

у каждого.

В опытах

Набелека

и

Хирша [401] положение

стимулов

на

шкале частот,

характеризующееся более высокой частотой (FK

для

переходов с возрастающим направлением и Fa для переходов с убы­ вающим), соответствовало 250, 1000 и 4000 Гц. В каждом положе­ нии диапазон изменения частоты на переходах принимал три значе­ ния: FJFn=2 :1, 3: 2 и 9:3 (при направлении другого знака — соответственно обратные отношения). Длительность переходов 711=104-300 мс при соотношении ее с длительностью стационар­ ного участка 1 : 4.

На рис. 12.18 представлены зависимости относительных по­ рогов различения скорости изменения частоты Д//Д от Д, при

328

построении которых использованы графические данные из работы Поллака (кружки) и табличные данные работы Набелека и Хирша (точки) для стимулов из области 1000 Гц. Учитывая раз­ ницу в методиках, можно считать, что соответствие данных обеих работ достаточно хорошее.

• Прежде чем обсуждать характер данных, овтановимся на воп­ росе о том, не могло ли различение стимулов определяться в дан­ ном случае длительностью переходов. Для этого сравним между собой значения относительных порогов различения скорости А///х и длительности кТП\, считая эти величины характеристи­ ками относительной погрешности измерения слухом исходных параметров / и Т. На рис. 12.18 штриховыми линиями указаны зависимости \ТП\ от Д для стимулов с 2\=27 мс и 200 мс, по данным Поллака. Видно, что с уменьшением значения Д относи­ тельные пороги различения по длительности становятся очень большими и существенно превышают относительные пороги раз­ личения скорости. Там, где значения &ТП\ приближаются к 1, можно считать, что информация о длительности стимулов практи­ чески отсутствует (длительность не измеряется).

Кроме того, даже минимальные значения относительных порогов различения длительности переходов, полученные как в экспериментах Поллака, так и Набелека и Хирша, оказались существенно большими, чем известные значения порогов разли­ чения длительности отдельных посылок [173] или паузы между тонами разной частоты [408]. К тому же в последнем случае зависимость порогов от разности частот, окружающих паузу, имеет противоположный характер, чем соответствующая зависи­ мость для переходов.

На этом основании можно считать,

что различение стимулов

в подавляющем большинстве случаев

было основано на слухо­

вом измерении скорости изменения частоты на переходах и при­ веденные кривые отражают свойства системы этого измерения. Судя по тому, что зависимость порогов Д//Д от Д представляет со­ бой семейство кривых, параметром которых выступает длительность переходов, можно сказать, что субъективная переменная f*(t) — субъективная скорость — не есть отображение мгновенного (пи­ кового) значения /(£). В противном случае зависимость описыва­ лась бы одной общей кривой.

Конкретный характер влияния длительности переходов на пороги различения скорости можно проследить по графикам на рисунках 12.19 и 12.20, на которых представлены зависимости А///х от Тг. Они позволяют выделить два диапазона значений Тг, в пределах которых пороги уменьшаются с увеличением длитель­ ности переходов. Первый диапазон соответствует длительностям примерно до 30 мс, второй — до 200 мс. Различие их сказывается

в

том, что

уменьшение порогов

в пределах первого

происходит

с более медленной скоростью, чем в пределах второго.

Кроме того,

в

пределах

диапазона малых

длительностей более

медленные

329

переходы (переходы с малым значением &F) практически не раз­ личаются по скорости.

Можно предположить, что в характере различения коротких переходов проявляются инерционные свойства либо спектрального

анализатора, обусловливающие сглаживание исходного

кон­

тура /(i), либо дифференцирующего звена системы анализа

его

производной f(t). Обе причины*должны приводить к тому, что при одной и той же исходной скорости стимулов отклик системы ее измерения в случае коротких переходов будет меньше по ампли­ туде, чем в случае длинных. При наличии порога чувствительности

Рис. 12.19. Зависимость порогов различения скорости изменения частоты тона от длительности переходов.

По оси абсцисс — длительность перехода стандартного стимула; по оси ординат — отно­ сительный порог различения скорости изменения частоты. Параметр кривых — диапа­ зон изменения частоты на переходе ( ДГ): 1 — 16, 2 — 32, 3 — 256, 4 — 512 Гц (дан­ ные [429]); 5 — 500, 6 — 334 Гц (данные [401]).

измерителя медленные и короткие переходы вообще не должны давать никакого сигнала на его выходе и не должны различаться по скорости.

Что касается эффекта увеличения различимости более длин­ ных переходов в пределах диапазона длительностей до 200 мс, то его можно было бы объяснить, например, тем, что измерение скорости сопровождается усреднением во времени субъективной производной j*(t) одного знака.

Однако в этом случае допустима также и другая интерпрета­ ция. Подобного эффекта накопления информации во времени можно ожидать, если изменения частоты «отслеживаются» с по­ мощью временного сканирования мгновенных значений функ­ ции/(i) [429]. Допущение такого механизма анализа применительно к длинным переходам не лишено оснований, так как обычно предполагаемый интервал сканирования составляет 2004-250 мс.

330

Соседние файлы в папке Нормальная физиология