2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_
.pdfнала, как скорость изменения частоты, нельзя объяснить дейст вием какого-то одного, общего для всех случаев механизма. Поддержкой этому могут служить нейрофизиологические данные работы [®18].
Допустимы по крайней мере два разных способа слухового измерения скорости изменения частоты.
1.Поскольку слух выделяет и измеряет краевые значения частоты в отдельной посылке с однонаправленным контуром f(t)
иможет измерять ее длительность, то эти три величины могут служить исходными параметрами для определения диапазона, направления и скорости изменения частоты. В данном случае непрерывно изменяющийся сигнал подвергается такой же обра ботке, как последовательность из двух стационарных посылок. Как можно было видеть по предыдущему разделу, данные по обнаружению непрерывных изменений частоты в тональных стимулах [473 509] интерпретируются именно с точки зрения та кого способа анализа.
2.Второй способ предполагает в слуховой системе возмож
ность вырабатывать некоторым аналоговым путем сигнал, пропор
циональный производной частотного контура, f(t), независимо от измерения координат спектральных максимумов в краевых точ ках. Для этого предполагается наличие специализированных устройств, выполняющих действие, аналогичное дифференциро ванию. Входной информацией для них должен служить либо некоторый аналоговый сигнал, монотонно связанный с мгновен ным значением частоты (координаты) максимума (функцией z*(£)), либо непосредственно огибающая слухового спектра g(z, t).
В пользу предположения о выделении слухом аналоговой
переменной, близкой по смыслу к производной f(t), говорят результаты нейрофизиологических исследойаний (см. главу 9), которые показывают, что реакции отдельных нейронов центральной слуховой системы систематически изменяются в зависимости от величины и направления скорости изменения частоты тонов. Этим устанавливается возможность осуществления в слухе так
называемого измерительного преобразования для f(t). По типам наблюдаемых нейронных ответов можно предполагать, что слух
может измерять знак и величину производной f(t) и длительность участка, где производная не равна нулю, или фиксировать мо мент появления такого участка.
Естественно ожидать, что в результате психоакустических исследований должно быть выяснено, в какой мере при слуховом
восприятии реализуется возможность таких преобразований и каковы реальные количественные характеристики анализа произ
водной f(t). К сожалению, существующие в настоящее время дан ные могут ответить только на очень немногие вопросы в этом плане.
321
12.3.1. ВОСПРИЯТИЕ НАПРАВЛЕНИЯ ИЗМЕНЕНИЯ СПЕКТРА В РЕЧЕВЫХ СИГНАЛАХ
Экспериментальные данные, свидетельствующие о том, что человек использует направление изменения частоты спектраль ного максимума в качестве полезного признака при распознавании фонем, были получены при исследовании восприятия формантных переходов — быстрых однонаправленных изменений частот фор
мант |
на |
начальном или конечном участках гласного [22° 228 349 - |
351 369 |
ill |
481] |
Рис. 12.12. Характеристики стимулов, применявшихся в опытах по иссле дованию восприятия формантных переходов. По [*61].
По оси ординат — частота формант (в Гц). На А — варианты переходов второй форманты (F2); на Б — два варианта переходов первой форманты (Fi); на В — комбинации значе ний Fi и F2 па стационарном участке сигнала и соответствующие им гласные.
При прослушивании естественных гласных звуков, выделенных из окружения согласных (обычно исключаются участки сигналов, предшествующие быстрому нарастанию амплитуды, если иссле дуются начальные переходы, или непосредственно следующие за спадом, если исследуются конечные), оказывается, что такие сиг налы воспринимаются как слоги, в которых хорошо распознается признак места образования согласного [95 171 4в5].
Различение согласных по начальным переходам формант под робно исследовалось в работах сотрудников Хаскинских лаборато рий на синтетических стимулах, параметры которых схематически представлены на рис. 12.12 (из работы [351]). Спектр стимулов имел двухформантную структуру, на рис. 12.12, В показаны зна чения F± и F2 на стационарном участке. Наличие перехода пер вой форманты определяет главным образом слогоподобный
322
характер звука, а направление перехода имеет значение для различения согласных по признаку глухости-звонкости (см. главу 6).
Место образования согласных зависит от характера перехода второй форманты, варианты которого приведены на рис. 12.12, А. Все предъявляемые стимулы испытуемые должны были иденти
фицировать как |
слоги, начинающиеся со звонкого согласного |
|||||
[b], |
[d] |
или [g] |
(левый вариант перехода |
F1 |
на рис. 12.12, Б), |
|
либо |
с |
глухого согласного |
[р], It], [к] |
(при правом варианте |
||
перехода |
Ь\)- |
Результаты |
идентификации |
представлены на |
рис. 12.13. Можно убедиться, что при возрастании Е2 на переходе
в |
качестве |
начального |
согласного выбирается |
губной |
звук |
[Ь] |
или [р], |
при обратном |
направлении — язычный |
Id], [t] |
или |
lg], |
Ik].1 |
основании направления переходов Е2 человек отли |
|||
|
Если на |
чает группу губных согласных от язычных, то, как показывает ряд, экспериментов!293’ 298, 86в382], для различения язычных согласных между собой он использует характер перехода третьей форманты.
Интересно, что человек способен различать направление изме нения спектрального максимума независимо от того, с помощью периодического или шумового возбуждения образован этот мак симум. В экспериментах Кожевникова и др. [S1] в качестве сти мулов применялись последовательности, состоящие из короткой посылки полосового шума и следующего за ней гласноподобного звука с гармоническим спектром, характеризующимся одним максимумом.
Фонемная граница между [р] и It], определенная как среднее
значение центральной частоты полосового шума Еш, |
совпадает |
с частотой спектрального максимума гласного FT (рис. |
12.14) — |
факт, свидетельствующий о том, что в этих опытах |
фонемная |
классификация основывается на направлении различия между Fm и FT. Существенно, что наблюдаемые при этом небольшие откло нения границы от Fr носят закономерный характер, который говорит о том, что порог различения направления зависит от значений частоты центрального максимума на участке гласного.
На рис. 12.15, А приведены величины относительных откло нений границ ((Ег—Fm)/FT в %) в зависимости от частоты максимума гласного. Подобная закономерность проявляется также при анализе данных Либермана и др. [ЗБ1] о различении согласных по признаку губной—язычный на основании началь ных переходов Е2 (рис. 12.15, Б). При составлении этого гра фика анализировались кривые идентификации [р] или [Ь], при-
1 Сотрудники Хаскинских лабораторий попытались объяснить полу ченные данные с помощью чрезвычайно сложной гипотезы «локуса» [а96], которая, однако, имеет смысл лишь в плане выбора параметров переходов формант при синтезе согласных и не имеет реальных оснований рассматри ваться как один из способов слуховой обработки (описание гипотезы «ло куса» и критику ее см. [168]).
21 Физиология речи |
323 |
Рис. 12.13. Результаты идентификации стимулов, показанных на рис. 12.12.
На А — для стимулов с явно выраженным переходом Ft. На Б — для стимулов с мало выраженным переходом J\. Левые части рисунков соответствуют случаю, когда испытуемым
было разрешено пользоваться в ответах согласными [Ъ], [d], [g], правые части — соглас ными [р], [t], [к]. Каждый столбец (три расположенных друг под другом прямоуголь ника) соответствует определенному гласному, фонетическое обозначение которого приве дено под столбцом. Внутри каждого прямоугольника показана зависимость между зна чением перехода второй форманты (цифры по вертикали в центре рисунка) и числом иден тификаций стимула (цифры по горизонтали) с тем согласным, который указан слева или справа у соответствующей строки. Так, рельеф в верхнем левом прямоугольнике (строка [Ъ] столбец [i] на Л) показывает, что при значении перехода, равном —4, испытуемые опо знают согласный как [Ь] в 66 случаях; при повышении значения перехода второй фор
манты количество опознаний [Ъ] уменьшается.
веденные на рис. 12.13. Определялась разность между начальным и стационарным значениями F2, соответствующая 50% распозна вания [р] или [Ь], отнесенная к F2 на стационарном участке.
Направление изменения формантных переходов в конце глас ного также определяет признак места образования согласных [95]. При этом если человек слушает изолированные слоги, то конечные согласные опознаются по переходам более точно, чем началь ные [4вв]. Однако правила различения согласных на конце проти-
Рис. 12.14. Граница между [pj и [t]. По [я].
По оси абсцисс — частота спектрального максимума гласного; по оси ординат — средняя частота полосового шума. Точки и кружки — данные разных испытуемых.
Рис. 12.15. Отклонения средних значений фонетических границ при восприя тии признака места артикуляции согласных. По [81].
На А — отклонение среднего значения границы между [р] и [t] от частоты спектрального максимума гласного; по оси абсцисс — частота максимума в спектре гласного; по оси орди нат — отклонение среднего значения границы от Fr; данные 3 испытуемых. На Б — ве личина разности между значениями границы «губные-язычные согласные» и значениями частоты второй форманты на стационарном участке гласного (данные [Зб1]). По оси абс
цисс — частота второй форманты; по оси ординат — значение (Г2я—2р2)/2р2.
воположны тем, которые наблюдаются в начале гласного: так, губные звуки характеризуются понижением частоты, а языч ные — повышением.
Направление изменения спектра на переходах выступает как специфический признак сигнала, а сам факт однонаправленного изменения, очевидно, выделяется слуховой системой как отдельное событие. Эта точка зрения иллюстрируется в следующем опыте Рэнда [438].
Рис. 12.16 показывает схематические характеристики стиму лов и способ их предъявления. На одно ухо, например на правое, подавался сигнал, состоящий из двух сегментов: первый сегмент характеризовался спектром с одним максимумом в области пер
325
г
вой форманты гласного, спектр второго имел структуру, характер ную для трехформантного стационарного гласного [а] — схема 1 на рис. 12.16, А (такой звук сам по себе воспринимается как [Ьа]). На другое ухо — левое — поступала короткая посылка звука, спектр которой соответствовал начальным переходам F2 и F3, характерным для [Ьа] — 2, [dal — 3 и [ga] — 4.
В этих условиях испытуемые слышали в правом ухе совершенно отчетливо полный слог с согласным, соответствующим направле нию переходов F2 и F3, и дополнительно еще в левом ухе — ко роткий верещащий звук. При разных направлениях переходов F2 и F3 различение согласных по признаку места образования осуществлялось с вероятностью 100%. Распознавание было воз
можным даже в том случае, когда нарушалась синхронность поступ ления обеих частей: посылку, со держащую переход, можно было сдвигать по отношению к началу сигнала на другом ухе в преде лах + 25 мс.
Однако фонетический признак места образования согласного
Рис. 12.16. Схематическое изображение параметров стимулов (Л) и способ их предъявления (Б) при дихотическом восприятии формантных переходов. По
По оси абсцисс — время; по оси ординат —
частоты формант. Остальные обозначения см. в тексте.
определяется не только таким простым событием, как направление изменения спектра. Требуется еще наличие других событий, таких, например, как начало и конец гласного. Известно, что если человеку предъявлять изолированный отрезок сигнала с та кими характеристиками, как на переходах, то он вообще не вос принимается как речевой [326].
Таким образом, существующие экспериментальные данные заставляют считать, что факт определения слухом направления временнбго изменения спектра не вызывает сомнения. Это обстоя тельство ставит исследователей непосредственно перед задачей выяснения конкретного способа его слухового измерения.
Можно указать пока только на одну работу Стивенса [483] как на первую попытку моделирования механизма определения направления изменения спектра на переходах. В основе модели Стивенса лежит механизм сравнения энергии в соседних частот ных полосах, производимого через малые (10 мс) интервалы вре мени. Эту функцию выполняет система детекторов трех типов,
326
один из которых должен срабатывать на такой сигнал, в котором концентрация энергии в низкочастотной полосе следует за концент рацией энергии в высокочастотной, другой — на сигнал с об ратным направлением спектра и третий — на сигнал с расходящимся спектром.
Насколько верна модель Стивенса, сказать пока трудно: слишком мало сведений мы имеем о реальном слуховом анализе временных изменений спектра. Для дальнейшего его количествен ного исследования наиболее удобным методическим приемом ка жется использование синтетических речеподобных стимулов, со держащих информацию о признаке места образования согласных.
12.3.2. ВОСПРИЯТИЕ СКОРОСТИ ИЗМЕНЕНИЯ ЧАСТОТЫ ТОНА
Психоакустические данные, показывающие, что ско рость изменения частоты тона может служить различительным при знаком сигналов, были получены в работах Поллака [429], Набе лека и Хирша [401].
В обеих работах в качестве стимулов использовались отдель ные посылки тонов, закон изменения частоты которых указан
Рис. 12.17. Схема параметров стимулов, используемых при измерении поро гов различения скорости изменения частоты.
На А — по на В — по [42#]. Т, — длительность перехода стандартного стимула; Г, — длительность перехода переменного стимула; F„, FK, Fcp — начальное, конечное и
среднее значения частоты соответственно.
на рис. 12.17. В экспериментах Поллака контур f(t) имел изме няющийся участок — переход — в центре посылки (рис. 12.17, Б), в экспериментах Набелека и Хирша переходом начинался сигнал (рис. 12.17, А).
Предъявляемые для сравнения стандартный и переменный стимулы (использовался классический метод парного сравнения) имели фиксированные значения Fa и FK, а различия их по ско рости перехода задавались за счет длительности перехода пере менного стимула (Г2). Дифференциальный порог определялся по
327
значению Д71=|712—7’1|, при котором испытуемые в 75% слу чаев обнаруживали различие стимулов. По этому значению
можно затем вычислить порог различения по скорости: Д/—AF/кТ. При такой процедуре не исключена возможность для испыту емых различать стимулы по длительности переходов, и вопрос о том, пользуется ли человек этой возможностью, может быть решен при анализе величин дифференциальных порогов по одному
идругому параметрам (Д71 и Д/).
Вопытах Поллака использовались стимулы только с возра стающим направлением переходов, параметры которых варьиро-
Рис. 12.18. Пороги различения скорости изменения частоты тонов.
По оси абсцисс — скорость изменения частоты на переходах в тестовом стимуле; по оси ординат — относительный порог различения скорости изменения частоты. Параметр кривых (сплошные линии) — длительность переходов (Т,): 0 — 2 мс, 1 и 1' — 10, 2 — 27, 2' — 30, 3 — 100, 3' — 200, 4 — 400, 5 — 870 мс. Штриховыми линиями обозначены отно
сительные |
пороги |
различения |
длительности |
переходов, |
ДТ/ТХ: а — для Тх = 27 мс, |
|||
|
б — для Тх—200 |
мс. Остальные обозначения см. в тексте. |
|
|||||
вали в |
широких пределах: Д7г=4 4- 512 |
Гц, 711=0.14-870 |
мс. |
|||||
Средняя частота стимулов |
была одна и та же (Fcp = 707 Гц), дли |
|||||||
тельность стационарных |
участков |
равна |
1000 мс |
у каждого. |
||||
В опытах |
Набелека |
и |
Хирша [401] положение |
стимулов |
на |
|||
шкале частот, |
характеризующееся более высокой частотой (FK |
для |
переходов с возрастающим направлением и Fa для переходов с убы вающим), соответствовало 250, 1000 и 4000 Гц. В каждом положе нии диапазон изменения частоты на переходах принимал три значе ния: FJFn=2 :1, 3: 2 и 9:3 (при направлении другого знака — соответственно обратные отношения). Длительность переходов 711=104-300 мс при соотношении ее с длительностью стационар ного участка 1 : 4.
На рис. 12.18 представлены зависимости относительных по рогов различения скорости изменения частоты Д//Д от Д, при
328
построении которых использованы графические данные из работы Поллака (кружки) и табличные данные работы Набелека и Хирша (точки) для стимулов из области 1000 Гц. Учитывая раз ницу в методиках, можно считать, что соответствие данных обеих работ достаточно хорошее.
• Прежде чем обсуждать характер данных, овтановимся на воп росе о том, не могло ли различение стимулов определяться в дан ном случае длительностью переходов. Для этого сравним между собой значения относительных порогов различения скорости А///х и длительности кТП\, считая эти величины характеристи ками относительной погрешности измерения слухом исходных параметров / и Т. На рис. 12.18 штриховыми линиями указаны зависимости \ТП\ от Д для стимулов с 2\=27 мс и 200 мс, по данным Поллака. Видно, что с уменьшением значения Д относи тельные пороги различения по длительности становятся очень большими и существенно превышают относительные пороги раз личения скорости. Там, где значения &ТП\ приближаются к 1, можно считать, что информация о длительности стимулов практи чески отсутствует (длительность не измеряется).
Кроме того, даже минимальные значения относительных порогов различения длительности переходов, полученные как в экспериментах Поллака, так и Набелека и Хирша, оказались существенно большими, чем известные значения порогов разли чения длительности отдельных посылок [173] или паузы между тонами разной частоты [408]. К тому же в последнем случае зависимость порогов от разности частот, окружающих паузу, имеет противоположный характер, чем соответствующая зависи мость для переходов.
На этом основании можно считать, |
что различение стимулов |
в подавляющем большинстве случаев |
было основано на слухо |
вом измерении скорости изменения частоты на переходах и при веденные кривые отражают свойства системы этого измерения. Судя по тому, что зависимость порогов Д//Д от Д представляет со бой семейство кривых, параметром которых выступает длительность переходов, можно сказать, что субъективная переменная f*(t) — субъективная скорость — не есть отображение мгновенного (пи кового) значения /(£). В противном случае зависимость описыва лась бы одной общей кривой.
Конкретный характер влияния длительности переходов на пороги различения скорости можно проследить по графикам на рисунках 12.19 и 12.20, на которых представлены зависимости А///х от Тг. Они позволяют выделить два диапазона значений Тг, в пределах которых пороги уменьшаются с увеличением длитель ности переходов. Первый диапазон соответствует длительностям примерно до 30 мс, второй — до 200 мс. Различие их сказывается
в |
том, что |
уменьшение порогов |
в пределах первого |
происходит |
с более медленной скоростью, чем в пределах второго. |
Кроме того, |
|||
в |
пределах |
диапазона малых |
длительностей более |
медленные |
329
переходы (переходы с малым значением &F) практически не раз личаются по скорости.
Можно предположить, что в характере различения коротких переходов проявляются инерционные свойства либо спектрального
анализатора, обусловливающие сглаживание исходного |
кон |
тура /(i), либо дифференцирующего звена системы анализа |
его |
производной f(t). Обе причины*должны приводить к тому, что при одной и той же исходной скорости стимулов отклик системы ее измерения в случае коротких переходов будет меньше по ампли туде, чем в случае длинных. При наличии порога чувствительности
Рис. 12.19. Зависимость порогов различения скорости изменения частоты тона от длительности переходов.
По оси абсцисс — длительность перехода стандартного стимула; по оси ординат — отно сительный порог различения скорости изменения частоты. Параметр кривых — диапа зон изменения частоты на переходе ( ДГ): 1 — 16, 2 — 32, 3 — 256, 4 — 512 Гц (дан ные [429]); 5 — 500, 6 — 334 Гц (данные [401]).
измерителя медленные и короткие переходы вообще не должны давать никакого сигнала на его выходе и не должны различаться по скорости.
Что касается эффекта увеличения различимости более длин ных переходов в пределах диапазона длительностей до 200 мс, то его можно было бы объяснить, например, тем, что измерение скорости сопровождается усреднением во времени субъективной производной j*(t) одного знака.
Однако в этом случае допустима также и другая интерпрета ция. Подобного эффекта накопления информации во времени можно ожидать, если изменения частоты «отслеживаются» с по мощью временного сканирования мгновенных значений функ ции/(i) [429]. Допущение такого механизма анализа применительно к длинным переходам не лишено оснований, так как обычно предполагаемый интервал сканирования составляет 2004-250 мс.
330