Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
13.47 Mб
Скачать

делью II, т. е. нейрофизиологические данные указывают на необхо­ димость компрессирующей выходной нелинейности.

На основании всего изложенного в настоящей главе можно сде­ лать следующие выводы:

1)модели с переменным порогом воспроизводят преобразование сигнала в периферической слуховой системе лучше, чем модели

спеременным коэффициентом передачи; однако модели с пере­ менным порогом не могут обеспечить сильной компрессии сигна­ лов, не искажая при этом формы сигнала;

2)пока остается неясным, должна ли функциональная модель частотного канала содержать одну или две компрессирующие нелинейности и каков их вид; поскольку динамический диапазон канала гораздо шире динамического диапазона отдельного ней­ рона, выяснить эти вопросы, вероятно, возможно только с помощью психоакустических экспериментов.

Глава 9

ПРИНЦИПЫ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА ЦЕНТРАЛЬНЫМИ ОТДЕЛАМИ СЛУХОВОЙ СИСТЕМЫ

Сигналом, поступающим в центральную слуховую систему, является пространственно-временной рисунок плотности импульсации в слуховом нерве. Мы будем его называть перифери­ ческим изображением стимула.

Примем, что функциональная модель периферической слухо­ вой системы представляет собой упорядоченный по шкале частот (назовем ее шкалой z) набор частотных каналов; каждый канал включает фильтр звуковых частот (см. главу 7) и преобразова­ тель сигнала на выходе фильтра в плотность импульсации g(t) (см. главу 8). Соответственно периферическое изображение сти­ мула обозначим как g(z, t). Обработку сигнала центральными отделами слуховой системы естественно рассматривать как ряд преобразований g (z, t).

Существующие электрофизиологические данные отнюдь не дают возможности точно описать эти преобразования, однако они позволяют составить качественные представления о том, на выделение какого типа признаков g(z,t) направлены эти преоб­ разования.

Для формирования этих качественных представлений полезно начать с того, чтобы рассмотреть наиболее примитивную (вклю­ чающую наименьшее число параметров) модель нейрона и вы­ яснить, какие классы признаков g(z, t) могли бы выделяться такой моделью. Эти классы признаков можно будет дальше рас­ сматривать как возможные гипотезы, правдоподобность которых должна быть оценена на основании экспериментальных данных электрофизиологии слуха.

9.1. КАЧЕСТВЕННАЯ КЛАССИФИКАЦИЯ ВОЗМОЖНЫХ ПРИЗНАКОВ СИГНАЛА

Идеализированный центральный нейрон рассмат­ ривается как состоящий из двух элементов [114]. Первый элемент обеспечивает преобразование поступающего потока импульса-

222

ции в аналоговую переменную P(f), характеризующую степень возбуждения нейрона. Второй элемент обеспечивает преобразо­ вание Р (£) в последовательность импульсов на выходе нейрона.

Физиологические явления, описываемые моделью первого элемента, обозначаются как пространственная и временная сум­ мация процессов торможения и возбуждения и как взаимодей­ ствие этих процессов внутри клетки.

Рис. 9.1. Фунициоиальаая схема иейроииого канала.

Обозначения см, в тексте.

Для описания пространственной суммации необходимо указать источники, от которых поступает импульсации на возбуждающие и тормозные входы, и приписать каждому источнику свой весо­ вой коэффициент.

Допустим, что источниками импульсации для рассматриваемого нейрона является ряд примыкающих друг к другу каналов слухо­ вого нерва. Для указания этих каналов можно воспользоваться одномерной шкалой z и описать весовые коэффициенты возбужда­ ющих и тормозных связей двумя функциями, <рв (z) и <рт (z) соот­ ветственно (рис. 9.1).

Для простоты принимается, что импульсации, поступающая на все возбуждающие входы, объединяется на одном сумматоре — С„, а импульсации, поступающая на все тормозные входы, — на другом сумматоре — Ст (рис. 9.1). Распространенное представ­ ление относительно временной суммации состоит в том, что ее можно моделировать фильтрами нижних частот, расположенными на выходах сумматоров возбуждения и торможения — Фв и Фт (рис. 9.1). Часто принимается, что граничная частота фильтра торможения ниже таковой для фильтра возбуждения [43, 58].

223

Простейшее предположение относительно взаимодействия торможения и возбуждения состоит в том, что они просто алгебра­

ически суммируются: Р

kJ(t), где E(t) — сигналена

выходе фильтра возбуждения, J (t) — сигнал на выходе фильтра торможения (вариант I на рис. 9.1). Используются и более слож­ ные предположения. Напримеф, принимается [58], что J (t) управ­ ляет параметрами фильтра возбуждения — возрастание J (t) при­ водит к уменьшению коэффициента передачи фильтра и расшире­ нию полосы частот (вариант II на рис. 9.1). Следует подчеркнуть, что основной интерес представляет, как правило, не модель еди­ ничного нейрона, но модель нейронного канала, описывающая поведение группы идентичных или близких по характеристикам нейронов. В этом случае логично принять, что входными сигна­ лами, поступающими на каждый возбуждающий и тормозной вход элемента, являются не последовательности импульсов, но ана­ логовые переменные, отражающие плотность импульсации в со­ ответствующих источниках.

Для описания плотности импульсации на выходе модели нейронного канала Родионов использовал следующий подход (рис. 9.1). Рассматривалась совокупность одинаковых независи­ мых между собой пороговых) элементов — П (рис. 9.1), на вход которых подается один й тот же сигнал P(t), т. е. все элементы имеют на входе один и тот же механизм пространственной и вре­ менной суммации. Элементы обладают рефрактерностью: после «срабатывания» элемента его порог резко повышается, а затем с определенной скоростью снижается до стационарного уровня. Кроме того, на входе^каждого элемента действует свой источник аддитивного шума — ГШ (рис. 9.1). Выходом системы является величина, пропорциональная количеству сработавших элемен­ тов — назовем ее g* (t).

Для такой системы характерны, в частности, нелинейная за­ висимость установившейся реакции от уровня стационарного сигнала, колебательный переходный процесс, мощная кратко­ временная реакция на положительный скачок во входном сигнале

инекоторая частотная избирательность, определяющаяся в ос­ новном параметрами рефрактерности и зависящая от уровня сигнала.

Можно надеяться, что принцип взаимодействия возбуждения

иторможения внутри клетки достаточно универсален, т. е. функ­

циональная зависимость Р (!) от Е (t) и J (t) может быть описана с помощью одного и того же алгоритма для всех нейронов слухо­ вой системы. Одинаковой для разных нейронных каналов может оказаться также и зависимость между Р (t) и плотностью импуль­ сации на выходе канала g* (t).

В таком случае главное, что определяет специфику нейрон­ ного канала, это пространственные весовые функции возбуждаю­ щих и тормозных связей (tpB и tpT) и функции передачи фильтров возбуждения и торможения.

224

Рассмотрим, нельзя ли составить каких-либо качественных предположений о возможных классах признаков f(z, i), вы­ деляемых нейронными каналами, основываясь на этих параметрах модели. При этом естественно начать с крайних случаев.

Допустим, что каждый нейронный канал высшего уровня по­ лучает на вход информацию только иэ ограниченного по ширине участка шкалы z. В этом случае признак, выделяемый каналом, можно определить как локальный по спектру. Если, наоборот, используется информация со всей шкалы z, можно говорить о при­ знаках звука (спектра) в целом. Допустим теперь, что тормоз­ ных входов вообще нет — <рт (z)=0. Если при этом <рж(г) равна нулю на всем интервале z, кроме одного частотного канала пери­ ферической слуховой системы, а фильтр возбуждения является фильтром нижних частот с высокой граничной частотой, то ни­ какого преобразования информации практически не произойдет, передаваемым признаком останутся мгновенные значения g,(i). При тех же условиях в отношении <рт (z) и <p„(z), но низкой гранич­ ной частоте фильтра возбуждения признаком станут усредненные по времени значения g{ (i), т. е. нечто близкое к огибающей сигнала

в i-той частотной полосе. Расширение

(z) приведет к

усредне­

нию изображения по ряду частотных каналов.

 

Для всех моделей без тормозных

входов и с %(z),

харак­

теризующейся одним максимумом, мгновенное значение плотности импульсации на выходе одного нейронного канала будет отражать

усредненные по Az и Дi

значения g (z, t) в определенной точке

z в данный момент времени.

 

Так как усредненное

по времени значение

(t) отражает

текущее значение энергии сигнала в i-той частотной полосе, мы приходим к тому, что упорядоченный по шкале z ряд централь­ ных нейронных каналов без тормозных входов должен давать изображение, соответствующее мгновенному спектру стимула, полученному с тем или иным усреднением по шкале частот и по вре­ мени.

Если нейрон имеет и возбуждающие, и тормозные входы,

признаки, которые он может выделять

в

g (z, t),

чрезвычайно

многообразны. Поэтому рассматривать

вопрос

о

признаках,

не накладывая определенных ограничений на

(z) и <рт

(z), вообще

не имеет смысла. Одно из важнейших ограничений состоит в том, что % (z) и tpT (z) заданы (имеют отличные от нуля значения) на достаточно близких или перекрывающихся интервалах значений z. В этом случае можно говорить о том, что нейронный канал выделяет локальную особенность или неравномерность на g (z) и соответственно на спектре стимула. Характер этой особенности будет, естественно, зависеть от вида ср„ (z) и <рт (z) и их взаимного расположения по шкале z. Если обе эти весовые функции имеют один максимум, находящийся в одной и той же точке z, причем

ширина

<рт (z) является большей,

то мы имеем дело с моделью

15

Физиология речи

225

«латерального Торможения». Выделяемая ею неравномерность соответствует максимуму или краю на g(z).

Легко заметить, что варьируя параметры фильтров возбужде­ ния и торможения, можно получить самые разнообразные харак­ теристики результирующего фильтра, соответствующего ней­ ронному каналу. В частности, результирующий фильтр может оказаться полосовым, и признаком, выделяемым каналом, будет изменение текущего значения энергии (огибающей) сигнала в со­ ответствующей частотной полосе. Неравномерности g (z, t) во вре­ мени мы будем дальше называть событиями, в отличие от неравно­ мерностей по z, названных особенностями.

Если нижние уровни центральной слуховой системы обес­ печивают выделение особенностей и событий, можно предпо­ ложить, что более высокие уровни работают уже как обнаружи­ тели определенных комбинаций особенностей и определенных последовательностей событий, т. е. осуществляют некоторую предварительную классификацию сигналов.

Итак, можно сформулировать следующие предположения от­ носительно природы выделяемых признаков:

1)признаки являются локальными но спектру или относятся

кспектру в целом;

2)признаки соответствуют текущим (мгновенным или усред­

ненным) значениям g (z, t) или отражают только неравномер­ ности g (z, t) по z и по t.

9.2. ТОНОТОПИЧЕСКАЯ ОРГАНИЗАЦИЯ СЛУХОВОЙ СИСТЕМЫ. ДАННЫЕ О ЛОКАЛЬНОМ ПО СПЕКТРУ ХАРАКТЕРЕ ПРИЗНАКОВ

Под центральной слуховой системой обычно пони­ мается классический восходящий слуховой путь. Он схематически рассматривается как состоящий из нескольких последователь­ ных уровней. Нейроны данного уровня получают информацию преимущественно от нейронов предыдущего уровня и посылают информацию преимущественно к нейронам ближайшего следую­ щего уровня.

Волокна первичных нейронов — нейронов первого порядка — образуют слуховой нерв. Соответственно начальным (нижним) уровнем центральной слуховой системы являются скопления ней­ ронов второго порядка — кохлеарные ядра (Б/ и Б2 на схеме рис. 9.2). Нейроны кохлеарных ядер получают импульсацию от слухового нерва своей стороны. Основная часть волокон, от­ ходящих от нейронов кохлеарных ядер, переходит на противо­ положную сторону мозга.

В ядрах верхней оливы (рис. 9.2), получающих импульсацию от кохлеарных ядер обеих сторон, В1—В5, расположены преиму­ щественно нейроны третьего порядка, в нижних (задних) буграх четверохолмия, Г, — нейроны четвертого порядка, во внутреннем

226

коленчатом теле, Д, — нейроны пятого порядка, в первичной слуховой коре, Е, — нейроны шестого порядка.

Следует иметь в виду, что представление о том, что каждый данный уровень получает информацию только с выхода пре­ дыдущего уровня, является известным упрощением реальной кар­ тины. Имеются как связи через один и более уровней, так и связи внутри ядер одного и того же уровня. Кроме того, имеется система

Рис. 9.2. Схема восходящего слухового пути. По [26°].

А — улитка; Б1 — вентральное кохлеарное ядро; Б2 — дорсальное кохлеарное ядро; Bi—В5ядра, относимые к оливариому комплексу; Г — задний бугор четверохолмия; Д — внутреннее коленчатое тело; Е — первичная слуховая кора. 1—5 указывают поряд­ ковые номера нейронов, аксоны которых образуют основную часть данного участка слухо­ вого пути.

нисходящих слуховых путей (достаточно подробное и вместе с тем доступное неспециалисту описание слуховых путей дано Ратни­ ковой I117]).

На всех уровнях слуховой системы обнаружена более или менее строгая тонотопическая организация. Под тонотопической организацией понимается наличие монотонной зависимости между пространственными координатами нейрона (местоположением ней­ рона в ядре) и частотой тона, к которому этот нейрон наиболее

чувствителен.

организация была обнаружена

Отчетливая тонотопическая

в кохлеарных ядрах I248 453], в

ядре верхней оливы [508], в зад­

них

буграх четверохолмия [454],

во внутреннем коленчатом теле

[5341

(цит. но [2781), в первичной слуховой коре [383].

15* 227

С точки врения интересующего нас вопроса о природе при­ знаков, выделяемых на разных уровнях слуховой системы, важен не столько сам факт наличия тонотопической организации, сколько тот промежуточный результат, который позволяет ее обнару­ жить.

В эксперименте по определению тонотопической организации для каждого нейрона или снимается частотно-пороговая кривая, или определяется при постоянной интенсивности тестирующего тона полоса частот, внутри которой нейрон отвечает на тональ­ ный стимул. В качестве оптимальной частоты, приписываемой нейрону, используется или частота, соответствующая минимуму на частотно-пороговой кривой, или центральная частота найден­ ной полосы частот.

Необходимым условием, без выполнения которого определе­ ние тонотопической организации было бы невозможным, явля­ ется наличие у нейрона выраженной частотной избирательности: частотно-пороговая кривая должна иметь один выраженный мини­ мум, полоса частот, на которую реагирует нейрон, должна быть существенно уже всего слухового диапазона.

Рассмотрение литературы показывает, что электрофизиологи слуха считают выполнение этого условия правилом, т. е. наи­ более часто встречающимся случаем. Описываются как исключе­ ние те случаи, когда оно не выполняется. Хотя количественных оценок, характеризующих частоту отклонений от правила для раз­ ных уровней слуховой системы, найти не удалось, создается впечат­ ление, что «неправильные» формы частотно-пороговых кривых наблюдаются преимущественно на уровне коленчатого тела и слу­ ховой коры. Ограничимся рассмотрением данных о нейронах слуховой коры, т. е. наиболее сложного случая.

Необходимо прежде всего указать, что не у всех нейронов слуховой коры удается наблюдать реакцию на звуковой сигнал. Из нейронов, отвечающих на звук, только примерно 80—85% отвечают на тональные стимулы [247].

Три типа форм частотно-пороговых кривых, наблюдавшихся при тестировании 70 нейронов первичной слуховой коры тональ­ ными посылками длительностью 100 мс I174], приведены на рис. 9.3. Можно видеть, что часть нейронов (рис. 9.3, Л) характеризуется очень узкими и близкими к полосовым частотно-пороговыми кри­ выми. Другие нейроны характеризуются или малой частотной избирательностью (рис. 9.3, Б), или наличием нескольких (обычно двух) минимумов (рис. 9.3, В).

Рис. 9.3. Типичные формы (Л—В) частотно-пороговых кривых нейронов первичной слуховой коры. По [174].

tlo пси абсцисс — частота тональной посылки; по оси ординат уровень звукового давления.

\

На рис. 9.4 приведена гистограмма распределения 236 ней­ ронов по ширине полосы частот, на которые они отвечают [174]. Тестирование производилось при стандартном уровне звукового давления тона (50 дБ), полоса определялась как отношение F<JFr, где Fr — самая низкая, a F., — самая высокая частота тестирующего тона, еще вызывающая ответ нейрона.

Из рис. 9.4 видно, что в большинстве случаев ширина полосы меньше октавы. Более 50% нейронов (нейроны типа А на рис. 9.3) характеризуются полосой, меньшей половины октавы.

Рис. 9.4. Гистограмма распределения нейронов первичной слуховой коры по ширине полосы частот, вызывающих ответ нейрона. По [174].

По оси абсцисс — ширина полосы (Г2/Г1); по оси ординат — число нейронов с дайной шириной полосы.

Область частот, вызывающих положительный ответ (увеличе­ ние частоты разрядов) нейрона, называется зоной возбуждения. В случае модели латерального торможения зона возбуждения соответствует той области 2, где значения у,, (2) больше значе­ ний <рт (2), т. е. она может быть уже области возбуждающих связей (области задания у,, (2)). Для модели латерального тормо­ жения по бокам зоны возбуждения находятся две зоны торможе­ ния, соответствующие тем областям 2, где значения <рв (z) меньше значений (рг (2).

Для исследования зон торможения обычно применяется сле­ дующий метод. Тональная посылка оптимальной частоты предъ­ является одновременно с тоном «боковой» частоты. Определя­ ется зависимость между частотой и уровнем интенсивности тона боковой частоты, соответствующая некоторому критерию по­ давления реакции нейрона на топ оптимальной частоты.

230

Соседние файлы в папке Нормальная физиология