2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_
.pdfделью II, т. е. нейрофизиологические данные указывают на необхо димость компрессирующей выходной нелинейности.
На основании всего изложенного в настоящей главе можно сде лать следующие выводы:
1)модели с переменным порогом воспроизводят преобразование сигнала в периферической слуховой системе лучше, чем модели
спеременным коэффициентом передачи; однако модели с пере менным порогом не могут обеспечить сильной компрессии сигна лов, не искажая при этом формы сигнала;
2)пока остается неясным, должна ли функциональная модель частотного канала содержать одну или две компрессирующие нелинейности и каков их вид; поскольку динамический диапазон канала гораздо шире динамического диапазона отдельного ней рона, выяснить эти вопросы, вероятно, возможно только с помощью психоакустических экспериментов.
Глава 9
ПРИНЦИПЫ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА ЦЕНТРАЛЬНЫМИ ОТДЕЛАМИ СЛУХОВОЙ СИСТЕМЫ
Сигналом, поступающим в центральную слуховую систему, является пространственно-временной рисунок плотности импульсации в слуховом нерве. Мы будем его называть перифери ческим изображением стимула.
Примем, что функциональная модель периферической слухо вой системы представляет собой упорядоченный по шкале частот (назовем ее шкалой z) набор частотных каналов; каждый канал включает фильтр звуковых частот (см. главу 7) и преобразова тель сигнала на выходе фильтра в плотность импульсации g(t) (см. главу 8). Соответственно периферическое изображение сти мула обозначим как g(z, t). Обработку сигнала центральными отделами слуховой системы естественно рассматривать как ряд преобразований g (z, t).
Существующие электрофизиологические данные отнюдь не дают возможности точно описать эти преобразования, однако они позволяют составить качественные представления о том, на выделение какого типа признаков g(z,t) направлены эти преоб разования.
Для формирования этих качественных представлений полезно начать с того, чтобы рассмотреть наиболее примитивную (вклю чающую наименьшее число параметров) модель нейрона и вы яснить, какие классы признаков g(z, t) могли бы выделяться такой моделью. Эти классы признаков можно будет дальше рас сматривать как возможные гипотезы, правдоподобность которых должна быть оценена на основании экспериментальных данных электрофизиологии слуха.
9.1. КАЧЕСТВЕННАЯ КЛАССИФИКАЦИЯ ВОЗМОЖНЫХ ПРИЗНАКОВ СИГНАЛА
Идеализированный центральный нейрон рассмат ривается как состоящий из двух элементов [114]. Первый элемент обеспечивает преобразование поступающего потока импульса-
222
ции в аналоговую переменную P(f), характеризующую степень возбуждения нейрона. Второй элемент обеспечивает преобразо вание Р (£) в последовательность импульсов на выходе нейрона.
Физиологические явления, описываемые моделью первого элемента, обозначаются как пространственная и временная сум мация процессов торможения и возбуждения и как взаимодей ствие этих процессов внутри клетки.
Рис. 9.1. Фунициоиальаая схема иейроииого канала.
Обозначения см, в тексте.
Для описания пространственной суммации необходимо указать источники, от которых поступает импульсации на возбуждающие и тормозные входы, и приписать каждому источнику свой весо вой коэффициент.
Допустим, что источниками импульсации для рассматриваемого нейрона является ряд примыкающих друг к другу каналов слухо вого нерва. Для указания этих каналов можно воспользоваться одномерной шкалой z и описать весовые коэффициенты возбужда ющих и тормозных связей двумя функциями, <рв (z) и <рт (z) соот ветственно (рис. 9.1).
Для простоты принимается, что импульсации, поступающая на все возбуждающие входы, объединяется на одном сумматоре — С„, а импульсации, поступающая на все тормозные входы, — на другом сумматоре — Ст (рис. 9.1). Распространенное представ ление относительно временной суммации состоит в том, что ее можно моделировать фильтрами нижних частот, расположенными на выходах сумматоров возбуждения и торможения — Фв и Фт (рис. 9.1). Часто принимается, что граничная частота фильтра торможения ниже таковой для фильтра возбуждения [43, 58].
223
Простейшее предположение относительно взаимодействия торможения и возбуждения состоит в том, что они просто алгебра
ически суммируются: Р |
kJ(t), где E(t) — сигналена |
выходе фильтра возбуждения, J (t) — сигнал на выходе фильтра торможения (вариант I на рис. 9.1). Используются и более слож ные предположения. Напримеф, принимается [58], что J (t) управ ляет параметрами фильтра возбуждения — возрастание J (t) при водит к уменьшению коэффициента передачи фильтра и расшире нию полосы частот (вариант II на рис. 9.1). Следует подчеркнуть, что основной интерес представляет, как правило, не модель еди ничного нейрона, но модель нейронного канала, описывающая поведение группы идентичных или близких по характеристикам нейронов. В этом случае логично принять, что входными сигна лами, поступающими на каждый возбуждающий и тормозной вход элемента, являются не последовательности импульсов, но ана логовые переменные, отражающие плотность импульсации в со ответствующих источниках.
Для описания плотности импульсации на выходе модели нейронного канала Родионов использовал следующий подход (рис. 9.1). Рассматривалась совокупность одинаковых независи мых между собой пороговых) элементов — П (рис. 9.1), на вход которых подается один й тот же сигнал P(t), т. е. все элементы имеют на входе один и тот же механизм пространственной и вре менной суммации. Элементы обладают рефрактерностью: после «срабатывания» элемента его порог резко повышается, а затем с определенной скоростью снижается до стационарного уровня. Кроме того, на входе^каждого элемента действует свой источник аддитивного шума — ГШ (рис. 9.1). Выходом системы является величина, пропорциональная количеству сработавших элемен тов — назовем ее g* (t).
Для такой системы характерны, в частности, нелинейная за висимость установившейся реакции от уровня стационарного сигнала, колебательный переходный процесс, мощная кратко временная реакция на положительный скачок во входном сигнале
инекоторая частотная избирательность, определяющаяся в ос новном параметрами рефрактерности и зависящая от уровня сигнала.
Можно надеяться, что принцип взаимодействия возбуждения
иторможения внутри клетки достаточно универсален, т. е. функ
циональная зависимость Р (!) от Е (t) и J (t) может быть описана с помощью одного и того же алгоритма для всех нейронов слухо вой системы. Одинаковой для разных нейронных каналов может оказаться также и зависимость между Р (t) и плотностью импуль сации на выходе канала g* (t).
В таком случае главное, что определяет специфику нейрон ного канала, это пространственные весовые функции возбуждаю щих и тормозных связей (tpB и tpT) и функции передачи фильтров возбуждения и торможения.
224
Рассмотрим, нельзя ли составить каких-либо качественных предположений о возможных классах признаков f(z, i), вы деляемых нейронными каналами, основываясь на этих параметрах модели. При этом естественно начать с крайних случаев.
Допустим, что каждый нейронный канал высшего уровня по лучает на вход информацию только иэ ограниченного по ширине участка шкалы z. В этом случае признак, выделяемый каналом, можно определить как локальный по спектру. Если, наоборот, используется информация со всей шкалы z, можно говорить о при знаках звука (спектра) в целом. Допустим теперь, что тормоз ных входов вообще нет — <рт (z)=0. Если при этом <рж(г) равна нулю на всем интервале z, кроме одного частотного канала пери ферической слуховой системы, а фильтр возбуждения является фильтром нижних частот с высокой граничной частотой, то ни какого преобразования информации практически не произойдет, передаваемым признаком останутся мгновенные значения g,(i). При тех же условиях в отношении <рт (z) и <p„(z), но низкой гранич ной частоте фильтра возбуждения признаком станут усредненные по времени значения g{ (i), т. е. нечто близкое к огибающей сигнала
в i-той частотной полосе. Расширение |
(z) приведет к |
усредне |
нию изображения по ряду частотных каналов. |
|
|
Для всех моделей без тормозных |
входов и с %(z), |
харак |
теризующейся одним максимумом, мгновенное значение плотности импульсации на выходе одного нейронного канала будет отражать
усредненные по Az и Дi |
значения g (z, t) в определенной точке |
|
z в данный момент времени. |
|
|
Так как усредненное |
по времени значение |
(t) отражает |
текущее значение энергии сигнала в i-той частотной полосе, мы приходим к тому, что упорядоченный по шкале z ряд централь ных нейронных каналов без тормозных входов должен давать изображение, соответствующее мгновенному спектру стимула, полученному с тем или иным усреднением по шкале частот и по вре мени.
Если нейрон имеет и возбуждающие, и тормозные входы,
признаки, которые он может выделять |
в |
g (z, t), |
чрезвычайно |
|
многообразны. Поэтому рассматривать |
вопрос |
о |
признаках, |
|
не накладывая определенных ограничений на |
(z) и <рт |
(z), вообще |
не имеет смысла. Одно из важнейших ограничений состоит в том, что % (z) и tpT (z) заданы (имеют отличные от нуля значения) на достаточно близких или перекрывающихся интервалах значений z. В этом случае можно говорить о том, что нейронный канал выделяет локальную особенность или неравномерность на g (z) и соответственно на спектре стимула. Характер этой особенности будет, естественно, зависеть от вида ср„ (z) и <рт (z) и их взаимного расположения по шкале z. Если обе эти весовые функции имеют один максимум, находящийся в одной и той же точке z, причем
ширина |
<рт (z) является большей, |
то мы имеем дело с моделью |
15 |
Физиология речи |
225 |
«латерального Торможения». Выделяемая ею неравномерность соответствует максимуму или краю на g(z).
Легко заметить, что варьируя параметры фильтров возбужде ния и торможения, можно получить самые разнообразные харак теристики результирующего фильтра, соответствующего ней ронному каналу. В частности, результирующий фильтр может оказаться полосовым, и признаком, выделяемым каналом, будет изменение текущего значения энергии (огибающей) сигнала в со ответствующей частотной полосе. Неравномерности g (z, t) во вре мени мы будем дальше называть событиями, в отличие от неравно мерностей по z, названных особенностями.
Если нижние уровни центральной слуховой системы обес печивают выделение особенностей и событий, можно предпо ложить, что более высокие уровни работают уже как обнаружи тели определенных комбинаций особенностей и определенных последовательностей событий, т. е. осуществляют некоторую предварительную классификацию сигналов.
Итак, можно сформулировать следующие предположения от носительно природы выделяемых признаков:
1)признаки являются локальными но спектру или относятся
кспектру в целом;
2)признаки соответствуют текущим (мгновенным или усред
ненным) значениям g (z, t) или отражают только неравномер ности g (z, t) по z и по t.
9.2. ТОНОТОПИЧЕСКАЯ ОРГАНИЗАЦИЯ СЛУХОВОЙ СИСТЕМЫ. ДАННЫЕ О ЛОКАЛЬНОМ ПО СПЕКТРУ ХАРАКТЕРЕ ПРИЗНАКОВ
Под центральной слуховой системой обычно пони мается классический восходящий слуховой путь. Он схематически рассматривается как состоящий из нескольких последователь ных уровней. Нейроны данного уровня получают информацию преимущественно от нейронов предыдущего уровня и посылают информацию преимущественно к нейронам ближайшего следую щего уровня.
Волокна первичных нейронов — нейронов первого порядка — образуют слуховой нерв. Соответственно начальным (нижним) уровнем центральной слуховой системы являются скопления ней ронов второго порядка — кохлеарные ядра (Б/ и Б2 на схеме рис. 9.2). Нейроны кохлеарных ядер получают импульсацию от слухового нерва своей стороны. Основная часть волокон, от ходящих от нейронов кохлеарных ядер, переходит на противо положную сторону мозга.
В ядрах верхней оливы (рис. 9.2), получающих импульсацию от кохлеарных ядер обеих сторон, В1—В5, расположены преиму щественно нейроны третьего порядка, в нижних (задних) буграх четверохолмия, Г, — нейроны четвертого порядка, во внутреннем
226
коленчатом теле, Д, — нейроны пятого порядка, в первичной слуховой коре, Е, — нейроны шестого порядка.
Следует иметь в виду, что представление о том, что каждый данный уровень получает информацию только с выхода пре дыдущего уровня, является известным упрощением реальной кар тины. Имеются как связи через один и более уровней, так и связи внутри ядер одного и того же уровня. Кроме того, имеется система
Рис. 9.2. Схема восходящего слухового пути. По [26°].
А — улитка; Б1 — вентральное кохлеарное ядро; Б2 — дорсальное кохлеарное ядро; Bi—В5 — ядра, относимые к оливариому комплексу; Г — задний бугор четверохолмия; Д — внутреннее коленчатое тело; Е — первичная слуховая кора. 1—5 указывают поряд ковые номера нейронов, аксоны которых образуют основную часть данного участка слухо вого пути.
нисходящих слуховых путей (достаточно подробное и вместе с тем доступное неспециалисту описание слуховых путей дано Ратни ковой I117]).
На всех уровнях слуховой системы обнаружена более или менее строгая тонотопическая организация. Под тонотопической организацией понимается наличие монотонной зависимости между пространственными координатами нейрона (местоположением ней рона в ядре) и частотой тона, к которому этот нейрон наиболее
чувствителен. |
организация была обнаружена |
|
Отчетливая тонотопическая |
||
в кохлеарных ядрах I248 453], в |
ядре верхней оливы [508], в зад |
|
них |
буграх четверохолмия [454], |
во внутреннем коленчатом теле |
[5341 |
(цит. но [2781), в первичной слуховой коре [383]. |
15* 227
С точки врения интересующего нас вопроса о природе при знаков, выделяемых на разных уровнях слуховой системы, важен не столько сам факт наличия тонотопической организации, сколько тот промежуточный результат, который позволяет ее обнару жить.
В эксперименте по определению тонотопической организации для каждого нейрона или снимается частотно-пороговая кривая, или определяется при постоянной интенсивности тестирующего тона полоса частот, внутри которой нейрон отвечает на тональ ный стимул. В качестве оптимальной частоты, приписываемой нейрону, используется или частота, соответствующая минимуму на частотно-пороговой кривой, или центральная частота найден ной полосы частот.
Необходимым условием, без выполнения которого определе ние тонотопической организации было бы невозможным, явля ется наличие у нейрона выраженной частотной избирательности: частотно-пороговая кривая должна иметь один выраженный мини мум, полоса частот, на которую реагирует нейрон, должна быть существенно уже всего слухового диапазона.
Рассмотрение литературы показывает, что электрофизиологи слуха считают выполнение этого условия правилом, т. е. наи более часто встречающимся случаем. Описываются как исключе ние те случаи, когда оно не выполняется. Хотя количественных оценок, характеризующих частоту отклонений от правила для раз ных уровней слуховой системы, найти не удалось, создается впечат ление, что «неправильные» формы частотно-пороговых кривых наблюдаются преимущественно на уровне коленчатого тела и слу ховой коры. Ограничимся рассмотрением данных о нейронах слуховой коры, т. е. наиболее сложного случая.
Необходимо прежде всего указать, что не у всех нейронов слуховой коры удается наблюдать реакцию на звуковой сигнал. Из нейронов, отвечающих на звук, только примерно 80—85% отвечают на тональные стимулы [247].
Три типа форм частотно-пороговых кривых, наблюдавшихся при тестировании 70 нейронов первичной слуховой коры тональ ными посылками длительностью 100 мс I174], приведены на рис. 9.3. Можно видеть, что часть нейронов (рис. 9.3, Л) характеризуется очень узкими и близкими к полосовым частотно-пороговыми кри выми. Другие нейроны характеризуются или малой частотной избирательностью (рис. 9.3, Б), или наличием нескольких (обычно двух) минимумов (рис. 9.3, В).
Рис. 9.3. Типичные формы (Л—В) частотно-пороговых кривых нейронов первичной слуховой коры. По [174].
tlo пси абсцисс — частота тональной посылки; по оси ординат уровень звукового давления.
\
На рис. 9.4 приведена гистограмма распределения 236 ней ронов по ширине полосы частот, на которые они отвечают [174]. Тестирование производилось при стандартном уровне звукового давления тона (50 дБ), полоса определялась как отношение F<JFr, где Fr — самая низкая, a F., — самая высокая частота тестирующего тона, еще вызывающая ответ нейрона.
Из рис. 9.4 видно, что в большинстве случаев ширина полосы меньше октавы. Более 50% нейронов (нейроны типа А на рис. 9.3) характеризуются полосой, меньшей половины октавы.
Рис. 9.4. Гистограмма распределения нейронов первичной слуховой коры по ширине полосы частот, вызывающих ответ нейрона. По [174].
По оси абсцисс — ширина полосы (Г2/Г1); по оси ординат — число нейронов с дайной шириной полосы.
Область частот, вызывающих положительный ответ (увеличе ние частоты разрядов) нейрона, называется зоной возбуждения. В случае модели латерального торможения зона возбуждения соответствует той области 2, где значения у,, (2) больше значе ний <рт (2), т. е. она может быть уже области возбуждающих связей (области задания у,, (2)). Для модели латерального тормо жения по бокам зоны возбуждения находятся две зоны торможе ния, соответствующие тем областям 2, где значения <рв (z) меньше значений (рг (2).
Для исследования зон торможения обычно применяется сле дующий метод. Тональная посылка оптимальной частоты предъ является одновременно с тоном «боковой» частоты. Определя ется зависимость между частотой и уровнем интенсивности тона боковой частоты, соответствующая некоторому критерию по давления реакции нейрона на топ оптимальной частоты.
230