Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Психофизиология речевых процессов (лекции).docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
71.11 Кб
Скачать

Периферические механизмы речи Психоакустика восприятия и порождения устной речи

Эксперименты начала века, когда только провели телефонные линии. Тогда проводили много экспериментов о том, как человек воспринимает переданную по телефону информацию в условиях разного шума. Придумали словесную разборчивость и слоговую (слоги, конечно же, были бессмысленными). Получились интересные кривые. Например, в одном и том же шуме человек правильно воспринимает 20% слогов и 70% слов. Значит, слова ему воспринимать легче, они более устойчивы к зашумлению. Потому что в голове есть эталон, есть контекст, есть ожидания. Вывод: восприятие речи – процесс top-down, и это хорошо согласуется с Александровым.

Есть теория, что вход в сенсорные системы изначально очень зашумлен, чтобы у психики в процессе восприятия были определенные степени свободы, чтобы мир не воспринимался жестко. Получается, что психика все время фильтрует шум и отфильтровывает то, что ей нужно или знакомо. В том эксперименте слова заменили короткими стандартными фразами, и кривая еще круче пошла вверх.

Дыхание – предшественник устной речи. Затем – вокализация, т.е. особый способ изменения выдоха. Животное тоже так умеет. Получается крик – тоже вполне себе средство коммуникации. Насчет коммуникативных функций таких вокализаций – большой вопрос. Может, они просто экспрессируют. Но у высших приматов вокализации явно дорастают до коммуникативных функций. Причем нам многие их вокализации понятны. Видимо, общие корни.

Дальше – связки. Они могут сужаться (до полного замыкания пути для воздуха) и расширяться. Они тоже изменяют выход воздуха. Связки работают циклично, на частоте примерно 100-200Гц. Причем частоту они меняют. Потому что иначе мы не могли бы передать ничего интересного. А так, игра связок с частотой вносит огромный объем информации.

Тембр. У мальчиков связки жестче и сокращаются с меньшей частотой. У девочек – наоборот. Заболел – еще иначе зазвучал от того, что заработали иначе связки.

Дальше – резонансный артикуляторный аппарат. Резонанс – это такой физический процесс, когда два явления совпадают по фазе и усиливают друг друга. (Играющий мост в Самаре, лопающийся от звука бокал, летучий голландец (в море иногда возникают инфразвуковые волны 5-6Гц, они совпадают с колебаниями диафрагмы, что вызывает животный ужас – и все прыгают за борт.)) Каждое конкретное положение нашего артикуляционного аппарата – это структура, имеющая свою резонансную характеристику. Причем она меняется от звука к звуку. Волна, прошедшая через связки вступает в полости, и начинается резонанс. И этот резонанс всегда разный, всегда на разных частотах. Вступают в резонанс не все частоты, а только те, которые есть в речевом аппарате.

Формант – пик на спектре воздуха, вышедшего из нашего рта. Эти пики берутся из резонансной характеристики нашего артикуляторного аппарата. Разные фонемы кодируются формантами. Гласные звуки укладываются в треугольник в системе координат из первой и второй форманты, т.е. они неплохо кодируются этими формантами. Причем каждая гласная гуляют в некоторых пределах вокруг средних значений.

Первая гипотеза – про зеркальные нейроны. Есть еще одна интерпретация на этот счет. Сферическая модель и предетекторы. А зеркальный нейрон, по сути, объединяет в себе функцию предетекторов и командных нейронов. Любые нейроны на речь формируются при-жиз-нен-но. Еще об этом: предетекторы – это часть неречевого слуха. А вот детекторы – это уже при жизни и социально.

Можно построить и динамическую спектрограмму. Х – время, У – вклад разных частот в спектр. Такой спектр отражает уже не отдельный звук, а речь. Интервалы между словами и между фонемами очень условны. Наша речь достаточно слита.

Проблема автоматического распознавания речи. Есть принципиальная граница: машина не знает всего контекста, а восприятие речи – процесс top-down. Ну и еще одна проблема, связанная со слитостью речи. Мы-то слышим непрерывное ляляля, а уже психика «мощно вычерпывает» в этом ляля то, что может оказаться словом. Из физических характеристик это не очень-то следует.

Красивые кривульки на фразу «это мамонт». Траектория изменения частоты колебания связок много чего меняет в смысле речи. Интонация фразы «это мамонт» меняет всю структуру предложения и смысл. Акцент во многом связан с тем, что люди не могут копировать мелодический контур иностранного языка. А мелодический контур это что? Работа связок. А это процесс какой? Во многом автоматический, поэтому слабо поддается контролю и тренировке.

Частота основного тона. Это доартикуляционный, очень древний механизм. Еще приматы начали использовать модуляцию этого параметра для передачи некоторой информации. 248Гц – женщины, 136Гц – мужчины, дети – примерно столько же, сколько у женщин. Система безопасности рефлекторная реагирует тоже во многом на частоту голоса.

Можно говорить, что речевая информация делится на два канала

  • Лингвистический. Кодирует конкретно смысл, это уровень артикуляции. Эмоциональный контур ему пофигу.

  • Экстралингвистический. Все, что не связано с конкретным лингвистическим смыслом. Исходно это – связки. Частота основного тона – один из мощнейших механизмов для передачи информации по этому каналу. Этот механизм возник очень давно, он был уже с вокализациями. Связан во многом с эмоциями и правым полушарием. Связки-эмоции-правое полушарие и подкорка (лимбика). Модулирование колебания связок – древнейший механизм выражения эмоций.

    • Сюда же включается эстетика, красота речи.

    • Индивидуальный стиль произношения.

    • Медицинский аспект: при разных заболеваниях спектр речи изменяется определенным образом. Когда создается достаточно большой банк, по нему можно проводить автоматическую диагностику. И с некоторой вероятностью действительно угадывать болезнь. Потому что каждая из них определенным образом меняет гормональный фон.

    • Возраст и пол.

    • Статус. Чем выше статус, тем ниже интонирование.

«Наша психика – музей всех предыдущих форм поведения». Поскольку новые функции лучше осознаются, когда мы говорим, мы думаем, прежде всего, о смысле. Но актеры, например, вытягивают весь процесс порождения речи на сознательный уровень, чтобы сделать свою речь красивой и более понятной для зрителя.

Этология человека. В ней активно изучаются отношения полов. Исследование более сложной и простой речи. Девочка говорит с мальчиком более просто, чем говорила бы с девочкой. А мальчики – наоборот. Еще пример с политиками: на предвыборной кампании говорят очень просто, а как только выбрали – сразу очень сложно. Еще исследование – про мобильные телефоны. Чем больше мужчин в кафе, тем чаще они достают телефон и кладут его на стол. Вот так вот зоопсихологические моменты отражаются в реальном поведении.

Марков, «Эволюция человека»

Еще одна штука: на людей надевали халаты. Если ученого, то лучше решали задачи, если художника – то не лучше.

Эксперимент: в правое или левое ухо – короткие эмоциональные фразы. Просили оценить. Лучше расшифровываются те эмоциональные фразы, которые идут в правое полушарие (левое ухо). Чтобы показать, что левое полушарие больше настроена на техническую сторону речи, придумали дихотомическое прослушивание. Если у человека левое полушарие доминирует, он после окончания прослушивания вспоминает в основном те слова, которые слышал в правое ухо.

Но ни в коем случае не надо говорить, что левое полушарие делает только что-то одно, а правое – что-то другое. Они оба могут справиться со всем. Но что-то каждое делает лучше.

Викариат – межполушарный перенос функции при ее недостатке: когда ломается функция одно полушария, она симметрично отражается в другом.

Одна из гипотез о том, почему у левшей много проблем. Возможно, что у них полушария более симметричны в функциональном смысле, и получается конкуренция полушарий. Отсюда проблемы при принятии мозгом различных решений (на разных уровнях вплоть до самоубийств).

Коэффициент правого уха: 20%. Т.е. при вспоминании после дихотомического прослушивания на 20% большего количества слов можно сказать, что левое полушарие доминирует.

Пение. При пении связки колеблются с частотой гораздо больше, чем в обычной речи. Фонемы и смысл те же самые. Но весь спектр речи сдвигается направо. И изменяется эмоциональное наполнение. Пение включает древний экстралингвистический канал, связанный с эмоциями. Связочный язык эмоций один и тот же у всех народов во всех языках. Поэтому эмоции в песне на незнакомом языке в общем ясны.

Еще можно вычесть из спектра вокальной речи спектр обычной речи и посмотреть, что добавилось. Оказывается, есть специальная певческая форманта, которая добавляет в звук что-то вроде щелканья соловья.

Обратная связь в устной речи.

Обратная связь – это общий принцип управления любой сложной системы. Каналы:

  • Слуховой: непрерывно слышим себя и можем корректировать все что угодно, кучу экстралингвистических и лингвистических параметров.

    • Эффект Ламбардо: на слуховую обратную связь. Непроизвольное увеличение громкости речи под влиянием увеличения громкости окружающего фона.

    • Эффект Томатиса: непроизвольное изменение частотных характеристик своего голоса в форме подстройки под частоту обратной связи. Если дать человеку его же речь со сдвинутым спектром, то он автоматически подстраивается. Эдакая самоимитация. Проявляется в процессе говорения.

  • Костный: улитка находится в глубине височной кости, и, когда мы говорим, возникает эффект резонанса, который затрагивает череп. Он изменяет частоту своих колебаний в резонанс с теми, которые сейчас актуальны. И трясет улитку. Эта информация тоже анализируется и посылается в мозг. Этим объясняется эффект, когда мы не узнаем свой голос на записи. Просто костный канал не работает. Поэтому чувствуешь, что не ты говоришь и не так говоришь.

  • Проприоцептивный, он же кинестетический. Связан с обратной связью от речевых мышц. Тоже мало осознаваемый канал. Помогает правильно все проговаривать, тонко артикулировать. Есть близкие артикулеммы, они могут похоже начинаться, и роль проприоцептивной обратной связи заключается в том, чтобы по ходу проговаривания непрерывно корректировать произносимую артикулемму.

    • Если проблема тут, то получается афферентная моторная афазия. У них сохранны сенсорные речевые функции: они слышат, что неправильно говорят, и очень переживают по этому поводу.

    • Когда дети учатся читать и писать, они пробуют это делать и проговаривают все-все-все. Причем, если их попросить зажать язык между зубами, они сразу ошибаются. Потому что у них отнимают сенсорные коррекции, без которых писать, например, гораздо тяжелее. Плюс, если следовать общей моторной теории речи, то получается, что проговаривание в принципе всегда помогает все понять.

    • Эффект Ли. Если человеку давать его же речь, но сдвинутую на 100-200мс, то он начнет запинаться. Стал использовать для диагностики симуляции глухоты в армии. Если человек действительно оглох, то он читает текст и не запинается при подаче ему собственной сдвинутой речи. А заикающимся это наоборот помогает. Речевой круг. Сенсорная зона прямо говорить моторной, что она услышала. А моторная – как в 4 канале. И сдвиг на 200мс вгоняет зону Брока в ступор. Она отдает команду моторным нейронам и зоне Вернике, а ответа от нее не получает. Так можно вызвать судороги речевого аппарата.

    • Заикание. Одна версия – перевозбуждение зоны Брока. И помогает слушать свою речь с задержкой им потому, что она оттормаживает зону Брока. Еще тренинг – на изменение спектра речи.

  • Выдачи эфферентной моторной копии. Этот канал – внутримозговой. Зона Брока прямо посылает зоне Вернике копию отданной команды. «Сейчас будем говорить «Солнце взошло»». И тогда зона Вернике может услышать эту фразу и сравнить ее с копией.

Все эти каналы очень быстро и предельно синхронно работают, позволяя все оперативно анализировать и корректировать буквально на лету. Сознанию же в результате эволюции остаются самые «не-технические» функции: я думаю только о том, что я говорю.