
Литература по Психолингвистике / Психолингвистика / Основы теории речевой деятельности. Под ред. А.А. Леонтьева
.pdfскольких синтагм, и единственным признаком, обязательным для фразы, а не для синтагмы, является законченность высказывания. Будучи единицей более высшего порядка, чем слнтагма, фраза является основной с точки зрения намерения говорящего, поэтому слушающий легко может передать смысл услышанного, но далеко не всегда в состоянии сохранить исходную синтагматическую структуру и даже словесный состав. Принято считать, что фонетическим признаком, цементирующим фразу, является фразовое ударение — т. е. усиление одного из синтагматических ударений. Однако нужно сказать, что это скорее теоретическое предположение, чем реальное явление. По-видимому, не одно только ударение, а весь комплекс интонационных средств выполняет функцию организации фразы. Т. М. Николаева высказывает мысль о том, что контрастирование синтагм в потоке речи является способом организации интонационных единиц [Николаева, 1969]; в этом случае фразовое объединение должно достигаться соответствующими изменениями временных, мелодических и динамических характеристик синтагм, образующих данную фразу. При этом нельзя с уверенностью утверждать, что интонационные средства, объединяющие фразу, являются более сильными, чем смысловые. Это же в равной степени можно сказать и о средствах разграничения фраз.
Фонетические характеристики единиц типа слова, синтагмы и фразы также образуют некоторую систему (так называемых просодических или суперсегментных единиц), так как они обладают сами по себе определенной самостоятельностью.
Своеобразием этих единиц является их некоррелированность с единицами линейными (фонемами) в способах их выделения и описания. Трудно согласиться с теми лингвистами, которые выстраивают в одну линию и сегментные, и суперсегментные единицы, называя их фонемами [Блумфилд, 1968; Bloch and Trager, 1942]. Совершенно очевидно, что выделение и осознание просодических явлений не может происходить тем же образом, что и выделение линейных единиц, которое обусловлено морфологической структурой языка, тогда как просодические единицы заключены в сегментных и могут быть лишь отвлечены от них, а не отделены. Практически неизвестно, существуют ли в языке единицы, которым бы соответствовали на фонетическом уровне такие явления, как просодемы, интонемы и т. д. Неудивительно поэтому, что существуют такие разные интерпретации одного и того же фонетического явления, как, например, ударение: если в большинстве работ оно описывается как суперсегментная единица, то для Якобсона и Халле ударные и безударные гласные являются разными фонемами. Довольно распространенное мнение о существовании двух различных подсистем гласных фонем — ударных и безударных — по существу также основано на «сегментном» понимании ударения. Идя таким путем при исследовании тоновых языков, нужно признавать наличие
такого числа подсистем фонем, сколько имеется различных тонов. Вопрос о существовании суперсегментных и просодических единиц (именно единиц, образующих некоторую систему) в настоящее время нельзя считать близким к разрешению. Сказанное относится и к тому, что сейчас принято называть интонационными контурами, интонемами и т. п. Хотя, с одной стороны, число их в языке, по-видимому, ограничено, обнаружить их самостоятельность и системность их организации весьма трудно. Здесь речь идет скорее о способе описания соответствующих явлений, чем о выявлении единиц, существующих в языковом сознании носителей языка. Сложность при этом заключается еще и в том, что наряду с собственно языковыми (смысловыми) отношениями интонационные средства передают информацию и об эмоциональном отношении и даже о собственно индивидуальных особенностях говорящего. Не случайно поэтому, что разделить эти разные уровни при анализе тех или других интонационных конструкций практически не удается.
В цитированной уже работе Т. М. Николаевой приводится следующее определение интонемы: «...Интонема — это различаемая в языковом употреблении единица, передающая тип отношений между звуковыми единицами-синтагмами и представляющая собой связанный пучок значений отдельных просодических величин» [Николаева, 1969, 116].
К фонетическим характеристикам интонем разных типов, полученным Т. М. Николаевой на большом и удачно подобранном экспериментальном материале, остается добавить факты восприятия для того, чтобы доказать психологическую реальность типов интонем и их акустических характеристик. Но именно здесь и заключается основная трудность, о которой идет речь — а именно, невозможность получить эти типы «в чистом виде», независимо от сегментных единиц.
При фонетических исследованиях выбор аспекта (артикуляционного или акустического) по существу не является принципиальным. Это утверждение требует специального рассмотрения. Дело в том, что почти одновременно с возникновением фонетики как науки возникает и спор между сторонниками примата того или другого аспекта. Крайняя точка зрения, представленная Форхгаммером, сводится к тому, что нужно рассматривать эти два аспекта как две разные дисциплины — лалетику, занимающуюся артикуляциями, и фонетику, занимающуюся характеристиками звуков как таковых. Доводы сторонников важности того или другого направления кажутся достаточно убедительными, поскольку, с одной стороны, действительно звуки появляются лишь в результате определенных артикуляций произносительных органов, а с другой стороны — общение происходит при помощи звуков, а не при помощи артикуляций. Однако поскольку речь идет о единицах более высокого уровня, чем просто артикуляционные движения или звуковые колебания (если мы говорим о еди-
ницах языка), едва ли можно противопоставлять эти разные аспекты фонетических единиц. Так как мы говорим о языке как средстве связи между людьми (а эта его функция является ведущей), то и производящий речь, и воспринимающий сообщение представляют собой необходимые элементы данной системы связи. Таким образом, и по самим условиям коммуникации любой индивид артикулирует те или иные звуки только потому, что он воспринимает звуковые корреляты артикуляционных движений. Само обучение произносительным навыкам у ребенка происходит через акустические образы и под постоянным контролем (обратная связь). Поэтому в современных фонетических исследованиях основное внимание обращено именно на нахождение корреляций между указанными аспектами звуковых единиц (Фант, Фланаган, Сапожков). Наиболее систематически соотношение между артикуляционным и акустическим в речевом сигнале рассмотрено в широко известной ныне моторной теории восприятия речи. Сущность ее заключается в следующем. Акустические характеристики звуков речи таковы, что хорошая их опознаваемость кажется невероятной: и длительность звуков речи (в некоторых случаях не превышающая 20—30 мсек), и спектральные характеристики их, представляющие собой весьма неустойчивую, сильно варьирующую картину, делают трудно объяснимой идентификацию звуков слушающим с достаточно большой скоростью (10—12 звуков в секунду). Поэтому возникает предположение, что у слушающего имеется специфический способ описания и классификации речевых сигналов, основанный на связи поступающих звуковых стимулов с нервной активностью, обусловливающей соответствующие артикуляторные движения. В данном случае речь идет не о внутреннем проговаривании воспринимаемого отрезка, а только о моторных командах, служащих своеобразным кодом при восприятии речи: «Под моторным образом понимается программа движений или набор указаний относительно характеристик движений, содержащихся в этой программе... Создание программы отнюдь не обязательно предполагает, чтобы эта программа была реализо-
вана |
в форме внешних движений» [Галунов, Чистович, |
1965, |
424]. |
Таким образом, оба аспекта физического описания звуков речи оказываются в действительно неразрывном единстве. Экспериментально доказано, что при различных способах отключения артикуляторного аппарата (включая управляющие центры) восприятие речи становится затрудненным или вовсе невозможным. В ряде лингвистических работ связь между рассматриваемыми аспектами учитывается недостаточно или совсем не принимается в расчет. Либо вовсе отрицается обязательность звуко-артикуляторной субстанции языкового знака1 (которая, как мы видели, является
1«...Нарушится ли коммуникативная функция естественного звукввого языка, если его акустическая субстанция будет транспонирована в другие
единственным условием существования языка) [Шаумян, 1962], либо отдается предпочтение одному из аспектов — например, акустическому — который объявляется при этом достаточным для описания функциональных отношений в системе фонем [Панов, 1967].
Без сомнения, исследование одного из аспектов звукового строя должно рассматриваться не как результат пренебрежения к другому его аспекту: данные и об артикуляторной, и об акустической стороне речи являются во всех случаях лишь сведениями, необходимыми для исчерпывающего описания всего сложного комплекса явлений, наблюдающихся при речеобразовании и восприятии речи.
Преимущество, которое отдается в настоящее время изучению акустического аспекта, следует объяснять не принципиальными соображениями,' а тем, что для этого имеются более совершенные и в то же время более доступные технические средства. Акустические данные могут быть достаточно хорошо соотнесены с соответствующими артикуляционными движениями — во всяком случае, известные зависимости вполне достаточны для получения основных фонетических представлений. Наиболее ярким примером в этом отношении являются акустическая теория речеобразования Г. Фанта и дихотомическая классификация дифференциальных признаков фонем Якобсона—Фанта—Халле, построенная на параллельном описании акустических, артикуляторных
и перцептивных |
коррелятов |
дифференциальных |
признаков. |
Как уже было |
сказано в |
начале этой главы, |
физические |
описания звуковых явлений в речи возможны только на лингвистической основе. Представления об акустическом или артикуляторном тождестве двух сигналов выводятся не из их физических свойств (очень сильно варьирующихся от случая к случаю), а из их функционально-лингвистического тождества. Поэтому и авторы упомянутой дихотомической классификации оперируют лингвистическими понятиями — фонемами и дифференциальными признаками.
К сожалению, это дало повод к тому, что многие лингвисты механически перенесли рассмотренные Якобсоном — Фантом — Халле дифференциальные признаки на самые разнообразные звуковые системы без всякого соотнесения с реальной действительностью. Как пишет Г. Фант, эта теория стала интеллектуальной игрой в руках структурных лингвистов [Fant, 1967]. Многие считают достаточным подвести под дихотомическую классификацию систему фонем того или иного языка просто на основании чисто транскрипционных знаков, без какого-либо анализа звуковой стороны. Бессмысленность такого рода операций очевидна,
виды физической субстанции? Очевидно, что не нарушится» (подчеркнуго н а м и - Л. В и Л. 3.).
ибо никакой информации о способах организации акустических множеств в языке они не несут.
Важнее всего подчеркнуть, что дихотомическая классификация породила иллюзию, будто бы инвентарь фонем языка может быть выведен из матриц распределения дифференциальных признаков, полученных путем указанных операций. Хотя сами авторы дихотомической теории и предупреждали против ошибок такого рода [Якобсон и Халле, 1962], подчеркивая необходимость анализа конкретных фонемных противопоставлений, последующие работы показали, что эти предупреждения остались незамеченными. Вместе с тем теоретически очевидно, что не фонема определяется дифференциальными признаками, а дифференциальные признаки вытекают из фонемных противопоставлений. Критикуя дихотомическую классификацию, П. С. Кузнецов справедливо писал: «... каждый отрезок речи может быть описан акустически. Но ведь этого недостаточно, чтобы был выделен дифференциальный признак, так как под дифференциальным признаком понимается такой признак..., которым данный отрезок речи... отличается от другого отрезка речи» [Кузнецов, 1958].
Одним из наиболее убедительных свидетельств о тех или иных способах организации акустических множеств в конкретном языке являются факты восприятия.
Прежде всего нужно рассмотреть отношения между психоакустическим и лингвистическим аспектами в проблеме восприятия речевых сигналов и разграничить эти понятия. Как и всякий акустический сигнал, звук речи может быть описан набором простейших характеристик — таких, как длительность (время звучания), интенсивность, периодичность или апериодичность, характер нарастания и характер спада звука и т. д. Известно, что в слуховом анализаторе человека имеются специальные отделы, ответственные за восприятие тех или иных параметров. Психоакустический аспект восприятия определяется в первую очередь теми возможностями и ограничениями, которые имеет слуховая система человека.
В частности, весьма существенными являются сведения о значениях порогов восприятия разных характеристик акустического сигнала [Bekeszy, 1929]. Так, если из данных психоакустики известно, что постоянная времени человеческого слуха — 30— 50 мсек, то заведомо бесполезно искать перцептивные корреляты взрывных согласных, длительность взрыва которых не превышает 20—25 мсек; с другой стороны, если в психоакустическом опыте доказано, что при восприятии звука речи человек следит не за частотой форманты, а за изменением положения максимума в спектре, то с лингвистической точки зрения это довольно безразлично, так как и в том, и в другом случае речь идет об одних и тех же фонетических характеристиках. В общем можно сказать, что лингвиста должны интересовать только те сведения из психоакустики, которые очерчивают круг возможностей слу-
ховои системы: конкретные механизмы восприятия в значительной степени могут быть безразличны. Что касается исследования восприятия речевых звуков, то сведений по этому вопросу в психоакустике достаточно мало: практически очень долгое время занимались восприятием неречевых сигналов — чистых тонов, шумовых сигналов — и очень многие предположения относительно восприятия звуков речи построены на основе чисто психоакустических сведений.
В. К. Лабутин и А. М. Молчанов пишут об изучении восприятия речи следующее: «В настоящее время не существует ни достаточно полных экспериментальных данных, ни четких теоретических представлений, которые описывали бы комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов» [Лабутин, Молчанов, 1970, 168].
В последнее время появилось большое количество работ, посвященных исследованию механизмов восприятия собственно речевых звуков. Большая группа ученых, работающих в этом направлении, исследует восприятие синтезированных звуков [Федорова, 1969; Fant, 1967; Delattre, 1965]. Предпочтение, оказываемое синтезированным звукам, определяется тем, что исследователь имеет возможность управлять интересующими его параметрами. Однако нужно подчеркнуть, что результаты подобного рода опытов не могут считаться с лингвистической точки зрения окончательными, так как хотя эти результаты говорят очень много о том, что может делать человек при восприятии речеподобных стимулов, они почти ничего не говорят нам о том, как в действительности поступает человек при восприятии более богатого и сложного естественного речевого сигнала.
В отличие от психоакустической, с психолингвистической точки зрения существенно восприятие и различие тех или иных звуков именно как языковых единиц. Это тем более важно, что между воспринимаемыми единицами и единицами лингвистическими связь не непосредственная, а обусловленная целым рядом дополнительных обстоятельств. Звуковую единицу, которая воспринимается носителями языка и находится во взаимосвязанных отношениях с фонемой, называют эталоном или «психологической фонемой».
В исследовании, проведенном в ЛЭФ ЛГУ, было обнаружено, что носители русского языка различают 18 эталонов гласных [Вербицкая, 1965]. Это соответствует (акустически и артикуляторно) оттенкам гласных фонем а, о, i, e, ы в следующих фонетических позициях:
1)между твердыми согласными,
2)после твердого перед мягким,
3)после мягкого перед твердым,
4)между мягкими.
Все четыре позиции существенны для варьирования гласных а, о, е; гласные i и ы реализуются каждый в одном эталоне
независимо от позиции (заметим, что и число позиций для них меньше, так как i встречается только после мягких, а ы — только после твердых согласных).
Способность носителей русского языка различать эти звуковые единицы обусловлена, очевидно, не столько их физическими характеристиками, сколько их лингвистической значимостью, а именно специфическим способом реализации дифференциального признака мягкости согласных, наиболее выразительным фонетическим коррелятом которой является качество соседнего гласного. Психолингвистический характер эталонов обнаруживается с особенной четкостью, если учесть то обстоятельство, что другие изменения как гласных, так и согласных, не менее значительные по своему акустическому эффекту, практически не замечаются носителями русского языка, а если и замечаются (как, например, различие между огубленными и неогубленными согласными, предъявленными рядом), то фонетически не идентифицируются.
Интересны данные по фонемной идентификации и по различению оттенков одной фонемы, полученные в опытах по восприятию синтезированных гласных [Чистович, Кожевников, 1969]. Множество синтезированных гласных, спектральные характеристики которых изменялись от i-образного до а-образного, было представлено 12 разными стимулами. Оказалось, что испытуемые, которые были носителями русского языка, разбивают это множество на три подмножества, обозначая их через [i], [e] или [а]; они пользуются, следовательно, фонемной классификацией. Вместе с тем обнаружилось, что испытуемые замечают различие между разными [е], если физическая разница между ними увеличивается. Авторы пишут по этому поводу: «...субъективное расстояние монотонно возрастает с увеличением физической разницы между стимулами. Этого не могло бы быть, если бы информация о гласном, полученная при его восприятии, ограничивалась фонемным символом. Необходимо допустить, что человек способен на какое-то время запоминать не только фонему, выбранную на основании услышанного стимула, но и какие-то особенности звучания сигнала, назовем это условие тембральной информацией» [Чистович, Кожевников, 1969, 54].
С лингвистической точки зрения речь здесь идет о том, что испытуемые замечают различие между открытыми и закрытыми оттенками фонемы [е]. При рассмотрении этих фактов возникает ряд интересных для лингвиста вопросов, которые сводятся к выяснению отношений между замеченной в описанных опытах способностью «запоминать тембральную информацию» и реальным распределением таких характеристик в речи. Известно, что в абсолютном начале слова перед твердым согласным произношение открытого и закрытого [е] факультативно [ieta] и [eta]; известно также, что изменения гласных в соседстве с мягкими согласными, приводящие к появлению более закрытого варианта [е] в слове [сеть] по сравнению с [е] в слове [цех], испы-
туемые — носители русского языка достаточно хорошо различают. Возможно, что существенным является следующее обстоятельство. Закрытый оттенок [е] является статистически преобладающим в речи, так как этот гласный чаще всего следует за мягким согласным. Это приводит к тому, что закрытый оттенок (вариант) гласного [е] становится равноправным с основным оттенком (открытым [е]), встречающимся в абсолютном начале и после твердых согласных.
Неразличение же разных «оттенков» гласного [а] (которым соответствуют стимулы с разным положением FI и FII) объясняется не тем, что испытуемые «плохо слышат», а тем, что это различие не задано фонемными отношениями русского языка. Таким образом, процедура фонемной идентификации обусловлена не только и не столько особенностями работы слухового анализатора, но и теми ограничениями, которые накладываются системой фонем родного языка испытуемого.
Все эти соображения ведут к подтверждению реальности того понятия, которое уже давно существует в лингвистике под названием «языковое чутье». Будучи проекцией языковых отношений на поведение говорящего, «языковое чутье» может быть использовано как критерий для оценки истинности построений исследователя-фонетика (фонолога). Хорошим примером такой проверки является экспериментальное исследование реальности так называемых «пограничных сигналов» для носителей данного языка. Опыты, проведенные на материале русского языка, показали, что фонетические особенности звуков, оказывающихся на стыке слов, практически не используются слушающими для определения места границы между словами. Это ставит под вопрос применимость общей теории пограничных сигналов к фактам русского языка: если говорить о признаках границ слов, то нужно искать их не в фонетических характеристиках, а в гораздо более сильном факторе, которым является морфологическая и шире — смысловая сторона языка.
Сейчас едва ли кто-нибудь станет отрицать плодотворность исследования «языкового чутья» для выявления собственно языковых закономерностей и единиц. О значении его для выявления таких единиц, как фонема, оттенки, пограничные сигналы, речь шла выше. Для решения вопроса о выделимости дифференциальных признаков фонемы необходимо соответствующее изучение процессов лингвистического восприятия.
Не только выделимость дифференциальных признаков, но и их лингвистическая значимость может быть выявлена при исследовании восприятия. Так, например, трудный для лингвистического обоснования вопрос о маркированности одного из членов данного фонематического противопоставления может найти разрешение при привлечении психолингвистических фактов.
Велико значение психолингвистических исследований при решении разнообразных вопросов прикладной фонетики. В первую
очередь здесь следовало бы назвать проблему построения рациональной системы письма. Создание графики и орфографии, которые были бы простыми для усвоения пишущим и удобными для читающего, иными словами, которые были бы экономичными, безусловно, должно опираться на знание связей между устной и письменной формой речи, существующих в сознании людей, пользующихся этими формами.
Выбор того или иного принципа орфографии, который неизбежно встает как первый вопрос при попытках реформировать орфографию, не может считаться теоретическим лингвистическим вопросом. Поскольку дело идет о пользовании письмом самыми широкими массами людей, постольку те или иные решения должны выбираться не на основании изучения системы языка как таковой. Необходимо знать отражение этой системы в сознании говорящих. Весьма существенным моментом является то, что в отличие от устной формы речи, которая усваивается спонтанно без сознательных усилий со стороны усваивающего ее ребенка, письменная форма изучается сознательно с самого начала и до конца. Несомненно то, что письменная форма речи (в буквенном ее варианте) отражает звуковую сторону, оддако вопрос о том, в какой степени система письма должна совпадать с фонемной системой, должен быть решен на основе специальных исследований психолингвистического характера. Так, например, сторонники морфологического принципа орфографии видят его преимущество перед фонетическим в том, что он дает возможность отразить тождество морфемы в ее письменном образе; считается, что это облегчает понимание текста. Однако в устной речи отсутствие звукового тождества морфем нисколько не препятствует осознанию их единства. Отдать предпочтение тому или другому принципу можно только на основе экспериментального исследования.
Более явная связь с психолингвистической проблематикой обнаруживается в новых сферах приложения фонетики. Прежде всего это относится к передаче информации через каналы связи. Давно уже было установлено, что качество этих каналов и аппаратуры не может быть оценено только на основании их технических характеристик. Это привело к созданию так называемого артикуляционного метода испытания, который сводится к изучению восприятия слушающим переданного через канал связи сообщения. Создание текстов для таких испытаний потребовало участия фонетистов, так как объективное испытание качества трактов должно проводиться на фонетически представительном языковом материале [Зиндер, 1951]. Представительность, в частности, определяется и вероятностным критерием. Отсюда — и потребность детального статистического исследования различных аспектов фонематической структуры речи [Зиндер, 1958]. Нужно сказать, что многие экспериментально-фонетические исследования были стимулированы потребностями техники связи, одной из за-
дач которой является экономное использование каналов связи. Способом такого экономного использования является передача компрессированной речи, т. е. такой речи, в которой сохранены лишь ее важнейшие акустические характеристики и отброшено то, что не оказывает существенное влияние на правильное восприятие ее. В связи с этим определение ценности тех или иных фонетических характеристик при восприятии речи человеком приобретает первоочередное значение.
В настоящее время всеми исследователями признается, что оптимизация каналов связи на основе чисто технических соображений по существу невозможна. Это же относится и к таким проблемам, как автоматический анализ и синтез речи, автоматическое распознавание речи.
Большинство исследователей стоит на той точке зрения, что принципиальное решение проблем автоматического распознавания речи возможно только при построении системы, учитывающей те операции, которые производит человек в процессе восприятия речи. И действительно, надо полагать, что механизм, выработанный в результате многовековой эволюции, обладает высокой степенью надежности: известно, что при самых разнообразных помехах на разных уровнях — от посторонних шумов и искажений и до пропусков целых значимых отрезков речи — общение при помощи звуковой речи является самым надежным и универсальным средством коммуникации.
При таком подходе вопрос о единицах фонетического описания и о соотношении физических характеристик речевого потока с лингвистическими понятиями приобретает особую остроту. Требования, поставленные специалистами в области автоматического распознавания к фонетистам-лингвистам, заставили последних более строго сформулировать основные определения и характеристики речевого потока, что, конечно, имеет важное значение не только для прикладных аспектов, но и для теоретических построений. Общее положительное влияние технической проблематики на фонетические исследования сказывается еще и в том, что в экспериментально-фонетических работах последних десятилетий стали использоваться достаточно совершенные технические средства анализа акустических, артикуляторных и перцептивных характеристик речевых сегментов разной длительности.
Существенное значение имело также и то, что фонетика во всех ее аспектах, включая и фонологический, обратилась к исследованию речевого поведения носителя языка. Это и сблизило современную фонетику с психолингвистической проблематикой.