Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Timofeeva_M._Yazyk_s_pozitsiy_filosofii_psikhologii_matematiki-1

.pdf
Скачиваний:
22
Добавлен:
19.11.2019
Размер:
1.03 Mб
Скачать

сы или свойства, с которыми оно соотнесено через посредство ка тегорий и частей речи (состав категорий схоласты определяли в соответствии с традициям греков Доната и Присциана).

В XVII в. идея построения универсальной грамматики вдохно вила группу французских грамматистов Антуана Арно и Клода Лан сло из аббатства Пор Руаяль под Парижем (кстати, именно их Хом ский считал первыми приверженцами трансформационной грам матики). Они полагали, что в грамматических категориях всех языков присутствуют общие элементы мысли, правда, в отличие от греков и римлян, их интересовал не литературный язык, а реальная живая речь. Первая работа на эту тему была издана в 1660 г. Идеи, высказанные Арно и Лансло, были восприняты многими. В частно сти, интересен труд Джеймса Хэрриса, лорда Малмсбери, опубли кованный им в 1751 г. под названием Hermes, or a philosophical inquiry concerning Universal Grammar. Дж. Хэррис предпринимает попытку построить логическое исчисление для всех теоретически возмож ных способов выражения универсальных понятий. Примерно в то же время (в 1767 г.) аналогичное исчисление пытался создать француз Н. Бозе. Высказанные ими идеи, в частности идея логи ческого исчисления теоретически возможных смысловых универ салий, очень созвучны ряду современных исследований. В назван ном выше компендиуме морфологии, разработанном И.А. Мель чуком, решается подобная задача.

Итак, историей предлагается, по крайней мере, два подхода к построению универсального языка: выбрать конкретный язык и считать его описание (точнее, используемые им категории) этало ном для всех прочих языков или построить универсальную катего риальную систему, не совпадающую полностью с категориальными системами конкретных языков, но составляющую их основу.

ЯЗЫКОВЫЕ УНИВЕРСАЛИИ

Мы знаем кое что о языках, но много ли мы знаем о самом языке...?36

Многообразие языков, со временем все более постигаемое, не могло не охладить оптимизм в отношении поисков универсальной

36 Успенский Б.А. Указ. соч. С. 12.

130

грамматики. Стало ясно, что нет такого шаблона, по образцу кото рого можно было бы описать все языки. Можно говорить лишь об отдельных категориях и отношениях, общих всем известным чело веческим языкам. Такие категории и отношения принято имено вать универсалиями.

Понятие универсалии привнесено в лингвистику из антропо логии Б. и А. Агинскими, авторами статьи The Importance of Language Universals, опубликованной в 1948 г. в журнале Word. Вопрос о су ществовании универсалий среди прочих обсуждался на VI Между народном лингвистическом конгрессе, состоявшемся в Париже в 1948 г. С конца 1950 х годов в этой области велись интенсивные исследования. В 1961 г. в Нью Йорке прошла конференция по проблеме языковых универсалий. К этой конференции был напи сан известный Меморандум Дж. Гринберга, Ч. Осгуда, Дж. Джен кинса37.

Возможны универсалии двух сортов: первые характеризуют сами языки, вторые — способы построения языковых описаний (метаязыковые универсалии).

Задача поиска универсалий тесно связана с языковой типоло гией, цель которой — определить множество естественных языков логически, задав потенциальные способы их устройства. Законо мерности строения языков выявляются эмпирически и часто име ют форму импликаций. Например38:

Если имеется регулярное противопоставление по признаку числа в формах прилагательного или глагола, то такое про тивопоставление имеется в данном языке и в формах суще ствительного.

Если в языке есть тройственное число, то в нем есть и двой ственное число, а если в языке есть двойственное число, то в нем есть и множественное число.

Дж. Гринберг

37Greenberg J.H., Osgood Ch., Jenkins J. Memorandum Concerning Language Universals // Universals of Language, ed. вy J.H. Greenberg, Cambridge (Mass.), 1963.

38Успенский Б.А. Отношения подсистем в языке и связанные с ними уни версалии // Вопр. языкознания. 1968. № 6. С. 3—15.

131

Сравнение языков неизбежно приводит к стремлению устра нить терминологическую расплывчатость, создать единую систему терминов, пригодную для описания любого языка. Такая система терминов — это особая универсальная система, метаязык. К числу попыток построить подобный метаязык можно отнести и грамма тики Хомского, предложившего метамеханизм, воспроизводя щий, как полагал автор, способность человека усваивать любой язык и мыслимый как модель овладения языком.

4.1.5.Функциональное моделирование как создание новых языков

Nihil est in lingua quod non prius fuerit in oratione языке нет ничего, чего раньше не было бы в речи)39.

Как сказано в подразд. 4.1.2, теория создания функциональ ных моделей естественного языка есть, по сути, теория создания новых языков по заранее заданным свойствам этих языков. В дан ном случае приведенное выше высказывание Эмиля Бенвениста следует трактовать как прагматически ориентированную инструк цию: при построении функциональной модели не нужно вклю чать в нее ничего такого, что реально не требовалось бы для ими тации требуемой функции.

Никакой естественный (русский, английский и т.д.) язык «в целом» как таковой не существует. Любой язык — это практичес ки бесконечная иерархия языковых вариантов, основанием кото рой служат индивидуальные языки (идиолекты) и в составе кото рой находятся языки самой разной степени общности и специали зации, вплоть до очень узкоспециализированных языков вроде языка пульта управления телевизором. Однако лингвистика, в от личие от языка, едина, она используется как метатеория для лю бых рассуждений о языке. Она не множит свои теории пропорци

39 Бенвенист Э. Общая лингвистика. М.: Прогресс, 1974. С. 140. Перефра зировка известного высказывания, приписываемого Аристотелю: «нет ниче го в душе, чего не было бы раньше в чувствах».

132

онально числу языковых вариантов. Обобщение — единственный способ построения теории языка.

Основу любой теории языка составляет набор категорий. Как определяют это понятие в лингвистике?

Лингвистические категории — это «общие свойства различных классов и разрядов языковых единиц, конституирующие эти клас сы и получающие разнообразное языковое выражение: морфоло гическое, синтагматическое, просодическое и т.п. — при различ ном содержании (грамматическом, лексическом, стилистическом и т.п.)»40.

Следующие ниже определения значительно яснее.

Языковая категория (в широком смысле) — это «любая группа языковых элементов, выделяемая на основании какого либо обще го свойства». Языковая категория (в строгом смысле) — «некоторый признак (параметр), который лежит в основе разбиения обширной совокупности однородных языковых единиц на ограниченное чис ло непересекающихся классов, члены которых характеризуются од ним и тем же значением данного признака (например, категория падежа)». «Нередко... категорией называется одно из значений упо мянутого признака, например, категория винительного падежа...»41

Категория — это «максимальное множество значений, исклю чающих друг друга в одной и той же позиции (семантической или логической)»42.

Целям функционального моделирования языка лучше всего соответствует определение, данное И.А. Мельчуком.

В традиционной лингвистике сложилась определенная, до вольно устойчивая, базовая система категорий, достаточно неза висимая от того, какой вариант языка подвергается рассмотре нию. В частности, понятия «слово», «грамматика», «синтаксис» определяются более или менее одинаково. Так, в любом варианте описания русского языка элементы дерев , о будут считаться мор фами, дерево, зеленое — словоформами, зеленое дерево — словосо

40Ахманова О.С. Словарь лингвистических терминов. М.: Сов. энцикл., 1966. С. 190.

41Лингвистический энциклопедический словарь. С. 215.

42Мельчук И.А. Курс общей морфологии. М.; Вена: Яз. рус. культуры: Вен. славист. альманах: Прогресс, 1997. Т. 1. С. 247.

133

четанием и т.д. Правила комбинирования первых будут относить ся к морфологии, а правила комбинирования остальных — к син таксису. Хотя, в принципе, можно вообразить существование та кого носителя языка, который в течение всей своей жизни видел деревья только зеленого цвета и не видел никаких зеленых пред метов, кроме деревьев. Для такого человека вполне естественно будет использовать выражение зеленое дерево в роли слова, а не словосочетания. (Ему просто в голову не придет, что деревья могут быть какого то другого цвета или что нечто, кроме деревьев, быва ет зеленым.) При изучении его индивидуального варианта русско го языка это выражение надо будет рассматривать в разделе «Лек сика», а не в разделе «Синтаксис».

Именно так рациональнее поступать и при построении функ циональной модели. Здесь выделение составляющих языка долж но определяться только относительно рассматриваемой части языка, а не языка в целом. Незачем, например, разделять надписи с пульта управления телевизором на морфы. Эти «морфы» в дан ном случае не были бы «минимальными осмысленными частями слова». «Смысл», т.е. определенное изменение состояния телеви зора, соответствует только надписи в целом. Аналогично в языке Эллочки Щукиной из «Двенадцати стульев» И. Ильфа и Е. Петро ва выражение У вас вся спина белая функционально тождественно слову, а не словосочетанию.

Категориальный аппарат, используемый для описания модели языка, чрезвычайно важен. Именно он предопределяет состав и организацию модели. Задача выбора категориальной системы, оп тимальной для имитации определенного аспекта языка, в традицион ной лингвистике не ставится. Необходимость выработки методоло гии такого выбора вообще довольно слабо осознана, обычно он в значительной степени диктуется традицией. Это совершенно новая задача и пока еще не достигнуто приемлемое понимание путей ее решения. В частности, при построении формальных грамматик обычно используют привычные классы частей речи и парадигм сло воизменения. Первоначально такие модели языка вообще строили только на базе синтаксических категорий. Позже добавили семан тические категории, еще позже — прагматические. Ниже кратко описаны принципы устройства формальных грамматик, предназна

134

ченных для моделирования синтаксиса и имитирующих (на синтак сическом уровне) процессы порождения и понимания текстов.

4.1.6. Синтаксические структуры

Обычно говорят, что математическая модель языка, основан ная на аппарате формальных грамматик, задает множество пра вильных текстов рассматриваемого языка. Это утверждение нуж дается в пояснении.

Для конструирования формальной грамматики необходимо уже иметь (предварительно) некоторое неформальное представле ние о том, какие тексты рассматриваемого языка являются пра вильными. Грамматика задает формальные правила построения этих текстов (синтаксис). Правила должны быть точными — таки ми, чтобы их выполнение можно было поручить компьютеру. В частности, для их применения и для определения условий их при менимости не должна требоваться никакая дополнительная ин формация помимо той, что содержится в определении правила.

Первоначальное неформальное (имеющееся до построения формальной грамматики) представление о том, какие тексты явля ются правильными, вообще говоря, не совсем совпадает с тем мно жеством текстов, которые задает формальная грамматика. Эти два множества текстов лишь похожи, в большей или меньшей степени. Поэтому такие высказывания, как «формальная грамматика позво ляет отличать правильные тексты некоторого языка от неправиль ных» или «формальная грамматика задает множество правильных текстов», являются либо неоднозначными высказываниями, либо ошибочными, либо тавтологиями43. Можно сказать, что формаль ная грамматика задает множество текстов, правильных относитель но нее самой, т.е. относительно содержащихся в ней правил. Но

43 Правильность текста мы можем оценивать либо с позиции носителя языка (в соответствии с имеющимся у него интуитивным неформальным представлением о таких текстах), либо относительно некоторой заданной формальной грамматики. Если не уточнено, о какой из этих позиций идет речь в приведенных высказываниях, то они неоднозначны, если имеется в виду первая позиция, то они ошибочны, если вторая, то они тавтологичны.

135

лишь человек может трактовать это множество текстов как похожее на множество текстов, правильных с точки зрения носителя языка.

Рассмотрим два вида формальных грамматик: первые предназ начены для моделирования процессов порождения текстов, вто рые — для моделирования процессов их понимания.

Каждый из этих двух видов грамматик существует во множе стве вариантов, различающихся принципами выбора категорий и устройства правил. Далее приведены только самые общие сведе ния о грамматиках, без обсуждения их разновидностей.

ПОРОЖДАЮЩИЕ ГРАММАТИКИ

Термин «формальные грамматики» прежде всего ассоциируется с именем американского лингвиста Ноэма Хомского. Сам Хомский истоки своих идей усматривал в идеях философов рационалистов XVII в. В 1955 г. он защитил диссертацию, в которой ввел метод, на званный им «трансформационным анализом», в 1957 г. вышла его работа Синтаксические структуры (Syntactic Structures)44, оказав шая очень большое (можно сказать, революционное) влияние на лингвистику и, как считается, положившая начало математичес кой лингвистике. В этой работе предложена идея «трансформаци онной грамматики».

Возможны сомнения относительно того, кому принадлежит при оритет в отношении этой идеи — Хомскому (как это обычно счита ется) или же его учителю, другому американскому лингвисту Зеллигу Харрису и соответственно кто из них по справедливости должен счи таться основоположником математической лингвистики. Оставив разрешение этого этического вопроса на долю историков науки, по смотрим, в чем суть идей Хомского и Харриса, заметив лишь, что термин «трансформационная грамматика» впервые был введен не Хомским, а Харрисом. Понимался этот термин ими по разному.

Грамматика Харриса. Во множестве всех правильных предложе ний рассматриваемого языка выделяются два подмножества — ядерные предложения (kernel sentences) и неядерные предложения (nonkernel sentences). Множество ядерных предложений называет

44 Перевод этой статьи: Хомский Н. Синтаксические структуры // Новое в лингвистике. М., 1962. Вып. 2.

136

ся ядром грамматики. Неядерные предложения выводятся из ядер ных посредством трансформационных правил. Например, ядер ное предложение: Собака грызет кость — может быть трансфор мировано в неядерные предложения (трансформы): Кость грызома собакой, Грызет ли собака кость? и т.д. Трансформационное отно шение между активным и пассивным вариантами предложения можно описать, например, таким правилом:

N

а V ет N

ь

N

ь V ома N

ой45.

1

2

 

2

1

 

Это правило реорганизует составляющие и добавляет элемен ты в конкретные позиции. Существуют и правила, выбрасываю щие составляющие, например,

N2 ь V ома N1 ой N2 ь V ома.

Грамматика Хомского. Трансформационная грамматика Хомско го, описанная им в работе «Синтаксические структуры»46, базирует ся на трансформационной грамматике Харриса, но отличается от нее в ряде отношений. В ее составе выделяется три компонента: структура непосредственно составляющих (НС компонент), трансформационный компонент, морфофонематический компо нент. Каждый компонент состоит из множества правил. НС ком понент задает базовые способы построения текстов, результат его работы — структура (phrase marker), определяющая синтаксичес кое устройство правильно сконструированного текста. Трансфор мационный компонент позволяет получать по заданным базовым структурам производные, результат его работы — тоже структура, получающаяся из некоторой НС структуры посредством транс формационных правил.

Важное различие между трансформационными грамматиками Харриса и Хомского состоит в следующем. Первая преобразует один (считающийся более типичным) правильный текст рассмат риваемого языка в другой (считающийся менее типичным). Вто рая оперирует не с реальными текстами, а со структурами, лежащи ми (как предполагается) в основе текстов. Поэтому даже простей

45Можно было бы записать правило трансформации в более общем виде, об этом речь пойдет дальше.

46В более поздних работах Хомского ядерные предложения не вводятся.

137

шие тексты («ядерные» по терминологии Харриса) здесь требуют применения по крайней мере некоторых трансформационных пра вил. Например, в грамматике Харриса пассивная конструкция по лучалась путем трансформации из активной. В грамматике Хомско го и пассивная, и активная конструкции, отрицание и утверждение, декларативное и вопросительное предложения должны выводиться из одного и того же выражения, содержащегося в НС компоненте. Разница между ядерными и неядерными текстами у Хомского в другом. Первые порождаются без применения каких либо необяза тельных трансформаций, вторые — с применением как обязатель ных, так и необязательных трансформаций.

Теория грамматик Хомского обсуждается и развивается в не скольких сферах науки: в теории алгоритмов, программировании, лингвистике, психологии, психолингвистике, философии. Порож дающие грамматики широко используются, например, для задания синтаксиса формальных языков (в частности, языков программи рования). Эти грамматики также являются одним из основных ин струментов, используемых при компьютерном моделировании про цессов языковой деятельности. Именно в этом качестве они нас и будут здесь интересовать.

Порождающая грамматика — математический объект, фор мально определяемый следующим образом.

Порождающей грамматикой называется упорядоченная четвер ка вида <V, W, S, R>, где V — алфавит основных (или терминальных символов); W — алфавит вспомогательных (или нетерминальных) символов; S — выделенный элемент множества W («аксиома» или «начальный символ»); R — множество правил вида ϕ ψ ; ϕ и ψ — последовательности символов, входящих в объединенный алфавит, состоящий из символов алфавитов V и W, причем ψ может не содер жать ни одного символа (быть пустой последовательностью симво лов), ϕ всегда содержит не менее одного вспомогательного символа. Основной (терминальный) алфавит — это множество всех тех сим волов, из которых могут быть составлены тексты рассматриваемого языка. Вспомогательный (нетерминальный) алфавит — это множе ство всех символов категорий, которые мы ввели для описания язы ка и которые не могут содержаться в текстах этого языка (они явля ются метасимволами). Тем самым алфавиты V и W не пересекаются,

138

т.е. не имеют ни одного общего элемента. Типы формальных грам матик различаются в зависимости от вида правил.

Поясним на ряде примеров возможности применения порождаю щих грамматик для моделирования синтаксиса естественного языка.

П Р И М Е Р 1.

Для построения порождающей грамматики прежде всего надо выбрать множество используемых синтаксических категорий. Един ственный критерий выбора — удобство моделирования нужного фраг мента языка. Поэтому стандартного (нормативного) множества кате горий нет. Однако очень часто в это множество включают следующие символические названия традиционных для лингвистики категорий:

S, NP, VP, PrP, N, V, Adj, Adv, Рr, Det,

где S — предложение;

NP — именная группа;

VP — глагольная группа;

PrP — предложная группа;

N— существительное;

Vглагол;

Adj — прилагательное;

Adv — наречие;

Рr — предлог;

Det — артикль.

Предполагается, что в рассматриваемых текстах моделируемо го языка (в нашем случае — русского) ни одно из этих названий не встречается, поэтому данные обозначения принято называть вспо могательными (или нетерминальными) символами. Тексты же са мого моделируемого языка состоят из так называемых основных (или терминальных) символов. Основной словарь (словарь симво лов собственно языка) не должен пересекаться со вспомогатель ным словарем, используемым только для формулирования пра вил. Состав вспомогательного словаря в данном случае таков:

W = {S, NP, VP, PrP, N, V, Adj, Adv, Рr, Det}.

139