Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Timofeeva_M._Yazyk_s_pozitsiy_filosofii_psikhologii_matematiki-1

.pdf
Скачиваний:
22
Добавлен:
19.11.2019
Размер:
1.03 Mб
Скачать

ческие исследования. Однако в виде конкретной научной дисцип лины, предметом которой является язык, а методами — методы математики, этот интерес оформился впервые только в середине ХХ в., в тесной связи с развитием компьютерной техники и ин форматики, для которых разработка языковых технологий была и остается одним из существенных направлений деятельности. Воз растанию интереса математиков к языку немало поспособствова ли и логико философские исследования начала ХХ в., важная роль в развитии которых принадлежит Львовско Варшавской ло гико философской школе.

4.1.Математическая лингвистика

Врамках математической лингвистики разработан ряд новых теорий естественного языка, причем многие из них (прежде всего формальные грамматики) в настоящее время используются не только лингвистами (для моделирования естественных языков), но и математиками (для описания математических языков).

Взаимодействие математической лингвистики с традиционной лингвистикой — непростой процесс, несмотря на то что матема тический аппарат, используемый в первой из них (и кажущийся сложным многим лингвистам), на самом деле, при разумном огра ничении пределов данной дисциплины2, особой сложности не представляет. Он вряд ли сложнее тех разделов математики, кото рые успешно изучаются в средней школе. Правда, лингвист, поже лавший освоить эту область, сразу столкнется с «подводным кам нем», затаившимся на пути освоения терминологии.

Какой язык проще выучить: похожий на родной язык или не похожий? Как ни удивительно, в определенном отношении пер вое может оказаться труднее: если какие то слова, конструкции, правила родного и изучаемого языков похожи лишь внешне, по форме, но при этом содержательно различны, то очень легко слу чайно привнести в изучаемый язык что нибудь свойственное вов

2 При включении в нее только тех математических теорий и рассуждений, которые значимы для исследования именно естественного языка.

100

се не ему, а родному языку. Чем больше такого, чисто внешнего, сходства, тем труднее. С подобными сложностями наверняка стал кивался всякий русскоязычный человек, изучавший чешский3, польский или какой либо другой славянский язык.

Аналогичные проблемы возникнут и у того, кто, зная традици онную лингвистику, возьмется за изучение математической линг вистики. Многие термины этих двух лингвистик внешне одинако вы, но различны по своему содержанию. Если это упустить из вида4, то трактовка какого либо математического термина может незаконно впитать в себя ассоциации, связанные с этим термином в традиционной лингвистике (подобно тому, как чешскому слову pozor был приписан смысл созвучного русского слова). Возникаю щее в результате «понимание» будет лишь иллюзорным и по сути ошибочным. Иначе говоря, для понимания математической линг вистики нужен пересмотр определенных «привычек ума».

Конечно, этот процесс не ограничивается просто освоением терминологии, да и освоить ее, по существу, невозможно, не поняв суть формального стиля мышления и отличия его от неформально го, не научившись отличать перспективные цели формализации языка от имеющих неопределенное назначение переписываний уже известной информации с использованием математической симво лики.

Унификация терминологии — одно из важнейших условий продуктивности любых междисциплинарных исследований. Ос ложняет ситуацию тот факт, что новые междисциплинарные облас ти знания зачастую наследуют положения смежных дисциплин, принимая их на уровне догм. Из за этого исследования, проводи мые на стыке дисциплин, зачастую не вполне самостоятельны, не базируются на собственных явно принятых, критически осмыс

3 Например, однажды в Праге русский турист, увидев на табличке перед лестницей надпись Pozor na shodi, очень удивился, решив, что в ней говорит ся нечто вроде: «Позор тому, кто сходит» (с этой лестницы). На самом деле надпись предупреждает: будьте осторожней на лестнице, а слово pozor по чешски означает ‘внимание’.

4 К сожалению, в лингвистической литературе (и того и другого направ ления) этому вопросу никакого внимания не уделяется, что немало затрудня ет междисциплинарные взаимодействия.

101

ленных и обоснованных положениях. Речь идет не об игнорирова нии смежных наук (вполне продуктивных в рамках традиционно го для них круга задач), а о том, что при существенном изменении точки зрения на предмет (в данном случае язык) никакие положе ния этих наук не могут быть иммунизированы от критики и прин ципиальной возможности устранения.

Математическая лингвистика — междисциплинарная область. Сфера проводимых в ней исследований затрагивает традицион ную лингвистику, математику, психологию, информатику. Каждая из этих дисциплин считает ряд научных положений устоявшими ся и не подвергаемыми сомнению, т.е. фактически фигурирующи ми в качестве догм. Однако вполне может случиться так, что по добные положения не будут отвечать измененной точке зрения на язык и новому кругу задач. Такие «привычки ума» тоже придется критически пересмотреть.

Кто вообще занимается математической лингвистикой? Пред ставителей этой дисциплины можно условно подразделить на две основные группы: лингвисты и математики. Первым интересны существующие естественные языки и природа естественного язы ка вообще. Вторым — формальные языки, в частности формаль ные языки, приближенные к естественным (и, возможно, исполь зуемые компьютером). Различие профессиональных интересов и навыков затрудняет взаимодействие, необходимое для продуктив ной совместной работы.

Лингвисты оценивают описание языка прежде всего с содер жательной точки зрения, они привыкли к определенным тради циям описания. Формальные же теории языка, рассматривающи еся в математической лингвистике, следует оценивать не по содер жанию, а лишь по их функциональным качествам (по тому, как они выполняют свое назначение, например, служат базой для перево да с одного языка на другой). Авторы лингвисты, строя формаль ную модель языка, часто стремятся аппроксимировать математи ческими средствами привычные неформальные лингвистические описания, им сложно пожертвовать содержательными критерия ми ради критериев функциональных. Нарушение традиций (на пример, значительное изменение или упрощение правил грамма тического анализа) ранит эстетическое чувство лингвиста, зачас

102

тую кажется ему нелепым или примитивным. В то же время мно гие проблемы, очень важные и глубокие, требующие внимания именно лингвистов, но не входящие в традиционную сферу их за нятий, так и остаются незамеченными.

Человек с математическим образованием не обременен лингви стическими конвенциями, более свободен в этой сфере принятия решений и руководствуется лишь своим знанием языка в качестве его носителя. Четкое разделение функциональных и содержатель ных свойств языковых описаний с приоритетностью первых перед вторыми воспринимается в рамках его профессиональных привы чек вполне естественно. Однако дефицит лингвистических знаний, в свою очередь, может привести к «изобретению велосипедов», т.е. «открытию» фактов, ранее уже замеченных лингвистами (но не сформулированных ими на языке математики), и соответственно, к необоснованному приданию чисто математическим или програм мистским результатам лингвистически значимого статуса.

Несмотря на все эти сложности, процесс проведения совмест ных исследований лингвистов и математиков имеет перспективы развития, обусловленные наличием по крайней мере следующих причин.

Компьютерные технологии все более совершенствуются, мате матические методы начинают все более интенсивно использовать ся во многих дисциплинах, в том числе и в лингвистике. К этому предрасполагает и само устройство естественного языка. Возмож ность поручить часть трудоемкой работы компьютеру и желание найти общий язык с будущими поколениями коллег — серьезные аргументы в пользу изучения лингвистами математических теорий языка.

Еще один аргумент — существование социально востребован ных (и соответственно, неплохо оплачиваемых) видов деятельно сти, связанных с моделированием тех или иных функций есте ственного языка на компьютере (автоматическое реферирование, автоматический перевод и т.д.).

Наконец, существенен (причем для кого то в наибольшей сте пени) еще один аргумент: интерес к природе естественного языка. Всякий научный метод, в том числе и методы математики, может высветить новые, прежде не замечавшиеся аспекты языка.

103

4.1.1. Немного об истории

Каждый человек, интересуясь прошлым и настоящим опреде ленной научной области, словно ведет внутренний, растянутый во времени диалог с двумя собеседниками: с историей, сформировав шей данную область именно такой, какая она есть (с такой про блематикой и такими методами), и с собственной интуицией, на правляемой им на предмет своего интереса.

Взаимодействовать со своей интуицией можно двояким обра зом: справляясь у нее или пытаясь ее усовершенствовать. История же — какая есть, такая есть. Конечно, ее ход направили опреде ленные идеи, предложенные определенными людьми. Но иденти фицировать этих людей, выяснять, почему именно их идеи оказа лись решающими, раздавать персональные награды или обвине ния — дело историков. Всем остальным проще, персонифицируя историю, возложить на нее ответственность и за не всегда аргу ментированные решения, и за приверженность этим решениям. Относиться к такому консервативному «собеседнику» можно по разному: игнорировать его, соглашаться с ним, идти ему напере кор, спорить с ним. Каждый вправе сам выбирать свой вариант поведения.

Поскольку данное пособие относится к учебным изданиям, в нем будет кратко охарактеризовано реальное прошлое и настоя щее математической лингвистики, несмотря на то что далеко не все «решения», «произведенные» историей этой дисциплины (в том числе и очень важные), бесспорны. Например, идеи Хомского очень существенно повлияли на развитие математической лингви стики, были для нее основополагающими. Именно этот факт не позволяет уделить здесь этим идеям лишь столько внимания, сколько они заслуживали бы при оценке сугубо их теоретической значимости для понимания природы языка.

Так что же следует знать об истории математической лингвис тики?

Лингвистика — наука о естественных языках. Такие языки можно рассматривать под разными углами зрения: как психичес кие или логические сущности, как исторически развивающиеся образования, как системы знаков, как объекты с регулярными (математически формализуемыми) свойствами и т.д. Разные ра

104

курсы, в принципе, равны в своих правах, хотя реальная история с этим не считается. Так, математические теории языка начали ак тивно строить сравнительно недавно — с середины 50 х годов на шего века. Эти теории до сих пор с трудом и лишь частично при знаются традиционной лингвистикой «своими». В 50 е годы для них была учреждена отдельная дисциплина — «математическая лингвистика». К ней причисляли очень широкий и неоднородный по своим целям спектр исследований — от, по существу, традици онно лингвистических (использующих математику лишь как вспомогательное средство) до, по существу, математических (ин тересующихся тем или иным математическим аппаратом, приме нимым, в частности, к естественному языку).

Для иллюстрации приведем несколько определений математи ческой лингвистики, взятых из авторитетных источников. «Матема тическая лингвистика — отрасль языкознания, занимающаяся изу чением возможностей применения математических методов к ис следованию и описанию языка»5. «Математическая лингвистика — математическая дисциплина, предметом которой является разработ ка формального аппарата для описания строения естественных и не которых искусственных языков»6. «Математическая лингвистика яв ляется не особой лингвистикой, а лишь применением к языковым явлениям математических методов. Главным образом, это относится к речи, а не к языку, например, применение теории вероятностей и математической статистики»7. «Математическая лингвистика есть математическая дисциплина, “обращенная” в сторону естественных языков и лингвистики», она «представляет собой в основном неколи чественную дисциплину»8. «Применение математических методов в языкознании имеет своей целью заменить обычно диффузно сфор мулированную и не имеющую полного решения лингвистическую задачу одной или несколькими более простыми, логически сформу

5Ахманова О.С. Словарь лингвистических терминов. М.: Сов. энцикл., 1966.

С.218.

6Лингвистический энциклопедический словарь. М.: Сов. энцикл., 1990.

С.287—289.

7 Реформатский А.А. Введение в языковедение. М., 1967. С. 50.

8 Гладкий А.В., Мельчук И.А. Элементы математической лингвистики. М.: Наука, 1969. С. 16—20.

105

лированными и имеющими алгоритмическое решение математичес кими задачами». (Иначе говоря, «эксплицировать» лингвистический объект математическими средствами.)9

Многие из приведенных выше высказываний противоречат друг другу. Ни одно из них не охватывает весь спектр работ, отно симых к данной дисциплине. Единственное, что очевидно: судя по этим определениям и по работам, вышедшим в 50—60 х годах, основной предмет интереса у математической лингвистики тот же, что и у нематематической — естественный язык. Причиной учреждения ее как отдельной дисциплины послужило появление новых задач, для решения которых понадобилось использовать новые — математические — методы. Прежде всего это была задача автоматизации межъязыкового перевода.

В 1955 г. в Гарвардском университете США начал работать семи нар по математической лингвистике. В 1957 г. вышла работа Ноэма Хомского «Синтаксические структуры» («Syntactic Structures»10). Этот автор и это его сочинение дали начальный импульс развитию данной дисциплины. В ряде государственных университетов

СССР (в Москве, Ленинграде, Новосибирске, Горьком) были от крыты отделения математической лингвистики.

Приверженцы нового направления рассчитывали на то, что очень скоро можно будет научиться описывать естественные язы ки (или хотя бы содержательно богатые их фрагменты) полностью формально. В 50—60 е годы был предпринят ряд масштабных (и по целям, и по затратам труда) попыток такого рода. Затем стало ясно, что задача эта пока нереальна: в ближайшем будущем пол ностью формально можно будет описывать только очень ограни ченные фрагменты естественных языков. Такие описания зачас тую примитивны и малоинтересны в лингвистическом отноше нии, зато их можно реализовывать в виде компьютерных моделей языка. Для практического применения и алгоритмического совер шенствования теорий и моделей таких ограниченных фрагментов языка обычно не требуется специального лингвистического обра

9 Пиотровский Р.Г., Бектаев К.Б., Пиотровская А.А. Математическая лин гвистика. М.: Высш. шк., 1977. С. 7.

10 Русский перевод этой работы был опубликован в сб.: Новое в лингвис тике. М., 1962. Вып. 2.

106

зования. Достаточно быть носителем языка и иметь образование, например математика или программиста.

Когда преждевременность первоначальных надежд была осоз нана, у многих лингвистов наступило разочарование, отчасти про должающееся до сих пор. Математическими теориями языка ста ли более активно заниматься нелингвисты (логики, программис ты). Соответственно изменилась проблематика и требования к конечному продукту. Сейчас термин «вычислительная лингвисти ка» (“computational linguistics”) употребляется, пожалуй, даже чаще, чем «математическая лингвистика». Эта область лежит на пересече нии лингвистики и информатики. Сфера ее интересов — разработ ка и применение компьютерных методов моделирования и иссле дования естественных языков (автоматический перевод, анализ письменных текстов и разговорной речи, естественно языковое взаимодействие человека с компьютером, компьютерное моделиро вание лингвистических теорий, имитация языковых функций в рамках искусственного интеллекта и т.д.).

Ход истории не внес единства в понимание предмета математи ческой лингвистики. Исследования продолжают активно разви ваться (по крайней мере, количественно), появились сотни форма лизованных языковых моделей, очень разнородных по устройству и назначению. Их, правда, относят к разным областям знания: к ло гике, философии, когнитивным наукам, искусственному интеллек ту, математической, компьютерной, вычислительной лингвисти кам. Полезным образом ориентироваться во всей этой массе край не затруднительно.

Итак, историю математической лингвистики удобно разделить на три этапа:

n1950 е — конец 1960 х годов. Построение формального описа ния языка (предназначенного, прежде всего, для автоматичес кого перевода) кажется вполне реальным и достижимым в обо зримом будущем. В качестве объекта описания рассматривает ся либо язык в целом, либо его фрагменты, богатые в языковом отношении. Исследования в этом направлении вызывают ак тивный интерес лингвистов. Многие из предложенных в то время идей оказались весьма продуктивными и вошли в арсе нал лингвистических исследований и методов.

107

nКонец 1960 х — 1980 е годы. Осознана сложность формального описания языка в целом, во всем его многообразии. Работа в этой области в меньшей степени финансируется государством и, соответственно, менее активна.

nКонец 1980 х годов — настоящее время. Запрос времени, в зна чительной степени обусловленный прогрессом в сфере компь ютерных технологий, побудил продолжить разработку новых методов автоматического перевода, диалога с компьютером11, реферирования, создания баз данных, распознавания речи, се мантического поиска в Интернете. Объектами описания слу жат ограниченные (по сложности используемых языковых вы ражений и по тематике) фрагменты естественного языка. Их исследованием активно занимаются логики, представители «когнитивных наук», «искусственного интеллекта», филосо фы. Часть работ, использующих математические методы ис следования и моделирования языка, включают в сферу мате матической лингвистики, часть — нет. Среди математических теорий языка, никогда «официально» не причислявшихся к математической лингвистике, есть довольно известные и вли ятельные в сфере логико философских исследований. Такова, например, теория Ричарда Монтегю, формализующая пред ставления о содержательной стороне языковых текстов.

4.1.2. Функциональные модели языка

Лингвистика — это «наука о естественном человеческом языке вообще и о всех языках мира как индивидуальных его представи телях»12. «Язык вообще» — сущность ненаблюдаемая, «отдельные его представители», будучи составляющими человеческого созна ния, — тоже. Что же описывает лингвистика?

Утверждение о том, что внутреннее устройство языка непос редственно не наблюдаемо, казалось бы, очевидно, даже триви

11Каковой можно считать частным случаем автоматического перевода: всякий диалог — это перевод с одного индивидуального языка на другой.

12Лингвистический энциклопедический словарь. М.: Сов. энцикл., 1990.

С.618.

108

ально. Наблюдать можно только проявления языка в речи. Одна ко в литературе часто можно встретить рассуждения, явно или не явно полагающие обратное, т.е. формулирующие утверждения о реальном устройстве языка не как одну из возможных гипотез, а как нечто очевидное и не подлежащее сомнениям. Это обстоя тельство, например, надо иметь в виду при знакомстве с рассужде ниями Хомского и его единомышленников о том, что порождаю щие грамматики отражают реальные процессы владения языком.

Носители языковых знаний — люди, язык — психическая сущ ность, которая проявляется в определенных состояниях челове ческого сознания: в восприятии или производстве осмысленных языковых текстов (слов, предложений и т.д.). Мы не можем непос редственно наблюдать устройство и механизмы функционирова ния этих состояний сознания. О языке можно судить только по косвенным наблюдениям: связывая его либо с поведением, либо с мозгом человека.

Поэтому изучение речевого поведения, подвергающее те или иные языковые составляющие экспериментальному исследованию, может трактоваться только как косвенное подтверждение гипотез о форме реального воплощения этих структур в сознании или мозге человека. В частности, именно такова корректная оценка результа тов нейролингвистических исследований, устанавливающих корре ляции между устройством языка и устройством мозга13.

Существует ряд экспериментальных результатов, дающих ос нование предположить, что составляющие языка (элементы, структуры, процессы) имеют определенные материальные корре ляты (характеристики поведения14 или мозга), поэтому, наблюдая над вторыми, можно делать достоверные заключения о первых. Однако такое предположение — лишь гипотеза.

Принятие / непринятие этой гипотезы тесно связано с реше нием так называемой психофизической проблемы — проблемы

13Об этих результатах можно прочитать в работах Л.С. Выготского, А.Р. Лу рии, А.Н. Леонтьева, Д. Слобина и Дж. Грин и в многочисленных публика циях, основывающихся на развитии их взглядов.

14Если анализируется поведение, а не мозг, то обычно все равно предпо лагается, что в конечном итоге наука когда нибудь установит зависимость со ставляющих языка от составляющих мозга.

109