Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Timofeeva_M._Yazyk_s_pozitsiy_filosofii_psikhologii_matematiki-1

.pdf
Скачиваний:
22
Добавлен:
19.11.2019
Размер:
1.03 Mб
Скачать

П Р И М Е Р 4.

Все студенты данной группы уважают друг друга52

Введем предикаты:

студент(х) — истинен для всех таких элементов универсума, ко торые обладают свойством ‘быть студентом данной группы’, для всех остальных элементов универсума этот предикат ложен;

уважать(х, у) — этот двухместный предикат истинен для всех таких упорядоченных пар элементов универсума, компоненты которых связаны между собой отношением ‘уважать’ (х — тот, кто уважает, у — тот, кого уважают); для всех прочих пар эле ментов универсума этот предикат ложен.

Формула для данного предложения такова:

>х>у[(студент(х) студент(у))

уважать(х, у)].

Как и во всех предыдущих примерах, вместо аргументов х и у мо гут быть подставлены любые элементы универсума. Это означает, что при одной подстановке переменная х может принять значение Ива( нов, а при другой подстановке — переменная у может принять значе ние Иванов. Наличие квантора всеобщности говорит о том, что рас сматриваются все возможные подстановки. Поэтому для описанной в предложении ситуации верно следующее: каких бы двух студентов данной группы мы ни выбрали, первый из них уважает второго, а второй — первого, кроме того, каждый из них уважает сам себя (так как возможна такая подстановка переменных, при которой вместо х и вместо у подставляется одно и то же значение).

Предложение имеет ту же синтаксическую структуру, что и следующее предложение из примера 5, но для описания смысла этих предложений надо использовать разные формулы.

П Р И М Е Р 5.

Все древние ящеры пожирали друг друга

Введем два предиката: один одноместный и один двухместный:

52 Предложения, анализируемые в Примерах 4, 5, взяты из книги: Непей вода Н.Н. Прикладная логика: Учеб. пособие. Ижевск, 1997.

160

ящер(х) — этот предикат истинен для всех таких элементов уни версума, которые обладают свойством ‘быть древним ящером’, для всех остальных элементов универсума этот предикат ложен;

пожирать(х, у) — этот двухместный предикат истинен для всех таких упорядоченных пар элементов универсума, компоненты которых связаны между собой отношением ‘пожирать’ (х — пожирающий, у — пожираемый); для всех прочих пар элемен тов универсума этот предикат ложен.

Формула, отображающая смысл предложения, такова:

>х у[(ящер(х) ящер(у)) (пожирать(х, у) пожирать(у, х))].

Иначе говоря, для любого ящера х найдется такой ящер у, что либо х пожирал у а, либо у пожирал х а. Если мы хотим отразить еще и тот факт, что ни один ящер не может пожирать самого себя, то формулу надо немного усложнить, введя дополнительный двух местный предикат:

совпадать(х, у) — истинен для всех таких упорядоченных пар эле ментов универсума, которые связаны отношением ‘совпадать’; для всех прочих пар элементов универсума этот предикат ложен.

Формула в этом случае такова:

>х у[(ящер(х) ящер(у) совпадать(х, у)) (пожирать(х, у) пожирать(у, х))].

Если бы мы построили формулу по образцу предыдущего при мера, то смысл был бы передан гораздо менее точно, так как это означало бы, что каждый ящер должен встретиться с каждым яще ром и не только пожирать того ящера, но и быть пожираемым им. Вряд ли при высказывании данного предложения может иметься в виду такой ирреальный смысл. Отношение ‘пожирать’, в отличие от отношения ‘уважать’, не мыслится как симметричное.

П Р И М Е Р 6.

Приглашение военных дружин вызвало осуждение рыцаря Ричарда

Этот пример (данный тип предложений взят из лекций И.А. Мель чука для студентов отделения математической лингвистики НГУ)

161

хорошо иллюстрирует возможности использования логического языка для разграничения альтернативных смыслов неоднозначного текста. Приведенное предложение неоднозначно, оно имеет 25 = 32 разных смысла. Эта цифра получается так. В предложении есть 5 не зависимых участков, имеющих по 2 разных смысла. Поскольку данные участки текста независимы, общее количество смыслов получается перемножением этих чисел. Неоднозначные участки таковы:

1.Приглашение: какое дополнение подразумевает это слово (субъект или объект действия)? Иначе говоря, некто пригласил военные дружины или же, наоборот, сами дружины кого то пригласили?

2.Вызвало: каков порядок расположения субъекта и объекта дей ствия в тексте? Приглашение было вызвано осуждением или наоборот?

3.Осуждение: аналогичный вопрос. Рыцарь кого то осудил или же был осужден сам?

4.Военных дружин: какое из этих слов выступает в функции опре деления? Речь идет о военных дружинах (второе слово опреде ляется первым) или же об отдельных военных людях — выход цах из разных дружин (первое слово определяется вторым)?

5.Рыцаря Ричарда: вопрос аналогичный. Идет ли речь о рыцаре по имени Ричард или же о вассале некоего Ричарда?

Теперь посмотрим, как указанные выше различия смысла мож но было бы отобразить в логическом языке. Рассмотрим перечис ленные пять неоднозначностей в том же порядке.

1.Для различения первых двух смыслов можно ввести два одно местных предиката:

приглашение 1(х) — истинен для всех таких элементов универ сума, которые обладают свойством ‘быть приглашенным’; для всех остальных элементов универсума этот предикат ложен;

приглашение 2(х) — истинен для всех таких элементов универ сума, которые обладают свойством ‘быть приглашающим’; для всех остальных элементов универсума этот предикат ложен.

162

Если некто пригласил военные дружины, то выбираем первый предикат, если сами дружины кого то пригласили, то второй.

2.Выбор смысла зависит от того, который из следующих двух предикатов будет использован:

вызывать 1(х, у) — истинен для всех таких упорядоченных пар элементов универсума, которые связаны отношением ‘вызы вать’ (х — субъект, у — объект отношения); для всех прочих пар элементов универсума этот предикат ложен;

вызывать 2(х, у) — истинен для всех таких упорядоченных пар элементов универсума, которые связаны отношением ‘вызы вать’ (у — субъект, х — объект отношения); для всех прочих пар элементов универсума этот предикат ложен.

Если осуждение было вызвано приглашением, то выбираем первый предикат, в противном случае — второй.

3.В этом случае ситуация совершенно аналогична предыдущей, только вместо предикатов вызывать 1(х, у) и вызывать 2(х, у) надо будет использовать предикаты осуждать 1(х, у) и осуждать 2(х, у).

4.Выбор смысла зависит от того, какие из следующих предика тов будут использованы:

военный(х) — истинен для всех таких элементов универсума, которые обладают свойством ‘быть военным’, для всех осталь ных элементов универсума этот предикат ложен;

человек(х) — истинен для всех таких элементов универсума, которые обладают свойством ‘быть человеком’, для всех ос тальных элементов универсума этот предикат ложен;

дружина(х) — истинен для всех таких элементов универсума, которые обладают свойством ‘быть дружиной’; для всех ос тальных элементов универсума этот предикат ложен;

принадлежит(х, у) — истинен для всех таких упорядоченных пар элементов универсума, компоненты которых связаны между собой отношением ‘принадлежать’ (х принадлежит у ку); для всех прочих пар элементов универсума этот предикат ло жен.

163

Следующие две формулы соответствуют двум разным смыслам словосочетания военные дружины:

военный(х) дружина(х) — речь идет о военных дружинах;

человек(х) военный(х) дружина(у) принадлежит(х, у) — речь идет об отдельных военных людях — выходцах из разных дружин.

5.Выбор между данными двумя смыслами определяется тем, ка кие из следующих предикатов выбраны:

вассал(х, у) — истинен для всех таких упорядоченных пар эле ментов универсума, которые связаны отношением ‘быть васса лом’ (х является вассалом у а); для всех прочих пар элементов универсума этот предикат ложен;

рыцарь(х) — истинен для всех таких элементов универсума, ко торые обладают свойством ‘быть рыцарем’; для всех остальных элементов универсума этот предикат ложен;

Ричард(х) — истинен для всех таких элементов универсума, ко торые обладают свойством ‘быть Ричардом’; для всех осталь ных элементов универсума этот предикат ложен.

Следующие две формулы соответствуют двум разным смыслам словосочетания рыцарь Ричард:

рыцарь(х) Ричард(х) — речь идет о рыцаре по имени Ричард;

рыцарь(х) Ричард(у) вассал(х, у) — речь идет о вассале некоего Ричарда. Если считать, что в данном случае Ричард — это некий известный конкретный человек, то лучше поставить в соответ ствие данному слову не предикат, а константу логического язы ка. Тогда формула будет такая: рыцарь(х) вассал(х, Ричард).

Во всех приведенных выше примерах, по существу, строится перевод с естественного языка на логический язык. Такой перевод совсем непрост, существует множество проблем и нюансов, актив но обсуждаемых как логиками, так и лингвистами. Кроме того, применение логики для описания содержательной стороны есте ственного языка далеко не всегда состоит лишь в переводе. В част ности, логические средства продуктивны для анализа свойств пре суппозиций, для описания устройства обсуждаемого посредством

164

языка мира, для исследования семантики понятий, выражаемых посредством слов. Все названные вопросы также активно исследу ются и логиками, и лингвистами.

4.3. Статистические методы

Язык является объектом не только логических, но и статисти ческих исследований. Прежде чем кратко характеризовать эту об ласть, разграничим задачи статистики и лингвистики.

В первом случае задача состоит в описании частотных законо мерностей заданного материала, в данном случае — языковых тек стов. Исследователь может задаться вопросом о том, как выявить, описать, оценить частотные характеристики, свойственные этому материалу. Ответ на этот вопрос он будет искать в рамках матема тической статистики и теории вероятностей. Для лингвиста такой ответ содержательно не интересен, так как не объясняет, какие языковые явления составляют основу данных характеристик.

Лингвисту важно понять, почему данному языковому матери алу свойственны именно такие, а не иные вероятности, однако в рамках математической статистики такой вопрос неправомерен.

Иначе говоря, задача статистики — выявить количественные соотношения, вопрос об их качественном обосновании здесь, стро го говоря, неуместен. Для лингвиста же количественные соотноше ния — это лишь исходные данные, которые надо еще осмыслить и из которых предстоит сделать качественные выводы. Именно эти выводы (а не обусловившие их числовые соотношения) лингвист и будет считать основным результатом своего исследования. Парадокс состоит в том, что как только такие выводы сделаны, числа вообще перестают играть существенную роль. Существенными становятся отношения порядка, определяемые этими числами.

Основной вывод из сказанного таков. Прежде чем браться за подсчет частотных характеристик каких то языковых единиц, лингвисту уже надо иметь некоторую предварительную гипотезу относительно тех качественных соотношений, которые могут явиться их следствиями. Эта гипотеза и определяет, какие именно подсчеты он должен производить. Без нее подсчеты представляют интерес только для статистики и лишь случайно могут оказаться

165

интересными также и для лингвистики. Возникает вопрос: какие лингвистические гипотезы обычно служат основаниями для под счета частотных характеристик?

Для краткого ответа на этот вопрос перечислим то, что лингви стика числит среди результатов использования статистических ме тодов.

Результаты первого типа — методологические. Их цель — по нять, как следует выявлять такие количественные характеристики текстов, которые являются осмысленными, т.е. интерпретируемы ми в терминах лингвистики. Например, как подбирать тот корпус текстов, на котором будут производиться подсчеты (эти тексты должны быть в определенном отношении однородными, но каков формальный критерий однородности?). Как объединение текстов влияет на результаты исследования? Подобные вопросы очень ак туальны, в частности для корпусной лингвистики.

Результаты второго типа — эмпирические. Их цель — выявить числовые характеристики единиц языка или соотношения между такими характеристиками. Например, частоты встречаемости букв в русских литературных текстах, средние длины словоформ в раз ных языках53, зависимость между возрастом (временем возникнове ния) и длиной слова в слогах54, между рангом (порядковый номер слова в частотном словаре) и длиной слова в слогах55. Сюда же отно сится изучение количественных характеристик авторских или функ циональных стилей (художественного, публицистического, научно го и т.д.). Самый известный из эмпирических результатов — закон Эсту Ципфа Мандельброта, состоящий в следующем.

Пусть V = {w1, w2, w3, ..., wn } — словарь, в котором слова упоря дочены по убыванию частот их встречаемости в текстах, wr r е по порядку слово из этого словаря, n — частота встречаемости дан ного слова согласно словарю V. Порядковый номер r называется рангом слова wr (самое частое слово имеет ранг 1 и т.д.). Согласно закону Эсту Ципфа Мандельброта произведение частоты слова

53Пиотровский Р.Г., Бектаев К.Б., Пиотровская А.А. Математическая лингвистика. М.: Высш. шк., 1977. С. 120, 259.

54Арапов М.В., Херц М.М. Математические методы в исторической линг вистике. М.: Наука, 1974. С. 52.

55Арапов М.В. Квантитативная лингвистика. М.: Наука, 1988. С. 125.

166

на его ранг мало зависит от того, какое слово мы выбрали: эта ве личина почти одинакова для всех слов из V. Закон Эсту Ципфа Мандельброта формулирует только определенную тенденцию, он не абсолютен. Наиболее явственно данная закономерность на блюдается на самых частотных словах, для нечасто встречающих ся слов нередки отклонения.

Еще одна закономерность, обнаруженная Дж. Ципфом, связы вает время возникновения и частоту слова. Самые частые слова обычно оказываются наиболее древними. Ципф предположил, что эту зависимость можно использовать при исследовании истории языка. Здесь уместно перейти к другому типу результатов, получен ных путем применения количественных методов в лингвистике.

Результаты третьего типа — теоретические. Их цель — построе ние теории языка на базе количественных исследований. Самый из вестный результат такого рода — глоттохронология, предложенная американским лингвистом Морисом Сводешем в середине ХХ в.

В основе глоттохронологии лежат следующие пять постула тов56.

1.В словаре каждого языка можно выделить специальный фраг мент, называемый основной или стабильной частью (примерно 200 слов).

2.Можно указать список значений, которые в любом языке обя зательно выражаются словами из основной части (например, понятия «и», «все», «животные», «спина», «дерево», «больше»). Эти слова образуют основной список.

3.Доля слов из основного списка, которые сохранятся (не будут заменены другими словами) на протяжении некоторого интер вала времени t (год, столетие, тысячелетие и т.д.) постоянна (т.е. зависит только от величины t, но не от его выбора и не от того, слова какого языка рассматриваются).

4.Все слова из основного списка имеют одинаковые шансы со храниться (или не сохраниться) на протяжении этого интерва ла времени.

56 Арапов М.В., Херц М.М. Математические методы в исторической линг вистике. М.: Наука, 1974. С. 21—22.

167

5.Вероятность слова из основного списка праязыка сохраниться в основном списке языка потомка не зависит от его вероят ности сохраниться в аналогичном списке другого потомка.

Значение коэффициента сохранности слов основного словаря зависит от скорости развития языка и колеблется от 0,74 для быст ро развивающихся языков до 0,91 для стабильных языков (в сред нем 0,81).

Постулаты, сформулированные Сводешем (так же как законо мерности, обнаруженные Ципфом и другими авторами), конечно, не описывают процессы функционирования и исторического раз вития языка с абсолютной точностью. Эти гипотезы следует рас сматривать как утверждения о наличии определенных тенденций, свойственных языку. Однако, как уже говорилось, для лингвиста важны именно подобные качественные выводы, а не сами по себе количественные характеристики. Поэтому предложенная Своде шем теория языка продолжает привлекать интерес: критический анализ и развитие данной теории можно найти в ряде более по здних работ. В частности, подробное обсуждение ее возможностей и перспектив содержится в уже названной выше книге М.В. Ара пова и М.М. Херца.

168

5.ЗАКЛЮЧЕНИЕ

Вданном учебном пособии рассмотрены базовые позиции наиболее развитых, ставших (в своей сфере) уже классическими, направлений междисциплинарного исследования языка, находя щихся на стыке лингвистики и философии, психологии, матема тики. Это рассмотрение, конечно, не является исчерпывающим. Можно было бы говорить о других исследованиях, развивающих ся в рамках тех же областей, или же обратить внимание на сферы взаимодействия лингвистики с другими дисциплинами, здесь не затронутыми вообще или затронутыми лишь косвенно. Например, характеризовать современные цели и средства работы с языковы ми данными в области информатики. Однако понимание сути и возможностей таких средств должно базироваться на достаточно обширных предварительных знаниях и навыках, требующих само стоятельного рассмотрения. Здесь же можно лишь отметить, что наиболее распространенные в настоящее время компьютерные средства моделирования языка в существенной степени основыва ются на принципах устройства разных видов порождающих и ка тегориальных грамматик. Таковы, например, грамматики типа LFG (Lexical Functional Grammar), HPSG (Head Driven Phrase Structure Grammar), GPSG (Generalized Phrase Structure Grammar). Порождающие и категориальные грамматики в различных моди фикациях, в частности с элементами статистического анализа, за частую используются в системах автоматического анализа текстов естественного языка. Такие системы создают в целях автоматиза ции межъязыкового перевода, реферирования и т.д. С недавнего времени начали исследовать возможности построения самообуча ющихся систем машинного перевода, базирующихся на идее ста тистического анализа билингв: текстов, идентичных по смыслу, но написанных на разных языках. Подобные пары текстов в большом количестве имеются в странах с двумя государственными языка ми, в которых все официальные документы должны составляться сразу на двух языках. Это создает отличную экспериментальную

169