Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Синтаксис простого предложения.doc
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
688.13 Кб
Скачать

Формальные грамматики

Наиболее распространенный способ описания предложений заключается в перечислении их схем или образцов (не более нескольких десятков). Этот традиционный способ описания опирался на теорию членов предложения.

Многие современные теории грамматики используют более строгие понятия. При этом в теории часто используются математические объекты, которые обладают рядом свойств, общих с естественным языком, и тем самым до известной степени моделируют его.

Формальными грамматиками называются такие системы правил, которые математически строго задают (или характеризуют) множество цепочек, т.е. конечных последовательностей символов.

Каким образом можно представить в математически строгом виде правила построения синтаксических единиц?

Рассмотрим несколько русских ИГ:

а. игрушка

б. тетрадь

в. красивая игрушка

г. большая игрушка

д. красивая большая игрушка

е. большая красивая тетрадь

ж. большая красивая зеленая игрушка

з. эта игрушка

и. эта большая дорогая красивая игрушка

й. та большая зеленая красивая тетрадь

Назовем множество ИГ (а-й) N. Сформулируем правила на множестве N.

  1. Всякая цепочка вида П* С входит в N.

С – любой элемент множества {игрушка, тетрадь};

П – любой элемент множества {большая, красивая, зеленая, дорогая};

знак * (“звездочка Клини, по имени логика) означает, что отмеченный им элемент может быть повторен любое число раз от нуля до бесконечности.

2.Всякая цепочка вида М С’ входит в N.

М – любой элемент множества {эта, та};

C’ – любой элемент, принадлежащий множеству N в силу условия 1.

Цепочки, определяемые правилами 1) и 2), состоят из отдельных символов: игрушка, тетрадь, большая, эта и др.

Символы, из которых составлены цепочки, задаваемые правилами 1) и 2), называются терминальными, а множество таких символов – основным алфавитом.

Такие символы, как N, C, C’, M, П, которые используются при определении цепочек, но не входят в определяемые цепочки, называются нетерминальными (вспомогательными), и образуют вспомогательный алфавит.

Определение ИГ можно сформулировать также в виде правил, вида “ х → у”, что означает “заменить х на у” или “подставить у вместо х”, где х и у - любые цепочки символов:

а. N → C’

б. N → M C’

в. C’ → П С’

г. C’ → С

д. C’ → П С

е. С → игрушка

ж. С → тетрадь

з. П → большая

и. П → зеленая

й. П → красивая

к. П → большая

л. М → эта

м. М → та

Правила можно записать в одну строчку и использовать скобки. Скобки означают факультативность некоторой части правила: если два правила отличаются друг от друга только тем, что в одном из них содержится, а в другом отсутствует цепочка х, они записываются как одно правило, и при этом цепочка х берется в скобки. Так, вместо

а. N → C’

б. N → M C’

можно записать N → (M) C’, а вместо

г. C’ → С

д. C’ → П С

можно записать C’ → (П) С.

Можно упростить и запись

е. С → игрушка

ж. С → тетрадь

з. П → большая

и. П → зеленая

й. П → красивая

к. П → большая

л. М → эта

м. М → та, приняв, что если два правила отличаются только правыми или только левыми частями, то они записываются как одно, причем, несовпадающие правые (левые) части разделяются запятой. Так, вместо

е. С → игрушка

ж. С → тетрадь можно записать С → игрушка, тетрадь.

Вместо

з. П → большая

и. П → зеленая

й. П → красивая

к. П → большая можно записать П → большая, зеленая, красивая, большая.

Вместо

л. М → эта

м. М → та можно записать М → эта, та.

Правило “х → у” применяется следующим образом: в цепочке отыскивается левая часть правила, т.е. х, после чего записывается новая цепочка, отличающаяся от предыдущей только тем, что на месте х в ней стоит у. Правило порождающей грамматики может быть применено к любой цепочке, отрезком которой является его левая часть, но оно не обязано применяться ко всей “подходящей” цепочке, причем порядок применения правил произволен. Правило применяется либо к начальному символу, либо к такой цепочке, которая представляет собой результат применения одного или нескольких правил к начальному символу. Цепочки, задаваемые формальной грамматикой, должны целиком состоять из терминальных символов, т.е. все вспомогательные символы в ходе применения правил должны быть заменены на терминальные. Множество цепочек, задаваемых порождающей грамматикой, называется языком.

Языки, задаваемые некоторыми формальными грамматиками, проявляют определенные сходства с множествами единиц естественного языка – слогов, словоформ, синтаксических групп, предложений. Сопоставление языка, задаваемого формальной грамматикой, с множеством единиц естественного языка на основе наблюдаемых между ними сходств называется интерпретацией формальной грамматики.

Способ задания множества N с помощью приведенных правил представляет собой разновидность формальных грамматик – порождающую грамматику. Порождающей грамматикой называется упорядоченная четверка, состоящая из:

  • основного алфавита;

  • непересекающегося с ним вспомогательного алфавита;

  • одного символа из вспомогательного алфавита, который называется начальным символом и обозначает множество тех языковых объектов, для описания которых предназначена ГГ;

  • конечного множества правил.

Порождающей грамматикой называют также лингвистическую теорию, в которой используется это средство описания.

Сравним язык, задаваемый приведенными выше правилами с реально наблюдаемыми в русском языке ИГ. Лингвистический смысл символов С, П, М очевиден: это слова, обладающие грамматическими признаками жен. р., им. п., ед.ч.:

  • С – существительные,

- П – прилагательные,

  • М – указательные местоимения,

  • Аналог С’ в русском языке представляет собой фразовую категорию, в данном случае – множество составляющих, образованных сочетанием произвольного числа прилагательных с вершиной-существительным.

  • N – это множество некоторых ИГ русского языка.

Правила ГГ верно характеризуют часть свойств русских ИГ, а именно такие:

  • ИГ включает в себя ровно одну вершину-существительное, а определений к нему может быть несколько, и они факультативны.

  • Прилагательные и указательные местоимения в русском языке обычно предшествуют определяемому существительному,

  • причем указательное местоимение может быть только одно,

  • оно предшествует прилагательному.

  • Определений-прилагательных может быть несколько,

  • причем, по-видимому, какой бы длинной ни была ИГ, в нее всегда теоретически можно добавить еще одно прилагательное.

Рассматриваемая формальная грамматика принадлежит к классу бесконтекстных (контекстно-свободных) грамматик, т.е. таких, в которых разрешены лишь правила, в левых частях которых содержится один символ.

Рассмотрим бесконтекстную грамматику, задающую предложения (исходный символ S) и включающую следующие правила:

а. S → NP VP

б. NP → (D) (A) (A) N (PP)

в. VP → V (NP) (PP)

г. PP → P NP

д. D → the, some

е. A → big, brown, old

ж. N → birds, fleas, dog, hunter

з.V → attack, ate, watched, sings, sing

и. P → for, beside, with

Cимвол

NP обозначает ИГ (noun phrase),

VP – обозначает глагольную группу (verb phrase),

PP – обозначает предложную группу (preposition phrase).

Приведенные правила успешно моделирует фрагмент английской грамматики, выражая, например, структуру предложения The big brown dog with fleas watched the birds beside the hunter. Этому предложению соответствует следующее синтаксическое дерево:

S

NP VP

D A A N PP V NP PP

the big brown dog P NP watched D N P NP

with N the birds beside D N

fleas the hunter

ПОРОЖДАЮЩАЯ ГРАММАТИКА

ГГ (ПГ) – научное направление, сменившее структурализм.

Структурализм представляет язык в виде единиц и связывающих их отношений, причем эти единицы и отношения, сводимые в конечном счете к небольшому множеству неразложимых элементов, образуют организованную структуру, похожую на кристалл, атом или систему планет.

Структурализм способствовал тому, что лингвисты по образцу математики и естественных наук разработали точные и эксплицитные методы анализа материала. Однако, как и в доструктуралистский период, их усилия направлялись главным образом на создание лингвистических описаний. При этом упускалось из виду, что основная цель разработки формальных моделей в естественных науках – объяснение наблюдаемых фактов. ПГ явилась одной из первых серьезных попыток со стороны лингвистов создать в рамках традиции научного теоретизирования содержательную теорию языка.

Хомский предложил перейти от практики строгих и точных описаний материала в виде списков единиц и связывающих их отношений к решению объяснительных задач – обнаружению законов, лежащих в основе устройства любого естественного языка.

Одним из очевидных умений, свойственных носителю любого языка, является умение отличать правильные предложения, слова или сочетания слов от неправильных. Способность носителей языка отличать правильные предложения от неправильных, а также понимать значения правильных предложений, Хомский называет компетенцией носителя языка. Способность людей порождать и понимать предложения, которые они никогда не слышали и не читали, Хомский рассматривает как одно из проявлений творческого аспекта языковой способности.

ПГ характеризует компетенцию носителя языка на метаязыке формальной грамматики. Правилами формальной грамматики порождаются все те и только те грамматические структуры, которые лежат в основе грамматически правильных предложений естественного языка. В результате моделируется способность говорящего судить о правильности, многозначности и синонимии предложений.

Истинная цель ПГ – не создать машину для грамматического описания, а эксплицировать само понятие грамматики естественного языка.

На ранних этапах ПГ для характеристики грамматически правильных предложений использовался механизм порождения, когда с помощью некоторых правил, применяемых к начальному нетерминальному символу S (предложение), выводились все те и только те цепочки (и их структурные описания), которые являются правильными предложениями естественного языка. В теперешних вариантах ПГ порождение выглядит как процесс «сборки» правильных предложений из единиц словаря. Такие описания не следует рассматривать как модели реального порождения предложений говорящим, т.е. производства речи. Это всего лишь заимствованные из математики способы задания множества элементов, и их сходство с реальными механизмами «порождения» высказываний - чисто метафорическое («генеративная метафора»).

«Стандартная теория»

В качестве формального аппарата представления синтаксической структуры ПГ использует структуру составляющих.

Правила грамматики составляющих являются контекстно-свободными.

Правила грамматики составляющих определяют внутреннюю структуру фразовых категорий, причем контекстная свобода правил обеспечивает независимость структуры фразовых категорий от положения, занимаемого ими в структуре непосредственно составляющих.

Компонент, содержащий правила грамматики, называется базовым. Кроме базового компонента, грамматика включает трансформационный компонент. (Трансформационный метод был разработан учителем Хомского З.Хэррисом). Трансформационный компонент, согласно Хомскому, применяется к репрезентации, возникающей на выходе правил грамматики составляющих. Структура, которая подвергается трансформации, называется глубинной структурой (deep structure), а структура, которая является результатом применения трансформации (или некоторого множества трансформаций) – поверхностной структурой (surface structure).

Описание трансформации состоит из двух частей:

  • описания структуры, к которой трансформация может быть применена (структурное описание, structural description, SD);

  • описания результирующей структуры, возникающей после применения трансформации (структурное изменение, structural change, SC).

Например, трансформация инверсии меняет местами ИГ подлежащего и первый из цепочки вспомогательных или модальных глаголов (Aux).

Инверсия

SD: NP Aux Y

1 2 3

SC: 2+1 Ø 3

(Ø означает пустую цепочку на месте выдвинутого Aux).

Например:

John can open the door

Can John open the door?

Развитием теории структуры составляющих является «икс-штрих теория». Суть этой теории заключается в следующем. Принципы построения фразовых категорий едины, а различия между ними полностью сводятся к различиям между классами вершин. Если обозначить вершину через Х, то фразовая категория, содержащая Х в качестве своей вершины и непосредственно составляющей, может быть обозначена как X’ (икс-штрих), а та фразовая категория, которая содержит X’ в качестве непосредственно составляющей и Х в качестве вершины, обозначается X’’ икс-два штриха). Х’ и Х’’ называются проекциями вершины Х: Х’ – первой проекцией, а X” – второй проекцией.