
Тестелец, Введение в общий синтаксис
.pdf
Часть 2. Синтаксические теории
косвенного дополнения. Правило сдвига гласит, что ИГ прямого дополнения, включающая достаточно много слов, может занять позицию правее косвенного дополнения: (9) а.
Не [vР donated [NP the beautiful desk dating from the early Victorian period] [PP to charity]] 'Он преподнес прекрасный рабочий стол, относящийся к раннему викторианскому пе риоду, благотворительной организации'; ~> б. Не [VP donated
[РР to charity][NP the beautiful desk dating from the early Victorian period]].
(96) более компактно представляет структуру трех со ставляющих глагольной группы - СИС при таком порядке существенно меньше:
(9') а. [vр donated [NP the beautiful desk dating from the early Victorian
i
period] [pp to charity]]
6. [vp donated [PP to charity][NP the beautiful desk dating from the
early Victorian period]].
Глагол является первой составляющей и опознается за один шаг; кроме того, поскольку глагол — вершина, на нем идентифицируется глагольная группа. Осталось идентифи цировать две другие ее непосредственные составляющие. NP опознается по своему первому слову — артиклю the, так: как над артиклем может доминировать только NP. Предложная группа опознается также по своему первому слову — предло гу to, который недвусмысленно указывает, что узел, домини рующий над ним, - PP. В (9а) вторая составляющая глаголь ной группы опознается по второму слову, но чтобы «доб раться» до третьей ОИК, надо пройти еще 8 слов длинной ИГ. Таким образом, СИС для глагольной группы в (9а) включает 11 слов - 3 ОИК и 8 в промежуточном отрезке, который приходится включить в СИС, так как он распола гается между второй и третьей ОИК. В (96) порядок слов по зволяет быстрее проанализировать глагольную группу, так как СИС состоит всего из 4 слов.
Итак, некоторые порядки составляющих сравнительно с другими сокращают число узлов, которые должны быть просмотрены для распознавания структуры непосредствен ных составляющих, и делают этот процесс более быстрым и эффективным, поскольку то же количество информации из-
704

Глава XV. Функциональная синтаксическая типология
влекается из меньшего по длине отрезка. Хокинс предполо жил, что сокращение СИС является мотивом возникновения в английском языке «сдвига тяжелой ИГ». Не случайно, что это правило формулируется в терминах, характерных не для грамматики, а для области «употребления»: например, оно не устанавливает точное число слов в ИГ прямого дополне ния, которое нужно для того, чтобы мог произойти его сдвиг правее предложной группы.
Хокинс подсчитал по текстам сравнительный порядок более длинной и более короткой предложной группы в анг лийском языке, если они обе являются сестрами в глаголь ной группе. Результат оказался ожидаемым — в 90% случаев более короткая предложная группа предшествовала более длинной: (10) a. The raven [у? flew [PP through the barn] [PP into the blue but slightly overcast sky]] 'Ворон вылетел через амбар в синее, но несколько облачное небо'; б. The raven [vp flew
[рР into the blue but slightly overcast sky] [PP through the barn]]:
(10') a. [vp flew [pp through the barn] [pp into the blue but slightly overcast sky]].
6. [vp/few [Pp into the blue but slightly overcast sky] [PP through the
barn]].
СИС для глагольной группы в (10а) от глагола до вто рого предлога включает 5 слов, а СИС (106) - 9 слов, чем и объясняется тенденция коротких предложных групп зани мать позицию перед длинными.
Уже знакомое нам по главе XI 1.1 «передвижение час тицы» от английского глагола тем менее вероятно встретить в тексте, чем большее число слов оказывается между глаго лом и частицей. Здесь частица выступает как составляющая глагольной группы, и чем дольше адресату приходится ждать ее появлек тем хуже оценивает предложение носитель языка и тем реже оно встречается в реальной речи:
(11) a. Joe [vp[v looked] [P up] [NP the number]]
'Джо посмотрел номер',
б. Joe [vp[v looked] [NP the number] [P up]]
I I
705

Часть 2. Синтаксические теории
'Джо посмотрел на номер билета, который Мэри забыла'. Анализ проходит тем успешнее, чем короче длина СИС. В (11) она должна включить в себя глагол (вершину глагольной группы), артикль (ОИК именной группы допол нения) и частицу. Однако в зависимости от числа слов в ИГ порядок с передвижением частицы будет более или менее приемлемым, так как с увеличением числа слов в ИГ растет
и размер СИС для глагольной группы.
Можно ли «измерять» приемлемость некоторого поряд ка слов количеством слов в СИС? По-видимому нет. Напри мер, СИС для сочиненной ИГ может быть сколь угодно большой в зависимости от числа конъюнктов:
(12) ИГ
Структуры типа (12) не представляют никакой трудно сти для анализа, невзирая на сколь угодно большой размер СИС для сочиненной составляющей - в зависимости от чис ла конъюнктов, которое может быть произвольным. Поэтому Хокинс предложил оценивать размер сферы идентификации некоторой составляющей X по отношению числа непосред ственных составляющих X к числу слов, входящих в сферу идентификации. Это соотношение он назвал коэффициентом раннего распознавания (Early Immediate Constituent ratio, или ЕЮ). По методу Хокинса нетрудно вычислить коэффициен ты для предыдущих примеров. Понятно, что чем меньше ко эффициент EIC, тем менее приемлемо предложение на
706
Глава XV. Функциональная синтаксическая типология
взгляд носителя языка и тем реже оно встречается в текстах. Для (9а) Е1С=3/11=0,27, для (96) Е1С=3/4=0,75; для (10а) Е1С=3/5=0,6; для (106) Е1С=3/9=0,33; для (11а) Е1С=3/3=1; дая (116) - 3/4=0,75; для (Ив) 3/7=0,43; для (Иг) 3/8=0,38; (Ид) 3/11=0,27 — плавное снижение коэффициента по мере увеличения длины цепочки слов между глаголом и частицей; для (12) Е1С=6/9=0,67, чем и объясняется ее безупречная приемлемость, несмотря на очень длинную СИС.
Очевидно, оптимальным режимом распознавания со ставляющей X будет такой, при котором каждая непосредст венная составляющая X распознается за однословный шаг — каждое слово в СИС является ОИК некоторой непосредст венной составляющей X. В таком случае коэффициент ран него распознавания максимален и равен 1.
2.3. Решение загадки лево- и правоветвящихся языков
Хокинс предположил, что тенденция к минимизации доли числа составляющих к числу слов в СИС имеет в язы ке три сферы проявления. Примеры из первой сферы мы уже видели - это область вариантов равно грамматически допустимых порядков (какие из них более, а какие менее приемлемы или насколько часто они встречаются в речи). Отметим, что до сих пор наблюдения Хокинса не вступали в конфликт с идеологией ПГ, так как Хомский всегда призна вал, что факторы употребления (в том числе проблемы с синтаксическим анализом при восприятии той или иной конструкции) способны влиять на приемлемость предложе ний и на частоту их употребления.
Вторая сфера явлений, в которых проявляется открытая Хокинсом тенденция к раннему распознаванию, - универса лии порядка слов. В главе X п. 3 упоминалось, что большин ство языков принадлежит к одному из двух классов — левоветвящихся, в которых ветвящееся зависимое предшествует вершине, и правоветвящихся, в которых ветвящееся зависи мое следует за вершиной.
Это обобщение, восходящее к Л. Теньеру и Дж. Гринбергу, впервые точно сформулировал М. Драйер [Dryer 1988; 1992]. Он показал, что не которые виды зависимых, для которых ветвление нетипично (прилага тельные, указательные местоимения, отрицание, приложения), не подчи няются данной закономерности, так что, например, расположение прила-
707
Часть 2. Синтаксические теории
гательного относительно существительного еще ничего не говорит о том, принадлежит ли данный язык к классу левоили правоветвящихся.
Выясняется, что языки правого и левого ветвления ве дут себя в отношении расположения длинных составляющих, «создающих проблемы» для скорости распознавания, по-раз ному. Например, в английском языке чем длиннее придаточ ная клауза, тем больше вероятности, что она окажется в кон це, а не в начале предложения, а в левоветвящемся японском языке наоборот — чем длиннее придаточное, тем скорей оно будет стоять в начале предложения, а не в его конце.
Рассмотрим пример из японского языка:
(13) а. Мэри-га кино: Дзён-га кэкконсита то итта
Мэри вчера Джон-ИМ женился что сказала
б. Кино: |
Дзён-га |
кэкконсита |
то |
Мэри-га |
итта |
Вчера |
Джон |
женился |
что |
Мэри |
сказала |
'Мэри сказала, что Джон вчера женился'. |
|
В (13а) сфера идентификации предложения равна всему предложению: идентификация начинается с первой непосред ственной составляющей — подлежащего Мэри-га и заканчива ется сказуемым итта. В (136) дело обстоит иначе: предложение начинается с придаточного, которое выглядит точно так же, как главное предложение {Кино: Дзён-га кэкконсита 'Вчера Джон женился'). Адресат догадывается о том, что перед ним прида точное, только дойдя до союза то. Союз представляет собой ОИК придаточного предложения, и сфера идентификации главного предложения начинается с него и включает три слова. Понятно, что (136) будет тем более приемлемо по сравнению с (13а), чем больше слов будет включать в себя придаточное. Чис ло слов в придаточном не имеет никакого значения для режи ма распознавания (136) — сколько бы их там ни было, СИС главного предложения начинается с союза. Однако число слов в придаточном имеет существенное значение для режима рас познавания (13а), поскольку это предложение начинается с подлежащего, за которым следуют сентенциальное дополнение и глагол; расстояние между первым и последним и соответст венно СИС будет тем больше, чем больше слов в придаточном.
Рассмотрим еще один пример из языка левого ветвле ния. В грузинском языке, как это и должно быть в языке та кого типа, определение, выраженное посессивной ИГ в род. п., предшествует определяемому существительному:
708
Глава |
XV. |
Функциональная синтаксическая типология |
|
(14) |
im |
problem-is |
amoxsna |
|
этот.КОСВ проблема-ГЕН решение.НОМ |
||
|
'решение этой проблемы' |
|
Однако если посессивная ИГ включает в себя, напри мер, относительное придаточное, включающее много слов3,
препозиция посессивной ИГ затруднена: |
|||
(15) а. ? [иг im |
|
problem-is, |
romelic didixania |
этот. КОСВ |
проблема-ГЕН которая давно |
||
gv-acuxeb-s,] |
|
amoxsna |
|
l.MH.OB-беспокоить-З.ЕД.СУБ решение |
|||
б. amoxsna [иг |
im |
problem-isa, romelic didixania |
|
решение |
этот. КОСВ проблема-ГЕН которая давно |
||
gv-acuxeb-s] |
|
|
|
l.MH.OB-беспокоить-З.ЕД.СУБ
'решение той проблемы, которая давно нас беспокоит' Приемлемой перифразой (15а) оказывается (156) с пе ренесением посессивной ИГ в постпозицию, вопреки обще му правилу. Пример (15) показывает, что расстояние между вершиной анализируемой ИГ (amoxsna 'решение') и верши- ной-ОИК ее непосредственной составляющей (problem-is 'проблемы') не должно быть слишком большим. Чем боль ше расстояние, тем больше слов включает СИС и тем мень
ше коэффициент раннего распознавания.
Итак, максимально быстрое распознавание синтакси
ческой структуры |
происходит при |
м а к с и м а л ь н о |
близком р а с п о |
л о ж е н и и вершин |
последовательно |
вложенных составляющих. В этом выводе и заключается раз гадка деления языков на классы лево- и правоветвящихся.
Рассмотрим последовательное вложение нескольких со ставляющих, каждая из которых состоит из вершины и вет вящегося зависимого. Возьмем составляющую С, которая не посредственно доминирует над Q и Cj. Допустим, что Cj — зависимое. Если С[ начинается с вершины и, таким образом, опознается по своей левой периферии, то оптимальным бу дет порядок с правым ветвлением CjCi (16а), так как ветвя щееся зависимое внутри Ci не попадет в сферу идентифика ции составляющей С Если же вершина стоит в конце Cv то, наоборот, предпочтительнее порядок с левым ветвлением CiCj
3В грузинском языке, как и примерно в половине языков левого ветвления, относительное придаточное, вопреки общему принципу, не предшествует определяемому существительному, а следует за ним. Достаточно убедитель ное объяснение этого факта см. в [Hawkins 1990: 252—257].
709

Часть 2. Синтаксические теории
(166) — тогда ветвящаяся часть Ci не попадет в сферу иденти фикации составляющей С, поскольку идентификация С нач нется с вершины, находящейся на правой периферии G:
Таким образом, при правом или левом ветвлении Ci оптимальным порядком для С оказывается также соответст венно правое или левое ветвление.
Перейдем на уровень ниже:
Порядок CiCj оптимален в том случае, если вершиной Ci является Ci", а не Cj'. Но в таком случае и составляющая Ci' должна распознаваться по своей правой периферии, ина че оптимальным не будет порядок Ci'Ci" - если Ci' начина ется не с зависимого, а с вершины, то сферу идентификации составляющей Ci «загромоздит» ветвящееся зависимое в Ci'. Итак, левое ветвление Ci оптимально при условии левого ветвления его зависимого C'.
В случае правого ветвления (176) рассуждения совер шенно аналогичны:
[хочет |
{получить |
к |
[доме |
\пришел |
[за |
\ кофта |
|
{консультацию по поводу обмена]]] {друзей своего отца]]] {книгой, которую ему оставили]]] {пуговицами из перламутра]]]
710
Глава XV. Функциональная синтаксическая типология
Таким образом, при последовательном вложении со ставляющих разных фразовых категорий, которые состоят из
вершин |
и ветвящихся зависимых, о п т и м а л ь н ы м с |
точки |
з р е н и я р а с п о з н а в а н и я с и н т а к с и ч е |
ской структуры будет такой порядок, при котором вершины либо всегда предшеству ют, либо всегда следуют за в е т в я щ и м и с я за висимыми . Если принять, что языков с оптимальными порядками слов должно быть больше, чем языков с неопти мальными порядками, получает объяснение факт распреде ления подавляющего большинства языков мира на два клас са — левоветвящиеся и правоветвящиеся.
2.4. Факты грамматикализации «хороших» порядков
Хокинс особо отмечает, что грамматические правила могут «пересиливать» требования системы употребления. Например, отделяемые приставки в немецком языке, в от личие от английских отделяемых частиц, способны отры ваться от своего глагола на произвольное расстояние; жест кие правила порядка слов нередко приводят к очень не удобному режиму распознавания и соответственно малому коэффициенту EIC. Так, во французском языке длинное относительное придаточное, определяющее подлежащее, делает распознавание предложения в целом очень неудоб ным, но правила порядка слов не разрешают никакого дру гого расположения подлежащего и определения к нему:
(18) La citerne, qu' il fit creuserpar un architecte dont une reclame lui avait donne I'addresse, s'ecroula 'Водоем, который он по ручил вырыть архитектору, адрес которого он узнал из ре кламы, обрушился' [Гак 1989: 168]. Однако, что немало важно, предпочтения, создаваемые системой распознава ния, могут грамматикализоваться. Это значит, что из не скольких порядков грамматика закрепляет именно тот, ко торый является оптимальным с точки зрения скорости рас познавания. Например, в немецком языке дополнение, вы раженное местоимением, должно предшествовать дополне нию, выраженному полной ИГ, причем не важно, какое из двух дополнений прямое, а какое косвенное (19) a. gab ihr das Buck 'дал ей (APT) книгу'; б. gab es dem Madchen 'дал ее (APT) девушке'; в. *gab das Buck ihr, r. *gab dem Madchen es.
711

Часть 2. Синтаксические теории
Грамматикализация порядка «местоимение + ИГ», конеч но, связана с тем, что местоимение, в отличие от ИГ, не ветвится и не увеличивает СИС для глагольной группы (глагол — вершина первого дополнения — вершина второго дополнения).
Хокинс рассмотрел порядок двух определений к суще ствительному (N) - прилагательного (Adj) и придаточного относительного на представительной выборке языков мира. При этом он учитывал и внутреннюю структуру придаточно го относительного, т. е. какое положение в нем занимает со юз, союзное слово или какой-то их аналог - в начале при даточного (CompS) или в его конце (SComp). Из логически возможных 12 порядков оптимальными для распознавания являются 4, так как в них коэффициент раннего распозна вания равен 1:
(20)
а.[фильм] [хороший] [который я вчера видел]
б.[хороший] [фильм] [который я вчера видел]
I |
I |
•-г |
в.[я вчера видел который] [хороший] [фильм]
г.[я вчера видел который] [фильм] [хороший]
Выясняется, что практически все языки, попавшие в выборку Хокинса, разделились по четырем оптимальным ти пам. К типу (20а) относятся, например, романские, араб ский и эве; к типу (206) - русский, германские, финский; к типу (20в) — японский, тамильский, турецкий и к типу (20г) — баскский, бирманский и абхазский. С большим сом нением к неоптимальному типу N adj [SComp] можно отне сти мертвый шумерский язык и лушеи (сино-тибетская семья), а к типу AdjN [SComp] - мертвый хурритский. Что же касается шести оставшихся типов, в которых коэффици ент раннего распознавания самый низкий, то языков, в ко торых бы имел место соответствующий порядок в качестве основного, не нашлось вовсе.
Еще один пример грамматикализации оптимального порядка — способность составляющих разного вида появ ляться между предлогом и существительным-вершиной той ИГ, которой он управляет ([РР Р [NP N...]). Ясно, что чем длиннее составляющая, тем менее оптимален порядок. Ре-
712
Глава XV. Функциональная синтаксическая типология
зультат оказался вполне предсказуемым. Примерно полови на языков в выборке (например, арабский и тайский) разре шают поместить между предлогом и существительным ука зательное местоимение; остальные языки (масаи, испан ский...) разрешают также и прилагательное. Ветвящееся за висимое - посессивную ИГ - разрешают в этой позиции только 12% языков в выборке (например, австралийский язык маунг). Наконец, всего 1% языков разрешает ставить между предлогом и существительным самое длинное зависи мое - придаточное предложение (амхарский).
Хокинс обратил внимание также на то, что все языки с порядком слов VOS (глагол-сказуемое + прямое дополнение 4- подлежащее) обязательно располагают сентенциальное прямое дополнение после подлежащего. Например, в мала гасийском языке:
(21) a. Mihevitra Rabe |
[s'fa |
mitady |
ny |
zaza |
Rasoa] |
|
думает |
Рабе |
что |
ищет |
APT |
ребенка |
Расоа |
'Рабе думает, что Расоа ищет ребенка'. |
|
|||||
б. * Mihevitra [s |
fa mitady ny zaza Rasoa] Rabe |
|||||
думает |
что |
ищет |
APT |
ребенка Расоа |
Рабе |
Несмотря на то что порядок (21а) нарушает схему VOS, именно он, и только он, является грамматичным, а не соот ветствующий этой схеме порядок (216). Причина здесь в том, что придаточное предложение, «вклинившись» между элементами главного, значительно увеличивает его СИС и соответственно понижает коэффициент раннего распознава ния.
Другим примером обязательной грамматикализации под влиянием факторов распознавания речи может служить обязательная экстрапозиция придаточного - прямого до полнения — в немецком языке, чтобы не увеличивать СИС для клаузы:
(22) a. |
Er |
kann |
deine |
Worte |
nicht |
verstehen |
|||||
|
он |
может |
твои |
слова |
не |
|
понять |
||||
|
'Он не может понять твоих слов'. |
|
|
|
|||||||
в. |
Еr |
капп |
nicht |
verstehen, |
[was |
|
du |
sagst] |
|||
|
он |
может |
не |
понять |
что |
|
|
ты |
говоришь |
||
|
'Он не может понять, что ты говоришь'. |
|
|
|
|||||||
г. |
*Еr |
капп |
\was |
du |
sagst] |
|
nicht verstehen |
||||
|
он |
может |
что |
ты |
|
|
|
|
не |
понять |
|
|
|
говоришь |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
713