
ср. типология умк / гринберг_квантитативный
.docxПредлагаемый здесь метод базируется на классификации Сепира, представленной в переработанной форме. Основные критические замечания в адрес Сепира, уже высказанные Моустом (1948, стр. 183-190), сводятся в целом к двум.
Первое и наиболее важное замечание заключается в том, что в своем делении языков на четыре основных типа Сепир, казалось бы, говорит о понятиях, но в действительности исходит из формальных критериев, а не из семантических - обстоятельство, которое приводит к некоторым трудностям при изложении материала. Например, Сепир рассматривает понятие множественности, которое он считает в высшей степени абстрактным. Однако, как он указывает, в каком-либо конкретном языке оно может быть помещено в любом месте вдоль шкалы I-IV. Следовательно, является ли множественность понятием корневым (I), деривационным (II) или реляционным (III и IV), зависит от того, к какому формальному классу тот или иной конкретный язык ее причисляет. Сепир сам признает это несоответствие. "Мы не можем заранее сказать, куда следует поместить то или иное понятие, именно потому, что наша классификация понятий представляет собой скорее скользящую шкалу, чем философский анализ опыта" (1921, стр. 117). В типологической классификации, предлагаемой в настоящей статье, исходный пункт является формальным. Мы признаем, что в силу действительно существующей тенденции корневые морфемы (I у Сепира) обычно более конкретны по значению, чем деривационные (II у Сепира) или словоизменительные морфемы (III или IV); однако эта тенденция слишком расплывчата, чтобы на ней можно было строить обоснованную методику. В данном случае, так же как в современной лингвистике вообще, мы выделяем наши дистинктивные единицы при помощи формального, а не семантического критерия по чисто практическим соображениям.
Второе критическое замечание относится к шкале Сепира: а) изолирующие; b) агглютинирующие; с) фузионные; d) символические. Изоляция - это способ связи, так же как и другие приемы, но применяется он почти исключительно к словам, поскольку относительный порядок расположения элементов внутри слова имеет значение лишь в редких случаях. Изоляция, следовательно, в данной шкале неуместна, и это сказывается на асимметричности ее появления в схеме Сепира: она выступает в качестве способа только под рубрикой IV (чисто-реляционные понятия) и относится к связям, осуществляемым не внутри слова, как другие способы, но между словами.
Метод классификации языков, предлагаемый в настоящей статье, - это в своей основе метод Сепира, но с некоторыми видоизменениями в свете указанных критических замечаний. Более того, вместо интуитивных определений, опирающихся на общие впечатления, делается попытка охарактеризовать каждый признак, используемый в данной классификации, через отношение двух единиц, каждая из которых получает достаточно точное определение посредством исчисления числового индекса, основанного на относительной частотности этих двух единиц в отрезках текста. В основу классификации положено пять признаков вместо трех у Сепира и устанавливается ряд из одного или более индексов для определения места того или иного языка в отношении каждого из них. Первый из этих параметров - степень синтеза или общая сложность слова. Со времен Сепира минимальная значимая последовательность фонем в языке стала в американской лингвистике называться морфемой. Например, англ. sing-ing "пение" содержит две морфемы, но образует одно слово. Отношение M/W, где М - число морфем, a W - число слов [ср. англ. word "слово". - Перев.], является мерой синтеза и может быть названо индексом синтетичности. Теоретически низшим пределом его является 1,00, поскольку каждое слово должно содержать по крайней мере одну значимую единицу. Высший предел теоретически отсутствует, но на практике величины выше 3,00 встречаются редко. Показатели этого индекса для аналитических языков будут низкими, для синтетических - более высокими, а для полисинтетических - самыми высокими.
Второй параметр относится к способам связи. На одном полюсе здесь находятся языки, в которых значимые элементы, соединяясь, не изменяются совсем или изменяются незначительно. Таково классическое определение агглютинации. Явление, противоположное агглютинации, - взаимная модификация или слияние элементов. Здесь также можно выделить несколько конструкций и таким образом построить более детальную типологическую классификацию. Для целей настоящей статьи выбрана альтернатива, которая представляется наиболее точно соответствующей идеям Сепира и обычных исследований XIX в. Используя современную терминологию, можно сказать, что имеется в виду степень морфо-фонематических альтернаций. Значимые отрезки, реально обнаруживаемые в высказывании, называются "морфами". Ряд сходных морф подводится под одну основную единицу - морфему. Различные морфы, следовательно, находятся в отношении альтернации. Например, в английском языке мы связываем морфу lijf (leaf "лист") с морфой lijv-, которая встречается только в сочетании с морфой множественного числа -z и образует lijvz (leaves "листья"). Lijf и lijv- - это морфы, альтернирующие в пределах одной и той же морфологической единицы. Правила констатации подобного альтернирования относятся к морфо-фонематической части описания английского языка. В тех случаях, когда среди морф, составляющих морфему, варьирования не наблюдается или когда варьирование происходит автоматически, о самой морфеме говорят, что она автоматична. Под автоматической альтернацией понимается такая альтернация, при которой все альтернанты можно образовать от основной формы, зная ряд правил сочетаемости, сохраняющих в данном языке силу для всех аналогичных случаев. Этот вопрос будет рассмотрен ниже более детально. Если обе морфы в какой-либо конструкции относятся к морфемам, являющимся автоматическими, конструкция называется агглютинативной.
Индекс агглютинации - это отношение числа агглютинативных конструкций к числу морфных швов. Число морфных швов в слове всегда на единицу меньше, чем число морф. Так, в leaves две морфы, но только один морфный шов. Индекс агглютинации - A/J, где А равно числу агглютинативных конструкций, a J - числу швов между морфемами [англ. juncture "стык, шов". - Перев.]. Язык с высоким индексом агглютинации является агглютинирующим, а язык, имеющий малый по величине индекс, - фузионным. В целом, чем ниже первый индекс (индекс синтетичности), тем меньше фиксируется границ между морфами и тем менее важен для характеристики языка второй индекс - индекс агглютинации. Если язык достигает теоретически низшего предела в синтетическом индексе (1,00), исчисление второго индекса становится невозможным, поскольку это означает, что никаких границ между морфемами вообще нет. Иными словами, индекс агглютинации становится равным О/О, что бессмысленно. При исчислении индекса агглютинации не принимались во внимание различия между степенью агглютинации, которые можно обнаружить в конструкциях, включающих понятия групп II, III и IV у Сепира, и которые как мы видели, фигурируют в окончательной формулировке его классификации. Такие индексы можно было бы вычислить на основе разграничения классов корневых, деривационных и словоизменительных морфем, ибо именно эти категории наиболее точно соответствуют делению понятий у Сепира. Они не были установлены, частично чтобы избежать слишком больших общих осложнений в типологической классификации, а отчасти потому, что исчисление их сопряжено с значительными трудностями.
Третий параметр соответствует наиболее точно тому, что для Сепира было центральным признаком при классификации языков, - это наличие или отсутствие деривационных и конкретно-реляционных понятий. Поскольку, как мы видели, взяв за отправную точку значения понятий, нельзя добиться необходимой научной точности, в настоящем исследовании мы исходим из возможности исчерпывающего деления морфем на три класса - корневые, деривационные и словоизменительные. Каждое слово должно содержать по крайней мере одну корневую морфему, и многие слова во многих языках больше ничего и не содержат. Наличие в слове более чем одной корневой морфемы называется словосложением (compounding). Это важный признак, благодаря которому языки существенно отличаются друг от друга. В некоторых языках словосложение либо вообще отсутствует, либо встречается очень редко. Другие, напротив, широко используют словосложение. Однако большинство языков занимает в этом отношении промежуточное положение. Примечательно, что Сепир, по-видимому, не принимает этого во внимание в своей классификации. Указанное явление можно легко измерить при помощи структурного индекса (compositional index) R/W, где R равно числу корневых морфем [ср. англ. root "корень". - Перев.), а W равно числу слов. Второй класс морфем - деривационные морфемы. Примерами деривационных морфем в английском языке могут служить re- в re-make "пере-делать", -ess в lion-ess "льв-ица", -er в lead-er "предводи-тель". Деривационный индекс D/W - отношение числа деривационных морфем [ср. англ. derivational "словообразовательный, деривационный". - Перев.] к числу слов. Языки с высоким D/W принадлежат к сложным, или деривационным, подтипам у Сепира и, таким образом, попадают в классы Б и Г его классификации. Словоизменительные морфемы образуют третий класс. Примеры из английского языка: -s в eats "ест" и -es в houses "дома".
Словоизменительный индекс I/W есть отношение числа словоизменительных морфем [ср. англ. inflectional "словоизменительный". - Перев.] к числу слов Это, как будет показано, не вполне тождественно сепировским понятиям типа III (конкретно-реляционные). Однако язык, в котором эти понятия существуют и который, таким образом, принадлежит у Сепира к смешанно-реляционным типам В и Г, обязательно характеризуется довольно высокой величиной индекса словоизменения; обратное отношение верно не всегда.
Четвертый параметр связан с фактором, который Сепир считал важным для морфологической структуры языка, но который он не включил в окончательную формулировку своей классификации. Это порядок следования подчиненных элементов по отношению к корню. Основным различием здесь является различие между использованием префиксов и суффиксов. Префиксальный индекс P/W представляет собой отношение числа префиксов к числу слов, а суффиксальный индекс S/W -отношение числа суффиксов к числу слов. Сходным образом можно исчислить и индекс инфиксации, то есть количества подчиненных элементов, которые инкорпорируются внутри корня, но в исследованных языках инфиксы встречались настолько редко, что представлялось обоснованным их опустить. Существует неопределенное число и других возможных типов положения подчиненных элементов по отношению к корню, например обрамление (containment), как у арабского имперфективного префикса второго лица женского рода, который окружает глагольную морфему в taqtuli' "ты (ж. р.) убиваешь", где морфемой второго лица женского рода является ta- - -i-, в то время как "убивать" передается при помощи -q-t-l, а "имперфектное время" - через -u-. Точно так же существует и вставка (intercalation), обнаруживаемая опять-таки в семитских языках, при которой часть подчиненного элемента предшествует корню или следует за ним, а другая часть вставляется внутрь. Все эти способы, встречаются настолько редко, что, по крайней мере для изученных нами языков, вычислять их индексы не имело смысла. Сюда же по существу относится и сепировский символизм, который он рассматривает как особый технический прием наряду с изоляцией, агглютинацией и фузией. Сепировский символизм, или внутреннее изменение, является, на мой взгляд, просто инфиксацией словоизменительного элемента: ср., например, инфикс прошедшего времени -а- в английском sang "пел". Когда подобные элементы являются деривационными, как в индонезийских языках, процесс обычно называется инфиксацией. Это выявляет тот факт, что с использованием термина "символизм" у Сепира связаны два определенных соображения - позиция и регулярность. Процесс инфиксации вполне может быть регулярным, и в этом случае конструкция должна быть агглютинирующей. В действительности же, однако, это вряд ли когда-либо случается.
Последний параметр имеет дело со способами, используемыми в различных языках для установления связи между словами. Он, следовательно, вводит критерии как синтаксического, так и морфологического порядка. Существуют три способа, которые языки могут использовать, - словоизменение без согласования, значимый порядок слов и согласование.
Языки, применяющие первые два способа, принадлежат, по классификации Сепира, к чисто-реляционной категории, в то время как языки, применяющие согласование, являются смешанно-реляционными. Словоизменительный индекс, рассмотренный выше, будет включать как несогласуемые, так и согласуемые словоизменительные морфемы. Этот индекс, который можно было бы назвать индексом преобладающего словоизменения, для настоящей проблемы можно использовать лишь с известными ограничениями. Весьма вероятно, что, разграничив согласуемые и несогласуемые словоизменительные морфемы и причислив слова без словоизменительных морфем к изолирующему классу, можно было бы произвести четкое тройное деление. Степень характерности для языка изолирующих, словоизменительных и согласуемых приемов можно было бы исчислить тогда при помощи трех индексов, опирающихся на отношение каждого из этих типов к общему числу слов. Существует, однако, ряд осложнений, препятствующих осуществлению такой простой методики. Во многих языках, в частности в латыни, согласуемые и несогласуемые явления сливаются в одной и тон же словоизменительной морфеме. Так, -um латинских прилагательных мужского рода винительного падежа единственного числа имеет два согласуемых признака - род и число - и один чисто словоизменительный - падеж. В подобных случаях наша методика заключается в том, что одну и ту же морфему мы считаем обычно несколько раз, т. е. столько, сколько в ней дифференциальных признаков. Другая трудность возникает в связи с порядком следования элементов. Порядок, по-видимому, всегда имеет известное значение для установления связи между элементами даже там, где существует словоизменение. Мы связываем винительный падеж с ближайшим глаголом даже при наличии нефиксированного порядка слов. Порядок может быть фиксированным даже тогда, когда в наличии имеются и другие средства, указывающие на то, какие слова входят в конструкцию. В целом это, например, справедливо в отношении немецкого языка. Значимый порядок придется ограничить такими случаями, при которых изменение порядка элементов вызывает изменение значения конструкции. Использованный здесь критерий ближе всего к этому последнему, но более легко применим. Отсутствие словоизменительной морфемы в том или ином слове принималось за указание на то, что связь осуществлялась при помощи порядка. Если назвать каждый случай использования того или иного принципа указания отношений между словами в предложении нексусом (nexus), то можно вычислить три индекса - О/N, Pi/N и Co/N, где О - порядок (order), Pi - чистое словоизменение (pure inflection), Co - согласование (concord) и N - нексус.
Таким образом, в общей сложности были охарактеризованы следующие типологические индексы:
1) M/W - индекс синтеза
2) A/J - индекс агглютинации
3) R/W - индекс словосложения
4) D/W - индекс деривации
5) I/W - индекс преобладающего словоизменения
6) P/W - индекс префиксации
7) S/W - индекс суффиксации
8) О/N - индекс изоляции
9) Pi/N - индекс словоизменения в чистом виде
10) Co/N - индекс согласования
Ценность данных индексов заключается в том, что мы можем определить использованные величины последовательно и таким образом, что они окажутся применимыми ко всем языкам. В действительности почти все величины, употребленные в приведенных выше формулах, допускают несколько определений. Предпочтение, оказанное здесь тем или иным определениям, обусловлено конкретными задачами исследования. Мы всегда задаем вопрос, что же, собственно, мы хотим измерить. С этой точки зрения в некоторых случаях, как представляется, нет достаточных оснований для предпочтения того или иного определения, и выбор производится совершенно произвольно, поскольку к какому-то решению волей-неволей нужно было прийти. Известным утешением является то, что теоретически широкий диапазон возможных определений для некоторых величин оказывает влияние на решение только сравнительно небольшой части трудных случаев. В качестве доказательства приведем результаты индексов, вычисленных для отрывка из 100 слов на английском языке в 1951 г. при помощи методов, которые уже невозможно ретроспективно полностью восстановить, и сравним их с индексами для отрывка из 100 слов, полученными недавно в соответствии с методами, охарактеризованными здесь.
|
1951 |
1953 |
Синтез |
1,62 |
1,68 |
Агглютинация |
0,31 |
0,30 |
Словосложение |
1,03 |
1,00 |
Префиксация |
1,00 |
1,04 |
Суффиксация |
0,50 |
0,64 |
Преобладающее словоизменение |
0,64 |
0,53 |
Следует подчеркнуть, что в равной степени возможны, а для других целей, например для создания грамматики того или иного языка, вероятно, заслуживают предпочтения другие определения единиц, чем те, которые были выбраны здесь.
В нижеследующем разделе обсуждаются основные проблемы, которые возникают при определении единиц, использованных в индексах. Они касаются морфы, морфемы, агглютинирующих конструкций и разграничения корня, деривационных и словоизменительных морфем и слова. Мы не пытаемся здесь дать ничего приближающегося к исчерпывающему изложению этих проблем. Цель настоящего обсуждения - наметить главные проблемы, возникшие в данном исследовании, и указать основания для решений, принятых в каждом конкретном случае.
Основной для индекса синтеза, так же как для большинства других, является возможность сегментирования любого высказывания языка на определенное число значимых последовательностей, которые уже нельзя подвергнуть дальнейшему членению. Такая единица называется морфой. Существуют вполне очевидные деления, которые полностью оправданы и которые может произвести любой исследователь. Например, каждый разделил бы английское eating "принятие пищи" на eat-ing и сказал бы, что оно состоит из двух единиц. Существуют и другие членения, столь же явно неоправданные. Например, анализ chair "стул" на ch- "деревянный предмет" и -air "нечто для сидения" был бы всеми, безусловно, отвергнут. Имеются, однако, промежуточные неясные случаи, относительно которых мнения расходятся. Следует ли, например, разлагать английское deceive "обманывать" на de- и -ceive? Именно такие неясные случаи нам и нужно научиться анализировать. Начнем с ряда форм, которые мы в дальнейшем будем называть квадратом (square) Квадрат существует тогда, когда в языке имеется четыре значимые последовательности, принимающие форму АС, ВС, AD, BD. Примером в английском языке может служить eating "принятие пищи": sleeping "процесс сна":: eats "ест": sleeps "спит", где А = eat-, B = sleep-, C = -ing и D - это -s [2]. В тех случаях, когда квадрат существует с соответствующим варьированием значения, мы вправе сегментировать все последовательности, из которых он состоит. После того как квадрат расчленен, каждый из его сегментов следует подвергнуть анализу, чтобы выяснить, не является ли он также членом квадрата. Если да, тогда он в свою очередь будет разделен на две морфы. Если же этого сделать нельзя, значит, мы достигли предела анализа и дальнейшее членение невозможно. Во избежание возникновения таких квадратов, как hammer "молоток": ham "ветчина":: badger "барсук": badge "значок, медаль", прибегают к проверке соответствия в значении. Квадрат, отвечающий описанным условиям, всегда даст нам возможность правильного и в общем приемлемого анализа. Однако он слишком ограничен в том смысле, что исключает некоторые членения, которые могли бы быть приняты всеми. Прежде всего необходимо несколько расширить понятие морфы. Последовательность, которая встречается с каким-либо членом квадрата, выделяется как морфа также и в других случаях, если по отношению к этому члену (а) последовательность фонем является тождественной (за исключением автоматических изменений, о которых см. ниже) и (б) если значение ее одинаково. На этом основании мы признаем членение huckleberry "черника" на huckle+berry, поскольку berry "ягода" само является в других случаях морфой. Отсюда и huckle- также оказывается морфой, хотя оно никогда не встречается в составе квадрата. Если бы обнаружилось, что huckle- встречается в каком-нибудь другом сочетании, мы бы выделили его и там и, следовательно, добавили бы еще одну новую морфу. Этот процесс продолжается до тех пор, пока мы не подойдем к последовательности, которая не повторяется больше ни в каком сочетании. В нашем примере такой последовательностью является huckle-.
Границы должны быть расширены и для случаев так называемого неполного квадрата, недостаточного с формальной точки зрения. Было бы очень желательно выделить в men "люди" две морфы, одну со значением "человек", а другую - "множественное число", но нет такого квадрата, в который его можно было бы включить. Так, квадрат man "человек": men "люди":: boy "мальчик": boys "мальчики" формально недостаточен. Мы формулируем следующее правило: если можно найти квадрат, подобный только что приведенному, в котором boy: boys само является парой другого правильного или полного квадрата, например boy : boys:: lad "парень": lads "парни", и если boy всегда можно заменить man, a boys - men и получить нормальное с грамматической точки зрения (хотя и семантически невероятное) предложение, тогда man : men можно подвергнуть сегментации, аналогичной сегментации boy : boys, и men можно рассматривать как две морфы. В случае sheep "овца": sheep "овцы":: goat "коза": goats "козы" мы признаем в sheep "овцы" две морфы, одна из которых является нулевой. Подобный анализ не следует смешивать с членением на две или более семантические категории, где для субституции не существует обоснованного квадрата. В латыни, например, мы не можем разложить -us "именительный падеж единственного числа" на две морфемы - именительный падеж и единственное число. Квадрат -us : -o :: -i : -is - "им. п. ед. ч.: дат. п. ед. ч.:: им. п. мн. ч.: дат. п. мн. ч." - не имеет пары, которой можно было бы заменить члены формально полноценного квадрата, и, следовательно, сегментация этих форм неосуществима. Подобно тому как существуют формально неполноценные квадраты, существуют также квадраты неполноценные семантически. В них, если возможно параллельное неавтоматическое варьирование, членение допускается даже несмотря на то, что морфам нельзя приписать определенных значений. Так, в английском языке ряды deceive "обманывать": receive "принимать":: decep-tion "обман": recep-tion "прием":: decei-t "обман": recei(p)t "получение, расписка" оправдывают сегментацию de+ceive и re+ceive. Данное правило позволяет обычно выделить морфы для производных форм глагола в семитских языках. Без этого правила, ввиду многообразия значений в подобных примерах, трудно было бы работать.
Существуют и другие пути расширения понятия морфы, которые, однако, здесь отвергаются как несоответствующие задачам настоящего исследования, хотя и полностью приемлемые для других целей. Не принимаются, например, прерывающиеся морфы, сегменты которых содержатся в двух различных словах. Это понятно, поскольку мы хотим вычислить отношение морфем к словам и, следовательно, хотим, чтобы каждое слово содержало определенное число морфем, ограниченных пределами самого слова. Подобным же образом мы не рассматриваем в качестве морф значимые единицы, сопровождающие грамматические отрезки более длинные, чем слово, например интонационные модели предложения. Причины этого также ясны. Мы хотим, чтобы морфемы были частями слов, а они не могут быть таковыми, если они появляются одновременно с целой последовательностью слов. В этой связи следует заметить, что ни индекс синтеза, ни какой-либо иной индекс, используемый в настоящем исследовании, не является мерилом сложности того или иного языка в целом. Не включаются в число морф также интонационные модели и некоторые другие явления, усложняющие функционирование языка.
Следующий шаг, который нужно сделать после отождествления морф, - это установление более сложных единиц - морфем - с морфами в качестве их членов. Именно данная сторона проблемы как составляющая основное содержание морфемного анализа получила наиболее полное освещение в трудах Хэрриса, Хокетта, Блока, Найды и др. В целом принципы, выдвинутые Найдой (1948, стр. 414-441), являются вполне обоснованными и достаточными. Они включают общепринятые критерии сходства значения (здесь этот критерий применяется очень строго) и дополнительной дистрибуции, а также следующее правило: если мы хотим подвести под одну и ту же морфемную единицу морфы, различные по своей фонематической форме, нужно иметь по крайней мере одну неварьирующую единицу со столь же широкой дистрибуцией.
По этому вопросу, однако, по причинам, которые будут раскрыты в дальнейшем, нецелесообразно принимать дополнения, рекомендуемые Найдой в соответствии с его правилом о том, что "дополнительная дистрибуция в тактически различных окружениях является основой для объединения различных форм в одну морфему только при условии, если какая-то другая морфема, принадлежащая к тому же дистрибуционному классу и имеющая либо одну-единственную фонематическую форму, либо фонологически определяемые альтернирующие формы, встречается во всех тех тактически различных окружениях, где мы находим данные формы" (стр. 421). Например, в арабском языке существуют местоименные суффиксы, обозначающие принадлежность, когда они присоединяются к существительному, и другой ряд суффиксов, указывающих на глагольное дополнение, когда они присоединяются к глаголу. Эти окружения тактически различны, то есть глагол, как правило, не может быть заменен существительным, и наоборот. Наличие -ka со значением "второе лицо мужского рода единственного числа" и Других фонематически тождественных форм в обоих рядах должно было бы, согласно правилу Найды, позволить нам объединить морфы первого лица единственного числа -i и -уа (притяжательность у существительного) и -in (глагольный объект) как морфы, составляющие одну и ту же морфему. Эта альтернация, разумеется, нерегулярна, и если бы мы согласились с указанной точкой зрения, то, вычисляя наш индекс агглютинации, мы должны были бы считать любую конструкцию, включающую одну из форм суффикса 1-го лица единственного числа, неправильной или неагглютинативной. Таким образом, мы поставили бы арабский язык в невыгодное положение, и только из-за того, что данные формы характеризуются известной степенью регулярности. В языке с двумя совершенно различными рядами местоимений в подобных употреблениях, согласно правилу Найды, нельзя было бы обнаружить указанного ограничения; следовательно, не существовало бы нерегулярных альтернаций такого происхождения, хотя с точки зрения здравого смысла мы должны были бы назвать подобную ситуацию еще более нерегулярной. Поэтому только члены одного и того же структурного ряда, то есть те, которые могут заменять друг друга в одинаковом тактическом окружении, рассматриваются здесь как возможные альтернанты одной и той же морфемы.