Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пиотровский

.pdf
Скачиваний:
174
Добавлен:
06.06.2015
Размер:
9.13 Mб
Скачать

Во-первых, он еще раз показывает, что текст имеет квантовую информационную структуру, где информационно нагруженные элементы чередуются со слабоинформативными элементами заполнения. Такое «зернистое» строение текста связано, очевидно, с ритмом работы нейронов мозга, периодически накапливающих и отдающих информацию, поступающую к ним от органов чувств нли из других участков мозга.

Во-вторых, объективное выделение информационных гармоник слов и текста позволяет поставить на твердую основу морфологосинтаксическую типологию языков и создать некоторые количественные эталоны. Сопоставляя с этими эталонами информационные гармоники конкретных текстов, лингвисты получают возможность пролить свет на типологию и происхождение таких загадочных языков, каким является, например, кетский язык.

Г Л А В А 2

ГЛОТТОХРОНОЛОГИЯ, ИНФОРМАЦИОННАЯ СХЕМА ТЕКСТА И ИХ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ АППАРАТА БЕСКОНЕЧНО

МАЛЫХ ВЕЛИЧИН И ПРЕДЕЛОВ

§ 1. Понятия бесконечно малой величины и предела

вквантитативной лингвистике

Впредыдущей главе мы познакомились с математическими приемами, позволяющими представить в виде аналитической схемы и охарактеризовать числом различные лингвистические процессы. При этом мы оперировали двумя основными математическими понятиями: независимой переменной величиной (это понятие позволяет формализовать всякое лингвистическое изменение и эволюцию)

ифункцией (это понятие дает возможность следить за количественным и качественным изменением лингвистического явления в зависимости от изменения его аргумента). Однако рассмотренные нами элементарные функции представляют собой довольно грубые схемыэталоны, которых явно недостаточно, чтобы исследовать любые малые, непрерывно текущие и изменяющиеся по своему темпу диа-

хронические процессы, а

также

неустановившиеся

состояния

языка и речи. Для описания

этих

процессов следует

применять

более гибкий математический

аппарат, построенный на

понятиях

предела и бесконечно малой

величины.

 

1. Бесконечно малая величина. Нам уже известно (см. гл. 1, §3, п. 2), что переменной называется величина, принимающая различные численные значения в течение некоторого лингвистического процесса.

Переменная величина, которая изменяется таким образом, что в процессе своего изменения становится и в дальнейшем остается меньше сколь угодно малого наперед заданного положительного числа е, носит название бесконечно малой. Кратко это определение записывается в виде неравенства j а | < е, где а — бесконечно малая величина.

Например, бесконечно малая величина может быть получена как вероятность фонологической системы принять устойчивое положение при однократном случайном изменении одного из дифферен-

циальных признаков этой системы [24]. Указанная

вероятность

определяется выражением

 

р = 1/2".

(2.1)

Предположим, что мы будем увеличивать число дифференциальных признаков фонологической системы, последовательно придавая величине п значения 0,1, 2, 3, 4, ...; тогда вероятность р принимает соответственно значения 1, 1/2, 1/4, 1/8, 1/16, ... .

Очевидно, какое бы малое положительное число г мы ни взяли, среди значений р всегда найдется число, меньшее чем е.

Если в качестве е выбрать число 1/5000, то при п = 13 переменная р примет значение 1/8192, меньшее чем е; если же за е взять

1/10000, то при п =

14 получим, что

р =

1/16384,

т. е. снова*

р < е.

 

 

 

 

В дальнейшем для нас будут важны следующие

с в о й с т в а

бесконечно малых величин.

 

 

 

1. Алгебраическая

сумма конечного

числа

бесконечно малых ве-

личин есть также бесконечно малая величина,

т. е.

 

| а г

+ щ + . . . + а „ | = 2 a i < е -

 

 

 

<

 

 

В том случае, когда число слагаемых неограниченно возрастает, такая сумма может и не быть бесконечно малой величиной.

2. Произведение бесконечно малой величины а на ограниченную величину х есть также величина бесконечно малая, т. е.

ах <. е.

С л е д с т в и е 1. Произведение бесконечно малой величины а на постоянную величину с также есть величина бесконечно малая, т. е.

ас < е.

 

С л е д с т в и е 2. Произведение двух или

нескольких бесконечно

малых величин есть величина бесконечно малая,

т. е.

п

 

| а 1 а 2 . . . а п | = П а г < е .

 

i

 

2. Предел. Как было только что указано, вероятность фонологической системы принять устойчивое положение при однократном случайном изменении одного из п дифференциальных признаков определяется выражением р — 1/2".

Если аргументу п последовательно, придавать все возрастающие целочисленные значения, то величина р будет неограниченно уменьшаться, приближаясь к нулю. Однако, последовательно уменьшаясь, эта величина всегда остается больше нуля. Следовательно, всегда найдется какая-то бесконечно малая величина, которая по абсолютной величине представляет собой разность между значением переменной и величиной предела ее изменения — в данном случае нулем. Все эти рассуждения приводят нас к понятию предела пере-

*

В выражении

 

 

/ о =

log2 S,

где / 0

(S) — информация алфавита,

состоящего из S букв, переменная вели-

чина S

принимает последовательно

значения натурального ряда чисел. Если

этот процесс возрастания происходит неограниченно, то какое бы большое по-

ложительное число М

мы ни взяли, среди значений / 0 всегда

найдется

чис-

ло, большее чем М, т. е. будет выполняться

неравенство | / 0

| > М.

Такая

переменная величина

называется бесконечно

большой.

 

 

Между бесконечно большой и бесконечно малой величинами существует связь, которая выражается следующим образом: если А — величина бесконечно большая, то обратная величина 1/А есть бесконечно малая; наоборот, если а — бесконечно малая величина (т. ё. а -»• 0), то 1/а — бесконечно большая (1/а оо).

52

менной величины, которое формулируется следующим образом: постоянное число а называется пределом переменной величины и, если абсолютная величина их разности есть величина бесконечно малая, т. е. 1 и — а\ = а.

Символически это записывается в виде выражения lim и — а, которое читается: «лимит и равен а».

Всякая переменная величина, имеющая предел, является ограниченной— такова, например, величина р в равенстве (2.1).

Определив понятие предела переменной величины, заметим, что обычно переменная величина выступает в виде функции. Так, в соотношении (2.1) переменная величина р является, по существу, функцией, зависящей от п, т. е. р — f (п). Предел такой переменной величины правильнее записать в виде

lim р — О, tt-t-00

указывая в этой записи характер изменения аргумента.

Понятие предела функции можно сформулировать следующим образом. Если любая последовательность значений аргумента х стремится к некоторому числу а, т. е. lim хп= а, и последователь-

П-*оо

ность значений функции при этом стремится к числу Ь, то число b называется пределом функции у — f (х) при условии х-*- а. Это записывается так:

lim y — b. Х-а

Рассмотрим понятие предела функции на примере роста употребительности нулевых форм родительного падежа множественного числа у существительных, обозначающих единицы измерения

(вольт — вольтов, рентген — рентгенов) — см. гл. 1, § 7, п. 1. Указанный процесс описывается зависимостью (1.23):

p = J . a r c t g ( £ = p ) + 0 . 5 ,

или в общем виде р — f (0, где р — вероятность появления нулевых форм, a t — время.

Возьмем такую последовательность значений аргумента: 1905, 1907, 1908, 1909, 1910 1920 1950

Вычислим по формуле (1.23) соответствующие каждому из этих значений t значения функции / (i):

0,906, 0,922, 0,927, 0,933, 0,937, ..., 0,962, ..., 0,983, . . . .

Очевидно, что по мере приближения t к оо рассматриваемая функция стремится к единице.

Приведем теперь основные теоремы о пределах, которые понадобятся нам впоследствии при решении лингвистических задач.

Теорема I. Предел алгебраической суммы нескольких переменных величин равен алгебраической сумме пределов этих переменных величин, т. е.

lim (х + у + ... + г) = lim х + lim у + ... + Нт г.

53

Теорема 2. Предел произведения нескольких переменных величин вавен произведению пределов этих переменных величин, т. е.

Иш (х • у ... z) — lim х • Нш у ... lim z.

Из последней теоремы вытекают три следствия.

С л е д с т в и е 1. Предел произведения постоянной на переменную величину равен произведению постоянной на предел переменной величины. Иными словами, постоянный множитель можно выносить за знак предела:

iim ах = lim а • lim х = a lim х.

С л е д с т в и е 2. Предел целой положительной степени переменной величины, имеющей предел, равен той же степени предела этой переменной величины'.

lim хп =

(lim я)".

(2.2)

С л е д с т в и е 3. Предел

корня т-й степени из

переменной

величины, имеющей предел, равен корню той оке степени

из предела

этой переменной величины, т.

е.

 

lim >/х = у limx.

(2.3)

Так как равенство (2.3) можно представить в виде limx1 / m = (limx)1 / / n ,

то следствие 2 справедливо и для дробных положительных степеней.

Теорема 3. Предел

частного двух

 

переменных величин,

имеющих

пределы, равен частному от деления

этих пределов {при

условии,

что предел делителя

не равен

нулю),

т. е.

 

 

,

к

lim х

.

 

 

hm — =

 

 

 

уhm У

Из теоремы 3 и следствия

2 вытекает, что

 

\ \ т х ~ т

= { \ \ т х ) ~ т .

(2.4)

3. Сравнение бесконечно малых величин. Отношение двух

бес-

конечно малых величин а и р может быть либо бесконечно большой, либо бесконечно малой, либо конечной величиной, либо величиной, не имеющей предела. В общем виде об отношении двух бесконечно малых величин нельзя сказать что-либо определенное. Это отношение зависит от характера изменения бесконечно малых величин.

Установить характер отношения двух бесконечно малых величин или, как говорят, раскрыть неопределенность вида 0/0 можно путем определения предела отношения а/р. Здесь имеют место следующие

ситуации.

 

1. Предположим, что имеются

бесконечно малые величины

а — х3 и р = х, тогда

 

lim — == — = 0.

Р

*

64

Величина а = х3, стремящаяся к нулю быстрее, чем р = х, выступает в качестве бесконечно малой высшего порядка малости относительно р.

2. Если, например, а = х, а р = х2, то

1- а х

lim — = — = сю.

Рх*

Вэтом случае а является бесконечно малой низшего порядка ма-

лости

относительно

р.

 

 

 

 

 

 

 

3. Предел отношения может быть равен конечному числу, на-

пример, в случае, когда а

= +

5) х,

а р =

х:

 

 

lim

= lim i f ± 5 I l

=

lim (Х + 5) = 5.

 

 

Р

х-*0

х

 

 

*->0

 

 

 

Здесь бесконечно

малые

а и р

являются

величинами

одного

и того же порядка

малости.

 

 

 

 

 

 

4.

Отношение а/р может вовсе не иметь предела, как, например,

в случае, если а = х sin

a р =

х.

Предел

 

 

 

 

xsin —

 

. .

.

I

 

 

 

 

lim

л;

 

 

 

 

 

x

= lim sin —•

 

 

не существует.

jt-0

 

x-+о

*

 

 

 

 

 

 

 

 

 

 

5.

Предел отношения бесконечно

малых величин а и р

может

быть

равен единице, т. е.

 

 

 

 

 

 

 

 

 

 

lim — =

1.

 

 

 

 

 

 

 

Р

 

 

 

 

 

В этом случае а и р

называются

эквивалентными бесконечно ма-

лыми

величинами.

 

 

 

 

 

 

 

 

§2. Число Эйлера и модель роста словаря

Вразличных областях математики и ее приложениях часто используется функция

пределом которой при неограниченном возрастании х является уже встречавшееся нам число Эйлера е = 2,718... (см. гл. 1, §6, п. 3). Таким образом, можно записать, что

e = l i m f l + - L V

(2.5)

X оо \

х I

 

С помощью предела (2.5) решаются многие задачи квантитативной лингвистики, связанные с ростом или убыванием какой-либо величины.

Рассмотрим в этой связи некоторую идеальную модель роста словаря.

55

57 В результате постоянного расширения сферы деятельности человека лексика каждого языка, особенно его терминологический словарь, несмотря на выпадение некоторого количества слов, неуклонно растет. Характеристикой увеличения словаря служит коэффициент k его прироста за определенный период времени, например, за десятилетие. Этот коэффициент представляет собой отношение количества новых слов, появившихся за десятилетие, за вычетом вышедших из употребления архаизмов (AL), к общему объему

(L) словаря в данный период, т. е.

L

Зная начальный объем словаря L и коэффициент k, легко показать, что через 10 лет объем словаря составит

L0 + -AL = L0 + L0k = L0 (1 + k).

Однако этот подсчет является в значительной степени приближенным. Ведь в течение десятилетия прирост словаря происходит не относительно исходной величины L0, а относительно сумм L0 + AL (здесь величина AL указывает прирост словаря за то количество времени — за год, месяц, неделю, — которое прошло от момента, когда был зафиксирован начальный объем словаря L0).

Предположим, что нам нужно учесть рост словаря по годам. Тогда к концу первого года мы получим объем словаря, равный

к концу второго года он будет равен

а к концу десятилетия объем словаря составит

Если же учитывать прирост словаря не по годам, а по месяцам, то получим еще более точный результат: к концу десятилетия объем словаря будет равен

Ч ' + ^ Р

Теперь попытаемся представить процесс роста словаря в общем виде. Для этого будем определять изменение словаря относительно промежутка времени Т (например, тысячелетия), считая, что начальный объем словаря характеризуется величиной L0, а коэффициент прироста по-прежнему равен k. Разделим весь период Т на п малых равных частей:

К } [Vf] [ ^ . - f ]

•ч

If

(i n y

x

Поскольку все промежутки — — v

= — малы, то в каждом

из них можно считать прирост новых слов АЬ постоянным и пропорциональным исходному объему словаря и величине промежутка

Т/п, т. е. AL = kL0T/n.

Объем словаря к концу первого промежутка составит

L ^ + k L ^ - u l l + j p j ,

к концу второго промежутка

kT \ !

и, наконец, к концу эпохи Т словарь будет включать

 

 

kT \п

 

 

слов.

L ' = L ' ( 1 +

Jir)"

 

 

Предполагая,

что число промежутков

неограниченно

растет

(т. е. п -*• оо), а

длина промежутка

Tin

неограниченно

убывает

(т. е. Т/п -> 0), являясь тем самым бесконечно малой величиной,

приходим

к равенству

 

 

 

 

 

 

Lr = limL0 (l +

Щ " .

(2.6)

 

 

1-.ОС.

V

п /

 

Заменим частное kT/n

величиной

Мх, тогда п = kTx.

Посколь-

ку kT/n

представляет

собой

произведение постоянной

величины

k на бесконечно малую величину Tin,

то Мх есть тоже бесконечно

малая величина, т. е. \!х = kTIn

0. Учитывая все

сказанное,

имеем:

 

 

 

 

 

 

Применяя следствия 1 и 2 из теоремы 2 (см. § 1, п. 2), перепишем

это выражение в виде

 

lim f 1 -|—— V kT

 

 

Lt — L.

 

 

 

 

*-mxj\

X j

 

откуда на основании соотношения (2.5) получаем формулу объема словаря к концу периода Т в виде

Lt — L0

(2.7)

§3. Глоттохронология

1.Классическая глоттохронология. На только что рассмотренный математический аппарат опирается современная глоттохронология, целью которой является приближенная абсолютная датировка процессов расхождения диалектов и родственных языков, а также количественная оценка степени их родства.

67

Исходные лингвистические предпосылки глоттохронологии [32в, с. 384] сводятся к пяти постулатам.

1°. Во всех языках мира существует некоторое множество слов, обозначающих наиболее древние, всегда необходимые и поэтому не изменяющиеся понятия-означаемые (например: большой, все, дерево, птица и т. д.). Их можно объединить в некоторый тестовый список (ТС).

2°. Доля означающих (слов или' эквивалентных словам устойчивых словосочетаний) из ТС, которая сохраняется за некоторый промежуток времени Т для каждого языка, постоянна и не зависит от способа выбора этих слов из ТС.

3°. Каждый язык и диалект имеет свой коэффициент сохранности г относительно периода в 1000 лет. Величины г колеблются относительно периода в тысячу лет от 0,74 (для быстро развивающихся «динамичных» языков) до 0,91 (для «стабильных» языков), средняя величина ~г равна 0,81.

4°. Все означающие из ТС данного языка имеют одинаковые шансы сохраниться на протяжении интервала Т.

5°. Если мы имеем дело с двумя потомками некоторого праязыка, то вероятность означающего из праязыкового ТС удержаться в ТС первого потомка не зависит от вероятности сохраниться в ТС второго потомка.

Опираясь на эти постулаты, можно, во-первых, математически оценить число тех означающих из ТС праязыка, которое сохраняется в двух языках-потомках за период их независимого развития; во-вторых, получить количественную оценку времени их самостоятельного развития.

Предположим, что L„ есть известное нам число означающих ТС, которые характеризуют праязык в момент выделения из него языков-потомков i и /. Зная коэффициенты сохранности лексики для каждого из сравниваемых языков (rt и г}), легко определить коэффициент потери общих слов в ходе дивергенции. Этот коэффициент р а в е н k = 1 — rtr}. Теперь, опираясь на рассуждения, приведенные в § 2, легко показать, что число общих означающих,

сохранившихся в

языках-потомках за Т тысячелетий

их самостоя-

тельного развития,

будет

равно

 

W

o

^ -

f ^ f l + b ^ ] "

(2.8)

(напомним, что п — произвольное количество отрезков, на которое разделено время дивергенции Т). Повторяя преобразования, использованные в § 2, приходим к равенству

LT = L0e~kT.

(2.9)

Зависимость (2.9) показывает, сколько слов из ТС, определенного в момент распада праязыка Т0, доживет до момента Т, (здесь

- Т0 = Г).

ffi

Степень родства языков и диалектов можно оценивать через

отношение

у — LT/LQ.

При у >

0,81

два

«говорения» следует

считать диалектами,

при

0,36^ у <

0,81

«говорения» являются

родственными

языками, входящими в одну семью; при 0,12 <

у <

< 0,36 их следует считать принадлежащими

к одной ветви.

 

Из соотношения (2.9)

легко получить значение периода дивер-

генции Т. Для

этого, прологарифмировав (2.9), получаем

 

 

 

In LT

= In L0

kT,

 

 

откуда приходим к

равенству

 

 

 

 

 

 

 

 

 

т

in L0

In LT

 

 

 

( 2 1 0 )

 

 

 

 

k

 

 

 

 

 

 

Теперь, опираясь

на данные, приводимые

В. Гуцу-Ромало

[50,

с. 576—584], определим период дивергенции для пары романских

«говорений» — дакорумынского и

арумынского

языков-диалектов.

Всего сравнивается

L0

= 202

латинских слова, из которых оба

языка-диалекта сохраняют только

Lt == 149 общих

лексем. Ко-

эффициент сохранности

лексики для

дакорумынского

языка-диа-

л.кта составляет rd =

0,81, для арумынского варианта соответствен-

но имеем га = 0,88 [32в,

с. 3861.

 

лексики

равен

 

Тогда коэффициент

потери

общей

 

k = 1 — rdra = 1

— 0,81

• 0,88 «

0,29.

 

С помощью этих данных на основании формулы (2.10) вычисляем период дивергенции для обоих языков-диалекгов. Этот период составляет

In 202 — In 149

, n c

 

 

0,29

= 1,05 тысячелетия.

 

 

 

Иными словами, распадение

балканороманского языка-основы

относится к началу IX в., что хорошо согласуется с историко-линг-

вистическими фактами

[24, с.

273—2781.

 

2. Ранговый метод в глоттохронологии.

Классическая глотто-

хронология имеет ряд уязвимых пунктов.

 

Во-первых, критерии отбора понятий для ТС не являются про-

стыми, объективными

и однозначными. Сами

значения используе-

мые в ТС, неизоморфны для разных языков. Примером может служить неконгруэнтность означаемых у прилагательных, обозначающих цвета, у терминов родства, у существительных со значением «дерево» [32 в, с. 2851; [44]. Поэтому между ТС и словарем конкретного языка трудно установить однозначное соответствие.

Во-вторых, нет никакой уверенности в том, что степень сохранности лексики одинакова для всех участков ТС (ср. постулаты 2° и 4°).

В-третьих, классическая глоттохронология не учитывает возможности вторичного сближения родственных языков, так широко представленного в индоевропейском, тюркском и других ареалах.

59