
Пиотровский
.pdfВо-первых, он еще раз показывает, что текст имеет квантовую информационную структуру, где информационно нагруженные элементы чередуются со слабоинформативными элементами заполнения. Такое «зернистое» строение текста связано, очевидно, с ритмом работы нейронов мозга, периодически накапливающих и отдающих информацию, поступающую к ним от органов чувств нли из других участков мозга.
Во-вторых, объективное выделение информационных гармоник слов и текста позволяет поставить на твердую основу морфологосинтаксическую типологию языков и создать некоторые количественные эталоны. Сопоставляя с этими эталонами информационные гармоники конкретных текстов, лингвисты получают возможность пролить свет на типологию и происхождение таких загадочных языков, каким является, например, кетский язык.
Г Л А В А 2
ГЛОТТОХРОНОЛОГИЯ, ИНФОРМАЦИОННАЯ СХЕМА ТЕКСТА И ИХ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ АППАРАТА БЕСКОНЕЧНО
МАЛЫХ ВЕЛИЧИН И ПРЕДЕЛОВ
§ 1. Понятия бесконечно малой величины и предела
вквантитативной лингвистике
Впредыдущей главе мы познакомились с математическими приемами, позволяющими представить в виде аналитической схемы и охарактеризовать числом различные лингвистические процессы. При этом мы оперировали двумя основными математическими понятиями: независимой переменной величиной (это понятие позволяет формализовать всякое лингвистическое изменение и эволюцию)
ифункцией (это понятие дает возможность следить за количественным и качественным изменением лингвистического явления в зависимости от изменения его аргумента). Однако рассмотренные нами элементарные функции представляют собой довольно грубые схемыэталоны, которых явно недостаточно, чтобы исследовать любые малые, непрерывно текущие и изменяющиеся по своему темпу диа-
хронические процессы, а |
также |
неустановившиеся |
состояния |
языка и речи. Для описания |
этих |
процессов следует |
применять |
более гибкий математический |
аппарат, построенный на |
понятиях |
|
предела и бесконечно малой |
величины. |
|
1. Бесконечно малая величина. Нам уже известно (см. гл. 1, §3, п. 2), что переменной называется величина, принимающая различные численные значения в течение некоторого лингвистического процесса.
Переменная величина, которая изменяется таким образом, что в процессе своего изменения становится и в дальнейшем остается меньше сколь угодно малого наперед заданного положительного числа е, носит название бесконечно малой. Кратко это определение записывается в виде неравенства j а | < е, где а — бесконечно малая величина.
Например, бесконечно малая величина может быть получена как вероятность фонологической системы принять устойчивое положение при однократном случайном изменении одного из дифферен-
циальных признаков этой системы [24]. Указанная |
вероятность |
определяется выражением |
|
р = 1/2". |
(2.1) |
Предположим, что мы будем увеличивать число дифференциальных признаков фонологической системы, последовательно придавая величине п значения 0,1, 2, 3, 4, ...; тогда вероятность р принимает соответственно значения 1, 1/2, 1/4, 1/8, 1/16, ... .
Очевидно, какое бы малое положительное число г мы ни взяли, среди значений р всегда найдется число, меньшее чем е.
Если в качестве е выбрать число 1/5000, то при п = 13 переменная р примет значение 1/8192, меньшее чем е; если же за е взять
1/10000, то при п = |
14 получим, что |
р = |
1/16384, |
т. е. снова* |
р < е. |
|
|
|
|
В дальнейшем для нас будут важны следующие |
с в о й с т в а |
|||
бесконечно малых величин. |
|
|
|
|
1. Алгебраическая |
сумма конечного |
числа |
бесконечно малых ве- |
|
личин есть также бесконечно малая величина, |
т. е. |
|
||
| а г |
+ щ + . . . + а „ | = 2 a i < е - |
|
||
|
|
< |
|
|
В том случае, когда число слагаемых неограниченно возрастает, такая сумма может и не быть бесконечно малой величиной.
2. Произведение бесконечно малой величины а на ограниченную величину х есть также величина бесконечно малая, т. е.
ах <. е.
С л е д с т в и е 1. Произведение бесконечно малой величины а на постоянную величину с также есть величина бесконечно малая, т. е.
ас < е. |
|
С л е д с т в и е 2. Произведение двух или |
нескольких бесконечно |
малых величин есть величина бесконечно малая, |
т. е. |
п |
|
| а 1 а 2 . . . а п | = П а г < е . |
|
i |
|
2. Предел. Как было только что указано, вероятность фонологической системы принять устойчивое положение при однократном случайном изменении одного из п дифференциальных признаков определяется выражением р — 1/2".
Если аргументу п последовательно, придавать все возрастающие целочисленные значения, то величина р будет неограниченно уменьшаться, приближаясь к нулю. Однако, последовательно уменьшаясь, эта величина всегда остается больше нуля. Следовательно, всегда найдется какая-то бесконечно малая величина, которая по абсолютной величине представляет собой разность между значением переменной и величиной предела ее изменения — в данном случае нулем. Все эти рассуждения приводят нас к понятию предела пере-
* |
В выражении |
|
|
/ о = |
log2 S, |
где / 0 |
(S) — информация алфавита, |
состоящего из S букв, переменная вели- |
чина S |
принимает последовательно |
значения натурального ряда чисел. Если |
этот процесс возрастания происходит неограниченно, то какое бы большое по-
ложительное число М |
мы ни взяли, среди значений / 0 всегда |
найдется |
чис- |
|
ло, большее чем М, т. е. будет выполняться |
неравенство | / 0 |
| > М. |
Такая |
|
переменная величина |
называется бесконечно |
большой. |
|
|
Между бесконечно большой и бесконечно малой величинами существует связь, которая выражается следующим образом: если А — величина бесконечно большая, то обратная величина 1/А есть бесконечно малая; наоборот, если а — бесконечно малая величина (т. ё. а -»• 0), то 1/а — бесконечно большая (1/а оо).
52
менной величины, которое формулируется следующим образом: постоянное число а называется пределом переменной величины и, если абсолютная величина их разности есть величина бесконечно малая, т. е. 1 и — а\ = а.
Символически это записывается в виде выражения lim и — а, которое читается: «лимит и равен а».
Всякая переменная величина, имеющая предел, является ограниченной— такова, например, величина р в равенстве (2.1).
Определив понятие предела переменной величины, заметим, что обычно переменная величина выступает в виде функции. Так, в соотношении (2.1) переменная величина р является, по существу, функцией, зависящей от п, т. е. р — f (п). Предел такой переменной величины правильнее записать в виде
lim р — О, tt-t-00
указывая в этой записи характер изменения аргумента.
Понятие предела функции можно сформулировать следующим образом. Если любая последовательность значений аргумента х стремится к некоторому числу а, т. е. lim хп= а, и последователь-
П-*оо
ность значений функции при этом стремится к числу Ь, то число b называется пределом функции у — f (х) при условии х-*- а. Это записывается так:
lim y — b. Х-а
Рассмотрим понятие предела функции на примере роста употребительности нулевых форм родительного падежа множественного числа у существительных, обозначающих единицы измерения
(вольт — вольтов, рентген — рентгенов) — см. гл. 1, § 7, п. 1. Указанный процесс описывается зависимостью (1.23):
p = J . a r c t g ( £ = p ) + 0 . 5 ,
или в общем виде р — f (0, где р — вероятность появления нулевых форм, a t — время.
Возьмем такую последовательность значений аргумента: 1905, 1907, 1908, 1909, 1910 1920 1950
Вычислим по формуле (1.23) соответствующие каждому из этих значений t значения функции / (i):
0,906, 0,922, 0,927, 0,933, 0,937, ..., 0,962, ..., 0,983, . . . .
Очевидно, что по мере приближения t к оо рассматриваемая функция стремится к единице.
Приведем теперь основные теоремы о пределах, которые понадобятся нам впоследствии при решении лингвистических задач.
Теорема I. Предел алгебраической суммы нескольких переменных величин равен алгебраической сумме пределов этих переменных величин, т. е.
lim (х + у + ... + г) = lim х + lim у + ... + Нт г.
53
Теорема 2. Предел произведения нескольких переменных величин вавен произведению пределов этих переменных величин, т. е.
Иш (х • у ... z) — lim х • Нш у ... lim z.
Из последней теоремы вытекают три следствия.
С л е д с т в и е 1. Предел произведения постоянной на переменную величину равен произведению постоянной на предел переменной величины. Иными словами, постоянный множитель можно выносить за знак предела:
iim ах = lim а • lim х = a lim х.
С л е д с т в и е 2. Предел целой положительной степени переменной величины, имеющей предел, равен той же степени предела этой переменной величины'.
lim хп = |
(lim я)". |
(2.2) |
С л е д с т в и е 3. Предел |
корня т-й степени из |
переменной |
величины, имеющей предел, равен корню той оке степени |
из предела |
|
этой переменной величины, т. |
е. |
|
lim >/х = у limx. |
(2.3) |
Так как равенство (2.3) можно представить в виде limx1 / m = (limx)1 / / n ,
то следствие 2 справедливо и для дробных положительных степеней.
Теорема 3. Предел |
частного двух |
|
переменных величин, |
имеющих |
||
пределы, равен частному от деления |
этих пределов {при |
условии, |
||||
что предел делителя |
не равен |
нулю), |
т. е. |
|
||
|
, |
к |
lim х |
. |
|
|
|
hm — = |
|
|
|
уhm У
Из теоремы 3 и следствия |
2 вытекает, что |
|
\ \ т х ~ т |
= { \ \ т х ) ~ т . |
(2.4) |
3. Сравнение бесконечно малых величин. Отношение двух |
бес- |
конечно малых величин а и р может быть либо бесконечно большой, либо бесконечно малой, либо конечной величиной, либо величиной, не имеющей предела. В общем виде об отношении двух бесконечно малых величин нельзя сказать что-либо определенное. Это отношение зависит от характера изменения бесконечно малых величин.
Установить характер отношения двух бесконечно малых величин или, как говорят, раскрыть неопределенность вида 0/0 можно путем определения предела отношения а/р. Здесь имеют место следующие
ситуации. |
|
1. Предположим, что имеются |
бесконечно малые величины |
а — х3 и р = х, тогда |
|
lim — == — = 0. |
|
Р |
* |
64
Величина а = х3, стремящаяся к нулю быстрее, чем р = х, выступает в качестве бесконечно малой высшего порядка малости относительно р.
2. Если, например, а = х, а р = х2, то
1- а х
lim — = — = сю.
Рх*
Вэтом случае а является бесконечно малой низшего порядка ма-
лости |
относительно |
р. |
|
|
|
|
|
|
|
3. Предел отношения может быть равен конечному числу, на- |
|||||||||
пример, в случае, когда а |
= (х + |
5) х, |
а р = |
х: |
|
||||
|
lim |
= lim i f ± 5 I l |
= |
lim (Х + 5) = 5. |
|
||||
|
Р |
х-*0 |
х |
|
|
*->0 |
|
|
|
Здесь бесконечно |
малые |
а и р |
являются |
величинами |
одного |
||||
и того же порядка |
малости. |
|
|
|
|
|
|
||
4. |
Отношение а/р может вовсе не иметь предела, как, например, |
||||||||
в случае, если а = х sin |
a р = |
х. |
Предел |
|
|
||||
|
|
xsin — |
|
. . |
. |
I |
|
|
|
|
|
lim |
л; |
|
|
|
|||
|
|
x |
= lim sin —• |
|
|
||||
не существует. |
jt-0 |
|
x-+о |
* |
|
|
|||
|
|
|
|
|
|
|
|
||
5. |
Предел отношения бесконечно |
малых величин а и р |
может |
||||||
быть |
равен единице, т. е. |
|
|
|
|
|
|
|
|
|
|
|
lim — = |
1. |
|
|
|
||
|
|
|
|
Р |
|
|
|
|
|
В этом случае а и р |
называются |
эквивалентными бесконечно ма- |
|||||||
лыми |
величинами. |
|
|
|
|
|
|
|
|
§2. Число Эйлера и модель роста словаря
Вразличных областях математики и ее приложениях часто используется функция
пределом которой при неограниченном возрастании х является уже встречавшееся нам число Эйлера е = 2,718... (см. гл. 1, §6, п. 3). Таким образом, можно записать, что
e = l i m f l + - L V |
(2.5) |
|
X оо \ |
х I |
|
С помощью предела (2.5) решаются многие задачи квантитативной лингвистики, связанные с ростом или убыванием какой-либо величины.
Рассмотрим в этой связи некоторую идеальную модель роста словаря.
55
57 В результате постоянного расширения сферы деятельности человека лексика каждого языка, особенно его терминологический словарь, несмотря на выпадение некоторого количества слов, неуклонно растет. Характеристикой увеличения словаря служит коэффициент k его прироста за определенный период времени, например, за десятилетие. Этот коэффициент представляет собой отношение количества новых слов, появившихся за десятилетие, за вычетом вышедших из употребления архаизмов (AL), к общему объему
(L) словаря в данный период, т. е.
L
Зная начальный объем словаря L и коэффициент k, легко показать, что через 10 лет объем словаря составит
L0 + -AL = L0 + L0k = L0 (1 + k).
Однако этот подсчет является в значительной степени приближенным. Ведь в течение десятилетия прирост словаря происходит не относительно исходной величины L0, а относительно сумм L0 + AL (здесь величина AL указывает прирост словаря за то количество времени — за год, месяц, неделю, — которое прошло от момента, когда был зафиксирован начальный объем словаря L0).
Предположим, что нам нужно учесть рост словаря по годам. Тогда к концу первого года мы получим объем словаря, равный
к концу второго года он будет равен
а к концу десятилетия объем словаря составит
Если же учитывать прирост словаря не по годам, а по месяцам, то получим еще более точный результат: к концу десятилетия объем словаря будет равен
Ч ' + ^ Р
Теперь попытаемся представить процесс роста словаря в общем виде. Для этого будем определять изменение словаря относительно промежутка времени Т (например, тысячелетия), считая, что начальный объем словаря характеризуется величиной L0, а коэффициент прироста по-прежнему равен k. Разделим весь период Т на п малых равных частей:
К } [Vf] [ ^ . - f ]
•ч
If |
(i n y |
x |
Поскольку все промежутки — — v |
= — малы, то в каждом |
из них можно считать прирост новых слов АЬ постоянным и пропорциональным исходному объему словаря и величине промежутка
Т/п, т. е. AL = kL0T/n.
Объем словаря к концу первого промежутка составит
L ^ + k L ^ - u l l + j p j ,
к концу второго промежутка
kT \ !
и, наконец, к концу эпохи Т словарь будет включать
|
|
kT \п |
|
|
слов. |
L ' = L ' ( 1 + |
Jir)" |
|
|
Предполагая, |
что число промежутков |
неограниченно |
растет |
|
(т. е. п -*• оо), а |
длина промежутка |
Tin |
неограниченно |
убывает |
(т. е. Т/п -> 0), являясь тем самым бесконечно малой величиной,
приходим |
к равенству |
|
|
|
|
|
|
Lr = limL0 (l + |
Щ " . |
(2.6) |
|||
|
|
1-.ОС. |
V |
п / |
|
|
Заменим частное kT/n |
величиной |
Мх, тогда п = kTx. |
Посколь- |
|||
ку kT/n |
представляет |
собой |
произведение постоянной |
величины |
||
k на бесконечно малую величину Tin, |
то Мх есть тоже бесконечно |
|||||
малая величина, т. е. \!х = kTIn |
0. Учитывая все |
сказанное, |
||||
имеем: |
|
|
|
|
|
|
Применяя следствия 1 и 2 из теоремы 2 (см. § 1, п. 2), перепишем |
||||||
это выражение в виде |
|
lim f 1 -|—— V kT |
|
|||
|
Lt — L. |
|
||||
|
|
|
*-mxj\ |
X j |
|
откуда на основании соотношения (2.5) получаем формулу объема словаря к концу периода Т в виде
Lt — L0 |
(2.7) |
§3. Глоттохронология
1.Классическая глоттохронология. На только что рассмотренный математический аппарат опирается современная глоттохронология, целью которой является приближенная абсолютная датировка процессов расхождения диалектов и родственных языков, а также количественная оценка степени их родства.
67
Исходные лингвистические предпосылки глоттохронологии [32в, с. 384] сводятся к пяти постулатам.
1°. Во всех языках мира существует некоторое множество слов, обозначающих наиболее древние, всегда необходимые и поэтому не изменяющиеся понятия-означаемые (например: большой, все, дерево, птица и т. д.). Их можно объединить в некоторый тестовый список (ТС).
2°. Доля означающих (слов или' эквивалентных словам устойчивых словосочетаний) из ТС, которая сохраняется за некоторый промежуток времени Т для каждого языка, постоянна и не зависит от способа выбора этих слов из ТС.
3°. Каждый язык и диалект имеет свой коэффициент сохранности г относительно периода в 1000 лет. Величины г колеблются относительно периода в тысячу лет от 0,74 (для быстро развивающихся «динамичных» языков) до 0,91 (для «стабильных» языков), средняя величина ~г равна 0,81.
4°. Все означающие из ТС данного языка имеют одинаковые шансы сохраниться на протяжении интервала Т.
5°. Если мы имеем дело с двумя потомками некоторого праязыка, то вероятность означающего из праязыкового ТС удержаться в ТС первого потомка не зависит от вероятности сохраниться в ТС второго потомка.
Опираясь на эти постулаты, можно, во-первых, математически оценить число тех означающих из ТС праязыка, которое сохраняется в двух языках-потомках за период их независимого развития; во-вторых, получить количественную оценку времени их самостоятельного развития.
Предположим, что L„ есть известное нам число означающих ТС, которые характеризуют праязык в момент выделения из него языков-потомков i и /. Зная коэффициенты сохранности лексики для каждого из сравниваемых языков (rt и г}), легко определить коэффициент потери общих слов в ходе дивергенции. Этот коэффициент р а в е н k = 1 — rtr}. Теперь, опираясь на рассуждения, приведенные в § 2, легко показать, что число общих означающих,
сохранившихся в |
языках-потомках за Т тысячелетий |
их самостоя- |
||
тельного развития, |
будет |
равно |
|
|
W |
o |
^ - |
f ^ f l + b ^ ] " |
(2.8) |
(напомним, что п — произвольное количество отрезков, на которое разделено время дивергенции Т). Повторяя преобразования, использованные в § 2, приходим к равенству
LT = L0e~kT. |
(2.9) |
Зависимость (2.9) показывает, сколько слов из ТС, определенного в момент распада праязыка Т0, доживет до момента Т, (здесь
- Т0 = Г).
ffi
Степень родства языков и диалектов можно оценивать через |
||||||||||
отношение |
у — LT/LQ. |
При у > |
0,81 |
два |
«говорения» следует |
|||||
считать диалектами, |
при |
0,36^ у < |
0,81 |
«говорения» являются |
||||||
родственными |
языками, входящими в одну семью; при 0,12 < |
у < |
||||||||
< 0,36 их следует считать принадлежащими |
к одной ветви. |
|
||||||||
Из соотношения (2.9) |
легко получить значение периода дивер- |
|||||||||
генции Т. Для |
этого, прологарифмировав (2.9), получаем |
|
||||||||
|
|
In LT |
= In L0 |
— |
kT, |
|
|
|||
откуда приходим к |
равенству |
|
|
|
|
|
|
|||
|
|
|
т |
in L0 |
In LT |
|
|
|
( 2 1 0 ) |
|
|
|
|
|
k |
|
|
|
|
|
|
Теперь, опираясь |
на данные, приводимые |
В. Гуцу-Ромало |
[50, |
с. 576—584], определим период дивергенции для пары романских
«говорений» — дакорумынского и |
арумынского |
языков-диалектов. |
|||||
Всего сравнивается |
L0 |
= 202 |
латинских слова, из которых оба |
||||
языка-диалекта сохраняют только |
Lt == 149 общих |
лексем. Ко- |
|||||
эффициент сохранности |
лексики для |
дакорумынского |
языка-диа- |
||||
л.кта составляет rd = |
0,81, для арумынского варианта соответствен- |
||||||
но имеем га = 0,88 [32в, |
с. 3861. |
|
лексики |
равен |
|
||
Тогда коэффициент |
потери |
общей |
|
||||
k = 1 — rdra = 1 |
— 0,81 |
• 0,88 « |
0,29. |
|
С помощью этих данных на основании формулы (2.10) вычисляем период дивергенции для обоих языков-диалекгов. Этот период составляет
In 202 — In 149 |
, n c |
|
|
|
0,29 |
= 1,05 тысячелетия. |
|
|
|
|
|
Иными словами, распадение |
балканороманского языка-основы |
||
относится к началу IX в., что хорошо согласуется с историко-линг- |
|||
вистическими фактами |
[24, с. |
273—2781. |
|
2. Ранговый метод в глоттохронологии. |
Классическая глотто- |
||
хронология имеет ряд уязвимых пунктов. |
|
||
Во-первых, критерии отбора понятий для ТС не являются про- |
|||
стыми, объективными |
и однозначными. Сами |
значения используе- |
мые в ТС, неизоморфны для разных языков. Примером может служить неконгруэнтность означаемых у прилагательных, обозначающих цвета, у терминов родства, у существительных со значением «дерево» [32 в, с. 2851; [44]. Поэтому между ТС и словарем конкретного языка трудно установить однозначное соответствие.
Во-вторых, нет никакой уверенности в том, что степень сохранности лексики одинакова для всех участков ТС (ср. постулаты 2° и 4°).
В-третьих, классическая глоттохронология не учитывает возможности вторичного сближения родственных языков, так широко представленного в индоевропейском, тюркском и других ареалах.
59