Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пиотровский

.pdf
Скачиваний:
174
Добавлен:
06.06.2015
Размер:
9.13 Mб
Скачать

в /почке х =

а,

то ее производная в этой

точке либо

равна нулю

I/' («) = 0J,

либо вообще не существует. Этот признак

является не-

обходимым,

 

но

н е д о с т а т о ч н ы м

признаком

экстремума:

из того, что производная в данной точке обращается в нуль или вовсе не существует, еще не следует, что эта точка обязательно будет точкой экстремума. Поэтому при выявлении экстремальных зна-

чений приходится оперировать двумя более сильными — так

назы-

ваемыми достаточными признаками

экстремума.

 

П е р в ы й д о с т а т о ч н ы й

п р и з н а к э к с т р е м у-

м а формулируется так: точка х = а служит точкой экстремума

функции y=f (х), если производная /'

(*) при переходе х через а ме-

няет знак; при

перемене знака с «+» на «—» точка а является

точ-

кой максимума,

при перемене знака с «—» на «+» — точкой

мини-

мума (в самой точке а производная

либо равна нулю, либо не су-

ществует).

 

 

 

Исходя из необходимого и первого достаточного признака

экст-

ремума, получаем следующее п р а в и л о исследования функции

У = f (х) на максимум и минимум с помощью первой

производной:

1) найти

первую

производную у'х

= /'

(х);

(х) не

. <•

2) найти

точки,

в

которых f (х) =

0

или f

существует;

эти точки называются

критическими

точками

I рода

(если таких

точек не существует, то функция экстремумов не имеет); 3). исследовать изменение знака производной при переходе сле-

ва направо через каждую критическую точку х—а, для чего следует дать х значение несколько меньшее, чем а (т. е. х = а К), а затем несколько большее, чем а (т. е. х = а + h), причем под h подразумевается произвольное достаточно малое положительное число (возникающие здесь варианты представлены в табл. 3.6);

4) вычислить экстремальные значения функции в точке а.

f'(e-A)

 

Г (а)

 

f'(a+h)

+

0

или

оо

+

0

илй

оо

+

0

или

оо

+

 

0

или

00

 

Т а б л и ц а 3.6

Характер критической точки

максимум

минимум экстремума нет, функция возрастает

экстремума нет, функция убывает

Иногда для установления максимумов и минимумов функции бывает удобнее и проще воспользоваться в т о р ы м д о с т а т о ч -

н ы м

п р и з н а к о м

э к с т р е м у м а , который формулирует-

ся так:

точка х — а есть точка экстремума функции

у = f (х),

если /'

(а) — 0, a f

(а) Ф

0, причем в том случае,

когда

f" (а) > О,

точка а является

точкой минимума, а когда f

(а) <

0 — точкой

максимума.

 

 

 

 

Исходя из второго достаточного признака сформулируем следующее п р а в и л о исследования функции на экстремум:

ь

1)найти первую и вторую производные;

2)найти критические точки функции;

3)определить знак второй производной: если вторая производная в критической точке положительна, то эта точка является точкой минимума; если вторая производная отрицательна, то рассма-

триваемая точка есть точка максимума; если же вторая производная в критической точке равна нулю, то следует возвратиться к исследованию функции с помощью первой производной (см. табл. 3.7);

4) вычислить экстремальные значения функции в точке а.

X

Г <*!

 

 

 

а

0

r w

<

о

 

 

/ ' ( * ) > 0

 

 

Г М

=

о

Т а б л и ц а 3.7

Характер критической точиг

максимум

минимум

неизвестен (правило неприменимо)

4. Выпуклость, вогнутость и точка перегиба кривой. Для опре-

деления

понятий

выпуклости

и

вогнутости рассмотрим

кривую

у = f (*), изображенную на

рис.

31. В промежутке

(а,

Ь) выберем

несколько точек и прове-

у

 

 

 

 

 

 

 

 

 

 

 

 

дем

в

них

касательные,

 

 

 

 

 

 

 

 

 

 

 

 

Из графика видно, что все

 

 

 

 

 

 

 

 

 

 

 

 

 

точки кривой

в промежут-

 

 

 

 

 

 

 

 

 

 

 

 

 

ке

(а,

в)

лежат

 

н и ж е

 

 

 

 

 

 

 

 

 

 

 

 

 

любой

ее

касательной

в

 

 

 

 

 

 

 

 

 

 

 

 

 

этом промежутке. В таком

 

 

 

 

 

 

 

 

 

 

 

 

 

случае говорят,

что кривая

о

 

 

 

 

 

 

 

 

 

 

 

 

выпукла

вверх

в

интервале

 

 

 

 

 

 

 

 

 

 

 

 

 

(а,

Ь) или

просто

выпукла.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим теперь дру-

 

 

 

 

 

 

 

 

 

 

 

 

 

гой

промежуток

 

(Ь, с) той

 

 

 

 

 

 

 

 

 

 

 

 

 

же

кривой

и проведем несколько

касательных

в

точках

этого про-

межутка. Здесь все точки кривой лежат в ы ш е

любой ее касатель-

ной в промежутке (b, с).

В

таком

случае

говорят,

что кривая вы-

пукла вниз

в интервале (b,

с)

или

просто

вогнута.

 

 

 

 

 

 

Вогнутость и выпуклость кривой может быть определена с по-

мощью одного

из следующих

признаков.

 

 

 

 

 

 

 

 

П р и з н а к

 

1. Интервалу

убывания

первой

производной

f

(*)

соответствует участок выпуклости

(а,

Ь) кривой,

а интервалу

воз-

растания /' {х) — участок

вогнутости

(Ь, с).

 

 

 

 

 

f

(х)

П р и з н а к

 

2.

Если

вторая

производная

функции

у =

во всех точках

интервала'{а,

Ь) отрицательна,

т. е. f

[х) <z О, то

кривая у =

/ (х) выпукла в этом интервале

и, наоборот, если вторая

производная

во

всех

точках

интервала

(а, Ь)

положительна,

т. е.

f ' (*) >

0, то кривая

у =

f {х) вогнута

в указанном

интервале.

 

81

Если кривая у — f (х) имеет участки выпуклости и вогнутости, то между ними, очевидно, будет существовать какая-то точка, которая не обладает свойствами соседних промежутков. Такая точка называется точкой перегиба (точка В на рис. 31). Поскольку по обе стороны от точки перегиба направления выпуклости различны, зна-

ки второй производной /" (х)

в соседних

точках также

различны,

а сама производная

должна

быть равна

нулю.

 

Для нахождения

точек перегиба, а также участков

выпуклости

и вогнутости кривой у

= f (х) рекомендуется пользоваться следую-

щим

п р а в и л о м :

 

 

1) найти вторую производную у"

= /" (х);

2)

найти точки, в которых /" (х) =

0 или /" (х) не существует, —

критические точки II

рода;

 

3) исследовать изменение знака второй производной при переходе слева направо через каждую критическую точку II рода х — Ь,

для

чего

следует определить

знаки /" (х) в

точках

х = b h

и

х =

b +

h, где h — произвольное достаточно

малое

положитель-

ное число; если /" (х) меняет

знак при переходе через точку х =

Ь,

то график функции имеет точку перегиба; если же знак /" (х) не

меняется, то точки перегиба нет — при /" (х) <

0 кривая в рассма-

триваемом интервале выпукла, а при /" (х) >» 0 — вогнута;

4)

вычислить ординаты

точек

перегиба.

 

5.

Асимптоты. Прямая

линия

А называется

асимптотой кри-

вой, если расстояние точки М от прямой А стремится к нулю при неограниченном удалении этой точки по кривой от начала координат. Примером г о р и з о н т а л ь н о й асимптоты может служить ось Ох на рис. 9, примером в е р т и к а л ь н о й асимптоты является ось Оу на том же-рисунке. Кроме того, могут существовать и н а- к л о н н ы е асимптоты.

Для выявления вертикальных асимптот необходимо найти точки бесконечных разрывов, т. е. точки, в которых f (х)-> оо. Взаимное расположение бесконечной ветви кривой и асимптоты определяется

в ходе исследования «знака бесконечности» при стремлении х к х0

слева

и

справа. Так, например, для функции у = tgx

значения

t g x - > -

+

оо, когда

х - + я/2, оставаясь меньше чем

л/2,

и t g x - >

-> — оо,

когда х->

я/2, оставаясь больше чем л/2

(см. рис. 13).

Если же f (х) ни при каком значении х не стремится к бесконечности, то вертикальных асимптот нет.

Чтобы найти "наклонную асимптоту кривой у — f (х), нужно выразить расстояние между точкой М (я; у) и точкой М' (х\ у') прямой А через разность ординат этих точек при одной и той же абсцис-

се

х\

 

у-у'

=

/ (х) -

(kx + Ь).

 

 

 

 

 

 

По определению, прямая у'

= kx +

b служит асимптотой кри-

вой у

=

f (х) в том случае, если расстояние между ними (разность

ординат

у — у') стремится

к нулю при бесконечном

возрастании

х

т.

е.

lim [/(*) — (Ь-|-6)] = 0.

(3.24)

 

 

 

 

 

 

Х-+0О

 

 

 

 

82

Определим величины k и b. Для нахождения k представим выражение (3.24) в следующем виде:

Х-+Ж I X X J

Так как первый множитель этого произведения стремится к бесконечности, то второй множитель должен стремиться к нулю. Отсюда

 

lim

 

j = 0.

или

 

X

 

 

lim i i £ > _ i i m _ t

=

 

 

X х

X

х оо X

 

но

lim — = 0, поэтому

 

 

 

 

х ~*оо X

 

 

 

 

lim Ш - = к.

(3.25)

 

X -+оо

 

 

Найдя величину k, теперь из равенства (3.24) определим b:

 

 

b = \\m[f{x) — kx\.

(3.26)

 

 

Х-*эо

 

Для установления взаимного расположения кривой и асимптоты

следует выяснить знак разности / (х) (kx + b) как при х-*-

+ оо,

так и при

х-*- — оо. Если эта разность положительна, то

кривая

расположена н а д

асимптотой; если же она отрицательна, то кри-

вая лежит

п о д

асимптотой.

 

6. Общая схема исследования функции и построение ее графика. Как уже говорилось, при математической экспликации того или иного лингвистического процесса представляют интерес не отдельные численные значения моделирующей его функции, а существенные особенности этой функции, например: возрастание и убывание, максимум и минимум, выпуклость и вогнутость ее графика. Все эти свойства функции хорошо прослеживаются на графике. Однако построение графика, так же как и выбор аналитической формы функции по некоторому (пусть даже очень большому) количеству точек, взятых наудачу, всегда связано с опасностью упустить некоторые существенные особенности функции. Напротив, предварительное аналитическое исследование, выявляя ее существенные особенности, позволяет определить положение характерных точек.

Исследование функции, а затем построение графика осуществляется обычно по схеме, включающей следующие этапы.

1.Определение области существования и промежутков непрерывности функции.

2.Установление области возрастания и убывания функции;

нахождение точек экстремума и выяснение их характера.

3. Установление промежутков выпуклости и вогнутости кривой; нахождение ее точек перегиба.

4.Отыскание асимптот.

5.Сведение результатов исследования в таблицу.

Эта таблица должна включать значения функции в ее характерных точках, к которым относятся точки экстремума, точки перегиба и точки пересечения функции с осями координат, точки разрыва (если они существуют), а также границы области существования функции. Кроме того, в таблицу вносятся и некоторые дополнительные значения функции. Перенеся найденные точки на чертеж и соединив их плавной кривой, мы получим график исследуемой лингвистической функции.

Проведя исследование функции и представив его результаты в легко обозримой графической форме, мы получаем возможность объективно решить вопрос о соответствии математической модели

еелингвистическому оригиналу.

7.Исследование двух функций, аппроксимирующих распределение информации в тексте. Моделирование распределения информации в тексте осуществляется с помощью двух функций: выражения

=

i - ) ] ,

(3.27)

где. п — номер буквы в тексте, Н1 — энтропия первой буквы текста, а — коэффициент [23, с. 67], а также показательной функции

In = Vo — Uer-*+I„.

(3.28)

Необходимо выяснить, какая из этих зависимостей лучше моделирует распределение информации в тексте. Чтобы сделать возможным использование аппарата исследования функций, будем считать аргумент п в обоих случаях непрерывной величиной.

1) Приведем правую часть соотношения (3.27) к общему знаменателю:

 

 

 

 

гт __

Hi

п—аНх

п+аН\

 

 

 

 

 

 

 

 

In

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из

полученного

равенства

видно,

что

функция 1тп = у

= f (л)

существует и непрерывна при всех значениях аргумента

я,

кроме

п =

 

О, т". е. в интервалах

(— оо,

0),

(0, +

оо).

 

 

2) Установим теперь характер поведения функции в интервале

(0,

+

оо). Для этого найдем первую

производную

 

 

 

 

/'(„) =

( я 1 - Я

1 а

+ - ^ - ) '

=

- Я 1

а - 1 .

 

(3.29)

 

 

 

 

\

 

 

я

In

 

 

 

п*

 

 

Это соотношение

показывает,

что

при любом

значении

аргумента

п в интервале (0, +

оо) первая производная

является отрицатель-

ной

величиной,

откуда следует,

что

данная

функция

убывает

в указанном интервале.

 

 

 

 

 

 

 

 

 

 

 

Так как среди возможных значений аргумента нельзя найти та-

кое, при котором производная /' (п) обращалась бы в нуль, то функция (3.27) не имеет точек экстремума.

84

3) Для установления характера кривой в интервале (0, + оо) (выпуклости или вогнутости) найдем вторую производную. Имеем

Очевидно, что при всех положительных значениях п вторая производная данной функции положительна. Значит, график распреде-

ления информации в тексте

представляет

собой

вогнутую линию

и не имеет в интервале (0,

+ оо) точек перегиба.

4) Определим

асимптоты

кривой распределения информации.

Так как

при п

О

 

 

 

 

lim f(n)=* lim

Нщ-аНщ+аН,.

=

+00>

 

л-»-0

п.-*О

Я

 

 

то прямая

п — 0 (т. е. ось ординат) есть вертикальная асимптота.

Для определения положения наклонной

асимптоты нужно вос-

пользоваться формулами (3.25) и (3.26). Угловой коэффициент равен

ft = lim Ж

= lim Ъп - аНгп+аНг =

П —* ОО

fl

fl

ОО

 

пя

— lim

f - ^ L - - ^ - +

^

= 0.

п-+ оо \

п

п

 

п* I

Начальная ордината асимптоты

 

 

 

6 = lim [f(n)-kn]

= lim

 

rt

Л —•00

 

 

/I-*00

 

= lim 1-аН1+^-)

fl

=

Н1(1-а).

n~*oo \

 

 

J

 

Поскольку угловой коэффициент асимптоты равен нулю, эта асимптота имеет горизонтальное положение, а ее уравнение принимает вид

y = H i ( \ - a ) .

(3.30)

Для установления взаимного расположения кривой распределения информации и горизонтальной асимптоты определим разность ординат этой кривой и асимптоты при одном и том же значении п:

Так как полученная разность положительна (величины а, Н1 и п положительны), то горизонтальная асимптота (3.30) расположена под кривой (3.27).

Перенеся все результаты исследования на чертеж,

мы получаем

график функции

(3.27) в том виде, как он изображен на рис. 32.

Используя ту же схему, исследуем функцию (3.28),

представляю-

щую собой второй

вариант описания распределения

информации

в тексте. Здесь

мы

получаем

следующие

результаты.

1) Функция

1п

— У — Ф (я)

существует

и непрерывна на всей

числовой оси:

— оо < п <

+

оо.

 

 

85

2) Вид

первой производной

 

 

ф' (и) = — s (/„

и е - 5

показывает,

что функция является

убывающей, так как первая

производная всегда отрицательна, и экстремальных значений не имеет.

3) Вторая производная

положительна, поэтому кривая (3.28) вогнута и не имеет точек перегиба.

4) График функции имеет только одну горизонтальную асимпто-

ту У = Л»- При п = О кривая пересекает

ось

Оу в точке у =

/0.

 

 

 

Всем этим

условиям

 

 

 

соответствует уже знако-

 

 

 

мый

нам график,

изоб-

 

 

 

раженный

на

рис.

19.

 

 

 

Результаты

исследо-

 

 

 

вания

показывают,

что

 

 

 

зависимость

 

 

 

 

 

 

 

моделирует

распределе-

 

 

 

ние

информации

в

тек-

 

 

п

сте при 0 < « < о о ,

вто

 

Рис. 32

 

время

как

зависимость

 

 

 

In =

 

(/ o - / J

^

+

U

описывает

распределение

информации при 0 ^

 

п <

 

 

 

 

При информационных измерениях языка широко используется

величина

/ 0 (информация

алфавита). Эта

величина характеризует

количество информации (неопределенности), возникающее в том случае, когда совершенно не учитываются дистрибутивно-вероят- ностные ограничения на употребление лингвистических единиц, причем п здесь считается равным нулю. Эта ситуация учтена в зависимости (3.28), но не предусмотрена в функции (3.27), которая при п = 0 не существует.

Из всего сказанного следует, что для моделирования распределения информации в тексте следует выбрать функцию (3.28).

Г Л А В А 4

СУММИРОВАНИЕ И ИНТЕГРИРОВАНИЕ В ЛИНГВИСТИЧЕСКИХ ПРОЦЕССАХ

Многие задачи квантитативной лингвистики возникают как задачи вычисления сумм языковых величин, характеризующих тот или иной речевой или диахронический процесс в целом или в его части. Эш задачи решаются с помощью аппарата теории рядов и интегрирования.

§1. Основные понятия теории рядов

1.Числовой ргяд. Если взять множество значений величин информации, приходящихся на первую, вторую и т. д. буквы слова или множество относительных или абсолютных частот, характеризующих употребительность данного лингвистического явления в определенные периоды истории языка, то видно, что из этих множеств можно образовать числовые последовательности, подчиняющиеся

определенному

правилу.

Бесконечная

числовая последователь-

ность имеет следующий вид:

 

 

 

 

 

 

 

«1.

 

•••>

•••»

 

где ип — общий

член

последовательности.

 

Члены последовательности можно суммировать. Тогда алгебра-

ическая

сумма членов

последовательности

 

 

 

ut +

«2 +

«3 + ... +

ип

4- ...

(4.1)

образует

бесконечный

числовой

ряд, или

просто ряд. Иногда

для

 

 

 

 

 

 

со

ип. Выражение для

п-го

обозначения ряда применяют

запись

Е

 

 

 

 

 

 

п= 1

 

 

члена ряда при произвольном п называется общиц членом ряда. Обычно общий член ряда задается формулой ип = / («), пользуясь которой, можно сразу написать любой член ряда. Например, в ряде, характеризующем сумму информаций, приходящихся на первую, вторую, ..., п-ю, ... буквы слова, общий член имеет вид

ип — 1п = 10е sn

Составим из первых членов ряда (4.1) суммы

Si и и

 

 

 

S$ — Ui -f- и%,

 

 

Ss = "l +

«2

+u3,

 

Sn = Щ +

«2 +

"s +

+ Un,

которые называются частичными суммами данного ряда.

87

Если при бесконечном возрастании номера п частичная сумма ряда Sn стремится к конечному пределу S, т. е.

 

 

lim Sn =

S,

 

(4.2)

 

 

П-*оо

 

 

 

то

в этом случае ряд

называется

сходящимся, а

число

S — его

суммой.

неограниченно возрастает, т. е.

lim S„ =

 

Если же величина Sn

 

оо, или Sn хотя и не возрастает неограниченно,

rl-*oc

=

но ни к какому

конкретному пределу не стремится, то мы имеем дело с расходя-

щимся

рядом.

 

Ряды могут быть либо знакоположительными (все члены такого

ряда

положительны, т. е. ип ~> 0), либо

знакоотрицательными

(все члены такого ряда отрицательны, т. е. ип

<С 0), либо знакопере-

менными (члены такого ряда могут быть как положительными, так и отрицательными).

Членами ряда могут служить не только числа, но и функции не-

которого аргумента х.

В этом случае мы имеем дело с так называе-

мым функциональным

рядом,

который

имеет вид

 

Л (*) + /2 (*) + /з (*) + -

+

fn

(х)

+ ....

(4.3)

где функции Д (х), /2 (х)

/„ (х),

...

определены

в некоторой

области изменения аргумента

х. Придавая х какое-либо значение

х0 из области определения функций /„ (х),

получим

числовой ряд

Л (*о) +

h (*о) +

— * + 7 п (*о)

+

 

Этот ряд может сходиться или расходиться. Если он сходится, то точка х0 называется точкой сходимости функционального ряда (4.3). Совокупность всех точек сходимости функционально о ряда называется областью его сходимости.

Важным случаем функциональных рядов являются степенные ряды. Степенной ряд имеет вид

 

а0 + atx

+ а2х2

+

...

+ апхп + ...,

(4.4)

где х

— аргумент, а а0, аи а2,

...,

ап

— постоянные числа, называе-

мые

коэффициентами.

 

 

 

 

 

Степенной ряд можно почленно дифференцировать сколько угодно раз, причем полученные при этом ряды будут иметь ту же об-

ласть

сходимости.

f (х) является суммой

степенного ряда:

 

Пусть функция

 

 

f (*) =

ай

+ а1х + а2х2 +

... +

апхп + ... .

(4.5)

Последовательно

дифференцируя

п

раз степенной ряд

(4.5)

и полагая в полученных равенствах х =

0, найдем следующие зна-

чения

коэффициентов:

 

 

 

 

 

 

ao~f(0)»

ai = /'(0),

 

=

 

 

 

a

-JC1M.

а

-

 

ni

 

 

а

°

 

 

 

 

Подставив значения коэффициентов в степенной ряд (4.5), получим ряд

/(*) = /-(0)+/'

(0)X + ГЖ.-X* +

- Q j j L *» + . . . +

 

X* + ... ,

 

 

 

 

 

 

 

 

 

 

 

(4.6)

который называется рядом

Маклорена. С помощью ряда

Маклорена

любую функцию / (х) можно разложить в ряд по степеням

х.

Например,

разложение

для

функции

f {х) =

е*

получается

следующим

образом. Сначала

определим

значения производных

/' (х) =

е\

f"

(х) = ех, /"'

(х) =

ех, ... Полагая

х =

0,

найдем

/ (0) =

1, f

(0) =

1, /" (0) =1, / " '

(0)= 1, .... Подставив значения

производных

в

р'яд Маклорена,

имеем

 

 

 

 

Если в равенстве (4.7) положить х = 1, то получим значение «числа Эйлера» в виде суммы числового ряда:

е = 1 + 1 + 4 - +

V- +

.••+ — + . . . •

2!

3!

п!

Представление числа е в виде суммы числового ряда дает возможность вычислять эту величину с любой степенью точности.

2. Признаки сходимости ряда. Важнейший вопрос исследования ряда состоит в определении его сходимости или расходимости. Поэтому рассмотрим те необходимые и достаточные признаки, с помощью которых по общему члену ряда можно определять его схо-

димость или расходимость.

 

 

Н е о б х о д и м ы й

п р и з н а к

с х о д и м о с т и

ряда

формулируется следующим образом: если

ряд

 

«1 +

"г + — + "п +

 

сходится, то неообходимо, чтобы общий член ряда ип при неогра-

ниченном возрастании

п

стремился

к

нулю:

 

 

 

 

 

 

 

lim ип =

0.

 

 

 

 

 

 

 

 

 

п-+оо

 

 

 

 

 

Из необходимого условия

сходимости

ряда вытекает д о с т а -

т о ч н ы й

п р и з н а к р а с х о д и м о с т и

ряда: если

общий

член ряда ип

не стремится

к нулю, то ряд

является расходящимся.

Из достаточных признаков сходимости ряда мы будем применять

следующие

три

признака.

 

 

 

 

 

 

 

П е р в ы й

п р и з н а к

с х о д и м о с т и

(признак

сравне-

ния). Пусть

даны

два знакоположительных

ряда:

 

 

У,

un

= Ul + u2 + ua + ...+un

+ ...{un>0)

(4.8)

 

п - 1

 

 

 

 

 

 

 

 

 

 

2

f n = o1 +

o 2 + o 3 + . . . + f n

+ . . . ( u n > 0 ) ,

(4.9)