Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Стохастический_мир.pdf
Скачиваний:
112
Добавлен:
16.03.2016
Размер:
2.96 Mб
Скачать

M: Математические приложения

В достаточно обширных приложениях содержатся важные факты из теории вероятностей, математического анализа и матричной алгебры.

295

296

IТеория вероятностей

Вероятность характеризует частоту, с которой происходит событие. Если мы произвели некоторый опыт (испытание) n раз, и при этом со-

бытие A произошло nA раз, то при больших n отношение p(A) = nA=n будет стремиться к определ¼нному значению. Понятно, что оно всегда положительно и меньше единицы: 0 6 p(A) 6 1.

Не стоит путать незнание и вероятность. Вероятности легко определяются, если в задаче есть определ¼нная симметрия. Например, вероятность выпадания решки при подбрасывании монеты равна 1=2. Ана-

логично для кости (кубика с шестью гранями) выпадение любой грани равновероятно и равно 1=6. Для европейской рулетки с 18-ю красными

ячейками, 18-ю ч¼рными и одним зеро вероятность попадания шарика на любую из 37 ячеек, включая зеро, равна 1=37.

Знание вероятностей позволяет легко подсчитывать, например, средний доход в азартных играх или финансовых операциях. Если мы полу- чаем доходы Ri > 0 или убытки Ri < 0 с вероятностями pi, то наш доход в среднем будет составлять величину:

 

q

 

Xi

R = R1p1

+ R2p2 + ::: + Rqpq = Ripi:

 

=1

Смысл этой формулы очень прост. Если мы сделаем большое число попыток n, то среди них n1 раз получим доход R1, n2 доход R2, è ò.ä. Суммарный доход Rtot = R1n1 + ::: + Rqnq. Средний доход за одну игру

R равен Rtot=n, а вероятности получить доход Ri обозначаются через pi = ni=n.

Пример: Сравним доход, получаемый при использовании двух стратегий игры на рулетке: (1) ставим 1$ на ячейку; (2) ставим 1$ на цвет. При угадывании конкретной ячейки казино выплачивает 35$ на поставленный 1$ (вероятность этого 1=37), иначе

(с вероятностью 36=37) ставка теряется. При угадывании цвета (18 ячеек) казино выплачивает 1$, иначе (остальные 19-ть ячеек) ставка теряется.

Средний доход обе стратегии будут давать одинаковый:

 

 

1

 

 

 

36

 

 

1

 

 

R = (35$)

 

 

 

(1$)

 

 

 

=

 

 

$

 

37

 

37

37

 

18

 

 

19

 

 

 

1

 

 

R = ( 1$)

 

 

(1$)

 

 

=

 

 

$;

37

 

37

 

37

хотя понятно, что вторая чаще приносит приятные минуты выигрыша.

M: Математические приложения

297

Различают элементарные и составные события.

Например, при

броске кости элементарным событием будет выпадение одной из граней: f1g, f2g, f3g, f4g, f5g, f6g. Составное событие A= выпавшие очки де-

лятся на три : f3; 6g, или B= выпало больше 4-х : f5; 6g. Таким образом, составные события состоят из элементарных.

Два события называют несовместными или непересекающимися, если они не имеют ни одного общего элемента. При броске одной кости не может выпасть сразу и 1, и 5. Не может одновременно произойти A = f2; 4; 6g= ч¼тные очки и B = f1; 3; 5g= неч¼тные очки . Для несов-

местных событий A и B вероятность того, что произойд¼т или одно, или другое, равна:

p(A + B) = p(A) + p(B) :

Действительно, если мы проводим опыт n раз, то событие A произойд¼т nA раз, а событие B nB раз. Понятно, что составное событие или A, или B происходит nA+B = nA + nB раз (если они не могут произойти одновременно!).

Все элементарные события Ai составляют полную группу, т.е. все они попарно несовместны, а сумма их вероятностей равна единице.

Наглядно полную группу элементарных событий можно представить,

как некоторое множество не пересекающихся друг с другом областей. При этом площадь каждой области пропорциональна вероятности данного события:

A

Правило сложения вероятностей представляет собой суммирование площадей таких областей. Составное событие A включает в себя несколько

элементарных событий-областей, и p(A) равна сумме их вероятностей.

Суммарная площадь всех элементарных событий равна единице. Если некоторое составное событие A имеет вероятность p(A), то вероятность

того, что оно не произойд¼т (

 

p(A).

A), равна p(A) = 1

298

Два сложных (составных) события A, B могут иметь общие эле-

ментарные события. В этом случае мы говорим, что они пересекаются. Чтобы они совместно реализовались, необходимо наступление хотя бы одного элементарного события из их пересечения.

Тот факт, что свершились и A, и B, обозначают как A B. Совместное наступление этих двух событий называют также их пересечением.

Аналогично, если произошло или A, или B, или оба, это означает, что случилось одно из элементарных событий из A или из B. Такое объединяющее логическое 'или' обозначают A + B, и говорят об объединении событий.

Например, при броске кости события A= выпавшие очки делятся на три : {3,6}, и B= выпало больше 4-х : {5,6}, имеют пересечение A B: {6} и объединение A + B: {3,5,6}.

На рисунках ниже символически представлены операции пересечения

 

 

 

 

 

A B, объединения A + B и отрицания A. Результат соответствующей

операции обозначен т¼мным цветом.

 

 

p(A B)

 

p(A+B)

 

 

p(A)

p(B)

p(A)

p(B)

p(A)

1-p(A)

 

 

 

 

Сравнивая заштрихованные площади несложно выразить вероятность события A+B (или A, или B, или оба) через вероятность одновременного

наступления A B (и A, и B):

 

 

p(A + B) = p(A) + p(B) p(A B) = 1 p(A

B):

Действительно, вероятность события A + B равна суммарной площади p(A) и p(B) минус площадь их пересечения p(A B), которую мы учитываем дважды, один раз в p(A), другой раз в p(B) (см. первый рисунок выше). Аналогично доказывается более общее соотношение:

 

 

:::):

p(A + B + C + :::) = 1 p(A

B C

Другими словами, вероятность того, что произойд¼т хотя бы одно событие, меньше единицы на вероятность того, что не произойд¼т ни одно из событий.

M: Математические приложения

299

Условная вероятность характеризует частоту наступления события A при условии, что произошло событие B:

p(B

)

A) =

p(A B)

p(A) AB p(B)

 

 

p(B)

 

Чтобы произошло A при наступлении события B, необходимо свершение совместного события (A и B). Именно ему пропорциональна условная вероятность. Так как нам известно, что B произошло, то вс¼ пространство элементарных вероятностей сжимается до размеров B. Но, поскольку его площадь не равна единице, мы для нормировки делим на p(B).

Это можно представить себе и по-другому. Пусть мы провели n испытаний, и из них событие B произошло nB раз, событие A nA, а одновре- менно они случились nAB раз. При вычислении условной вероятности нас интересует вероятность события A во всех ситуациях, когда происходило

B. Отношение числа таких событий nAB к общему числу событий nB è да¼т нам условную вероятность p(B ) A) = nAB=nB = (nAB=n)=(nB=n).

Условная вероятность чрезвычайно важна, так как позволяет связать друг с другом разнообразные события, характеризуя причинно-следствен- ную связь. Мы говорим, что, если Центральный Банк поднимет уч¼тную ставку, то, скорее всего, фондовый рынок отреагирует падением. Оба события являются вероятностными, но они связаны друг с другом, и вероятность падения рынка повышается, если происходит подъ¼м процентных ставок.

Два события A и B называют независимыми, если вероятность события A не зависит от наступления события B и равна p(A) в любом случае. Для независимых событий p(B ) A) = p(A) = p(A B)=P (B), и, следовательно,

 

 

 

p(A B) = p(A)p(B)

:

(6)

Таким образом, независимость это, с одной стороны, достаточно специфическое соотношение между значениями вероятностей (площадей областей), которые соответствуют событиям A, B, A B. С другой стороны,

это важнейшее свойство отсутствия между ними связи. Так, при бросании 2-х костей выпадение определ¼нной грани на каждой из них не зависит от другой. Поэтому вероятность получить, например, две единицы равна (1=6)(1=6) = 1=36.

300

II Векторный анализ

Вектор это набор из n чисел a = (a1; :::; an), которые называют компонентами вектора. Векторами являются: положение тела в пространстве, его скорость, набор весовых коэффициентов, определяющих долю i-той акции в инвестиционном портфеле, значение ВВП, произведенное

i той страной, и т.д.

Вектора можно складывать (покомпонентно), получая новый вектор:

a+ b = (a1 + b1; :::; an + bn);

èумножать на число a = ( a1; :::; an). Для двух векторов вводится операция скалярного произведения, равная числу (скаляру):

n

X

a b = a1b1 + a2b2 + ::: + anbn = aibi:

i=1

Соответственно, длина вектора:

p q

jaj = a a = a21 + a22 + ::: + a2n;

является n-мерным обобщением теоремы Пифагора. Косинус угла между двумя векторами определяется следующим образом:

a b cos = jaj jbj:

Если он равен нулю, то говорят, что векторы нормальны (перпендикулярны) друг другу.

Для нескольких скалярных произведений важна последовательность умножений, и в общем случае

(a b) c 6= a (b c):

Дело в том, что в первом случае мы умножаем вектор c на число (a b), а во втором другой вектор a на число (b c). Если c и a имеют различное

направление, то умножением на число нельзя сделать их одинаковыми. К векторам, в общем случае, необходимо относиться, как к абстрактному набору из n чисел, для которых введены операции сложения и умно-

жения на число, а также операция скалярного произведения. Например, вероятности всех элементарных событий можно рассматривать, как вектор p = (p1; :::; pn), а условие нормировки записывать в виде p u = 1,

ãäå u = (1; :::; 1).

M: Математические приложения

301

В двухмерном случае n = 2 в декартовых прямоугольных координатах (x; y) вектор a = (ax; ay) имеет простой геометрический смысл направленного отрезка с проекциями на оси x и y, равными ax è ay:

С осями координат удобно связать два единичных ( i2 = j2 = 1), нормальных (i j = 0) вектора. Любой вектор тогда может быть разложен по этому базису (i, j):

a = ax i + ay j;

ãäå ax = a1 = a i, ay = a2 = a j проекции вектора на оси x и y. Представив a и b в таком виде, несложно убедиться, что a b =

axbx + ayby.

Аналогично, в тр¼хмерном случае n = 3 вводят три единичных взаимно перпендикулярных вектора i, j и k. Любой вектор в тр¼хмерном

пространстве может быть по ним разложен: a = ax i + ay j + az k. Геометрически сложение векторов описывается правилом параллело-

грамма, а умножение на число во столько же раз удлиняет вектор:

b

c

-c

 

a + b

2c

a

 

 

 

Правило параллелограмма имеет простую физическую интерпретацию. Если два мышонка тащат кусок сыра в разные стороны и с различными силами a и b, то их общее усилие будет направлено по диагонали a + b.

В общем случае набор из n векторов e1,...,en называют базисом, если они являются полной системой линейно независимых векторов. Линейная независимость означает, что ни один из векторов базиса не может быть представлен в виде линейной комбинации остальных векторов, а полнота гарантирует, что произвольный вектор a = (a1; :::; an) может быть разложен по этому базису:

n

X

a = a1e1 + ::: + anen = aiei:

i=1

Размерность пространства равна числу базисных векторов. Векторы базиса, вообще говоря, не обязательно должны быть перпендикулярны друг другу и иметь единичную длину.

302

Для тр¼хмерного пространства (в котором мы жив¼м) можно ввести

ещ¼ одну операцию между векторами, называемую векторным произведением. В отличие от скалярного произведения, которое представляет собой число, векторное произведение это вектор:

0 1

i j k

a b = (a2b3 a3b2; a3b1 a1b3; a1b2 a2b1) = det @a1 a2 a3A; b1 b2 b3

где i; j; k базисные векторы, а det определитель матрицы (стр. 308).

Векторное произведение обладает рядом важных свойств, которые можно проверить в покомпонентном виде. Прежде всего, оно антисимметрич- но:

a b = b a:

Для смешанного произведения справедливо правило нахальства , при котором скалярное произведение выталкивает один вектор из векторного, сдвигая всех вправо:

c (a b) = (c a) b:

Наконец, часто используется правило б'ац минус ц'аб , которое нужно произносить с ударением на первую букву ^• :

a (b c) = b (a c) c (a b):

Длина векторного произведения пропорциональна синусу угла между векторами ja bj = jajjbj sin . В частности, если векторы параллельны,

то их векторное произведение равно нулю. Вектор a b перпендикулярен плоскости, в которой лежат a и b. Его направление (вверх или вниз) определяется по правилу штопора. Если от вектора a к вектору b вкру-

чивать штопор, то его направление движения будет указывать в сторону a b.

a b

b

b

|a b|

b

 

 

c

a

 

a

a

 

 

 

Векторное произведение имеет простой геометрический смысл и по модулю равно площади параллелограмма, образованного векторами a и

b. Соответственно, смешанное произведение c (a b) по модулю равно объему параллелепипеда, построенного на векторах a, b и c.

nz
ny
nx

M: Математические приложения

303

При помощи векторов можно описывать различные геометрические

объекты в пространстве. Так, параметрическое уравнение прямой имеет вид:

 

n

 

tn

r = r0 + nt,

 

r

 

 

 

r0

 

 

 

,

 

 

 

где вектор n направлен вдоль прямой, а r0 некоторая точка, лежащая на ней. Действительно, пусть вектор r выходит из начала координат (кру-

жок на схеме) в направлении произвольной точки на прямой, положение которой нас интересует. Радиус-вектор r0 направлен в фиксированную точку, через которую проходит прямая. Прямая полностью зада¼тся этой точкой и направлением n. Всегда можно подобрать такой скалярный па-

раметр t, чтобы вектор tn оказался в точности между точками r и r0. Èç геометрического сложения этих векторов и получается параметрическое уравнение прямой. Его также можно переписать в явном координатном

âèäå:

x x0 = y y0 = z z0 = t;

где x, y, z компоненты вектора r (координаты точки на прямой).

Плоскость зада¼тся при помощи фиксированной точки r0, через ко- торую она проходит, и перпендикулярного к ней вектора n. Разница вектора к произвольной точке на плоскости r и r0 лежит в этой плоско- сти, поэтому перпендикулярна к n. Следовательно, уравнение плоскости можно представить следующим образом:

(r r0) n = 0;

n

r

 

r-r0

 

r0

Соответственно, уравнение плоскости в координатном виде может быть записано, как x nx + y ny + z nz = d; ãäå d = r0n.

Сфера радиуса R это множество точек, равноудал¼нных от центра:

 

r-r0

(r r0)2 = R2;

r

 

r0

Е¼ уравнение в векторных обозначениях зада¼тся числом R и вектором положения центра окружности r0.

304

III Тензорная и матричная алгебра

Матрица это набор чисел, упорядоченных в виде прямоугольной таблицы. Компоненты вектора имеют только один индекс ai, тогда как у матрицы их два: aij.

Рассмотрим квадратную матрицу A:

 

0a21

a22

: : : a2n1

 

 

a11

a12

: : : a1n

C

 

A =

B .

.

... .

:

 

Ban1

an2

: : : annC

 

 

B

 

 

C

 

 

@

 

 

A

 

Заметим, что первый индекс чисел aij увеличивается при переходе к следующей строке, а второй к следующему столбцу. Числа aij называют элементами матрицы, а числа, имеющие одинаковые значения индексов aii, - диагональными элементами.

Как и в случае с векторами, матрицы можно поэлементно складывать и умножать на число:

C = A + B =>

cij = aij + bij:

Кроме этого, вводится операция умножения матриц друг на друга, в результате которой опять получается матрица. Для матриц A и B с эле-

ментами aij è bij матрица C, равная их произведению, имеет элементы:

n

Xk

 

cij = aik bkj:

(7)

=1

 

В табличной форме умножение матриц можно представить в виде правила лома . Чтобы получить cij, необходимо взять i-ю строку матрицы A (лом) и пробить им дыру в стенке из j-го столбика матрицы B:

 

0a21

a22

: : : a2n1 0b21

b22

: : : b2n1

 

 

a11

a12

: : : a1n

b11

b12

: : : b1n

C

 

C = A B =

B .

.

... .

C B .

.

... .

:

 

Ban1

an2

: : : annC Bbn1

bn2

: : : bnnC

 

 

B

 

 

C B

 

 

C

 

 

@

 

 

A @

 

 

A

 

После этого на месте дыры в матрице C записать сумму произведений элементов лома и стенки: cij = ai1b1j + ai2b2j + ::: + ainbnj.

M: Математические приложения

305

Из определения (7) видно, что при перемножении матриц их можно группировать произвольным образом (умножение ассоциативно):

(A B) C = A (B C);

но нельзя переставлять местами (умножение не коммутативно):

A B 6= B A:

Т.е. вс¼ с точностью до наоборот по сравнению со скалярным умножением векторов! Необходимо помнить, что произведение матриц не является обычным арифметическим умножением. Это сокращение для достаточно специфического способа вычисления (7) элементов cij èç aij è bij.

Из матрицы A можно получить новую, транспонированную матрицу AT , в которой столбцы и строчки переставлены местами:

T

0a12

a22

: : : an21

 

 

a11

a21

: : : an1

C

 

A =

B .

.

... .

:

 

Ba1n

a2n

: : : annC

 

 

B

 

 

C

 

 

@

 

 

A

 

Таким образом, если элементы матрицы A равны aij, то в транспониро- ванной матрице AT они будут получены перестановкой индексов: aTij = aji. Матрица, которая не меняется при транспонировании aij = aji, íà- зывается симметричной. Такой тип матриц встречается в финансах и экономике очень часто.

Особое значение имеет единичная матрица, в которой все элементы

равны нулю, за исключением диагональных, равных единице. Так, для n = 3 имеем:

01

1 0 0

1 = @0 1 0A:

0 0 1

Умножение единичной матрицы на любую A не меняет эту матрицу:

1 A = A 1 = A:

Заметим, что единичная матрица может быть переставлена местами с любой матрицей. Это легко проверить напрямую, умножая произвольную матрицу на единичную слева или справа. Вообще говорят, что две матрицы коммутируют, если результат их умножения не зависит от их порядка. Еще раз подчеркн¼м, что в общем случае это не так, и за порядком произведения матриц необходимо внимательно следить.

может стоять

306

Для элементов единичной матрицы существует специальное обозна- чение, придуманное Кронекером:

ij

=

 

0

i 6= j:

 

 

 

1

i = j

Символ ij съедает сумму, в которой участвует, и после этого гибнет , заменяя везде суммационный индекс на свой второй:

n

X

ij aj = ai:

j=1

Действительно, в сумме по j окажутся равными нулю все слагаемые, за исключением случая, когда j = i. На месте символа aj

любая матрица ajp или тензорные выражения типа ajpq.

Матрица A имеет обратную матрицу A 1, если выполняется сле-

дующее уравнение:

A 1 A = A A 1 = 1:

Обратная матрица A 1 при перемножении может быть переставлена ме-

стами с A, следовательно, они коммутируют друг с другом. Действительно, будем считать, что A A 1 = 1. Докажем выражение для переставленных матриц A 1 A = 1. Умножим его слева на матрицу A:

A A 1 A = A 1 = A => (A A 1) A = 1 A = A:

Так как умножение единичной матрицы на любую матрицу да¼т е¼ же, мы приходим к тождеству. Другое важное тождество:

(A B) 1 = B 1 A 1;

проверяется умножением слева или справа на A B.

В матричных обозначениях можно записать и вектор w, представив его в виде столбика из n чисел. При умножении матрицы на вектор получается другой вектор, равный:

wi0 =

n

aikwk;

0w.10 1

= 0a.11

:.:..: a1.n1 0w.11

:

 

Xk

 

@wn0

A

@an1

: : : annA @wnA

 

 

=1

 

 

 

 

 

 

Обратим внимание, что правило лома действует и в этом случае, только стенкой является единственный столбик вектора w.

Удобно и для вектора вводить также понятие транспонирования, при котором столбик превращается в строчку: wT = w1 : : : wn .

M: Математические приложения

307

Транспонированные векторы позволяют компактно записывать квадратичные формы:

n

wi aij wj

= w1

: : : wn

 

0a.11

:.:..:

a1.n1 0w.11

= wT A w:

X

 

 

 

 

@an1

: : :

annA @wnA

 

i;j=1

 

 

 

 

 

 

 

 

Умножение строки на матрицу выполняется по тому же правилу лома, только лом теперь является единственной строкой. Квадратичная формаэто число, и е¼ можно вычислять в любом порядке:

wT A w = (wT A) w = wT (A w):

Квадратичная форма не изменяется при перестановке wi è wj, поэтому матрица aij является симметричной: aij = aji. Точнее, любую матрицу mij можно представить в виде суммы симметричной aij = (mij + mji)=2 и антисимметричной матриц bij = (mij mji)=2, òàê ÷òî:

mij = aij + bij:

В квадратичной форме антисимметричная bij = bji составляющая про- извольной матрицы сокращается.

Функция от матрицы понимается в смысле степенного ряда. Например, экспонента это сокращ¼нная запись бесконечного ряда:

eA = 1 + A + A2 + :::

1! 2!

Интеграл от матричной экспоненты можно вычислить следующим образом:

Z

t

1

Z

t

1 Ak tk+1

 

 

 

 

 

Ak k

 

 

 

eA d = k=0

 

 

d = k=0

 

= A 1

 

eAt 1 ;

 

 

k!

(k + 1)!

0

 

X

0

 

 

X

 

 

ãäå A 1 обратная к A матрица, а A0 = 1 единичная.

Важной характеристикой матрицы является сумма е¼ диагональных элементов:

Tr A = a11 + a22 + ::: + ann:

Это число называют следом матрицы и обозначают при помощи символа Tr или Sp.

308

IV Определители и собственные значения

Для квадратной матрицы размером 2x2 введ¼м число, которое называется определителем матрицы:

det A = det

a11

a12

= a11a22 a12a21:

a21

a22

Для вычисления определителя det A необходимо взять произведение эле-

ментов матрицы крест накрест и вычесть их друг из друга. В каче- стве упражнения стоит проверить, что определитель произведения любых двух матриц равен произведению определителей каждой из них:

det(A B) = det A det B:

(8)

Это очень любопытное свойство. Умножение матриц является специфи- ческой процедурой (правило лома ). Поэтому существование для каждой матрицы числа, удовлетворяющего обычному арифметическому правилу перемножения (8), является достаточно неожиданным.

Определитель с тем же свойством можно ввести и для матрицы 3x3:

a22

a23

 

a21

a23

 

a21

a22

det A = a11 det a32

a33

a12 det a31

a33

+ a13 det a31

a32 :

Чтобы его вычислить, необходимо взять элементы первой строки и для каждого из них вычеркнуть из матрицы строку и столбец, в котором этот элемент стоял. Затем найти определитель получившейся матрицы 2x2 и умножить его на этот элемент. Все такие произведения необходимо сложить со знаком плюс, если сумма номера строки и столбика, в котором стоит элемент, ч¼тная, и со знаком минус, если неч¼тная.

Это определение можно распространить на матрицу произвольной размерности, вычисляя е¼ определитель рекуррентным образом, сводя его к сумме (разности) определителей матриц с размерностью на единицу меньше. Определитель матрицы 2x2 тоже вычисляется по этому правилу, если считать, что определитель матрицы 1x1 равен е¼ элементу.

Понятно, что для любой диагональной матрицы определитель равен произведению диагональных элементов:

det

0

01

a2

0

1

= a1

a2 :::

 

@

a

0

0

A

 

 

 

 

 

 

00 ...

Произведение двух диагональных матриц снова да¼т диагональную. Понятно, что при этом выполняется правило (8).

M: Математические приложения

309

Определители обладают рядом полезных для их вычисления свойств: B Транспонирование не изменяет определителя det AT = det A.

B Перестановка двух строк или столбцов меняет знак определителя. B Определитель не изменится, если к любой строке поэлементно прибавить другую строку, умноженную на произвольное число . То же и

для столбцов.

В различных задачах часто возникают системы линейных уравнений относительно n неизвестных:

0

1 0

1

0 1

a11 a12

Ba21 a22

B

B . .

@

an1 an2

: : : a1n

x1

b1

 

:.:..:

a2.nC Bx.2C

= Bb.2C

:

: : :

annC BxnC BbnC

 

 

C B

C

B C

 

 

A @

A

@ A

 

Эту систему можно переписать в матричных обозначениях и даже сразу получить е¼ матричное решение (умножив слева на A 1):

A x = b => x = A 1 b:

Естественно, для реального решения необходимо уметь находить обратную матрицу A 1 к исходной матрице системы A. Решения системы

можно выразить при помощи формул Краммера:

xi = i ;

где = det A определитель матрицы A, а i определители матриц, полученных из A в результате замены i-го столбика на столбик b.

Если правая часть системы уравнений равна нулю: A x = 0, то решение, отличное от нуля, существует только в случае, если det A = 0.

Такая система уравнений называется однородной.

Определители позволяют находить обратную матрицу. Для этого

необходимо каждый элемент исходной матрицы заменить на определитель матрицы, полученной выч¼ркиванием строки и столбца, на пересе- чении которых он стоит. Затем умножить его на -1, если сумма номера столбика и строки неч¼тная. После этого каждый элемент получившейся матрицы делят на определитель исходной и транспонируют.

Пример: Найти обратную матрицу:

 

2

1

0

 

 

1

 

1

0

2

4

 

T

 

0

0

1

 

 

A =

06

4

21

;

A

 

=

 

 

00

0

1

1

=

0

1

0

21

:

 

2

 

@1

0

0A

 

 

 

 

 

 

@2

4

2

A

 

@ 2 0:5

1

A

 

310

Для матрицы A решим систему линейных уравнений вида:

A u = u;

(9)

где некоторое число, называемое собственным значением матрицы, а uT = (u1; :::; un) соответствующий ему собственный вектор.

Уравнение (9) это система однородных уравнений с нулевой правой частью: (A 1) u = 0. Она имеет отличное от нуля решение, только

если е¼ определитель равен нулю:

0 a21

a22

: : :

a2n

1

 

 

a11 a12

: : :

a1n

C

 

det B .

.

... .

= 0:

B

an1

an2

: : : ann

 

C

 

B

 

 

 

 

C

 

@

 

 

 

 

 

A

 

В результате получается характеристическое уравнение n-й степени относительно , имеющее, вообще говоря, n решений: 1, 2,..., n.

Для каждого собственного значения после решения (9) получается соответствующий ему собственный вектор u( ) = (u(1 ); :::; u(n )). Верхний индекс это номер собственного вектора, а не его компонента!

Важный для приложений случай действительные симметричные матрицы, для которых AT = A èëè aij = aji. Собственные значения дей- ствительной симметричной матрицы всегда действительны, а собственные векторы ортогональны. Ортогональность означает, что скалярное произведение различных собственных векторов равно нулю:

 

n

 

u( ) u( ) =

ui( )ui( ) = :

(10)

 

Xi

 

 

=1

 

Так как уравнения (9) линейны, собственный вектор всегда можно умножить на константу, выбрав е¼ таким образом, чтобы он стал единичным.

Пример: Найти собственные значения и вектора для матрицы A:

2

2

 

2

2

 

 

 

 

 

 

 

A = 1

2

=> det

1

2

= 2 +

 

6 = 0

=> 1 =

 

3; 2

= 2:

Для каждого собственного значения решим систему уравнений:

1

2

u1(1)

!

u1(1)

!

 

 

2

2

u2(1)

= 3

u2(1)

=> u2

= 2u1

:

Аналогично u(2)1 = 2u(2)2 . Поэтому, с уч¼том (10), имеем:

u(1) = p5

2

;

u(2) = p5

1

1

 

1

 

1

 

2

M: Математические приложения

311

Собственные вектора и собственные значения используются для диагонализации квадратичных форм. Предположим, что мы имеем выраже-

íèå âèäà:

n

X

F = xT A x = xiaijxj:

i;j=1

Сделаем замену переменных и перейд¼м к величинам yi:

 

 

xi =

n

 

(11)

 

 

ui( )y ;

 

 

 

X

 

 

 

 

=1

 

 

ãäå ui( )

собственные вектора матрицы A. Тогда:

 

 

 

n

n

n

 

F =

y ui( )aijuj( )y =

y ui( )

ui( )y = y2

;

 

 

X

i;X

X

 

 

 

i;j; ; =1

; =1

=1

 

где мы сначала воспользовались уравнением на собственные значения, а затем ортогональностью собственных функций и св¼рткой с символом Кронекера.

Таким образом, если нам известны собственные значения и вектора матрицы A, мы всегда можем найти такое преобразование координат, которое диагонализирует квадратичную форму xT A x.

Ещ¼ одно замечательное свойство собственных значений состоит в том, что их произведение да¼т определитель матрицы:

n

 

 

Yi

2 ::: n:

 

det A = i = 1

(12)

=1

 

 

Докажем это, введя матрицу C = c = u( ). Для не¼ справедливо соот- ношение:

n

n

n

= :

(CT C) = cTici = ci ci = ui( )ui( )

Xi

X

X

 

=1

i=1

i=1

 

Так как детерминант произведения матриц равен произведению их детерминантов, то det CT det C = 1. Введ¼м матрицу A0 = CT A C. ż

определитель равен: det A0

= det CT det A det C = det A: Матрицу A0

можно представить в виде:

 

 

n

n

n

A0 = Ci AijCj = ui( )Aijuj( )

= ui( )ui( ) = ;

X

X

Xi

i;j=1

i;j=1

=1

где мы воспользовались уравнением на собственные значения и соотношением ортогональности. Так как A0 диагональна и det A = det A0, ìû

приходим к (12).

312

VПолезные интегралы

Рассмотрим гауссовый интеграл (или интеграл Эйлера-Пуассона):

1

 

I = Z

e x2 dx:

1

 

Он вычисляется в координатах (r;

): x = r cos ,

y = r sin , êàê

двойной интеграл.

 

 

 

 

 

1 1

2 1

1

 

 

 

I2 = Z Z

e x2 y2 dxdy = Z Z

e r2 rdrd = 2 Z

e r2 d

r2

= ;

2

1 1

0

0

0

 

 

 

где мы воспользовались тем, что в полярных координатах (r; ) элемент площади равен произведению дуги rd на изменение радиуса dr: dxdy = rd dr. Это следует из якобиана или геометрических соображений (элемент дуги равен rd , так как для полного изменения = [0::2 ] получается длина окружности 2 r).

x = r cos

+ y2

= r2

x2

y = r sin

 

 

 

 

dx dy = r dr d

 

Извлекая квадратный корень и делая замену x ! xp , получаем:

 

1

dx = r

 

 

 

 

I( ) =

Z e x

 

 

:

(13)

 

2

 

 

 

 

1

Полезный при¼м взятие производных правой и левой частей по параметру для получения интегралов от ч¼тных степеней x2n. Интеграл от нечет-

ных степеней x, в силу антисимметричности подынтегральной функции,

равен нулю. Если выделить полный квадрат в выражении

x2 + x,

следующий

 

h

i

 

 

 

 

 

получим

(x =2 )2 2=4 2

: В результате легко вычисляется

 

интеграл:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

Z e x + x dx = r

 

 

e

=4

:

(14)

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

При помощи замены x0 = x =2 он сводится к (13).

M: Математические приложения

313

Ещ¼ одну полезную формулу можно получить на основе интеграла:

1

 

1

 

1

 

1

 

 

 

 

 

 

I( ) = Z

e xdx =

 

e x 0

=

 

 

:

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Взяв n раз производную по и определив факториал числа n! = 1 2 :: n, получаем:

1

 

n

 

Z0

xne xdx =

!

:

(15)

n+1

Интегралы такого типа встречаются достаточно часто, поэтому для них введено специальное обозначение в виде гамма-функции:

1

 

 

(z) = Z0

xz 1e xdx :

(16)

Интегрируя по частям, убеждаемся, что (z + 1) = z (z). В частности,

для целых аргументов: (n + 1) = n!. Для полуцелых аргументов гамма- p

функция сводится к гауссовым интегралам. Так, (1=2) = .

При помощи (15) можно получить формулу, позволяющую вычислять факториал при больших n. Представим xne x â âèäå ef(x). Функция

f(x) = x + n ln x имеет максимум в точке x0 = n, òàê êàê f0(x0) =1 + n=x0 = 0. Разложим е¼ в ряд в окрестности этой точки ( f0(n) = 0):

f(x) = f(n) + f00(n)(x n)2=2 + :: = n + n ln n (x n)2=2n + :::

Поэтому

n! e n+n ln n Z

e

2n

dx e n+n ln n

Z

e

2n

dx = e n+n ln np2 n:

1

 

(x n)2

 

1

 

(x n)2

 

 

 

0

 

 

1

 

 

 

 

 

Во втором интеграле нижний предел замен¼н на 1, так как при большом n максимум экспоненты уходит далеко вправо и становится вс¼ более узким, поэтому интеграл от 1 до 0 практически равен нулю. Таким образом, мы получили формулу Стирлинга:

n! p2 n ne n ;

которая уже при n = 10 дает относительную ошибку, меньшую 1%.

314

VI Интегралы и ряды Фурье

Для целых чисел n, m и {2 = 1 справедлива формула:

Za

b

= nm =

0

n 6= m;

(17)

e{2 (n m) t=T T

 

 

dt

 

1

n = m

 

ãäå T = b a, à nm функцию с периодом

символ Кронекера. Рассмотрим периодическую T : f(t + T ) = f(t). Представим е¼ на интервале

t = [a:::b] в виде следующего ряда:

1

X

f(t) =

cke{2 kt=T = c0 + c1e{2 t=T + c 1e {2 t=T + :::

(18)

 

k=1

 

Чтобы f(t) была действительна f (t) = f(t), должны выполняться соотношения: ck = c k. Для функции f(t), при помощи (17), можно найти коэффициенты ck и тем самым определить Фурье-разложение:

Z

b

dt

1

cm Z

b

dt

1

 

f(t)e {2 nt=T

e{2 (m n)t=T

cm mn = cn:

T

= m=

 

T

= m=

 

 

 

 

 

X

 

 

 

 

X

 

a

 

 

 

 

1

a

 

 

 

 

1

 

Если записать ck = (ak ibk)=2, то разложение действительной функции можно представить в виде бесконечной суммы вида:

1

 

 

Xk

f(t) = c0 +

 

ak cos(wkt) + bk sin(wkt) :

=1

 

 

Частоты wk = 2 k=T называют гармониками.

Рассмотрим симметричный интервал [a; b] = [ T=2; T=2] и введ¼м коэффициенты k = T ck. Обозначив tk = 2 k=T , запишем ряд Фурье:

 

 

 

 

 

 

 

T=2

 

1

k e{ tkx

1

 

 

 

Z

f(x) e { tkx dx:

f(x) = k=

 

 

;

k =

 

 

T

 

X

 

 

 

 

T=2

 

 

1

 

 

 

 

 

 

Устремим T ! 1. Величину tk можно рассматривать, как непрерывную переменную, изменение которой равно t = tk tk 1 = 2 =T . По определению интеграла выражение для f(x) можно записать в виде:

1

(t) e{ tx dt;

1

f(x) e { tx dx; (19)

f(x) = 2 Z

(t) = Z

1

 

 

 

 

 

 

1

 

1

 

где (t) становится функцией параметра t = tk. Соотношения (19) íàçû- ваются интегральным фурье-преобразованием .

M: Математические приложения

315

Понятно, что подстановка одного уравнения (19) в другое должно приводить к тождественному результату:

1

1

(s) e{sx

2

3

e { tx dx

=

1

1

e{ x (s t)

(t) = Z

2Z

Z

2Z

 

41

 

ds

5

 

 

 

41

 

1

 

 

 

 

1

 

3

dx

2

5 (s) ds:

Обозначим выражение в квадратных скобках во втором равенстве в виде следующей функции:

1

e{x (s t) dx:

(s t) = 2 Z

1

 

 

 

 

1

 

Тогда тождественное преобразование принимает форму:

1

Z

(t) = (s) (s t) ds:

1

(20)

(21)

Функция (20) со свойством (21) называется -функцией Дирака. Воспользуемся (17) на интервале [ T=2; T=2], обозначив переменную интегрирования через x:

2

T=2

e{(tn tm) x dx = 2 nm:

Z

1

 

 

T

T=2

При T ! 1 это выражение стремится к функции Дирака. С другой стороны, если tn 6= tm он равен нулю. Поэтому:

 

 

 

 

0

s 6= t

 

(s

 

t) =

 

1

s = t

:

Это существенно разрывная функция, являющаяся непрерывным аналогом символа Кронекера. В силу е¼ общего свойства (21) можно также записать условие нормировки :

1

Z

(s t) ds = 1:

1

Другими словами, несмотря на то, что (0) = 1, интеграл (площадь) от этой функции равен единице. Так как -функция равна нулю везде, за исключением (0), интеграл на самом деле может быть по любым

пределам, включающим точку особенности функции Дирака. Отметим также очевидное свойство симметричности: ( x) = (x):

316

VII Метод характеристик

Достаточно часто возникают линейные уравнения в частных производных первого порядка:

n

@

 

 

Xi

 

 

; :::; xn) @xi

= 0;

 

Yi(x1

(22)

=1

 

 

 

ãäå Yi(x1; :::; xn) заданные функции n переменных, а = (x1; :::; xn) неизвестная функция.

Так как это уравнение линейное, то для него справедлив принцип суперпозиции. Если 1 = 1(x1; :::; xn) è 2 = 2(x1; :::; xn) два решения (22), то их линейная комбинация = C1 1 + C2 2 с постоянными коэф- фициентами тоже будет решением дифференциального уравнения.

Если уравнение неоднородное и содержит в правой части функцию:

n

X @

i=1 Yi(x1; :::; xn) @xi = Yn+1(x1; ::; xn);

его можно свести к однородному. Для этого рассмотрим функцию n + 1 аргументов w(x1; :::; xn; ) = C = const, равную константе. Соответ-

ственно, е¼ дифференциал будет равен нулю:

n

@w

@w

Xi

 

 

 

@xi

dxi + @

dC = 0 =

=1

 

 

 

Запишем в явном виде дифференциал для d :

n

@w

@w

n

@

 

Xi

 

 

 

X

 

 

@xi

dxi + @

@xi

dxi =>

dC = 0 =

i=1

=1

 

 

 

 

 

d :

@

=

@w

=

@w

:

 

 

 

@xi

@xi

@

Подставляя в неоднородное уравнение производную @ =@xi получаем од- нородное уравнение:

n

 

@

 

 

n

 

@w

@w

Xi

 

 

 

X

 

 

 

 

 

 

 

 

 

 

Yi @xi

= Yn+1

=>

Yi @xi

+ Yn+1 @ = 0:

=1

i=1

 

 

 

 

 

 

 

 

 

Если неоднородность вида Yn+1 , то она устраняется заменой = e .

Решение уравнения в частных производных (22) может быть сведено к решению систем обыкновенных дифференциальных уравнений. Для этого используется метод характеристик.

M: Математические приложения

317

Метод характеристик. Рассмотрим n переменных x1; :::; xn. Çàïè- шем систему дифференциальных уравнений в симметричном виде:

dx1

=

dx2

= ::: =

dxn

;

(23)

Y1

Y2

Yn

 

 

 

 

ãäå Yi = Yi(x1; :::; xn) произвольные функции. Пусть зависимой переменной будет x1. Тогда (23) соответствует n 1 дифференциальным уравнениям:

dx2

=

Y2

;

dx3

=

Y3

; :::;

dxn

=

Yn

:

 

 

 

 

 

 

 

 

 

 

dx1

Y1

dx1

Y1

 

dx1

Y1

 

 

 

 

 

 

 

Для решения n 1 уравнений потребуется n 1 начальных условий, и, следовательно, n 1 независимых констант. Решения будут выглядеть в следующем виде xi = fi(x1; C1; :::; Cn 1). Их можно разрешить относительно Ci, записав Ci = gi(x1; :::; xn). Подобные постоянные функции называются интегралами системы. Если мы возьм¼м произвольную функцию F (g1; :::; gn 1) = C = const, то она будет общим интегралом системы, если gi интегралы.

Рассмотрим теперь некоторый интеграл системы:

C = (x1; :::; xn):

Дифференциал константы равен нулю, поэтому:

n

@

 

 

Xi

 

dxi = 0:

(24)

@xi

=1

 

 

 

Уравнения (23) можно записать в векторном виде: dx = Y, гдепроизвольная константа, а x = (x1; :::; xn), Y = (Y1; :::; Yn). Другими словами, вектора dx и Y являются параллельными. Выражение (24) ýê-

вивалентно утверждению о перпендикулярности двух векторов градиента @ =@xi и dx. Так как dx и Y параллельны, то перпендикулярными будут также градиент и Y. Поэтому:

n

@

 

 

Xi

 

 

; :::; xn) @xi

= 0:

 

Yi(x1

(25)

=1

 

 

 

Таким образом, чтобы решить уравнение в частных производных (25), необходимо найти интегралы системы дифференциальных уравнений (23) и с их помощью построить общий интеграл C = (x1; :::; xn), который и будет решением (25).

318

VIII Экстремум и множители Лагранжа

Экстремум (минимум или максимум) функции многих переменных

F (x1; :::; xn) находится так же, как и в одномерном случае. Для этого необходимо взять частные производные по каждой переменной и приравнять их к нулю. Решение получившейся системы n уравнений и будет

соответствовать экстремуму функции.

Чтобы понять, как вед¼т себя функция в точке экстремума fx1; :::; xng, можно записать ряд Тейлора в е¼ окрестности:

n

X

F (x1; :::; xn) = F (x1; :::; xn) + aij (xi xi)(xj xj) + :::

i;j=1

Первые производные F равны нулю (условие экстремума), поэтому раз-

ложение представляет собой квадратичную форму. Знаки собственных значений матрицы aij определяют характер экстремума. Так как aij ÿâëÿ- ется симметричной матрицей, то с помощью линейного преобразования е¼ всегда можно сделать диагональной (стр. 311) и проанализировать по каждой координате, минимум это или максимум.

Например, если F (x; y) = x2 + y2, то это минимум, F (x; y) = x2 y2максимум, а F (x; y) = x2 y2 это поверхность, похожая на седло (вдоль оси x функция возрастает, а вдоль y уменьшается).

Иногда возникают задачи, в которых необходимо найти максимум

или минимум при наличии ограничений. Например, нас интересует точ- ка (x1; :::; xn), максимизирующая функцию F (x1; :::; xn) и одновременно находящаяся на поверхности G(x1; :::; xn) = 0. Условия ограничений называют связями.

Рассмотрим сначала случай двух переменных F (x; y) при ограничении G(x; y) = 0. Предположим, что уравнение связи G(x; y) = 0 позволяет выразить y через x: y = g(x). Тогда мы получим обычную одномерную

задачу оптимизации, для решения которой необходимо взять производную функции F (x; g(x)) по x и приравнять е¼ к нулю:

@F

+

@F

g0(x) = 0:

(26)

@x

@y

 

 

 

Решив это уравнение, мы получим точку экстремума fx0; y0 = g(x0)g.

M: Математические приложения

319

На практике не всегда уда¼тся решить уравнение G(x; y) = 0. В этом

случае можно взять дифференциал его левой и правой части и выразить производную g(x):

dG =

@G

dx +

@G

dy = 0 =>

g0

(x) =

dy

=

@G=@x

:

 

 

 

 

@x

@y

dx

@G=@y

Подставляя е¼ в (26), получаем уравнение только для функций F и G:

@F

@G

=

@F

 

@G

:

(27)

@x

 

@y

 

@y

 

@x

 

 

 

 

 

 

Это же уравнение можно получить, минимизируя следующую функцию трех переменных:

L(x; y; ) = F (x; y) + G(x; y):

(28)

Действительно, взяв производные по x и y и приравняв их к нулю, полу- чим уравнения:

@F

+

@G

= 0;

@F

+

@G

= 0:

@x

@x

 

@y

@y

 

 

 

 

 

Исключая из них , мы приходим к уравнению (27). Если же взять производную L по и приравнять е¼ к нулю, то получится связь G(x; y) = 0.

Таким образом, в случае двух переменных имеется три способа поиска экстремума при наличии ограничения. Если одна переменная выражается через другую при помощи уравнения связи, то решается уравнение (26). Иначе (27) или оптимизируется функция Лагранжа (28).

В многомерном случае оказывается более удобным третий способ. Если нам необходимо найти экстремум функции F (x1; :::; xn) при наличии m-ограничений Gk(x1; :::; xn) = 0, то вычисляется экстремум функции Лагранжа от n + m переменных:

m

 

Xk

; :::; xn):

L(x1; :::; xn; 1; :::; m) = F (x1; :::; xn) + k Gk(x1

=1

 

Производные по i приводят к связям Gk(x1; :::; xn) = 0, а производ- íûå ïî xi можно записать в виде векторных уравнений при помощи градиента r = f@=@x1; :::; @=@xng:

m

X

rF + k rGk = 0:

k=1

Порядок действий обычно следующий. Сначала решают эти n уравнений и находят положение экстремума, как функцию k: xi = fi( 1; :::; m); i = 1; :::; n: Затем подставляют их в уравнения связи и получают m уравнений, из которых определяются k.

320

IX Вариация функционала

Функционалом мы называем объект, при помощи которого каждой функции ставится в соответствие некоторое число. Простейшим примером функционала является определ¼нный интеграл:

F [f] = Z

b

f(x) dx:

a

При подстановке в интеграл различных функций после интегрирования будут получаться некоторые числа значения интеграла.

Переходя к дискретному представлению интеграла, подобные функционалы можно рассматривать как функции большого числа переменных:

n

X

F (f1; :::; fn) = fi x;

i=1

ãäå x = (b a)=n, à fi = f(a + i x).

Аналогично обычным функциям решается задача поиска экстремума (максимума или минимума) функционала. Для этого необходимо найти функцию, для которой функционал да¼т, например, наибольшее значе- ние. В дискретном приближении задача эквивалентна поиску экстрему- ма функции n переменных f1; :::; fn. Необходимо взять производные по

fk и приравнять их к нулю. Взятие производной от функционала называется его вариацией и в непрерывном пределе обозначается следующим образом:

@F (f1; :::; fn)

!

 

F [f]

:

 

 

 

 

@fk

 

f(x)

В большинстве случаев взятие вариации достаточно тривиально, однако, если встречаются двойные интегралы, то необходима определ¼нная осторожность. Например, для

1y

ZZ

h i

f2(y) f4(z)dzdy f12 (f14)+f22 (f14 +f24)+f32 (f14 +f24 +f34)+::: z y

00

вариация по f(x) будет равна:

x

1

 

2f(x) Z0

f4(z)dz + 4f3(x) Zx

f2(y)dy:

Обращаем внимание на нижний предел во втором интеграле. Проверить это соотношение проще всего, взяв производную ряда по некоторому конкретному значению fk, например, по f5.

M: Математические приложения

321

Естественно, представлять каждый раз функционалы в виде интегральных сумм достаточно утомительное занятие. Удобнее использовать функции Дирака (x) и Хэвисайда (x):

0

x 6= 0;

 

1

x 0:

(x) = 1

x = 0

(x) =

0

x < 0

Функция Дирака обобщает на непрерывный случай символ Кронекера:

@fi

= ij

!

 

f(y)

 

= (y x):

@fj

f(x)

Ступенчатая функция Хэвисайда позволяет бороться с пределами интегрирования, зависящими от времени. Предыдущий пример можно записать в следующем виде:

11

Z Z

I[f] = f2(y) f4(z) (y z) dzdy:

00

Вычисляя вариацию произведения аналогично производной произведения, получаем:

1

1

2f(y) (y x) f4(z) + f2(y) 4f3(z) (z x) (y z) dzdy:

f(Ix) = Z Z

 

 

 

 

0

0

 

Проинтегрируем с функцией Дирака (стр. 315):

 

 

 

1

1

 

I

= Z0

2f(x) f4(z) (x z) dz + Z0

f2(y) 4f3(x) (y x)dy:

f(x)

Функция Хэвисайда ограничивает пределы интегрирования, и оконча- тельный результат имеет вид:

 

x

 

1

I

= 2f(x) Z0

f4(z)dz + 4f3(x) Zx

f2(y)dy:

f(x)

Подобная техника применима и тогда, когда функционал зависит от производной функции. В этом случае:

f0(y)

=

d f(y)

= 0(y x):

 

 

 

 

 

f(x)

dy f(x)

Дальнейшее интегрирование с производной от дельта-функции 0(x y) осуществляется по частям .

322