Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
177
Добавлен:
14.05.2015
Размер:
1.85 Mб
Скачать
h An, то, очевидно,
является в

Дополнение к лекции 4

43.1Знакопеременная группа

Название знакопеременной группы An (группы всех четных подстановок степени n) навеяно следующим построением. Рассмотрим отображение

sgn : Sn → K = {1, −1}, sgn(σ) =

−1,

σ нечетная подстановка.

 

1,

σ четная подстановка,

На множестве знаков K введем операцию умножения так же, как для целых чисел. Тогда K превращается в абелеву группу, а отображение sgn сохраняет операции:

sgn1σ2) = sgn1)sgn2) σ1, σ2 Sn.

Поэтому sgn является гомоморфизмом группы Sn на группу K.

Напомним, что ядром гомоморфизма называется множество всех элементов группы, которые переводятся данным гомоморфизмом в единичный элемент (вообще говоря, другой группы содержащей образы элементов при данном отображении). Таким об-

разом, ядром гомоморфизма sgn является в точности знакопеременная группа An.

Погруппа An Sn нормальным делителем, поскольку ядро любого гомоморфизма группы является ее нормальным делителем. Вот, впрочем, прямая проверка того, что An есть нормальный делитель группы Sn: åñëè σ Sn è

σhσ−1 An σAn = Anσ (левые смежные классы совпадают с правыми).

В данном случае имеется всего два различных смежных класса группы Sn ïî íîð- мальной подгруппе An: eAn = An è τAn, ãäå e тождественная подстановка, а τ

произвольная нечетная подстановка (например, транспозиция). В самом деле, если σ1 è σ2 одной четности, то h = σ1−1σ2 An σ1An = σ2An. Таким образом, фактор-

группа Sn/An состоит из двух смежных классов. Она изоморфна группе знаков K:

изоморфизм осуществляется отображением σAn sgn(σ) (здесь мы имеем частный случай более общей теоремы о гомоморфизме из Лекции 2).

43.2Подгруппы симметрической группы

Теорема. Любая конечная группа порядка n изоморфна некоторой подгруппе симметрической группы Sn.

Доказательство. Пусть группа G имеет элементы g1, . . . , gn. Тогда для любого i элементы gig1, . . . , gign представляют собой перестановку элементов g1, . . . , gn. Îáî- значим соответствующую подстановку через σi и определим отображение Φ : G → Sn правилом Φ(gi) = σi. Очевидно, Φ(gigj) = σiσj. Поэтому Φ является гомоморфизмомего образ Φ(G) является подгруппой в Sn.

Остается заметить, что Φ(gi) = Φ(gj) gi = gj. 2

277

278

Лекция 43

 

 

43.3Четность без инверсий

То, что четность числа транспозиций в любом разложении подстановки одна и та же, можно доказать и без подсчета числа инверсий. Это сразу же вытекает из следующего наблюдения.

Утверждение. В любом разложении тождественной подстановки в произведение транспозиций их число четно.

Доказательство. Пусть тождественная подстановка e Sn разложена в произведение транспозиций e = (ij) . . . (kl), в котором среди индексов i, j, . . . , k, l имеется ровно s различных. Ясно, что 2 ≤ s ≤ n и в случае s = 2 утверждение очевидно. Проведем индукцию по s. Пусть s ≥ 3. Не ограничивая общности, можно считать, что индексы равны 1, . . . , s. Легко проверить, что (1l)(kl) = (1k)(1l) для любых k, l 6= 1 è (1l)(ij) = (ij)(1l) ïðè {i, j} 6= {1, l}. Поэтому можно передвинуть все транспозиции вида (1l) вправо и получить другое разложение

e= (i1j1) . . . (ikjk) (1l1) . . . (1lm)

ñтем же числом транспозиций. Далее, если l1 = l2, òî (1l1)(1l2) = e и в последнем разложении можно убрать пару транспозиций (1l1), (1l2). Åñëè æå l1 6= l2, то, используя равенство (1l1)(1l2) = (l1l2)(1l1),

можно получить разложение с тем же числом транспозиций и меньшим на 1 числом транспозиций, содержащих индекс 1:

e = (i1j1) . . . (ikjk)(l1l2) (1l1)(1l3) . . . (1lm).

Продолжая таким же образом, придем к разложению с числом транспозиций, уменьшенным на четное число, и, возможно, всего лишь одной транспозицией вида (1l):

e = (i1j1) . . . (ipjp) (1l).

Поскольку i1, j1, . . . , ip, jp 6= 1, подстановка e переводит l â 1, что невозможно, так как она является тождественной. Поэтому

e = (i1j1) . . . (ipjp),

где индексы i1, j1, . . . , ip, jp принимают значения от 2 äî s. По индуктивному предположению, число p четно. 2

Дополнение к лекции 5

44.1Функциональное доказательство теоремы Лапласа

Рассмотрим выражение

f(A) =

X

det A(I, J) det A(I0, J0) (−1)ν(I)+ν(J)

 

I Nk

как функцию строк матрицы A и докажем, что она обладает тремя свойствами:

f(A) линейна по каждому аргументу;

если строки матрицы A линейно зависимы, то f(A) = 0;

åñëè A единичная матрица, то f(A) = 1.

Первое и третье свойства очевидны. Для того чтобы доказать второе свойство, достаточно установить, что f(A) меняет знак при перестановке двух строк. Более того, достаточно рассмотреть переста-

новку двух соседних строк. Пусть это будут строки с номерами

s è s + 1. Матрицу с переставленными

строками обозначим B.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть I,

I Nk. Определим на Nk взаимно-однозначное отображение, при котором I переходит в

I, следующим правилом. Если s è s + 1 оба входят или оба не входят в систему номеров

I, то пусть

I = I. Åñëè s bпринадлежит I, à s + 1 нет, то пусть I получается из I заменой номера s íà s + 1. Åñëè

sb+ 1 принадлежит I, à s нет, то пусть I получается из I заменой номера s + 1 íà s. ßñíî, ÷òî

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f(B) =

 

 

det B(I, Jb) det B(I0, J0)(−1)ν(I)+ν(J) = Σ1(B) + Σ2(B),

 

 

 

 

 

 

 

 

 

 

I Nk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ãäå Σ1 содержит члены, для которых I = I, à Σ2 члены, для которых I 6= I.

 

 

 

 

 

 

 

 

Нам нужно доказать, что

 

A). Рассмотрим члены, для которых I = I:

 

 

 

 

 

 

 

 

 

 

 

 

 

f(B) = −f( b

 

 

 

 

 

 

b

 

 

b

 

 

 

 

 

• s, s + 1 I

 

det B(I, J) = − det A(I, J),

 

det B(I0, J0) = det A(I0, J0).

 

 

 

 

 

 

 

s, s + 1 / I

 

det B(I, J) = det A(I, J), det B(I0, J0) =

det A(I0, J0).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ïðè ýòîì ν(I) = ν(I ) (поскольку I = I ). Отсюда Σ1(B) = −Σ1(A).

 

 

 

 

 

 

 

 

 

 

Теперь рассмотрим члены, для которых I 6= I. Заметим, что если I

переходит в

I

, òî

I переходит

 

 

 

 

è

 

 

 

â

 

. Следовательно,bсумма

 

 

разбивается на сумму пар членов, отвечающих

 

 

 

. При этом находим

I

Σ2

 

b

 

b

 

 

 

 

 

 

I

 

I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

b

 

 

 

 

 

 

 

det B(I, J) = det A(I, J),

det B(I0, J0) = det A(I0, J0),

 

 

b

 

 

 

 

 

 

 

 

 

 

det B(I, J) = det A(I,b

J),

det B(I0, J0) = det A(Ib0, J0).

 

 

 

 

 

 

 

В то же время,

ν(I ) = ν(I)

 

b1

. Поэтому

Σ2

(B) =

 

A). Таким образом, функция f(A) является

 

 

 

 

 

 

 

Σ2(b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

±

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

индикатором линейной зависимости, а в силу его единственности определителем матрицы A. 2

44.2Определители с нулевыми членами

Теорему Лапласа удобно применять, когда среди миноров на выбранных столбцах (или строках) оказывается много нулевых. Часто это связано с наличием большого числа нулей в матрице. Иногда нулей

279

Если все члены определителя

280

Лекция 44

 

 

оказывается настолько много, что каждый член определителя содержит нулевой сомножитель и поэтому равен нулю. Очевидно, так обстоит дело, если матрица имеет нулевой столбец или нулевую строку. Следующее утверждение представляет собой нетривиальное обобщение этого наблюдения.

Теорема Холла. Для того чтобы все члены определителя матрицы порядка n были равны нулю, необходимо и достаточно существование нулевой подматрицы размеров p × q с условием p + q > n.

Доказательство достаточности является простым упражнением. А вот доказательство необходимости требует уже изрядной изобретательности.

Доказательство необходимости. Проведем индукцию по n. Ïðè n = 1 утверждение очевидно. Предположим, что оно доказано для любых матриц порядка k ≤ n, и рассмотрим матрицу A, в которой

каждый член определителя содержит нулевой элемент матрицы. Если все ее элементы равны нулю, то утверждение уже доказано. Пусть имеется хотя бы один ненулевой элемент. Пусть a1n 6= 0. Тогда

 

a11

... a1 n−1

a1n

 

 

A =

 

 

a2n

 

,

B

a...

 

 

 

nn

 

 

 

 

 

 

 

 

причем любой член определителя матрицы B обязан содержать нулевой множитель. По индуктивному предположению, в B имеется нулевая подматрица 0k×l размеров k Ч l с условием k + l > n − 1. Если k + l > n, то эта подматрица является искомой.

Остается рассмотреть случай k + l = n. Не ограничивая общности, предположим, что A имеет вид

A =

A11

A12 .

 

0k×l

A22

Подматрицы A11 è A22 квадратные порядка l и k, соответственно. В силу исходного предполодения о матрице A, если хотя бы один член определителя A11 ненулевой, то все члены определителя A22 равны нулю. По индуктивному предположению, в A22 имеется нулевая r Ч s-подматрица с условием r+s > k. Не ограничивая общности, предполодим, что она находися на последних r строках и столбцах

с номерами от l+1 до l+s. Рассмотрим подматрицу Z на пересечении последних p = r строк и q = l+s и столбцов. Легко видеть, что Z = 0, при этом p + q = l + r + s > l + k = n.

A11 равны нулю, то индуктивное предположение можно применить непосредственно к A11. Искомая нулевая подматрица в A строится аналогичным образом. 2

Заметим, что теорема Холла появилась в 1935 году в связи с изучением специальных комбинаторных задач (а именно, задачи о паросочетаниях).

Дополнение к лекции 6

45.1Матрицы с диагональным преобладанием

Отметим полезное достаточное условие обратимости матрицы. Пусть для элементов матрицы A = [aij] порядка n выполняются соотношения

X

|aii| > |aij|, i = 1, 2 . . . , n.

1≤j≤n j6=i

В таких случаях A называется матрицей с диагональным преобладанием по строкам.

Если имеют место соотношения

X

|ajj| > |aij|, j = 1, 2 . . . , n,

1≤i≤n i6=j

òî A называется матрицей с диагональным преобладанием по столбцам.

Теорема. Любая матрица с диагональным преобладанием по строкам или по столбцам является обратимой.

Доказательство. Пусть A матрица с диагональным преобладанием по строкам. До-

кажем, что ее столбцы линейно независимы. Для этого приравняем нулю их линейную комбинацию с коэффициентами x1, . . . , xn:

x1

A . . . = 0. xn

Выберем строку с номером i таким, что |xi| ≥ |xj| äëÿ âñåõ j. Тогда

0 =

 

aiixi + X aijxj

 

 

|aii| −

X |aij|

 

|xi|.

 

 

 

 

 

 

 

 

 

 

 

1≤j≤n

 

1≤j≤n

j6=i

j6=i

Поскольку величина в скобках положительная, получаем xi = 0 xj = 0 j. Обратимость матрицы с диагональным преобладанием по столбцам доказывается с помощью перехода к транспонированной матрице. 2

45.2Определитель и возмущения

Можно доказать, что если определитель матрицы отличен от нуля, то при всех достаточно малых изменениях (в математике часто говорят возмущениях) элементов

281

282 Лекция 45

матрицы определитель не станет нулем.

Задача. Докажите, что det(I + F ) 6= 0, если каждый элемент матрицы-возмущения F порядка n

по модулю меньше 1/n.

Однако, по величине определителя трудно судить, насколько малы должны быть соответствующие возмущения. Например, рассмотрим двухдиагональные матрицы по-

рядка n с возмущением ε только одного элемента в левом нижнем углу:

1

2

0

12

A(ε) =

... ...

.

 

 

 

0

1

2

ε

 

1

При ε = 0 имеем det A(0) = 1. В общем случае, применяя теорему Лапласа для разложения определителя по первому столбцу, находим

det A(ε) = 1 + ε · (−1)n+1 2n−1.

Ïðè ε = (−1)n/2n−1 получаем det A(ε) = 0. Пусть, например, n = 100. Как видим,

невырожденная матрица с определителем 1 превращается в вырожденную при весьма малом возмущении!

машинных чи-

Дополнение к лекции 8

46.1Выбор ведущего элемента

Ненулевые элементы в строках, с помощью которых проводится исключение элементов, принято называть ведущими элементами. С теоретической точки зрения важно только то, что ведущий элемент не равен нулю.

С точки зрения практических вычислений этого мало. Дело в том, что компьютер оперирует с конечным набором вещественных чисел так называемых

ñåë. При использовании p-ичной системы счисления любое вещественное число можно

записать в виде

x = pα · β, 0 ≤ β < 1, ( )

ãäå α целое число называемое порядком числа x, à β вещественное число, назы-

ваемое мантиссой числа x (конечно, порядок и мантисса для x зависят от p). 1 Íà

компьютере для представления порядка и мантиссы отводится лишь конечное число разрядов. Поэтому при выполнении операций с машинными числами приходится делать округление замену точного результата каким-то близким машинным числом.

Предположим, например, что мантисса имеет t = 5 разрядов. Тогда при сложении чи- сел a = 102 ·0.11111 è b = 10−4 ·0.11111 сначала выравниваются порядки это означает

изменение мантиссы числа с меньшим порядком и потерю знаков, оказавшихся за пределами отведенных для представления мантисс разрядов:

10−4 · 0.11111 = 102 · 0.00000011111 7→102 · 0.00000.

Далее модифицированные мантиссы складыватся, после чего результат приводится к виду ( ). В данном случае

102 · 0.11111 + 102 · 0.00000 = 102 · 0.11111.

Как видим, сумма положительных чисел a è b оказалась равной a! Пусть на этом же компьютере решается система

 

1

5

1 y

=

1 .

 

10

1 x

 

2

Легко видеть, что точное решение имеет вид

x =

 

−1

,

y =

2

− 10−5

.

(1)

 

 

 

− 10−5

1

 

1

 

 

− 10−5

 

1Обычно p = 2, но есть и компьтер, для которого p = 3 это ЭВМ Сетунь , разработанная в Московском университете в 1960x годах.

283

росту элементов
(1) è (2), приходим к очевидному выводу: полученный ответ далек от ис-

284 Лекция 46

В то же время, при исключении элемента в позиции (2, 1) получаем

−105

1

1

5

1

=

0

5

1 −1105

7→

0

5

−105

,

1

0

10

1

 

10

 

 

10

1

 

òàê êàê

1 − 105 = 101 · 0.10000 − 106 · 0.10000 = 106 · 0.000001 − 106 · 0.10000

7→106 · 0.00000 − 106 · 0.10000 = −105.

Аналогично, при соответствующем преобразовании правой части находим

−105

1 1

7→ −2 2· 105 .

1

0

2

 

В итоге вычисленное решение x,˜ y˜ будет точным решением системы

 

0

5

−105

= −2 2· 105 .

 

10

1

 

Таким образом,

x˜ = 0, y˜ = 2.

(2)

Сравнивая

тинного.

Причина чудовищно большой погрешности в относительно малой величине ведущего элемента, приводящей к в преобразованной матрице. Чтобы снизить неприятный эффект, вызванный ростом элементов, обычно рекомендуется в каждом столбце выбирать в качестве ведущего элемент, максимальный по модулю.

Задача. Дана матрица A = [aij] порядка n с диагональным преобладанием (см. раздел 6.9) по строкам (по столбцам), и пусть после исключения элементов в первом столбце с помощью первой строки с ведущим элементом a11 6= 0 получается матрица

a11 a12 ... a1n

.

... B

0

Докажите, что матрица B порядка n−1 также имеет диагональное преобладание по строкам (по столб-

цам). Докажите также, что максимальный по модулю элемент матрицы B не больше максимального

по модулю элемента матрицы A.

46.2Вычисление обратной матрицы

Обратную матрицу можно вычислить, используя конструкции того же метода Гаусса. Если получено разложение A = LU, то, поскольку A−1 = U−1L−1, достаточно научиться вычислять обратные к

верхней и нижней треугольным матрицам. Общее число арифметических операций будет O(n3).

Однако, в 1965 году появилась работа Штрассена с заголовком Метод Гаусса не оптимален , в которой впервые было показано, что существуют и более быстрые алгоритмы. Пусть имеется алгоритм

умножения двух n × n-матриц c числом операций ≤ c nγ (например, в дополнительной части Лекции

1 обсуждается алгоритм Штрассена, для которого γ = log2 7 < 3). Тогда в случае строго регулярной матрицы A можно построить алгоритм вычисления A−1 с числом операций O(nγ).

Для простоты предположим, что n = 2p. Разобьем A на блоки порядка n/2 и рассмотрим следующее равенство:

−A21A11−1

I

A21

A22

=

0 W

, W = A22 − A21A11−1A12.

I

0

A11

A12

 

A11 A12

 

Е. Е. Тыртышников

 

 

 

 

 

 

 

 

 

 

 

 

285

 

 

 

Из невырожденности A è A11

вытекает невырожденность блока

W . Более того, блоки A11 (÷òî î÷å-

видно) и W (докажите!) наследуют строгую регулярность матрицы A. Нетрудно проверить, что

 

 

A11 A12

−1

=

A−1

A−1A12W −1

.

 

 

0

W

 

 

0

11W −1

 

 

 

 

 

 

 

 

 

 

11

 

 

 

 

 

 

Таким образом,

 

=

A−1

 

A−1A12W −1

 

 

 

0

.

 

A

1

I

 

( )

0

 

11W −1

−A21A11−1 I

 

 

11

 

 

 

 

 

 

 

 

 

 

Полученные из ( ) выражения для блоков матрицы A−1 иногда называют формулами Фробениуса. Для нашей цели формула ( ) интересна тем, что показывает, как обращение матрицы порядка n

сводится к двум аналогичным задачам для матриц A11 è W порядка n/2. Для реализации указанной редукции требуется выполнить несколько умножений матриц порядка n/2. Общие затраты на всех шагах редукции пропорциональны

 

n

 

γ

+ 2

n

 

γ

+ 22

n

 

γ

 

nγ 1

 

nγ

 

 

 

 

 

+ . . .

 

 

 

=

 

.

2

 

22

 

23

2γ

1 − 1/2γ

2γ − 1

Вслед за открытием Штрассена появилась работа других авторов под названием Метод Штрассена не оптимален . Но лидерство нового алгоритма было не очень долгим. Соревнование по построению все более быстрых алгоритмов обращения матриц и решения систем продолжается до сих пор, а вопрос об оптимальном алгоритме с точки зрения числа операций остается открытым.

Еще менее ясным является вопрос об алгоритме с минимальным числом параллельных шагов (хотя

бы в модели бесконечного параллелизма). Довольно давно был придуман алгоритм, в котором число параллельных шагов в случае матрицы общего вида есть O(log22 n). Никто не знает, можно ли построить

более быстрый параллельный алгоритм. Любопытно, что предъявленный алгоритм не имеет ничего общего ни с методом Гаусса, ни с методом Штрассена. Кроме того, даже для треугольной матрицы не

известно алгоритма с меньшим числом параллельных шагов (по порядку зависимости от n).

Задача. Докажите, что определитель строго регулярной матрицы порядка n можно вычислить за O(nlog2 7) арифметических операций.

286

Лекция 46

 

 

Соседние файлы в папке лИТЕРАТУРА