Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Сирл, С. Матричная алгебра в экономике

.pdf
Скачиваний:
20
Добавлен:
22.10.2023
Размер:
13.54 Mб
Скачать

решении уравнений, но вычисляются более простым способом. Такие модификации обобщенной обратной матрицы могут носить различные названия. Рао [7] и Грэвилл [3], например, употребляют термин «мнимая обратная матрица», Уилкинсон [9] применяемую матрицу называет «эффективной обратной», а Голдмэн и Зилэн [2] именуют любую матри­ цу, удовлетворяющую условиям 1 , 2 и 3, «слабо обобщенной обратной матрицей». Термином «обобщенная обратная матрица» Рао [8] называет также любую матрицу Т, обеспечивающую решение совместных урав­ нений Ах = у в виде х = Ту. Далее, при доказательстве теоремы 1 будет показано, что, если такое решение существует, то имеет место АТА — А, т. е. тем самым предполагается условие 1. По этой причине, а также потому, что большая часть предлагавшихся в литературе обоб­ щенных обратных матриц Пенроуза удовлетворяет условию 1, мы при­ няли в этой книге определение «обобщенная обратная матрица» для обозначения любой матрицы G, которая удовлетворяет условию AGA = =А, т. е. для обозначения любой матрицы, удовлетворяющей первому из четырех условий Пенроуза*.

Из теоремы, которую мы упоминали, следует, что условия, пред­ полагаемые определением Рао [8], включены в наше определение обоб­ щенной обратной матрицы; то же самое можно сказать и о большинст­ ве других приводившихся определений, поскольку все они опираются на условие 1. Остальные условия (2, 3, 4), которые могут содержаться в том или ином определении, не противоречат нашему определению, а лишь дополнительно ограничивают его; самое сильное ограничение налагает одновременное включение всех четырех приведенных ус­ ловий. В этом случае мы можем воспользоваться тем определением обобщенной обратной матрицы, которое можно найти в работе Пен­ роуза, — «единственная обобщенная обратная матрица»1.

б) ПРОИЗВЕДЕНИЕ

Я = GA

 

 

 

 

 

 

По определению, G представляет собой любую матрицу, удовлетво­

ряющую

условию

AGA = А. Отсюда

можно вывести

два

простых

свойства произведения Н = GA. Во-первых, ранг

матрицы

Я

равен

рангу

А;

ведь,

поскольку Я =

GA,

г (Я) <

г (А),

а

так

как

А =

AGA

= АН,

г (А) <; г (Н).

Следовательно,

г (Н) =

г (Л).

Во-вторых, Я2 =

Я, потому что Я2 = GAGA = G (AGA) =

GA = Я .

Матрицы, обладающие таким свойством, часто называют идемпотентными: так, матрица Я идемпотентна, если Я2 = Я.

*В русском переводе книги Рао С. Р. «Линейные статистические методы и их применения» (М., «Наука», 1968) также принято сокращенное обозначение обоб­ щенной обратной матрицы — g-обратная матрица. — Прим, перев.

ХВ параграфе 9 главы V рассматривались левая и правая обратные матри­ цы; каждая из таких матриц удовлетворяет трем из четырех условий. Так, если

L — левая обратная матрица

по

отношению к Л и LA = /, тогда

К = L

и выполняются условия 1, 2 и 3. Аналогичным образом правая обратная

матрица

будет удовлетворять условиям

1, 2

и 4.

 

180

в) ВЫ Ч И С Л ЕН И Е О Б О Б Щ Е Н Н О Й О Б Р А Т Н О Й М А Т Р И Ц Ы

Изложим общую технику вычисления обобщенной обратной к А матрицы G. Хотя описываемый метод в одинаковой мере пригоден и для прямоугольных, и для квадратных матриц, мы вначале будем предполагать, что исходная матрица А квадратна. Небольшие изме­ нения в методике вычислений, требующиеся в том случае, когда исход­ ная матрица А имеет прямоугольную форму, будут указаны в конце главы.

В параграфе 9 главы VI был описан метод приведения любой мат­ рицы А к следующей диагональной форме:

PAQ = Д = "Ц. О

О О

где А представляет собой матрицу, имеющую тот же порядок, что и ис­ ходная матрица Л; г означает ранг Л, Dr — диагональную матрицу, содержащую г ненулевых элементов, а 0 — нулевые матрицы соот­ ветствующего порядка. Матрицы Р и Q представляют собой произве­ дения соответствующих элементарных операторов.

Введем теперь определение новой матрицы А~:

Символ А- читается: «дельта минус», а знак D7 1 обозначает мат­ рицу, обратную DT.

Тогда, если определить матрицу G следующим образом:

G =* QA-P,

(12)

можно показать, что G представляет собой обобщенную обратную матрицу (по отношению к Л), т. е. AGA = А.

Пример. Матрица приведенных ранее уравнений (1) имеет следую­ щий вид

2 3 1

Л 1 1 1

3 5 1

С помощью следующих произведений элементарных операторов

1

0 0

1

—— —2

 

 

 

 

2

 

----- 1

0

и Q = 0

1

1

2

 

 

 

 

 

2

1

1

0

0

1

181

м о ж н о п р и в е с т и м а т р и ц у А к д и а г о н а л ь н о й ф о р м е . Т а к и м о б р а з о м ,

 

2

О

О

 

 

 

 

2

0

 

 

PAQ -..-Л=

О

jl_

О

~D2 O'

 

 

 

 

где D2,

1

 

 

 

 

2

 

о

о

 

 

О

2

 

 

 

О

О

О

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

О

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

д -

О

—2

О

 

 

 

 

 

 

 

 

 

О

О

О

 

 

 

 

 

1

■ А _ 2

 

О о

1

0

0

1

3

0

 

2

 

 

 

 

1

 

 

G = QA~P= О

1

1

 

- 2

О

1

0

1 -—2

0

 

2

 

 

 

 

 

 

 

 

0

0

0

О

О

 

 

О

о

2

1

1

 

 

 

 

 

Перемножив матрицы Равенство AGA =

А и А- :

Dr 0

о

1----

 

О

между собой, убеждаемся, что AGA = А.

А

основано

на следующих

свойствах матриц

ч•1

о

0'

1 о

Dr

 

о"5

о

0

0

о

О

--- О о

А-А, (13)

 

 

 

 

 

 

1

 

из этого следует, что Д~ДД_ = А- и ДА~А = А. Кроме того, по­ скольку Р и Q—произведения соответствующих элементарных опера­ торов, существуют и их обратные матрицы; поэтому из PAQ = А можно заключить, что А = P~1A Q 1. Подставив это выражение и соот­ ношение (12) в произведение AGA, а затем воспользовавшись равенст­ вом (13), мы получим следующие результаты:

AGA = P^AQ ^QA PP XAQ 1 = P ^ A A - A Q 1 = P^AQ -1 = A.

Таким образом, мы показали, что AGA — А, если матрица G опреде­ лена в соответствии с (12). Из этого можно сделать следующий вывод: G представляет собой обобщенную обратную матрицу А. Обобщенная обратная матрица G, как правило, определяется неоднозначно и Q, вообще говоря, могут быть различны, а следовательно, и G = QA P

182

определена не единственным способом); все же следует отметить, что может быть единственное исключение из этого правила1.

Представляют интерес также следующие два свойства обобщенной обратной матрицы G, доказываемые аналогичным путем. Во-первых, преобразуя выражение GAG, можно получить G (второе условие Пенроуза)2:

GAG =

(QA-P) (P^AQ-1) (QA Р) ----- QA~P =

G.

Во-вторых, если

Я = GA,

то ранг

матрицы Я—/ равен q—г, где

г — это число столбцов

в матрице

Ая. Приведенные

результаты

пополняют нашу информацию о свойствах обобщенной обратной мат­ рицы G; ранее уже отмечались два других свойства матрицы G, удов­ летворяющей условию AGA = А: г (Я) = г (А), и если GA = Я, то Я2 = Я. Все четыре указанных свойства используются при реше­ нии уравнений Ах = у относительно вектора х с помощью матрицы G.

4. РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ С ПОМОЩЬЮ ОБОБЩЕННЫХ ОБРАТНЫХ МАТРИЦ

а) СУЩЕСТВОВАНИЕ РЕШЕНИЯ

Приводимая далее теорема заимствована из работы Рао [8]. В этой теореме устанавливается соотношение между совместными уравнения­ ми Ах — у и обобщенной обратной матрицей А.

Теорема 1. Совместные уравнения Ах = у имеют решение х = Gy тогда и только тогда, когда удовлетворяется следующее условие:

AGA = А.

Доказательство. Рассмотрим уравнения Ах — ajt где а,- пред­ ставляет собой /-й столбец матрицы А. Эти уравнения совместны, поскольку их решение образует вектор х0, все элементы которого, кроме /-го, равны нулю, а /-й элемент равен единице. Итак, если реше­ нием уравнений Ах = у может служить вектор х ==Gy, то уравнения Ах = aj будут иметь решение х = Gaj. Подставив это решение в исход­

1Исключение составляет следующий случай: пусть А — это квадратная мат­ рица полного ранга; тогда Д —D и G = Q A ~P= Q (Q -1y4“ 1P'“:L) Р = Л -1. Таким образом, если А представляет собой квадратную матрицу полного ранга, она имеет единственную обратную матрицу G.

2 Рассмотренный^метод построения G позволяет вывести соотношение GAG = = G, однако наличие этого свойства не является необходимым условием решения

уравнений Ах = у. Достаточно,

если матрица G будет удовлетворять условию

AGA = А.

 

 

G — QA- Р

и

А = P ~ 1AQ~1,*

тогда

3 В произведение Н — GA подставим

H = G A=QA - AQ - i= Q[[f

Q"1,

так что H - / q = Q

^

J ] - / , } Q"1.

 

Следовательно, в силу того,

что Q представляет собой произведение элементар­

ных операторов, ранг Iq] =

ранг | Jq7"

— / gJ =

q г.

 

183

ные уравнения, мы получаем следующее выражение: AGa} = aj. Указанное равенство остается справедливым при любых значениях /, т. е. для всех столбцов матрицы А; но из этого следует, что AGA = А. Таким образом, если уравнения Ах = у имеют решение х = Gy, то, как мы показали, AGA = А.

Докажем теперь обратное утверждение. Допустим, что AGA = А. Тогда AGAx = Ах; поскольку же Ах = у, то AGy = у, т. е. A (Gy) — = у. Из этого следует, что вектор х = Gy служит решением уравне­ ний Ах = у, что и требовалось доказать.

Пример. В качестве примера вновь возьмем уравнения (1). Как

было показано, если исходная

матрица

А

 

2 3

1

 

1

1

1

 

 

3

5

1

то обобщенная обратная матрица G будет иметь следующий вид:

1

 

3

0

G

1

-- 2

0

 

0

 

0

0

Отсюда следует, что вектор

 

 

 

 

1

3

0 '

- 14

"4 "

1

2

0

6

2

0

0

0

22

0

будет служить решением уравнений (1); в этом можно убедиться не­ посредственно, подставив полученные значения в исходные уравнения.

Теорема

1 показывает,

как можно решить уравнения Ах = у;

для этого

надо отыскать

матрицу G, удовлетворяющую условию

AGA = А; в таком случае решение можно получить в виде Gy. Однако, как отмечалось ранее, если ранг матрицы А меньше, чем число неиз­ вестных, уравнения имеют множество решений. Теорема 2 позволяет разработать метод отыскания всех остальных решений, если известно хотя бы одно решение (последнее же можно получить с помощью тео­

ремы 1).

матрицу,

содержащую

Теорема 2. Пусть А представляет собой

q столбцов; если выполняется условие AGA =

А, то решение совмест­

ных уравнений Ах = у имеет вид х = Gy + (Я — I) z,

где Я = GA,

a г — это произвольный вектор порядка q.

 

 

Доказательство. Допустим, что

 

 

х = Gy + (Я — I) z,

 

 

Ах = AGy + А — /) г = AGy + (AGA A) z = AGy,

поскольку AGA = А; при этом уравнения

Ах = у в

соответствии

с теоремой 1 имеют решение в виде х = Gy. Следовательно,

Ах = AGy = Ах = у.

184

Так как Ах — у, х = Gy + (Я — I) z оказывается решением сов­ местных уравнений Ах = у при любых значениях вектора z, имеющего порядок q.

Пример (продолжение). Исходя из уравнений (1), рассчитываем

~4 -

 

 

"1

0

2 '

2

и я

а л

0

1

-- 1

0

 

 

0

0

0

Из этого следует,

что вектор

 

 

 

 

 

"4 ‘

 

'0

0

2

х -

Gy + (H— I)z 2

+

0

0

— 1

 

0

 

0

0

— 1

представляет собой решение уравнений (1). Предположим, что вектор

z =

Ггг.

 

 

zlt z2, z 3\ тогда решение

содержит произвольные элементы

уравнений (1) имеет следующий вид:

 

 

 

'4 '

2z3

”4 +

2z.~

 

х = 2 + z3 2— z3

 

0 _

—*3

—z3

Если предположить, что z3 = —с, это решение совпадает с решением по формуле (11), предполагающей расчленение соответствующих матриц. Придавая z3 значения 0, 1 и —2, мы получим прежние число­ вые решения:

'4

'

6

0 ~

Xi == 2

, x2 =--

1

и x3 = 4

0

 

1

2

Полученное с помощью теоремы 2

решение х = Gy + (Я — I) z

имеет, по существу, ту же форму, что и решение, вычисленное на осно­ ве формулы (9). Подставляя в одно из этих выражений произвольные значения вектора г, а в другое — соответствующие значения вектора х2, можно получить одну и ту же совокупность векторов, которые служат решением уравнений Ах = у. Поскольку ранг матрицы Я—I равен qг, вектор (Я—I) z содержит лишь q—г независимых элемен­ тов, т. е. то же число элементов, что и вектор х2. Из этого следует, что оба пути приводят к отысканию одного и того же набора линейно­ независимых векторов, которые служат решением уравнений Ах = у.

185

Векторы, образующие такую совокупность, называются линейно­ независимыми решениями.

Вместе с тем между решениями, полученными с помощью теоремы 2 (применяется обобщенная обратная матрица) и с помощью формулы

(9) (применяется расчленение матриц), существует важное различие, связанное с объемом требующихся вычислений. В одном случае (ре­ шение по формуле (9)) приходится выбирать строки и столбцы А, из которых удастся составить невырожденную подматрицу Alt тогда как в другом случае (по теореме 2) требуется только рассчитать обоб­ щенную обратную матрицу. Вторая задача предполагает несколько меньший объем вычислительных операций, потому что, если число

исходных

уравнений велико,

выбор

линейно-независимых

строк

и столбцов,

необходимых для построения подматрицы Ль потребовал

бы немалого труда. Кроме того,

при

работе с быстродействующими

электронными вычислительными

машинами легче составить

про­

грамму вычисления обобщенной обратной матрицы, чем п р о гр а м м у отбора строк и столбцов, образующих Лх.

6) НЕЗАВИСИМЫЕ РЕШЕНИЯ

Мы отыскали способ решения системы линейных уравнений и по­ казали, что при этом может возникать ситуация, когда уравнения имеют бесконечное множество решений. В связи с этим встают следующие вопросы:

1. В какой мере полученные решения можно считать линейно­ независимыми?

2. Как эти решения соотносятся между собой?

Поскольку каждое из решений представляет собой вектор р'-го порядка, то, конечно, в принципе может существовать не более q ли­ нейно-независимых решений. На самом деле число решений оказы­ вается меньше, об этом говорит следующая теорема.

Теорема 3. Пусть Л представляет собой матрицу ранга г, содер­ жащую q столбцов, а у — ненулевой вектор; в таком случае совмест­ ная система уравнений Ах — у имеет q г + 1 линейно-независимых решений.

В ходе доказательства этой теоремы1 будет показано, что из общего

решения х = Gy + (Я — I) z можно получить q г линейно-неза­ висимых решений с помощью q—г линейно-независимых векторов г; еще одно линейно-независимое решение получается, если положить г — 0, т. е. если предположить, что х = Gy. Все остальные решения могут быть представлены в виде линейных комбинаций, составленных из указанных независимых решений. Заметим, что эта теорема непри­ менима в случае, если у представляет собой нулевой вектор, этот слу­ чай рассматривается особо (раздел в параграфа 4).

1 См. приложение к данной главе, раздел б параграфа 6 .

1 8 6

Пример (продолжение). Векторы хъ х2 и х 3, имеющие следующий

вид:

 

"4 '

6

Х 1 - 2 ’ Л 2 ' “

1 . *3

0

1

представляют собой решения уравнений (1). Поскольку в этой системе уравнений q = 3 и г = 2, она содержит 3 — 2 -|- 1 = 2 линейно­ независимых решения. Можно показать, что любые два из трех при­ веденных решений линейно-независимы и, следовательно, третий вектор представляет собой линейную комбинацию двух других, на­

пример, х 3 = Зхх — 2х2. Следующая теорема указывает способ, с по­ мощью которого часть решений можно представить в виде линейной комбинации других решений.

Теорема 4. Пусть хъ х2, •••, xs представляют собой любые s ре­ шений совместных уравнений Ах — у, причем у Ф 0; в таком случае

 

S

 

любая линейная комбинация этих решений х* = ^

будет решени-

 

1=1

 

ем исходных уравнений тогда и только тогда, когда

 

i

ч = 1 .

 

i

= 1

 

Доказательство. (Чтобы упростить обозначения, будем далее

опускать пределы суммирования.)

 

Поскольку

 

 

-V* ---■=- О -v£.

 

Ах* =

хь= 2 Хг Axt.

 

Так как xt представляет собой решение, Axt =

у при всех значениях

i; поэтому

 

Ах* = Zk#,

(14)

Ах* = у (2А,г).

(15)

Допустим, что х* представляет решение Ах = у, так что Ах* = у , тогда, сравнивая это выражение с равенством (15), мы можем сделать

следующий вывод: если у не является нулевым вектором, то

= 1 .

Справедливо и обратное утверждение:

пусть 2 А,г = 1 ,

тогда из соот­

ношения (15) следует, что Ах* = у, т.

е. х* представляет собой реше­

ние исходных уравнений. Теорема доказана.

решений.

Сле­

Отметим, что в теореме предусматриваются любые s

довательно, сколько бы решений (линейно-зависимых или независи­ мых) мы ни рассматривали, любая их линейная комбинация также будет решением, если только выполняется условие, требующее, чтобы

187

сумма коэффициентов, необходимых для этой комбинации, была равна единице.

Пример (продолжение). Ранее отмечалось, что вектор х 3 = =--; Зхг 2х2 также образует решение уравнений (1) и что сумма коэф­ фициентов при вычислении х 3равна 3 — 2 = 1. То же самое относится к векторам х4 и х5, имеющим следующий вид:

хА= 0,73х2 -j- 0,27хх;

х5 - 0,23л'! -f 0,45х2 -|- 0,32х3.

Читатель может полностью выписать эти векторы и непосредственно убедиться в том, что они также образуют решения уравнений (1).

Пример. Предположим, что заданы следующие уравнения:

1

2

- 1

9 I

~ 4

 

2

4

3

3 L -

13

(16)

1

- 2

6

—24

1

 

1

2

4

А

9

 

 

 

 

 

 

В таком случае можно привести матрицу А к диагональному виду с по­ мощью следующих произведений элементарных операторов:

1

 

0

0

0

 

 

“ 1

1 — 2 —6

2

 

1

0

0

И

Q =

0

0

1

0

 

3

1

1

0

0

1

0

3

 

 

 

_

1

-

1

0

1

 

 

0

0

0

1

В результате преобразований получаем матрицу Д:

"1 0 0 0 "

PAQ —Л=

0 5 0 0

0 0 0 0

0 0 0 0

Следовательно, ранг матрицы А равен 2; и поскольку

4 А

0

исходные уравнения совместны (последние q—г элеменов втектора Ру равны нулю). Обобщенная обратная матрица будет иметь следующий вид:

0,6

0,2

0

0

 

~1

2

0

6'

0

0

0

0

, причем Н — GA —

0

0

0

0

- 0 ,4

0,2

0

0

0

0

1

- 3

0

0

0

0

 

0

0

0

0

188

Решения уравнений можно представить теперь в следующем виде:

х=- (л/-|-(Я—I)z =

5

0

1

0

ГО

+ о о

[ 0

2

0

6

'z,"|

- 1

0

0

 

0

0

— 3

 

0

0

- 1

 

( 17)

 

 

 

5 -f 2z, + 6z4

 

 

 

 

 

1 — 3z4

 

(18)

 

 

 

 

 

 

 

 

— z.

 

 

где z,

и z4 — это некие произвольные числа. Например, при z2 — 1

и z.

О X]

,

а при z2 = 0 и z4 =

1

решение х2 имеет сле­

 

 

1 Г

 

 

 

дующим вид: х%=

О

. Поскольку же q =

4

и г (Л)=2, всего суще­

 

 

~2

 

 

 

- 1

линейно-независимых решения. Для того чтобы

ствует q — г + 1 = 3

вычислить векторы

и х2, мы подставляли

в формулу х = Gy +

 

 

 

 

" 0

z независимые значения г, равные

1

и

0

, поэтому

0

0

 

 

 

 

 

 

_ 0 ^

 

1

 

решения х4 и х2 оказываются независимыми; наконец,

третье решение

 

 

5

 

 

 

х3, независимое от этих двух, равно Gy

0

 

 

 

1

 

 

 

 

 

 

 

 

 

 

О

 

 

 

Все остальные решения представляют собой линейные комбинации

хи х2, х 3.

в) УРАВНЕНИЯ Лх—О

Две приведенные теоремы применимы лишь в тех случаях, когда у не является нулевым вектором. Рассмотрим теперь систему Ах = О, т. е. частный случай уравнений Ах = у, когда все элементы вектора у равны нулю.

189

Соседние файлы в папке книги из ГПНТБ