Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Метод Гаусса-Жордана_методичка

.doc
Скачиваний:
90
Добавлен:
19.02.2016
Размер:
435.2 Кб
Скачать

Березнёва Т. Д.

Тема 7

«СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ.

МЕТОД ГАУССА – ЖОРДАНА.»

(Учебная дисциплина “Введение в линейную алгебру и аналитическую геометрию”)

СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ.

МЕТОД ГАУССА – ЖОРДАНА.

Основные понятия

Уравнение с n переменными называется линейным, если все переменные (x1,x2, …xn) входят в него в степени 1. Общий вид такого уравнения формально записывается следующим образом:

a1x1 + a2x2 + … ajxj + … anxn = b, (*)

или

= b.

Величины aj, j = 1,…,n, и b являются известными (заданными). Величины aj называются коэффициентами при переменных (при неизвестных), а b - свободным членом.

Решением линейного уравнения (*) называется упорядоченный набор (,,…,) значений переменных, который при подстановке в уравнение (т.е. при замене xj на при всех j от 1до n обращает его в тождество. Подчеркнем, что решение уравнения с n переменными всегда есть набор из n чисел и каждый такой набор из n чисел представляет собой одно решение. Очевидно, что если хотя бы один коэффициент при переменных не равен 0, то уравнение (*) имеет решение. В противном случае решение существует только при b = 0, и это все произвольные наборы из n чисел.

Рассмотрим одновременно m уравнений вида (*), т.е. систему m линейных алгебраических уравнений с n переменными. Пусть каждое i - е уравнение, i = 1,2,…,m, задается коэффициентами при переменных ai1, ai2, …, ain и свободным членом bi, т.е. имеет вид

ai1x1 + ai2 x2 + … + aij xj + … + ain xn = bi.

Тогда в общем виде система m линейных алгебраических уравнений с n переменными может быть записана в виде:

a11x1 + a12 x2 + … + a1j xj + … + a1n xn = b1

a21x1 + a22 x2 + … + a2j xj + … + a2n xn = b2

………………………………………………………………………………

ai1x1 + ai2 x2 + … + aij xj + … + ain xn = bi (1)

…………………………………………………

am1x1 + am2 x2 + … + amj xj + … + amn xn = bm

или, что то же самое,

= bi, i = 1,…,m.

Если все свободные члены равны нулю, то система (1) называется однородной, т.е. имеет вид

= 0, i = 1,…,m, (10)

в противном случае - неоднородной. Система (10) является частным случает общей системы (1).

Решением системы уравнений (1) называется упорядоченный набор (,,…,) значений пере­менных, который при подстановке в урав­нения системы (1) (т.е. при замене xj на , j = 1,…,n) все эти уравнения обращает в тождества, т.е. = bi при всех i = 1,…,m.

Система уравнений (1) называется совместной, если у нее существует хотя бы одно решение. В противном случае система называется несовместной.

Совокупность всех решений системы уравнений (1) мы будем называть множеством ее решений и обозначать Xb (X0, если система однородная). Если система несовместна, то Xb = .

Основная задача теории систем линейных алгебраических уравнений состоит в том, чтобы выяснить, совместна ли система (1), и, если совместна, то описать множество всех её решений. Существуют методы анализа таких систем, которые позволяют описывать множество всех решений в случае совместных систем или убеждаться в несовместности в противном случае. Одним из таких универсальных методов является метод последовательного полного исключения неизвестных, или метод Гаусса - Жордана, который мы будем подробно изучать.

Прежде, чем переходить к описанию метода Гаусса - Жордана, приведем ряд полезных для дальнейшего определений и утверждений.

Две системы уравнений называются эквивалентными, если они имеют одно и то же множество решений. Другими словами, каждое решение одной системы является решением другой, и наоборот. Все несовместные системы считаются эквивалентными между собой.

Из определений эквивалентности и множества решений систем вида (1) сразу же вытекает справедливость следующих утверждений, которые мы сформулируем в виде теоремы.

Теорема 1. Если в системе (1) имеется уравнение с номером k, 1 k m, такое, что akj = 0 j, то

  1. если соответствующий свободный член bk 0, то система (1) несовместна;

  2. если соответствующий свободный член bk = 0, то k - е уравнение можно отбросить и получить систему из (m – 1) - го уравнения с n переменными, эквивалентную исходной.

Справедливость утверждений теоремы становится очевидной, если заметить, что k – е уравнение имеет вид

0x1 + 0 x2 + … + 0 xj + … + 0 xn = bk.

Теорема 2. Если к одному уравнению системы (1) прибавить другое уравнение этой же системы, умноженное на любое число, то получится система уравнений, эквивалентная исходной системе.

Доказательство. Умножим, например, второе уравнение системы (1) на некоторое число и прибавим его к первому уравнению. В результате этого преобразования получим систему (1’), в которой все уравнения, начиная со второго, не изменились, а первое имеет следующий вид

= b1 + b2.

Очевидно, если какой-нибудь набор (,,…,) значений переменных обращает в тождества все уравнения системы (1), то он обращает в тождества и все уравнения системы (1’). Наоборот, решение (x’1 ,x’2 ,…,x’j , … ,x’n) системы (1’) является также решением системы (1), так как система (1) получается из системы (1’) с помощью аналогичного преобразования, когда к первому уравнению системы (1’) прибавляется второе уравнение системы (1’), умноженное на число (-) .

Точно также доказывается и следующее утверждение.

Теорема 2’. Умножение произвольного уравнения системы (1) на любое число, отличное от нуля, переводит систему (1) в эквивалентную ей систему уравнений.

Теоремы 2 и 2’ дают два вида преобразований, которым подвергалась система (1), оставаясь эквивалентной:

а) умножение (или деление) произвольного уравнения системы (1) на любое число, отличное от нуля;

б) прибавление (или вычитание) к одному уравнению другого, умноженного на некоторое число.

Такие преобразования а) и б) называются элементарными преобразованиями системы уравнений (1).

Если к системе уравнений (1) несколько раз применить элементарные преобразования, то полученная в результате система, очевидно, также будет эквивалентна первоначальной.

Систему уравнений (1) можно записать в табличной форме:

x1

x2

xj

xn

b

a11

a12

a1j

a1n

b1

a21

a22

a2j

a2n

b2

ai1

ai2

aij

ain

bi

am1

am2

amj

amn

bm


(2)

Прямоугольная таблица чисел, составленная из коэффициентов aij при неизвестных системы (1), называется матрицей системы (1) и обозначается A (в ней m строк и n столбцов), столбец свободных членов обозначается b. Прямоугольная таблица, составленная из коэффициентов aij при неизвестных и из столбца свободных членов b системы (1), называется расширенной матрицей системы (1) и обозначается (в ней m строк и (n+1) столбцов), т.е = (A, b). В i – ой строке матрицы содержатся все известные параметры, характеризующие i - ое уравнение системы (1), i = 1,…, m. В j – м столбце матрицы A содержатся все коэффициенты при неизвестном xj, встречающиеся в системе (1).

Числа aij называются элементами матрицы А. Элемент aij находится в i - ой строке и в j - м столбце матрицы А. Принято говорить, что элемент aij находится на пересечении i - ой строки и j - го столбца матрицы А. Если все элементы строки (столбца) матрицы А (кроме одного) равны нулю, а ненулевой элемент равен единице, то такая строка (столбец) называется единичной (единич­ным).

Элементарным преобразованиям системы (1) соответствуют следующие элементарные преобразования таблицы (2):

а) умножение (или деление) всех элементов произвольной строки таблицы (2) на любое число, отличное от нуля,

б) прибавление (или вычитание) к одной строке (поэлементно) другой строки, умноженной на некоторое число.

В результате любого элементарного преобразования получается новая таблица, в которой вместо той строки, к которой прибавляли (или умножали на любое число, отличное от нуля), пишется новая строка, а осталь­ные строки (в том числе и та, которую прибавляли) пишутся без из­менения. Новая таблица соответствует системе уравнений, эквивалентной исходной системе.

Применяя элементарные преобразования можно таблицу (2) и соответственно систему (1) упростить так, что решить исходную систему становится просто. На этом и основан предлагаемый метод.

Метод последовательного полного исключения неизвестных

(Метод Гаусса - Жордана)

Метод последовательного полного исключения неизвестных, или метод Гаусса – Жордана, является универсальным методом анализа любых (заранее неизвестно, каких - совместных или несовместных) систем линейных алгебраических уравнений. Он позволяет решать совместные системы или убеждаться в несовместности несовместных систем.

Отметим принципиальное отличие предлагаемого метода решения систем линейных алгебраических уравнений от метода решения, ска­жем, стандартного квадратного уравнения. Оно решается с помощью хорошо известных формул, в которых неизвестные выражаются через коэффициенты уравнения. В случае общих систем линейных алгебраических уравнений мы таких формул не имеем и используем для отыскания решения метод итераций, или итеративный метод, или итерационный метод. Такие методы задают не формулы, а последовательность действий.

Метод Гаусса - Жордана представляет собой последовательную реализацию ряда однотипных больших шагов (или итераций). Это конкретный итерационный метод - один из многих методов итераций, предложенных для решения систем линейных алгебраических уравнений вида (1). Он состоит из начального этапа, основного этапа и заключительного этапа. Основной этап содержит повторяющиеся итерации – наборы однотипных действий.

Пусть задана конкретная система линейных алгебраических уравнений (1). Это значит, что известны n, m, aij, bi, i = 1,…,m; j = 1,…,n. Опишем предлагаемый метод решения этой системы.

Начальный этап включает в себя построение таблицы I(0) вида (2) и выбор в ней ведущего элемента – любого ненулевого коэффициента при переменных из таблицы (2). Столбец и строка, на пересечении которых стоит ведущий элемент, называются ведущими. (Пусть выбран элемент ai0j0. Тогда i0 – ая строка ведущая, j0- й столбец ведущий.) Переходим к основному этапу. Заметим, что часто ведущий элемент называют разрешающим.

Основной этап состоит из повторяющихся однотипных итераций с номерами k = 1, 2,…. Опишем подробно итерации метода Гаусса - Жордана.

К началу каждой итерации известна некоторая таблица I вида (2), в ней выбран ведущий (разрешающий) элемент и, соответственно, ведущий столбец и ведущая строка. Кроме того, имеется информация о том, какие строки и столбцы уже были ведущими. (Так, например, после начального этапа, т.е. на итерации 1 известны I(0), ведущий (разрешающий) элемент ai0j0 и i0 – ая строка ведущая, j0- ой столбец ведущий.)

Итерация(с номером k) состоит из следующих действий.

  1. Преобразование ведущего столбца (т.е. столбца, содержащего ведущий элемент) в единичный с 1 на месте ведущего элемента путем последовательного поэлементного вычитания ведущей строки (т.е. строки, содержащей ведущий элемент), умноженной на некоторые числа, из остальных строк таблицы. Сама ведущая строка преобразуется путем поэлементного деления ее на ведущий элемент.

  2. Выписы­вается новая таблица I(k), (k - номер итерации), в которой все столбцы, которые были когда-либо ведущими, – единичные.

  3. Проверяется, можно ли в таблице I(k) выбрать новый ведущий (разрешающий) элемент. По определению это любой ненулевой элемент, который стоит на пересечении строки и столбца, которые еще не были ведущими.

Если такой выбор возможен, то столбец и строка, на пересечении которых стоит ведущий (разрешающий) элемент, называются ведущими. Затем итерация повторяется с новой таблицей I(k), т.е. действия 1 – 3 повторяются с новой таблицей I(k). При этом строится новая таблица I(k+1).

Если нельзя выбрать новый ведущий элемент, то переходим к заключительному этапу.

Заключительный этап. Пусть проделано r итераций, получена таблица I(r), состоящая из матрицы коэффициентов при переменных A(r) и столбца свободных членов b(r) , и в ней нельзя выбрать новый ведущий элемент, т.е. метод остановился. Заметим, что метод обязательно остановится за конечное число шагов, т.к. r не может быть больше min{m,n}.

Каковы варианты остановки метода? Что значит «нельзя выбрать новый ведущий элемент»? Это значит, что после r – ой итерации в матрице A(r) новой системы, эквивалентной системе (1), либо

а) все строки A(r) были ведущими, т.е. в каждой строке стоит одна и ровно одна единица, которая не стоит больше не в какой другой строке,

либо

б) остались строки в A(r) , состоящие только из нулей.

Рассмотрим эти варианты.

а) В этом случае r = m, m n. Переставив строки и перенумеровав переменные (т.е. переставив столбцы), можно таблицу I(r) представить в виде

x1

x2

xr

xr+1

xn

b

1

0

0

a(r)1,r+1

a(r)1n

b(r)1

0

1

0

a(r)2,r+1

a(r)2n

b(r)2

0

0

0

a(r)i,r+1

a(r)in

b(r)i

0

0

1

a(r)m,r+1

a(r)mn

b(r)m

(3)

Подчеркнем, что в таблице (3) каждая переменная с номером i, не превосходящим r, встречается только в одной строке. Таблица (3) соответствует системе линейных уравнений вида

x1 + = b(r)1 ,

x2 + = b(r)2 ,

………………………, (4)

xr + = b(r)r ,

в которой каждая переменная с номером i, не превосходящим r, однозначно выражается через переменные xr+1 , … ,xn, коэффициенты матрицы a(r)ij , j = r+1,…,n, и свободный член b(r)i, представленные в таблице (3). На переменные xr+1 , … ,xn не накладываются никакие ограничения, т.е. они могут принимать любые значения. Отсюда произвольное решение системы, описываемой таблицей (3), или, что то же самое, произвольное решение системы (4), или, что то же самое, произвольное решение системы (1) имеет вид

xi = b(r)i - a(r)ijxj, i = 1,…,r = m; xj – любое при j = (r+1),…,n. (5)

Тогда множество решений системы (1) можно записать как

Xb = {x=(x1 , … ,xn) : xi = b(r)i - a(r)ijxj при i = 1,…, r = m; xj – любое при j =(r+1),…,n.}.

б) В этом случае r < m, и существует хотя бы одна строка k, k > r, (предполагаем, что сделана перестановка строк и столбцов такая же, как в пункте а)) такая, что a(r)kj = 0 при всех j. Тогда, если соответствующий свободный член b(r)k не равен 0, то k - е уравнение не имеет решения, и, следовательно, вся система не имеет решения, т.е. система (1) несовместна.

Если же соответствующий b(r)k равен 0, то k - ое уравнение является лишним и его можно отбросить. Отбросив все такие уравнения, получим, что система (1) эквивалентна системе из r уравнений с n переменными, которая через r шагов записывается с помощью таблицы вида (3), в которой все строки были ведущими. Таким образом, мы пришли к рассмотренному выше случаю а) и можем выписать решение вида (5).

Метод Гаусса – Жордана описан полностью. За конечное число итераций система линейных алгебраических уравнений будет решена (если она совместна) или будет очевидно, что она несовместна (если она действительно несовместна).

Переменные, соответствующие ведущим (разрешающим) элементам, или стоящие в ведущих столбцах, принято называть базисными, а ос­тальные переменные - свобод­ными.

Обратим внимание на следующее.

1) Когда мы начинаем решать систему методом Гаусса - Жордана, мы можем не знать, совместна эта система или нет. Метод Гаусса - Жордана за конечное число итераций r даст ответ на этот вопрос. В случае совместной системы на основании последней таблицы выписывается общее решение исход­ной системы. В этом случае число базисных переменных обязательно равно номеру r последней итерации, т.е. числу выполненных итераций. Число r всегда не превосходит min{m,n}, где m - число уравнений системы, а n - число переменных системы. Если r < n, то (n r) равно числу свободных переменных.

2) При записи общего решения не нужно перенумеровывать переменные, как это делалось для простоты понимания при описании Заключительного этапа. Это сделано для более ясного понимания.

3) При решении системы (1) методом Гаусса - Жордана базисными переменными будут только переменные, соответствующие столбцам, которые на каких-то итерациях выступали в роли ведущих, и наоборот, если на какой-то итерации столбец выступал в качестве ведущего, соответствующая ему переменная обязательно будет в числе базисных.

4) Если общее решение системы (1) содержит хотя бы одну свободную переменную, то эта система имеет бесконечно много част­ных решений, если же свободных переменных нет, то система имеет единственное решение, которое совпадает с общим решением.

5) Ведущие элементы могут быть выбраны на каждой итерации различным способом. Важно только то, что это ненулевые коэффициенты, стоящие на пересечении строки и столбца, которые до этого не были ведущими. Различный выбор ведущих элементов может дать различные записи множества решений. Однако, само множество решений при любой записи одно и то же.

Поясним работу метода на примерах.

Пример I. Решить следующую систему линейных алгебраических уравнений

2 x1 – 3 x2 + 3 x3 + 5 x4 = -1,

3 x1 + 4 x2 - 2 x3 + 6 x4 = 2, (6)

5 x1 – 4 x2 + 6 x3 + 10 x4 = 2