
- •Вместо введения: о погрешностях при решении прикладных задач
- •Глава I. Численные методы решения уравнений
- •§ 1. Задача локализации корней
- •Ограничение корней
- •Локализация корней
- •Простейший (грубейший) алгоритм локализации корней:
- •§ 2. Понятие об итерационных методах уточнения корней
- •Метод деления пополам (метод вилки)
- •§ 3. Методы хорд и касательных
- •Метод хорд для монотонных выпукло-вогнутых функций
- •Метод касательных для монотонных выпукло-вогнутых функций
- •§ 4. Метрические и банаховы пространства. Теорема о неподвижной точке
- •Матричные нормы
- •§ 5. Метод простой итерации
- •§ 6. Применение метода простой итерации к решению
- •Условие h([; ]) [; ] :
- •Глава II. Вычисления в линейной алгебре
- •§ 1. Метод Гаусса и его улучшения для повышения точности решения
- •§ 2. Метод простой итерации и метод Зейделя
- •§ 3. Подготовка к применению метода простой итерации
- •§ 4. Проблема собственных значений
- •Глава III. Численное интегрирование
- •§ 1. Метод прямоугольников
- •§ 2. Метод трапеций
- •§ 3. Метод Симпсона (параболическое интерполирование)
- •Глава IV. Некоторые методы аппроксимации функций
- •§ 1. Интерполяционный многочлен Лагранжа
- •§ 2. Интерполяционный многочлен Ньютона
- •§ 3. Метод наименьших квадратов
- •Глава V. Некоторые методы численного решения дифференциальных уравнений
- •Приложение: Сводка характеристик численных методов
- •Характеристики метода:
- •Характеристики метода:
- •Характеристики метода:
- •Характеристики метода:
- •Характеристики метода:
§ 3. Метод наименьших квадратов
Как правило, табличные значения функций задаются не точно, а приближённо. Поэтому попытки провести через эти точки график многочлена зачастую не приближают к исходной функции, а даже удаляют от неё, т.к. погрешности исходных значений приведут к “разбалтыванию” графика многочлена.
Можно поставить задачу иначе: в классе функций определённого вида найти функцию, наименее уклоняющуюся в заданных точках от заданных значений. Более точно, по заданной таблице
x1 |
x2 |
… |
xn–1 |
xn |
y1 = f(x1) |
y2 = f(x2) |
… |
yn–1 = f(xn–1) |
yn = f(xn) |
требуется в заданном
классе функций Ф
найти функцию ,
для которой
минимально среди всех функций
Ф.
Как правило, класс
функций Ф
является
параметрическим семейством дифференцируемых
функций: Ф
= {(x,
a1
, … , am)
| (a1
; … ; am)
},
где
– некоторое
открытое множество в пространстве R
m.
Поэтому требуется найти значения
параметров a1
, … , am
, для которых
достигается минимум величины
.
Эта задача на экстремум приводит к
необходимым условиям равенства нулю
всех частных производных рассматриваемой
минимизируемой функции U:
В случае m = n и дважды непрерывно дифференцируемой функции можно сформулировать и достаточные условия минимума, которые состоят в неотрицательности всех собственных чисел симметричной матрицы вторых производных
В частности, это верно, если матрица вторых производных положительно определена. По критерию Сильвестра это равносильно положительности всех главных миноров этой матрицы:
.
Наиболее часто используются следующие двухпараметрические семейства функций:
(x, a, b) = ax + b, (x, a, b) = a + bln x,
(x, a, b) = axb, (x, a, b) = aebx,
(x,
a, b) = a +
,
(x,
a, b) =
, (x,
a, b) =
.
Используются и трёхпараметрические семейства:
(x, a, b) = ax2 + bx + c, (x, a, b) = axb + c,
(x, a, b) = aebx + c, (x, a, b) = a10bx + c .
Пример: 1. Рассмотрим приближение линейной функцией по методу наименьших квадратов.
Здесь (x,
a,
b)
= ax
+ b,
,
и для определения параметров a,
b
в соответствии с изложенной выше общей
теории получается система линейных
уравнений:
где
.
Полученная система
двух линейных уравнений
с двумя неизвестными
имеет единственное решение тогда и
только тогда, когда её определитель не
равен нулю:
.
При n
> 1 и попарно
различных узлах xi
(1
i
n)
это ограничение
выполнено:
Поэтому рассматриваемая
линейная система имеет единственное
решение при n
> 1. Нетрудно
понять, что её решения – параметры a
и b
– действительно
доставляют минимум квадратичного
отклонения
.
В самом деле,
,
и
,
т.е. матрица вторых частных производных
положительно определена.
2. Для приближения квадратичной функцией (x, a, b) = ax2 +bx + c аналогичные вычисления приводят к системе линейных уравнений
,
где
(0
k
4, 0
m
1).
Рассмотренные выше линейные и квадратичные приближения являются основными. Приведённые выше другие виды приближающих функций приводят к системам нелинейных уравнений. Чтобы избежать решения таких систем, можно сводить эти задачи к более простым приближениям.
Примеры: 1. Степенные приближения (x, a, b) = axb сводятся к линейным: если a > 0 и x > 0, то, прологарифмировав (x, a, b), получим функцию F(ln x, ln a, b) = ln (x, a, b) = ln a + bln x . Таким образом, можно “прологарифмировать” исходную таблицу и найти линейное приближение к полученной функции.
x1 |
… |
xn |
|
ln x1 |
… |
ln xn |
y1 |
… |
yn |
ln y1 |
… |
ln yn |
Если найдена приближающая функция F(z, u, v) = u + vz для полученной таблицы, то параметры a = eu , b = v приведут к приближающей функции axb для исходной таблицы.
2. Аналогично для (x, a, b) = aebx после логарифмирования получим линейное приближение F(x, ln a, b) = bx + ln a .
3.
Для приближения дробно-линейной функцией
(x,
a,
b)
=
достаточно рассмотреть функцию F(x,
a,
b)
=
= ax
+ b.
Таким образом, можно “обратить”
исходную таблицу и найти линейное
приближение к полученной функции.
x1 |
… |
xn |
|
x1 |
… |
xn |
y1 |
… |
yn |
|
… |
|
Если найдена приближающая функция F(x, a, b) = ax + b для полученной таблицы, то параметры a и b приведут к приближающей функции (x, a, b) = для исходной таблицы.
4.
Приближение семейством функций вида
(x,
a,
b)
=
сводится к предыдущей задаче: F(x,
a,
b)
=
.
Пример: По заданной таблице значений с помощью метода наименьших квадратов
а) найти приближающую линейную функцию f(x, a, b) = ax + b;
б) найти приближающую квадратичную функцию
f(x, a, b, c) = ax2 + bx + c;
в) для каждой из найденных функций вычислить сумму квадратов отклонений
и сравнить качество полученных приближений.
y |
2,93 |
6,10 |
9,44 |
8,25 |
9,79 |
–6,03 |
7,67 |
4,38 |
4,40 |
7,05 |
x0 |
4,33 |
2,72 |
6,02 |
7,03 |
9,90 |
5,67 |
2,29 |
5,43 |
1,14 |
–7,41 |
а) Находим линейную приближающую функцию (x, a, b) = ax + b по методу наименьших квадратов. Для этого минимизируем сумму квадратов отклонений
Условие минимума:
,
где
.
Вычисляем коэффициенты системы и решаем её методом Гаусса:
Итак, a 0,0030, b 5,3869, (x, a, b) 0,003x + 5,387, U 190,852.
б) Решаем аналогично предыдущему. Будем искать линейную приближающую функцию f(x, a, b) = ax2 + bx + c по методу наименьших квадратов. Для этого минимизируем сумму квадратов отклонений
Условие минимума:
,
где
.
Вычисляем коэффициенты системы и решаем её методом Гаусса:
Таким образом, для a 0,054, b –0,094, с 3,944, найдена приближающая функция (x, a, b) 0,054x2 – 0,094x + 3,944, U 170,282.
Видно, что квадратичное отклонение квадратичного приближения меньше, нежели квадратичное отклонение линейного приближения. Квадратичное приближение в данном случае лучше линейного.
Ещё одно применение метода наименьших квадратов связано со следующей задачей, часто возникающей на практике:
Нужно найти значения n различных величин x1 , … , xn , которые нельзя измерить непосредственно, но известно, что они связаны линейными зависимостями, коэффициенты которых определяются в ходе m измерений.
Таким образом, речь идёт о решении системы m линейных уравнений с n неизвестными
.
Для того чтобы величины x1 , … , xn можно было найти однозначно, должно быть выполнено ограничение m n (при m < n система имеет бесконечное число решений). Кроме того, будем предполагать, что ранг основной матрицы системы равен n – количеству неизвестных (критерий определённости системы).
Поскольку из-за
погрешностей измерений и вычислений
величин aij
и bi
(1
i
m,
1
j
n)
может
получиться несовместная система линейных
уравнений, разумно не решать полученную
систему, а искать величины x1
, … , xn
, для которых
отклонение
будет минимально. Эта задача минимизации
приводит к необходимым условиям
Это система n
линейных
уравнений с n
неизвестными,
коэффициенты
которой можно интерпретировать как
скалярные произведения столбцов
a(s)a(t)
исходной матрицы A
= (aij).
Поэтому определитель матрицы этой системы
обращается в ноль
тогда и только тогда, когда строки его
линейно зависимы, т.е.
(1
s
n).
Это возможно только в случае
линейной зависимости столбцов матрицы
А = (aij).
Это невозможно ввиду ограничения rg(A)
= n.
Таким образом, при сделанных предположениях полученная система линейных уравнений всегда имеет единственное решение. Это решение действительно доставляет минимум минимизируемой функции. Для того, чтобы убедиться в этом, нужно понять, что все собственные числа матрицы вторых производных неотрицательны. Но эта матрица, как не трудно проверить, в рассматриваемом случае равна
.
Поэтому, если
2AA
tv
= v,
то 2v
tAA
tv
= vv
t
и
.
Пример.
Пусть нужно определить величины x,
y,
связанные линейными зависимостями
, где
.
Легко видеть, что эта система несовместна.
Для решения задачи
по методу наименьших квадратов составляем
систему
и находим решение
.
Конечно, это решение не удовлетворяет
ни одному из уравнений исходной системы,
но при этих значениях вектор разности
левой и правой частей системы имеет
наименьшую длину. Действительно, матрица
вторых производных минимизируемой
функции
U(x, y) = (x+2y – 8,5)2 + (2x + y – 6,7)2 + (x + 3y – 11,1)2
равна
и является положительно определённой,
так, что в найденной точке достигается
минимум функции U(x,
y).