
- •Список принятых сокращений
- •Тема 1. Методы решения систем линейных уравнений
- •Лекция 1. Метод Гаусса
- •Концепция методов
- •Метод Гаусса
- •Верхняя треугольная система линейных уравнений
- •Метод исключения Гаусса и выбор главного элемента
- •Схема единственного деления
- •Лекция 2. Итерационные методы
- •Метод итераций
- •Замечания о точности расчета
- •Достаточное условие
- •Приведение линейной системы к виду удобному для итерации.
- •Метод Зейделя
- •Тема 2. Методы решения нелинейных уравнений
- •Лекция 3. Метод половинного деления
- •Приближенное решение нелинейных уравнений
- •Отделение корней
- •Метод половинного деления
- •Лекция 4. Метод Ньютона
- •Методика решения задачи
- •Ошибка деления на нуль.
- •Скорость сходимости.
- •Модификации метода Ньютона.
- •Упрощенный метод Ньютона
- •Метод Ньютона-Бройдена
- •Метод секущих
- •Тема 3. Численное интегрирование
- •Лекция 5. Метод трапеций
- •Постановка задачи
- •Формула трапеций
- •Погрешность формулы трапеций
- •Общая формула трапеций
- •Лекция 6. Метод Симпсона
- •Формула Симпсона
- •Остаточный член формулы Симпсона
- •Общая (обобщенная) формула Симпсона
- •Тема 4. Обработка экспериментальных данных
- •Лекция 7. Интерполирование
- •Постановка задачи
- •Линейная интерполяция
- •Квадратичная интерполяция
- •Интерполяционная формула Лагранжа.
- •Вычисление Лагранжевых коэффициентов
- •Интерполяция сплайном
- •Лекция 8. Метод наименьших квадратов
- •Постановка задачи
- •Метод наименьших квадратов
- •Линейная аппроксимация (интерполяция)
- •Коэффициент линейной корреляции
- •Квадратичная аппроксимация
- •Приложения
- •Транспонирование
- •Вычисление определителя матрицы
- •Нахождение обратной матрицы
- •Сложение и вычитание матриц
- •Умножение матрицы на число
- •Умножение матриц
- •Итерационные методы решения уравнений
- •Стандартные формы уравнений
- •Поиск корней графическим методом
- •Простой итерационный метод догадки и проверки
- •Представление уравнения в форме 2
- •Прямая подстановка
- •Итерации в ячейке
- •Введение в надстройку Поиск решения
- •Активирование надстройки Поиск решения
- •Установка надстройки Поиск решения
- •Применение надстройки Поиск решения
- •Приложение 3. Контрольные вопросы
- •Приложение 4. Список лабораторных работ
- •Часть 1. Вычислительная техника
- •Часть 2. Численные методы
- •Список литературы.
- •Основная литература
- •Дополнительная литература
- •Интернет-ресурсы

Лекция 8. Метод наименьших квадратов
Постановка задачи
Определение вида функциональных зависимостей, получаемых в физическом эксперименте, имеет очень важное значение. Так, в результате эксперимен-
тов часто получают совокупность точек (x1 , y1 )...(xN , yN ), абсциссы которых {xk } различны. Одно из назначений численных методов – определение формулы вида y = f (x), которая связывает эти переменные, точнее – выбор класса допустимых формул, коэффициенты в которых должны быть определены.
Если все численные значения {xk }, {yk } известны с несколькими знаками
точности, то интерполяционный полином может быть с успехом использован, иначе это невозможно. В некоторых экспериментах применяется специализированное оборудование, позволяющее получить измеряемые точки, по крайней мере, с пятью знаками точности. Однако большинство экспериментов проводится на оборудовании, которое надежно дает только три или меньше знаков точности. Часто в измерении присутствует экспериментальная ошибка. И хотя
записываются три цифры для значений {xk }, {yk }. Подразумевается, что ис-
тинное значение f (xk ) удовлетворяет равенству: |
|
f (xk )= yk + εk |
(8.1) |
где εk – ошибка измерения.
Для определения лучшего приближения функции к полученным точкам, проведем исследование ошибок (также называемых отклонениями или ос-
татками): |
|
εk = f (xk )− yk , для 1 ≤ k ≤ N . |
(8.2) |
Существует несколько норм, которые можно использовать с остатками в (8.2), чтобы измерить, насколько далеко от данных лежит кривая y = f (x).
Максимальная ошибка: |
E∞ ( f )= max{ |
|
|
|
f (xk )− yk |
|
} |
|
|
|
(8.3) |
|||||||||
|
|
|
|
|
||||||||||||||||
|
|
|
1≤k≤N |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
1 |
|
N |
|
|
|
|
|||||||||||
Средняя ошибка: |
E1 |
( f )= |
∑ |
|
f (xk )− yk |
|
|
|
|
|
(8.4) |
|||||||||
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
||||||||||||||||
|
|
|
N |
k=1 |
|
|
|
|
|
|
|
|
1 |
|
||||||
|
|
( f )= |
1 |
N |
|
2 |
2 |
|||||||||||||
Среднеквадратическая ошибка: |
E2 |
∑ |
|
f (xk )− yk |
|
|
(8.5) |
|||||||||||||
|
|
|
||||||||||||||||||
|
|
|||||||||||||||||||
|
|
|
N |
k=1 |
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
Рассмотрим это на примере.
Пример 1. Сравнить максимальную, среднюю и среднеквадратичную ошибки для линейного приближения функции y = f (x)= 8,6 − 1,6 x по за-
данным точкам (−1;10), (0;9), (1;7 ), (2;5), (3;4), (4;3), (5;0) и (6;−1).
51

|
|
12 |
|
|
|
|
|
yk |
|
|
|
|
|
|
|
|
|
|
|
10 |
|
|
|
|
|
f(xk) |
|
|
8 |
|
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
-1 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
|
|
-2 |
|
|
|
|
|
|
Рис. 8.1 |
График функции y = f (x)= 8,6 − 1,6 x с нанесенными точками |
Найдем ошибки, используя значения функции f (xk ) и εk , полученные в таблице 8.1.
|
Вычисления для нахождения E1 ( f ) |
и E2 ( f ) |
Таблица 8.1 |
|||||
|
|
|||||||
xk |
yk |
f (xk )= 8,6 − 1,6 xk |
|
|
εk |
|
|
εk2 |
|
|
|||||||
|
|
|
|
0,2 |
|
|||
-1 |
10 |
10,2 |
|
0,04 |
||||
0 |
9 |
8,6 |
|
0,4 |
0,16 |
|||
1 |
7 |
7,0 |
|
0,0 |
0,00 |
|||
2 |
5 |
5,4 |
|
0,4 |
0,16 |
|||
3 |
4 |
3,8 |
|
0,2 |
0,04 |
|||
4 |
3 |
2,2 |
|
0,8 |
0,64 |
|||
5 |
0 |
0,6 |
|
0,6 |
0,36 |
|||
6 |
-1 |
-1,0 |
|
0,0 |
0,00 |
|||
|
|
∑ |
|
2,6 |
1,40 |
E∞ ( f )= max{0,2;0,4;0,0;0,4;0,2;0,8;0,6;0,0}= 0,8
E1 ( f )= 81 (2,6 )= 0,325
E2 |
|
1,4 |
1 2 |
≈ 0 ,41833 |
|
( f )= |
8 |
|
|
||
|
|
|
|
|
Ясно, что максимальная ошибка наибольшая и если одна точка плохая, то ее значение определяет E∞ ( f ). Средняя ошибка E1 ( f ) – просто среднее абсолютных величин ошибок разных различных точек. Она часто используется
52

благодаря простоте вычисления. Ошибку E2 ( f ) часто используют при изуче-
нии ошибок статистической природы.
Наилучшая построенная линия определяется путем минимизации одной из величин, заданных выражениями (8.3) – (8.5). Таким образом, можно найти три наилучшим образом построенные линии. Традиционно выбирается третья нор-
ма E2 ( f ) потому, что ее намного легче минимизировать.
Метод наименьших квадратов
Пусть зависимость между переменными x и y представлена таблицей данных, полученных в эксперименте:
X |
x1 |
x2 |
… |
xN |
|
|
|
|
yN |
Y |
y1 |
y2 |
… |
Требуется полученные данные описать некоторой функциональной зависимостью вида y = f (x). Такая зависимость должна отразить основную тенденцию изменения переменной y с изменением переменной x и сгладить слу-
чайные погрешности измерений, которые неизбежны в эксперименте.
Задача нахождения эмпирической формулы (формулы, служащей для аналитического представления опытных данных) состоит из двух основных этапов.
На первом этапе необходимо установить вид зависимости y = f (x), т.е.
решить |
|
является |
ли |
она линейной |
f (x)= a0 + a1 x , |
квадратичной |
|||||
f (x)=a |
0 |
+a |
1 |
x+a |
2 |
x2 , |
логарифмической |
f (x)=a +a |
1 |
ln(x) |
или какой-либо |
|
|
|
|
|
0 |
|
|
иной. Для этого экспериментальные точки наносятся на координатную плоскость и по их расположению выдвигают гипотезу о виде эмпирической зависимости.
На втором этапе, когда общий вид эмпирической функции выбран, необходимо определить числовые значения ее параметров a0 , a1 , a2 ,..., an . Критери-
ем выбора значений параметров является метод наименьших квадратов
(МНК).
В методе наименьших квадратов аппроксимирующая функция (полином) строится на основании того, что сумма квадратов невязок по всем точкам должна быть наименьшей. Т.е.:
N |
|
N |
|
|
|
|
|
|
|
F = ∑δk |
=∑( f (xk )− yk )2 min , |
(8.6) |
|||||||
k=1 |
k=1 |
|
|
|
|
|
|
||
где δk – невязки. |
|
|
|
|
|
|
|
|
|
Если взять полином в виде: |
|
|
|
|
|
|
|
||
f (x)=a +a |
1 |
x+a |
2 |
x2 +...+a |
m |
xm |
, |
(8.7) |
|
0 |
|
|
|
|
|
|
|||
то F = F (a0 ,a1 ,...,am ) |
|
|
|
|
|
|
|
|
|
Заметим, что степень полинома m должна быть меньше числа точек N . (В случае m = N − 1 получим полином Лагранжа).
53

Линейная аппроксимация (интерполяция)
В этом случае m = 1 , тогда аппроксимирующая функция будет иметь вид: (8.8)
Согласно МНК значения ее параметров подбираются таким образом, чтобы отклонение экспериментальных точек (xk ; yk ) от выбранной кривой было минимальным. Т.е. параметры a0 , a1 должны быть такими, чтобы сумма квадратов отклонений наблюдаемых значений yk от рассчитанных по функции
(8.8), была минимальной. Сумма квадратов отклонений от линейной функции (8.8) имеет вид:
|
N |
|
|
F (a0 , a1 )= ∑(a0 + a1 xk − yk )2 min |
(8.9) |
Величина E2 ( f ) |
k=1 |
|
будет минимальной тогда и только тогда, когда будет |
минимальной величина (8.9).
Величина F (ao ,a1 ) есть функция двух переменных. Необходимым усло-
вием экстремума такой функции является равенство нулю всех ее частных производных:
|
|
∂F (ao |
,a1 ) |
= 0 |
∂F (ao ,a1 ) |
= 0 |
(8.10) |
|
Они имеют вид: |
|
∂a0 |
∂a1 |
|||||
|
|
|
|
|||||
∂F (a0 , a1 ) |
|
|
|
|
|
|
||
|
N |
|
|
|
||||
|
= 2∑(a0 + a1 xk − yk )= 0 |
|
|
|||||
∂a0 |
|
|
||||||
|
k=1 |
|
|
(8.11) |
||||
|
∂F (a0 , a1 ) |
N |
|
|
||||
|
|
|
|
= 2∑(a0 + a1 xk − yk ) xk = 0 |
|
|||
∂a1 |
|
|||||||
|
k=1 |
|
|
|
Таким образом, после преобразования имеем нормальную систему двух линейных уравнений относительно неизвестных параметров регрессии a0 , a1 .
|
|
N |
N |
|
|
a0 N |
+ a1 ∑xk = |
∑yk |
|
||
|
|
k=1 |
k= |
1 |
(8.12) |
|
N |
N |
|
N |
|
a0 ∑xk + a1 ∑xk2 = ∑yk xk |
|
||||
|
k=1 |
k=1 |
|
k=1 |
|
Решение системы – значение параметров a0 , a1 можно найти методом обратной матрицы1. Представим систему (8.12) в матричной форме:
N
∑N xk
k=1
N |
|
|
|
|
|
N |
|
|
∑xk |
a |
|
|
∑yk |
|
или |
||
k=1 |
|
|
a |
0 |
|
= k=1 |
|
|
N |
|
|
1 |
N |
|
|
||
∑xk2 |
|
|
∑yk |
xk |
|
|||
k=1 |
|
|
|
|
|
k=1 |
|
|
A a0 = Ba1
1 Основы работы с матрицами в MS Excel представлены в приложении 1
54