Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МП 3,4.doc
Скачиваний:
9
Добавлен:
05.11.2018
Размер:
945.66 Кб
Скачать

56

4.1. Метод наименьших квадратов

В дальнейшем мы будем рассматривать задачу аппроксимации только для одномерных переменных x = (x0, x1,…, xn) и y = (y0, y1,…, yn). Геометрически эта задача может быть сформулирована следующим образом: на плоскости OXY задано множество точек (xi, yi), 0  in, требуется провести гладкую кривую, которая проходит достаточно близко от этих точек. Такую задачу также называют задачей простой регрессии. Задача простой регрессии заключается в построении функции g(x), связывающей переменные x = (x0, x1,…, xn) и y = (y0, y1,…, yn). При этом x считается независимой переменной, влияющей на значения переменной y. В дальнейшем будем полагать, что нам заданы некоторые экспериментальные данные (xi, yi), 0  in, где n+1 – число измерений. Значения yi могут быть заданы точно, а могут содержать погрешность, т.е. yi = f(xi)+i, где f(x) – некоторая неизвестная функция, а i – погрешность. В простом регрессионном анализе, как правило, полагается, что 0, 1n – независимые одинаково распределенные случайные величины.

Отметим, что любая аналитическая зависимость g = g(x), полученная в результате обработки данных, называется эмпирической формулой. Следует также отметить, что в отличии от задачи интерполяции, в этом случае не требуется, чтобы все узлы сетки были различны между собой. То есть данные могут содержать точки, имеющие одинаковые координаты по x (xi = xj при ij).

Регрессионная функция (регрессионная модель, модель регрессии, эмпирическая формула) g = g(x) считается функцией, зависящей от параметров c1, c2,…, ck, где k<n+1, например, g(x) = c1+c2x. Таким образом, задача простой регрессии (задача аппроксимации, задача построения эмпирической формулы) разбивается на два этапа:

  1. выбор функции (модели) g = g(c1, c2, …, ck, x);

  2. нахождение числовых значений параметров c1, c2, …, ck.

Первый этап заметно сложнее второго. Предпочтение отдается простым формулам (полиномы, дробно-рациональные, показательные и другие функции). Нахождение параметров регрессионной функции (параметров регрессии, параметров регрессионной модели, параметров эмпирической формулы) является более легкой задачей, для решения которой используется метод наименьших квадратов (МНК), метод средних, метод выбранных точек и др. На практике чаще всего применяется метод наименьших квадратов, в дальнейшем мы будем использовать только этот метод.

Определение. Величины (yi-g(c1, c2, …, ck, xi)) называются остатками.

Определение. Методом наименьших квадратов называется способ подбора параметров c1, c2, …, ck регрессионной функции исходя из минимизации суммы квадратов остатков, т.е.:

.

Другими словами, метод наименьших квадратов – это метод нахождения параметров c = (c1, c2, …, ck) для фиксированной регрессионной функции (регрессионной модели, эмпирической формулы) /3/, таких что функция

достигает минимума. Рассматривая функцию U как функцию от переменных c1, c2, …, ck и используя необходимые условия экстремума функции нескольких переменных, получаем нормальную систему для определения параметров c1, c2, …, ck:

Если нормальная система имеет единственное решение, то это решение и будет искомым. Отметим, что если регрессионная функция g(c1, c2, …, ck) является линейной функцией относительно c1, c2, …, ck (например, ), то нормальная система является системой линейных уравнений с симметричной матрицей.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]