Статистика лб 2
.doc
Лабораторная работа 2
Метод наименьших квадратов. Аппроксимация рядов наблюдений. Регрессионный анализ.
2.1. Аппроксимация рядов наблюдений аналитической функцией.
Метод наименьших квадратов является одним из самых распространенных способов обработки результатов наблюдений. Будем описывать этот метод с помощью матричных форм.
Предположим, что в точках
получен ряд наблюдений
y1,y2,…..yk.
Требуется найти коэффициенты прямой линии
, (2.1)
исходя из системы уравнений
, (2.2)
(i=0,1,…k), называемых условной системой, и требования минимума средней квадратической ошибки
min (2.3)
Предполагается, что наблюдения искажены случайными ошибками, а значения xi известны точно. Дифференцируя выражение (4.3) по и и приравнивая производные нулю, получим два линейных алгебраических уравнения для определения неизвестных::
(2.4)
(2.5)
Решая систему( 2.4)-(2.5), находим оценки параметров и . Можно отметить, что матрица С системы (2.4)-(2.5) равна произведению двух прямоугольных матриц
=
или
С=XTX, где
X=- матрица системы (2.4) – (2.5) .
Наряду с линейной функцией ряды наблюдений можно аппроксимировать другими простыми аналитическими функциями, например, тригонометрическими функциями и экспонентами.
В качестве примера приведем аппроксимационную функцию вида
(2.6)
где
(2.7),
а T – период колебаний.
В случае m=2 ряд (4.6) имеет вид
(2.8)
Система нормальных уравнений в этом случае составляется из условия минимума функции
(2.9),
и имеет вид
(2.10)
Вычислив по значениям
все коэффициенты данной системы уравнений и решив ее, мы получим значения коэффициентов с0, с1 и с2.
Примеры
По значениям функции при (),приведенным в таблице , методом наименьших квадратов произвести аппроксимацию функции следующей аналитической формулой
где а
-
сутки
0
0.5
1
1.5
2
2.5
3
3.5
yi
1.00
0.52
-0.40
-0.38
0
-0.38
-0.60
0.18
yi
1.00
0.53
-0.38
-0.39
0.01
-0.40
-0.59
0.19
2.2. Метод множественной линейной регрессии.
Рассмотрим теперь метод множественной линейной регрессии, который используется для целей физико-статистического прогноза.
Предположим, что между неизвестной величиной Y ( предсказуемое или предиктант) и известными переменными Xi (предсказатели или предикторы) существует линейная связь
(2.11),
где сi - коэффициенты, которые находят методом наименьших квадратов по известным значениям Y и Xi для некоторой обучающей выборки из N случаев (k=1,2,…,N). При этом Nn.
Если ввести средние величины предикторов и предиктанта
отклонения от них, то есть величины
,
то уравнение (4.6) можно записать в виде
В соответствии с методом наименьших квадратов для определения коэффициентов сi имеем следующую систему нормальных уравнений
(2.12) где
,
Y’vk – фактическое значение предиктанта по данным обучающей выборки.
В ходе решения системы нормальных уравнений ( или после решения и оценки коэффициентов) можно рассчитать ряд величин, характеризующих точность полученного уравнения регрессии ( точность, соответствующая данной обучающей выбрки). Средняя квадратическая (стандартная) погрешность вычисляется по формуле
(2.13)
относительная ошибка определяется по формуле
(2.14)
а сводный (множественный) коэффициент корреляции рассчитывается из соотношения
(2.15),
где
(2.16)
средняя квадратическая величина Yk’.
Примеры.4.1.
Построить аппроксимационную кривую
по данным таблицы
x 1 2 3 4 5
y 671 970 1105 1285 1531
и построить данные таблицы и аппроксимационную функцию на графике
2.2.
Построить аппроксимационную кривую, вид которой представлен в примере 2.1. по данным таблиц
А
X 1 2 3 4 5 6 7 8
Y 150 300 550 680 900 1105 1280 1600
Б,
X 1 2 3 4 5 6 7 8
Y 0.1 0.22 0.33 0.45 0.6 0.65 0.7 0.79
В.
X 1 2 3 4 5 6 7 8
Y 65 75 81 92 101 111 120 132
и представить данные кривые на графике
-
ti
Xi
Cosω1ti
Cosω2ti
Cosω1ti *Cosω2ti
(Cosω1ti)2
(Cosω2ti)2
x Cosω1ti
x Cosω2ti
X апр
0
1
1
1
1
1
1
1
1
1
0.5
0.52
0.7
0
0
.49
0
.364
0
.36
1.0
-0.40
0
-1
0
0
1
0
.4
-.5
1.5
-.38
-0.7
0
0
.49
0
.267
0
-.35
2.0
0
-1
1
-1
1
1
0
0
0.01
2.5
-0.38
-0.7
0
0
.49
0
.267
0
.35
3.0
-0.6
0
-1
0
0
1
0
.6
-.5
3.5
0.18
-.7
0
0
.49
0
.126
0
.35
сумма
-0.06
0
0
0
3.96
4
2.024
2.0
С0=0.0
С1=0.51
С2=0.5
-
ti
1
2
3
4
5
6 7
x
1
3
5
8
10
11 12
ti2
1
4
9
16
25
36 49
xiti
1
6
15
32
50
66 84