Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторные работы / Бочаров (5 вариант) / Лабораторная работа 8.docx
Скачиваний:
23
Добавлен:
28.06.2014
Размер:
432.77 Кб
Скачать

Нелинейная зависимость

Связь между признаком x и yможет быть нелинейной, например, в виде полинома:

y = Pk (x) + ,

где Pk (x)=о + 1 x + ...+ k xk, k - степень полинома,- случайная составляющая, М = 0, D = 2 .

Для имеющихся данных (xi ,yi),i= 1, ...,n, можно записать

yi=о + 1 xi + 2 + ...+k + i , i =1, ...,n

или, как и (12), в матричной форме:

Y = X + ,

где .

Пример.Имеются эмпирические данные о зависимостиy- выработки на одного работника доменного производства отx- температуры дутья; данные приведены в табл. 3 в условных единицах.

Сначала оценим имеющиеся данные визуально, с помощью процедуры Scatterplot (диаграмма рассеяния):

Видим, что зависимость, возможно, нелинейная. Построим несколько регрессий.

1) Регрессия первой степени: y=о + 1 x (indep. Var.: x); получим (в скобках указаны стандартные ошибки оценок):

y= 5.37 + 1.40x

(0.98) (0.16)

= 0.795,s = 2.10.

2) Регрессия второй степени: y=о + 1 x + 2 x2 (indep. Var.: x, x2); получим:

y= 9.9 - 0.9x+ 0.21x2, (31)

(1.33) (0.57) (0.05)

= 0.891,s= 1.53,

коэффициент 1 = -0.9 незначимо отличается от 0. Эта регрессия лучше предыдущей в смыслеиs. Однако, возможно, регрессия третьей степени окажется лучше?

3) Построим регрессию третьей степени: y=о + 1 x + 2 x2 + 3 x3

(indep. Var.: x, x2 , x3 ); получим:

y= 11.6 - 2.32х+ 0.52х2- 0.02х3

(2.33) (1.75) (0.36) (0.02)

= 0.890,s = 1.53,

незначимо отличаются от 0. Поскольку степень увеличилась без увеличения, от регрессии третьей степени отказываемся в пользу (31) второй степени. Однако, гипотеза о нулевом значении 1 в (31) не отклоняется (p-level = 0.1), и потому построим

4) регрессию y=о + 2 x2 без линейного члена (indep. Var.: x2 ); получим

y= 8.02 + 0.13x2 (32)

(0.54) (0.01)

= 0.884,s= 1.6,

Сравнивая ее по иsс регрессией, включающей линейный член, отдаем предпочтение второй, поскольку ошибка прогнозаs меньше.

Обобщение нелинейной зависимости

Предполагается, что связь между факторами (х1, ...,хр) иyвыражается следующим образом:

y=о + 1 1 (х1, ..., хр)+ 2 2 (х1, ..., хр)+ ... + k k (х1, ..., хр) +

где j ( ),j= 1, ...,k, - система некоторых функций. Имеетсяnнаблюдений при различных значенияхх(х1, ..., хр):x1,x2, ...,xn ; имеем:

yi = o + ,i= 1, ...,n,

или в матричной форме:

y = X + ,

где Х- матрицаn(k+ 1), вi-й строке которой (1,1 (xi),2 (xi), ...,k (xi));

y, , , как в ранее решенных задачах. Все формулы остаются справедливыми.

Построим регрессию для z5. Рассмотрим полученные результаты:

По построенной регрессии:

Ошибки оценок для коэффициентов можем наблюдать в столбце Std.Err.ofB.

Построим график полученной функции и найдем точку ее минимума:

По полученному графику можно судить, что точкой минимума является точка (-4;-4). В этой точке, следует заметить, нет конкретных измерений величиныz5. Среди всех точек, в которых такие измерения присутствуют, точкой минимума является точка (3,2);