Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

[ММвЛХ] Лекция 7 Регрессионный анализ+

.pdf
Скачиваний:
38
Добавлен:
03.05.2015
Размер:
1.51 Mб
Скачать

Поволжский государственный технологический университет

Регрессионный анализ

Разработчик: доцент каф. ЛТ и Л, кандидат с.-х. наук Власова Н.А.

Регрессионный анализ – это метод определения степени раздельного или совместного влияния факторов на результативный признак.

Процедура простой регрессии заключается в нахождении аналитического выражения для связи двух переменных X и Y.

Переменная X носит название независимой переменной, или предиктора, переменная Y называется зависимой переменной, или откликом.

Данная терминология связана с тем, что необходимо определить именно зависимость Y от X или предсказать, какими будут значения Y при данных значениях X.

Значение переменной X в i-м опыте

обозначают через Xi, соответствующее значение величины Y - через Yi, 0 < i < = n.

Cамая простая регрессионная модель – линейная, в рамках этой модели наблюдаемые величины X и Y связаны между собой регрессионной зависимостью вида:

Yi b0 b1Xi ei ,

0 i n

где b0, bl – неизвестные константы, ei – ненаблюдаемые случайные величины

(наблюдаются только Xi, Yi, ) со средним 0 (как говорят, являются несмещенными) и неизвестной дисперсией, не меняющейся от опыта к опыту.

• Иногда случайные величины ei, 0 i n

называют ошибками наблюдения.

Относительно ei предполагается, что они не коррелированы в разных опытах. Кроме того, часто предполагается, что ошибки имеют нормальное распределение. В этом случае некоррелированность влечет независимость.

Линейные модели с несколькими независимыми переменными называют

множественными регрессионными моделями:

Y b

b X

1

b X

2

... b X

k

e

,

i 0

1

2

k

i

 

0 i n

где b0, bl, b2, ..., bk – неизвестные коэффициенты.

Общая задача регрессионного анализа состоит в том, чтобы по наблюдениям:

оценить параметры модели b0 и bl;

построить доверительные интервалы для b0 и bl;

проверить гипотезу о значимости регрессии;

оценить степень адекватности модели и т.д.

Результаты регрессионного анализа в MS Excel

Метод наименьших квадратов (МНК)

Требование метода заключается в том, чтобы теоретические точки линии

регрессии Ŷi были получены таким образом, чтобы сумма квадратов отклонений от этих точек эмпирических

(наблюдаемых) значений Yi была минимальной, т.е. Σ(Yi Ŷi)2→min.

Оценка адекватности модели

Под адекватностью понимается способность модели предсказывать результаты эксперимента с требуемой точностью.

Модель можно считать адекватной, если

множественный коэффициент корреляции (R) и коэффициент детерминации (R- квадрат) имеют значение, превышающее 0,5;

сумма квадратов регрессии превышает сумму квадратов остатков;

стандартная ошибка не велика;

фактическое значение критерия Фишера (F) превышает теоретическое при данном числе степеней свободы (df) и заданном уровне значимости.

В оценке адекватности модели важную роль играет и график остатков