[ММвЛХ] Лекция 7 Регрессионный анализ+
.pdfПоволжский государственный технологический университет
Регрессионный анализ
Разработчик: доцент каф. ЛТ и Л, кандидат с.-х. наук Власова Н.А.
•Регрессионный анализ – это метод определения степени раздельного или совместного влияния факторов на результативный признак.
•Процедура простой регрессии заключается в нахождении аналитического выражения для связи двух переменных X и Y.
•Переменная X носит название независимой переменной, или предиктора, переменная Y называется зависимой переменной, или откликом.
•Данная терминология связана с тем, что необходимо определить именно зависимость Y от X или предсказать, какими будут значения Y при данных значениях X.
•Значение переменной X в i-м опыте
обозначают через Xi, соответствующее значение величины Y - через Yi, 0 < i < = n.
•Cамая простая регрессионная модель – линейная, в рамках этой модели наблюдаемые величины X и Y связаны между собой регрессионной зависимостью вида:
Yi b0 b1Xi ei , |
0 i n |
•где b0, bl – неизвестные константы, ei – ненаблюдаемые случайные величины
(наблюдаются только Xi, Yi, ) со средним 0 (как говорят, являются несмещенными) и неизвестной дисперсией, не меняющейся от опыта к опыту.
• Иногда случайные величины ei, 0 i n
•называют ошибками наблюдения.
•Относительно ei предполагается, что они не коррелированы в разных опытах. Кроме того, часто предполагается, что ошибки имеют нормальное распределение. В этом случае некоррелированность влечет независимость.
•Линейные модели с несколькими независимыми переменными называют
множественными регрессионными моделями:
• Y b |
b X |
1 |
b X |
2 |
... b X |
k |
e |
, |
i 0 |
1 |
2 |
k |
i |
|
0 i n
•где b0, bl, b2, ..., bk – неизвестные коэффициенты.
•Общая задача регрессионного анализа состоит в том, чтобы по наблюдениям:
•оценить параметры модели b0 и bl;
•построить доверительные интервалы для b0 и bl;
•проверить гипотезу о значимости регрессии;
•оценить степень адекватности модели и т.д.
Результаты регрессионного анализа в MS Excel
Метод наименьших квадратов (МНК)
•Требование метода заключается в том, чтобы теоретические точки линии
регрессии Ŷi были получены таким образом, чтобы сумма квадратов отклонений от этих точек эмпирических
(наблюдаемых) значений Yi была минимальной, т.е. Σ(Yi – Ŷi)2→min.
Оценка адекватности модели
•Под адекватностью понимается способность модели предсказывать результаты эксперимента с требуемой точностью.
•Модель можно считать адекватной, если
•множественный коэффициент корреляции (R) и коэффициент детерминации (R- квадрат) имеют значение, превышающее 0,5;
•сумма квадратов регрессии превышает сумму квадратов остатков;
•стандартная ошибка не велика;
•фактическое значение критерия Фишера (F) превышает теоретическое при данном числе степеней свободы (df) и заданном уровне значимости.
•В оценке адекватности модели важную роль играет и график остатков