
5. Проверка значимости коэффициентов и адекватности уравнения регрессии
Неотъемлемым элементом регрессионного анализа является статистическая проверка значимости найденных коэффициентов регрессии. Оценку значимости коэффициентов выполняют по критерию Стьюдента. При этом проверяется нуль-гипотеза Н0: bj* = 0, т.е. j-й коэффициент регрессии генеральной совокупности при заданном уровне значимости α неотличим от нуля. Если условие:
(2.17)
где bj – j-й коэффициент регрессии; Sbj – среднее квадратичное отклонение у-го коэффициента: f = n – k – число степеней свободы: k – число учитываемых признаков в уравнении регрессии, выполняется, то нулевая гипотеза принимается. При несоблюдении условия (2.17) принимается альтернативная гипотеза H1: bj* ≠ 0. В случае принятия нуль-гипотезы незначимый коэффициент исключается из уравнения регрессии, а величины оставшихся коэффициентов находят заново, так как между ними существует корреляционная зависимость (2.8).
Средние квадратичные ошибки Sbj коэффициентов линейной регрессии для проверки условия (2.17) находят по формулам:
(2.18)
(2.19)
где Sост – корень квадратный из остаточной дисперсии или дисперсии уi относительно линии регрессии.
Остаточную дисперсию вычисляют по формуле:
(2.20)
где
– величины, вычисленные по уравнению
регрессии; k
–
число учитываемых признаков в уравнении
регрессии (для линейной регрессии k
=
2);
f
= n
– k
– число
степеней свободы. Если коэффициент
корреляции r
уже
вычислен, то при выполнении практических
расчетов удобно использовать связь
между линейной корреляцией и линейной
регрессией. В этом случае для нахождения
остаточной дисперсии можно использовать
формулу:
(2.21)
Другим
важным элементом регрессионного анализа
является проверка
адекватности уравнения
регрессии по критерию Фишера. В этом
случае проверяется нуль-гипотеза H0:
,
т.е. предполагается, что генеральные
дисперсии адекватности и воспроизводимости
равны. Поскольку проверка осуществляется
путем сравнения выборочных дисперсий,
то нуль-гипотеза принимается при
выполнении условия:
(2.22)
где
– выборочная дисперсия адекватности;
– выборочная дисперсия воспроизводимости;
f1
=
fад
– число степеней свободы
;
f2
= fвоспр
– число степеней свободы
.
При повторении (дублировании) каждого из n опытов m раз дисперсии адекватности и воспроизводимости вычисляют по формулам:
(2.23)
(2.24)
где n – объем выборки; m — число дублирующих опытов; k — число коэффициентов в уравнении регрессии; – значения, вычисленные по уравнению регрессии для xi, n – k = f1; n(m – 1) = f2 . В случае невозможности проведения дублирующих опытов и определения дисперсии воспроизводимости вместо соотношения (2.22) для оценки адекватности уравнения регрессии используют «обратное» отношение дисперсий:
F = s2y(f1) / s2ост(f2) > F1-α(f1, f2) , (2.25)
где f1 = n – 1; f2 = n – k.
В выражении (2.25) s2ост находят по формулам (2.19)–(2.21), а дисперсию относительно среднего s2y – по формуле (2.13). Считают, что эффективность уравнения регрессии тем выше, чем больше F превышает F1-α(f1, f2).
Вывод:
Таким образом, в ходе данной лабораторной работы для имеющихся экспериментальных данных была построена корреляционная зависимость в виде уравнения линейной регрессии, рассчитаны коэффициент корреляции и проведена проверка значимости коэффициентов и адекватности уравнения регрессии. Уравнение адекватно и в нем принимается гипотеза, отличная от нулевой.