- •Постановка задачи
- •Составление корреляционной матрицы. Отбор факторов
- •Построение уравнения множественной линейной регрессии. Интерпретация параметров уравнения
- •Коэффициент детерминации, множественный коэффициент корреляции
- •Оценка качества уравнения множественной линейной регрессии
- •Средняя относительная ошибка аппроксимации
- •4.2 Проверка статистической значимости уравнения множественной регрессии в целом с помощью f-критерия Фишера
- •4.3 Проверка статистической значимости параметров уравнения множественной регрессии. Интервальные оценки параметров
- •Применение регрессионной модели
- •Точечный прогноз
Построение уравнения множественной линейной регрессии. Интерпретация параметров уравнения
Построить уравнение множественной линейной регрессии. Дать интерпретацию параметров уравнения.
Составим регрессионную модель с помощью пакета анализа «Анализ данных→Регрессия» в MS Excel:
=
Уравнение регрессии будет выглядеть следующим образом:
b8 – положительный
b6 – положительный
Коэффициент детерминации, множественный коэффициент корреляции
Найти коэффициент детерминации, множественный коэффициент корреляции. Сделать выводы.
В регрессионном анализе, выполненном с помощью надстройки «Анализ данных→Регрессия» в MS Excel, найдём таблицу «Регрессионная статистика»:
Множественный R – связь между Y2 и Х8, Х6 слабая.
R-квадрат – 30,29% вариация признака Y объясняется вариацией признаков Х8 и Х6.
Оценка качества уравнения множественной линейной регрессии
Средняя относительная ошибка аппроксимации
Рассчитаем
прогнозные значения
для каждого наблюдения (подставим
соответствующие значения
и
в
полученное в п.2 уравнение регрессии)
или воспользуемся столбцом «Предсказанное
У» в таблице «Вывод остатка» в
регрессионном анализе, выполненном с
помощью надстройки «Анализ данных→Регрессия»
в MS
Excel)
Вычислим относительные ошибки для каждого наблюдения по формуле (см. столбец «|еi|/yi» из Примечания):
Вычислим среднюю относительную ошибку аппроксимации по формуле:
Вывод:
4.2 Проверка статистической значимости уравнения множественной регрессии в целом с помощью f-критерия Фишера
Проверить статистическую значимость уравнения множественной регрессии в целом с помощью F-критерия Фишера. Сделать выводы.
Для проверки значимости уравнения в целом выдвинем гипотезу Н0 о статистической незначимости коэффициента детерминации и противоположную ей гипотезу Н1 о статистической значимости коэффициента детерминации:
Н0: R2 = 0
Н1: R2 ≠ 0
Проверим гипотезы с помощью F-критерия Фишера.
Возьмём значение Fнабл из таблицы «Дисперсионный анализ», выполненной с помощью надстройки «Анализ данных→Регрессия» в MS Excel:
= 10,86529812
Рассчитаем Fкрит с помощью функции =FРАСПОБР(α;p;n-p-1) в MS Excel:
Fкрит = 3,18260985
Вывод:
>
– принимается гипотеза Н1 о статистической
значимости коэффициента детерминации:
уравнение признается статистически
значимым в целом на уровне значимости
0,05.
4.3 Проверка статистической значимости параметров уравнения множественной регрессии. Интервальные оценки параметров
Для проверки значимости коэффициентов уравнения выдвинем гипотезы Н0 k о статистической незначимости параметров bk и противоположные им соответствующие гипотезы Н1j о статистической значимости параметров bk:
Н0 k: bk = 0
Н1k: bk ≠ 0
k = 1, 2
Проверим гипотезы с помощью t- критерия Стьюдента.
Возьмём наблюдаемые значения критерия из столбца «t-статистика» таблицы, полученной с помощью надстройки «Анализ данных→Регрессия» в MS Excel:
|t_b0| < t_табл, |t_b8| > t_табл, |t_b6| > t_табл
Следовательно, b8 и b6 – статистически значимы, а b0 – статистически незначим.
Для интервальных оценок параметров регрессии воспользуемся таблицей, полученной с помощью пакета анализа «Анализ данных→Регрессия» в MS Excel:
95%-ые доверительные интервалы для параметров регрессии выглядят следующим образом:
b0 ∈ (-143,4196; 21,1462)
b8 ∈ (42,7120;126,4532)
b6 ∈ (95,4759; 460,2154)
