- •Лабораторная работа № 3 по дисциплине «Статистический анализ с применением современных программных средств» тема: «Множественная регрессия и корреляция»
- •Пример выполнения лабораторной работы № 3
- •1) Проверка наличия коллинеарности или мультиколлинеарности. Отбор неколлинеарных факторов.
- •2) Для построения уравнения линейной регрессии используем функцию «Данные. Анализ данных. Регрессия» (рис 3.1). Задав соответствующие диапазоны данных в окне, получим набор таблиц а, б, в.
- •Требования к оформлению результатов
- •Контрольные вопросы:
1) Проверка наличия коллинеарности или мультиколлинеарности. Отбор неколлинеарных факторов.
Построим корреляционную матрицу, используя функцию «Данные. Анализ данных. Корреляция» табличного процессора MS Excel.
|
y |
x1 |
x2 |
x3 |
y |
1 |
|
|
|
x1 |
0,099 |
1 |
|
|
x2 |
0,680 |
0,218 |
1 |
|
x3 |
0,661 |
0,159 |
0,506 |
1 |
Из матрицы следует, что наблюдается коллинеарность между факторами x2 и x3 , так как r x2 x3 = 0,506. Для дальнейшего рассмотрения оставляем фактор x3, так как он меньше коррелирует с фактором x1 (r x1 x3 = 0,159 < r x1 x2 = 0,218).
Таким образом, далее будет строиться регрессия y на факторы x1 и x3.
2) Для построения уравнения линейной регрессии используем функцию «Данные. Анализ данных. Регрессия» (рис 3.1). Задав соответствующие диапазоны данных в окне, получим набор таблиц а, б, в.
Рис. 3.1. Окно параметров регрессии
Таблица А
Показатель |
Значение |
Комментарий автора |
Множественный R |
0,661 |
Множественный коэффициент корреляции R |
R-квадрат |
0,437 |
Коэффициент координации R |
Нормированный R-квадрат |
0,393 |
|
Стандартная ошибка |
9,187 |
Стандартная ошибка определения R |
Наблюдения |
29 |
Число наблюдений |
Таблица Б – Дисперсионный анализ
Число степеней свободы ' |
Дисперсия на Дисперсия 1 степень свободы |
Статистика Фишера |
|||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
2 |
1700,834 |
850,417 |
10,077 |
0,000575573 |
Остаток |
26 |
2194,339 |
84,398 |
|
|
Итого |
28 |
3895,172 |
|
|
|
Таблица В
|
Коэффициенты уравнения регрессии |
Стандартная ошибка определения коэффициентов |
t- статистика |
Вероятность ошибки |
Нижние Верхние 95%- 95%-пределы пределы |
|
Коэффициенты |
Стандартная ошибка |
t- статистика |
P- Значение |
Нижние Верхние 95% 95% |
Y-пересечение |
84,753 |
9,449 |
8,970 |
0,000 |
65,33075807 104,1754 |
Переменная X 1 |
-0,005 |
0,112 |
-0,041 |
0,968 |
-0,234238092 0,225055 |
Переменная X 3 |
0,616 |
0,139 |
4,438 |
0,000 |
0,330928877 0,901872 |
Из табл. В следует, что уравнение регрессии имеет вид y = 84,753 – 0,005x1 + 0,616x3.
3) Коэффициент множественной корреляции определяется из табл. А
4) Проверка значимости уравнения регрессии основана на использовании F-критерии Фишера. Фактическое значение критерия берется из табл. Б, т. е. Fфакт=10,077.
Для определения табличных значений используем встроенную функцию MS Excel «FРАСПОБР» (рис. 3.2), задавая параметры k1 = 2, k2 = 29 - 2 - 1 = 26, α = 0,05 и α = 0,01.
Рис. 3.2. Окно параметров регрессии
В результате получаем Fфакт 0.05 = 3,369, Рфакт 0,01 = 5,526. Откуда следует, что уравнение регрессии значимо и при α = 0,05, и α = 0,01.
5) Частные уравнения регрессии. Предварительно определим средние значения переменных
С учетом средних значений построим частные уравнения регрессии
6) Средние частные коэффициенты эластичности
