- •Введение
- •Постановка и описание экономической проблемы исследования
- •Обработка экспериментальных данных
- •2.1 Оценка репрезентативности и необходимого объема выборки
- •2.2 Выбор гипотезы и ее экспериментальная проверка по тестам
- •2.3 Определение параметров описательной статистики
- •2.4 Построение гистограммы и функции распределения
- •2.5 Аппроксимация экспериментальной гистограммы распределения вероятности посредством типового закона распределения
- •Определение статистической взаимосвязи экономических параметров
- •3.1 Корреляционный анализ
- •3.2 Регрессионный анализ
- •Прогнозирование экономических параметров на основе трендовых моделей
- •Заключение
3.2 Регрессионный анализ
Регрессионный анализ предназначен для того чтобы выявить связь между параметрами в виде математической модели. Эта модель позволяет произвести исследование влияния группы параметров на один параметр (результирующий). Параметры влияния – причинные факторы.
Регрессия представляет собой модель, которая предназначена для обслуживания и исследования причинных взаимосвязей параметров для связей:
Регрессия представляет собой модель, которая предназначена для обслуживания и исследования причинных взаимосвязей параметров для связей:
(парная регрессия), где
y
– результирующий фактор,
– причинные факторы.
(множественная регрессия)
y
Регрессия – это односторонняя стохастическая связь, устанавливающая математическое соотношение между результативным фактором и причинными факторами.
В зависимости от числа взаимосвязанных признаков различают парную и множественную регрессию. Если исследуется связь между двумя признаками (результативным и факторным), то регрессия называется парной, если между тремя и более признаками множественной (многофакторной) регрессией.
Форма связи результативного признака Y с факторами получила название уравнения регрессии. В зависимости от типа выбранного уравнения различают линейную и нелинейную регрессию (в последнем случае возможно дальнейшее уточнение: квадратичная, экспоненциальная, логарифмическая и т. д.).
В данной работе исследование будет проведено с помощью линейными парной и множественной регрессией.
Простая (парная) линейная регрессия
«Промышленное производство»
«Добыча полезных ископаемых»
Регрессионная статистика
|
|
Множественный R |
0,902217465 |
R-квадрат |
0,813996354 |
Нормированный R-квадрат |
0,804696172 |
Стандартная ошибка |
3,879225208 |
Наблюдения |
22 |
Так как коэффициент детерминации равен 0,9, то вариация результативного признака обусловлена в основном влиянием включенного в регрессионную модель фактора, т.е. вариация «Промышленного производства» приблизительно на 90% обусловлена влиянием «Добычей полезных ископаемых». Значит, выбранный фактор существенно влияет Промышленное производство, что означает правильность включения его в модель.
Дисперсионный анализ |
|||||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
1317,107 |
1317,107 |
87,52477 |
9,5828E-09 |
Остаток |
20 |
300,9678 |
15,04839 |
|
|
Итого |
21 |
1618,075 |
|
|
|
Рассчитанный уровень значимости
=
9,5828E-09<
0,05 (показатель Значимость) подтверждает
значимость R.
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
-46,370101 |
15,6614298 |
-2,96078 |
0,007728 |
-79,0393 |
-13,7009 |
-79,0393 |
-13,7009 |
Добыча полезных ископаемых |
1,45278793 |
0,15528758 |
9,355468 |
9,58E-09 |
1,128864 |
1,776712 |
1,128864 |
1,776712 |
Уравнение:
.
Так как Р-значение значительно меньше 0,05, то коэффициент причинного фактора является значимым
«Промышленное производство» «Текстильное и швейное производство»
Регрессионная статистика |
|
Множественный R |
0,890481733 |
R-квадрат |
0,792957717 |
Нормированный R-квадрат |
0,782605603 |
Стандартная ошибка |
4,092736542 |
Наблюдения |
22 |
Так как коэффициент детерминации равен 0,79 то вариация результативного признака обусловлена в основном влиянием включенного в регрессионную модель фактора, т.е. вариация «Промышленного производства» приблизительно на 80% обусловлена влиянием «Текстильным и швейным производством». Значит, выбранный фактор существенно влияет Промышленное производство, что означает правильность включения его в модель.
Дисперсионный анализ |
|||||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
1283,064697 |
1283,064697 |
76,5986257 |
2,83101E-08 |
Остаток |
20 |
335,009848 |
16,7504924 |
|
|
Итого |
21 |
1618,074545 |
|
|
|
Рассчитанный уровень значимости = 9,5828E-09< 0,05 (показатель Значимость) подтверждает значимость R.
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
54,57335 |
5,257081513 |
10,38092135 |
1,6811E-09 |
43,60726983 |
65,5394296 |
43,6072698 |
65,5394296 |
Текстильное и швейное производство |
0,4753721 |
0,054315426 |
8,752064082 |
2,831E-08 |
0,362072094 |
0,58867208 |
0,36207209 |
0,58867208 |
Уравнение:
.
Так как Р-значение значительно меньше 0,05, то коэффициент причинного фактора является значимым
Линейная множественная регрессия
Регрессионная статистика |
|
Множественный R |
0,981993973 |
R-квадрат |
0,964312164 |
Нормированный R-квадрат |
0,953159715 |
Стандартная ошибка |
1,89976281 |
Наблюдения |
22 |
Так как множественный коэффициент детерминации равен 0,964312164, то вариация результативного признака обусловлена в основном влиянием включенных в регрессионную модель факторов. То есть выбранные причинные факторы существенно влияют на «Промышленное производство», что подтверждает правильность включения этих факторов в модель.
Дисперсионный анализ |
|||||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
5 |
1560,328966 |
312,06579 |
86,46640508 |
5,30083E-11 |
Остаток |
16 |
57,74557975 |
3,6090987 |
|
|
Итого |
21 |
1618,074545 |
|
|
|
Рассчитанный уровень значимости = 5,30083E-11< 0,05 (показатель Значимость) подтверждает значимость R
|
Коэффици- енты |
Стандартная ошибка |
t - статис- тика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
2,33206751 |
9,883295346 |
0,23596052 |
0,816457231 |
-18,61958 |
23,283718 |
-18,61958 |
23,28372 |
Добыча полезных ископаемых |
0,35986732 |
0,182955263 |
1,966968959 |
0,066776527 |
-0,027981 |
0,7477152 |
-0,027981 |
0,747715 |
Производство пищевых продуктов |
0,20225947 |
0,140626054 |
1,438278802 |
0,169627844 |
-0,095854 |
0,5003734 |
-0,095854 |
0,500373 |
Текстильное и швейное производство |
0,03131529 |
0,065022864 |
0,481604252 |
0,636608042 |
-0,106527 |
0,1691576 |
-0,106527 |
0,169158 |
Обработка древесины |
0,2803823 |
0,077866152 |
3,600823886 |
0,002395041 |
0,115313 |
0,4454512 |
0,1153134 |
0,445451 |
Химическое производство |
0,10414127 |
0,069386758 |
1,500881098 |
0,152861604 |
-0,042952 |
0,2512346 |
-0,042952 |
0,251235 |
Из полученных данных получается уравнение регрессии:
В множественной регрессии коэффициенты причинных факторов являются размерными, поэтому полученные коэффициенты не могут отражать степень влияния каждого фактора. Чтобы получить уравнение регрессии необходимо преобразовать размерные коэффициенты в безразмерные, которые будут отражать степень влияния.
,
где
В результате вычислений получились следующие безразмерные коэффициенты:
|
0,223486566 |
|
0,205660791 |
|
0,058660768 |
|
0,422987734 |
|
0,139765854 |
Теперь подставим рассчитанные ранее безразмерные коэффициенты в формулу , в полученном уравнении отсутствует свободный член, остальные коэффициенты помогают определить степень влияния каждого фактора.
Проанализировав данное уравнение можно сделать вывод о том, что наиболее сильное влияние на результативный фактор «Промышленное производство» оказывает причинный фактор «Обработка древесины», а наименьшее (незначительное) влияние оказывает «Текстильное и швейное производство».
Окончательное уравнение примет вид:
Проанализировав график значений фактического и предсказанного промышленного производства, можно говорить о том, что они приблизительно равны. Из этого следует то, что данную модель можно применять на практике
