Решение
1. Построение линейного уравнения множественной регрессии было произведено в программе MS Excel (Регрессия – Анализ данных (Рисунок 4))
Рисунок 4 – Построение уравнения множественной регрессии в программе MS Excel
2. Оценка влияния факторов на результативный показатель с помощью коэффициентов эластичности была осуществлена по зависимости
; ; ; ; ; .
– при изменении фактора на 1% результативный показатель увеличится на 0,22%.
– при изменении фактора на 1% результативный показатель уменьшится на 0,04%.
– при изменении фактора на 1% результативный показатель уменьшится на 0,6%.
– при изменении фактора на 1% результативный показатель уменьшится на 0,07%.
– при изменении фактора на 1% результативный показатель увеличится на 0,21%.
3. Значимость коэффициентов регрессии проверяется с помощью t-критерия Стьюдента. Воспользуемся t-статистикой из программы MS Excel (таблица 6).
По уровню значимости и числу степеней свободы определяют . Если , то считается, что параметры модели значимы.
Таблица 6 – Расчётные значения t-критерия Стьюдента для коэффициентов модели
|
Коэффициенты |
t-статистика |
Y-пересечение |
56,07562833 |
3,012898214 |
Переменная X 1 |
0,129797905 |
1,211212449 |
Переменная X 2 |
-0,212914017 |
-0,206246191 |
Переменная X 3 |
-0,510172008 |
-4,601549925 |
Переменная X 4 |
-0,03233606 |
-0,52846983 |
Переменная X 5 |
0,085742205 |
0,873560008 |
Сравнивая по модулю значения t-статистики для каждого параметра с критическим значением, определённым по таблице критических точек распределения Стьюдента , получаем, что значим свободный член и параметр ; остальные параметры модели статистически не значимы.
Статистическая оценка значимости модели проводится на основе F-критерия Фишера. Выборочное и критическое значения F-критерия были найдены при построении модели в программе MS Excel.
.
Выборочное значение F-критерия Фишера сравнивается с критическим значением: , где
– доверительная вероятность;
– степень свободы факторной дисперсии, определяется числом факторов в модели;
– степень свободы остаточной дисперсии; .
Таким образом, .
Если , то полученное уравнение регрессии значимо, т.е. хотя бы один из коэффициентов не равен нулю.
При 5%-ном уровне значимости можно сделать вывод о значимости построенного уравнения регрессии.
4. Качество построенной модели оценивается с помощью средней ошибки аппроксимации.
Ошибка аппроксимации модели составляет
,
что говорит о удовлетворительной точности построенной модели.
5. Построение регрессионной модели только со значимыми факторами осуществлялось по методу исключения факторов. После построения модели из неё поэтапно исключаются самые незначимые факторы до тех пор, пока в уравнении не останутся только значимые факторы.
Исключаем из модели самый незначимый фактор (самое маленькое расчётное значение t-критерия Стьюдента ). Модель с оставшимися факторами имеет вид
Оценим значимость коэффициентов полученного уравнения регрессии с помощью t-критерия Стьюдента. Воспользуемся t-статистикой из программы MS Excel (таблица 7).
Таблица 7 – Расчётные значения t-критерия Стьюдента для коэффициентов модели
|
Коэффициенты |
t-статистика |
Y-пересечение |
54,48112123 |
3,290382352 |
Переменная X 1 |
0,122982435 |
1,233544467 |
Переменная X 3 |
-0,504427149 |
-4,806247131 |
Переменная X 4 |
-0,035570154 |
-0,614939121 |
Переменная X 5 |
0,088336819 |
0,92789522 |
. Фактор статистически значим; остальные параметры модели не значимы.
Исключаем из модели самый незначимый фактор (самое маленькое расчётное значение t-критерия Стьюдента ). Модель с оставшимися факторами имеет вид
Оценим значимость коэффициентов регрессии с помощью t-критерия Стьюдента. Воспользуемся t-статистикой из программы MS Excel (таблица 8).
Таблица 8 – Расчётные значения t-критерия Стьюдента для коэффициентов модели
|
Коэффициенты |
t-статистика |
Y-пересечение |
49,96479636 |
3,413421616 |
Переменная X 1 |
0,117357892 |
1,198425978 |
Переменная X 3 |
-0,516310929 |
-5,074120904 |
Переменная X 5 |
0,110692123 |
1,275412085 |
. Фактор статистически значим; остальные факторы модели статистически не значимы.
Исключаем из модели самый незначимый фактор (самое маленькое расчётное значение t-критерия Стьюдента ). Модель с оставшимися факторами имеет вид
Оценим значимость коэффициентов регрессии с помощью t-критерия Стьюдента. Воспользуемся t-статистикой из программы MS Excel (таблица 9).
Таблица 9 – Расчётные значения t-критерия Стьюдента для коэффициентов модели
|
Коэффициенты |
t-статистика |
Y-пересечение |
58,15727458 |
4,452904609 |
Переменная X 3 |
-0,461283652 |
-5,034397512 |
Переменная X 5 |
0,087364009 |
1,023676365 |
. Фактор , включённый в модель, статистически значим.
Исключаем из модели самый незначимый фактор . Модель имеет вид
Оценим значимость коэффициентов регрессии с помощью t-критерия Стьюдента. Воспользуемся t-статистикой из программы MS Excel (таблица 10).
Таблица 10 – Расчётные значения t-критерия Стьюдента для коэффициентов модели
|
Коэффициенты |
t-статистика |
Y-пересечение |
71,02699692 |
20,05373157 |
Переменная X 3 |
-0,531821338 |
-8,797570126 |
. Фактор , включённый в модель, статистически значим.
Построение моделей было осуществлёно в программе MS Excel.
Таким образом, было выявлено, что на оценку смертности населения по причине болезни органов кровообращения на 100000 населения наиболее полно влияет оценка валового внутреннего продукта по паритету покупательной способности в 1994г. на душу населения (в % к США).
В модели только со значимыми факторами величина оценивает агрегированное влияние прочих (кроме учтённых в модели факторов) факторов на результативный показатель . Величина указывает на то, что с увеличением фактора на единицу значений результат уменьшается соответственно на 0,532.
Коэффициент эластичности для полученной модели составит:
– при изменении фактора на 1% результативный показатель уменьшится на 0,62%.
Адекватность модели проверим с помощью F-критерия Фишера.
.
.
Поскольку , то при 5%-ном уровне значимости построенное уравнение регрессии значимо.
Средняя ошибка аппроксимации модели составляет
,
что говорит о хорошей точности построенной модели.
6. Если прогнозное значение фактора будет составлять 80% от своего максимального значения, то прогнозное значение будет равняться:
y=71,023-0,532*80=28,49
7. Стандартная ошибка регрессии , рассчитываемая по формуле
составляет .
При двусторонней доверительной вероятности параметр распределения Стьюдента равен ; при уровне значимости он составляет .
Предельная ошибка, которая в 90% случаев не будет превышена, составляет . Таким образом, нижняя граница доверительного интервала прогноза составляет 12,746; верхняя граница равна 44,233.
Предельная ошибка, которая в 95% случаев не будет превышена, составляет . Нижняя граница доверительного интервала прогноза составляет 9,507; верхняя граница равна 47,472.
8. Оценка смертности населения по причине болезни органов кровообращения на 100000 населения в зависимости от пяти факторов была описана линейным уравнением множественной регрессии. При оценивании статистической значимости параметров регрессионной модели с помощью t-критерия было установлено, что в построенной модели значим только один фактор. Используя метод многошагового регрессионного анализа, была построена регрессионная модель только со значимыми факторами. Анализ с помощью F-критерия показал, что новая модель более адекватна; величина средней ошибки аппроксимации показала, что модель только со значимыми факторами рекомендуется использовать в практических целях.