- •Оглавление:
- •Введение.
- •Общая характеристика статистической информации.
- •1.Исходные данные.
- •2. Корреляционный анализ.
- •Процедуры выбора регрессоров и функциональной формы модели
- •Уравнение с учетом всех указанных факторов.
- •Исключение переменных.
- •3. Включение переменных
- •4. Проверка гипотез о линейном ограничении на параметры регрессии
- •5. Метод главных компонент.
- •6.Проверка линейности регрессии.
- •7.Регрессионная однородность выборки.
- •Проверка спецификации ошибок.
- •1. Нормальность.
- •2. Гомоскедастичность.
- •3.Автокорреляция.
- •Коррекция мнк-оценок и процедуры домнк.
- •1.Мнк с учетом стандартной ошибки в форме Уайта и Нью-веста.
- •2.Метод взвешенных наименьших квадратов.
- •Процедура Кохрана-Оркатта
- •Фиктивные переменные.
- •Интерпретация модели.
- •Приложение.
5. Метод главных компонент.
Теперь проверим, улучшится ли качество модели, если строить регрессию на главных компонентах. Метод главных компонент – это один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации.
Сделав необходимые вычисления, получим матрицу факторных нагрузок:
Матрица компонентa |
||||||
|
Компонента |
|||||
1 |
2 |
3 |
4 |
5 |
6 |
|
возраст авто, дней |
-,404 |
,740 |
,161 |
,289 |
-,423 |
-,019 |
пробег, км |
-,306 |
,819 |
,207 |
-,041 |
,434 |
,058 |
цена авто , руб.(сс) |
,375 |
,079 |
,735 |
-,545 |
-,122 |
-,045 |
курс доллара |
-,017 |
-,433 |
,689 |
,570 |
,108 |
,016 |
возраст младшего водителя, полных лет |
,928 |
,232 |
-,047 |
,121 |
-,075 |
,250 |
стаж наименее опытного водителя, полных лет |
,867 |
,343 |
-,106 |
,238 |
,091 |
-,236 |
Метод выделения: Анализ методом главных компонент. |
||||||
a. Извлеченных компонент: 6 |
||||||
Таблица 11 Матрица компонент
Первая полученная компонента, состоящая из х5-возраста младшего водителя и х6- стажа наименее опытного водителя, интерпретируется как характеристики водителя, вторая - технические характеристики автомобиля, а третья – стоимость автомобиля (+курс доллара).
Полная объясненная дисперсия |
|||||||
Компонента |
Начальные собственные значения |
Суммы квадратов нагрузок извлечения |
|||||
Итого |
% Дисперсии |
Кумулятивный % |
Итого |
% Дисперсии |
Кумулятивный % |
||
dimension0 |
1 |
2,010 |
33,501 |
33,501 |
2,010 |
33,501 |
33,501 |
2 |
1,583 |
26,383 |
59,884 |
1,583 |
26,383 |
59,884 |
|
3 |
1,097 |
18,280 |
78,163 |
1,097 |
18,280 |
78,163 |
|
4 |
,778 |
12,968 |
91,131 |
,778 |
12,968 |
91,131 |
|
5 |
,408 |
6,803 |
97,934 |
,408 |
6,803 |
97,934 |
|
6 |
,124 |
2,066 |
100,000 |
|
|
|
|
Метод выделения: Анализ главных компонент. |
|||||||
Таблица 12 объясненная дисперсия
По критерию Кайзера необходимо отобрать 3 первых фактора, так как у них собственные значения больше 1.
Теперь посмотрим, как полученные компоненты коррелируют со стоимостью полиса:
Таблица 13- корреляционная матрица новых компонент
Как видно из таблицы – всего двя коэффициента корреляции значимы. При этом связь и в первом и во втором случае достаточно заметная.
Результаты регрессии главных компонент:
Коэффициентыa |
||||||
Модель |
Нестандартизованные коэффициенты |
Стандартизованные коэффициенты |
t |
Знч. |
||
B |
Стд. Ошибка |
Бета |
||||
1 |
(Константа) |
1758,603 |
61,668 |
|
28,517 |
,000 |
Характеристики водителя |
-114,436 |
62,294 |
-,229 |
-1,837 |
,073 |
|
Технические характеристики автомобиля |
-30,441 |
62,294 |
-,061 |
-,489 |
,627 |
|
Стоимость автомобиля |
237,586 |
62,294 |
,476 |
3,814 |
,000 |
|
R2 =0,283 R2adj =0,236 ст. ош. = 436
|
||||||
Таблица 14 результаты регрессии главных компонент
В получившейся регрессии на главных компонентах b1 и b2 не значимы и скорр намного ниже, чем в регресси на исходных переменных.
Таким образом, оптимальной моделью из всех рассчитанных представляется модель, где в качестве объясняющих признаков использованы факторы Х(3) (цена автомобиля, руб.) и Х(6) (стаж наименее опытного водителя, лет.).
Рассчитаем коэффициенты эластичности:
Это означает, что при росте цены автомобиля на 1%, цена полиса увеличивается на на 6,106 %.
Это означает, что при росте стажа наименее опытного водителя на 1% ВВП цена полиса падает на 1,73%.
В данной модели дисперсия стоимости полиса автострахования каско объясняется на 47,8 % - не очень высоким, но достаточным значением.
