5. Метод главных компонент.

Теперь проверим, улучшится ли качество модели, если строить регрессию на главных компонентах. Метод главных компонент – это один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации.

Сделав необходимые вычисления, получим матрицу факторных нагрузок:

Матрица компонент^a
	Компонента
	1	2	3	4	5	6
возраст авто, дней	-,404	,740	,161	,289	-,423	-,019
пробег, км	-,306	,819	,207	-,041	,434	,058
цена авто , руб.(сс)	,375	,079	,735	-,545	-,122	-,045
курс доллара	-,017	-,433	,689	,570	,108	,016
возраст младшего водителя, полных лет	,928	,232	-,047	,121	-,075	,250
стаж наименее опытного водителя, полных лет	,867	,343	-,106	,238	,091	-,236
Метод выделения: Анализ методом главных компонент.
a. Извлеченных компонент: 6

Таблица 11 Матрица компонент

Первая полученная компонента, состоящая из х₅-возраста младшего водителя и х₆- стажа наименее опытного водителя, интерпретируется как характеристики водителя, вторая - технические характеристики автомобиля, а третья – стоимость автомобиля (+курс доллара).

Полная объясненная дисперсия
Компонента		Начальные собственные значения			Суммы квадратов нагрузок извлечения
Компонента		Итого	% Дисперсии	Кумулятивный %	Итого	% Дисперсии	Кумулятивный %
dimension0	1	2,010	33,501	33,501	2,010	33,501	33,501
	2	1,583	26,383	59,884	1,583	26,383	59,884
	3	1,097	18,280	78,163	1,097	18,280	78,163
	4	,778	12,968	91,131	,778	12,968	91,131
	5	,408	6,803	97,934	,408	6,803	97,934
	6	,124	2,066	100,000
Метод выделения: Анализ главных компонент.

Таблица 12 объясненная дисперсия

По критерию Кайзера необходимо отобрать 3 первых фактора, так как у них собственные значения больше 1.

Теперь посмотрим, как полученные компоненты коррелируют со стоимостью полиса:

Таблица 13- корреляционная матрица новых компонент

Как видно из таблицы – всего двя коэффициента корреляции значимы. При этом связь и в первом и во втором случае достаточно заметная.

Результаты регрессии главных компонент:

Коэффициенты^a
Модель		Нестандартизованные коэффициенты		Стандартизованные коэффициенты	t	Знч.
Модель		B	Стд. Ошибка	Бета	t	Знч.
1	(Константа)	1758,603	61,668		28,517	,000
	Характеристики водителя	-114,436	62,294	-,229	-1,837	,073
	Технические характеристики автомобиля	-30,441	62,294	-,061	-,489	,627
	Стоимость автомобиля	237,586	62,294	,476	3,814	,000
R² =0,283 R²_adj =0,236 ст. ош. = 436

Таблица 14 результаты регрессии главных компонент

В получившейся регрессии на главных компонентах b₁ и b₂ не значимы и скорр намного ниже, чем в регресси на исходных переменных.

Таким образом, оптимальной моделью из всех рассчитанных представляется модель, где в качестве объясняющих признаков использованы факторы Х⁽³⁾(цена автомобиля, руб.) и Х⁽⁶⁾(стаж наименее опытного водителя, лет.).

Рассчитаем коэффициенты эластичности:

Это означает, что при росте цены автомобиля на 1%, цена полиса увеличивается на на 6,106 %.

Это означает, что при росте стажа наименее опытного водителя на 1% ВВП цена полиса падает на 1,73%.

В данной модели дисперсия стоимости полиса автострахования каско объясняется на 47,8 % - не очень высоким, но достаточным значением.

<<< < Предыдущая 1 2 34 / 104 5 6 7 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
26.09.201988.89 Кб6Итог. 1 - 41..docx
#
29.03.20163.19 Mб27итог.docx
#
16.03.2015582.91 Кб32Итоги ФТС 2013.docx
#
01.05.2025115.38 Кб1Итоговая контрольная работа.docx
#
01.07.202554.65 Кб1итоговое сочинение.docx
#
01.05.20251.54 Mб1Итоговый отчет.Беднарская с-32.doc
#
01.07.202577.78 Кб1Итоговый_все темы.docx
#
19.09.2019139.78 Кб8ИТУ (ОТВЕТЫ 1-17).doc
#
19.09.2019184.83 Кб26ИТУ (ОТВЕТЫ 18-34).doc
#
01.04.2025472.06 Кб1Иту задачи.doc
#
22.11.2019558.59 Кб14ИТУ лекциию.doc