Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Итоговый отчет.Беднарская с-32.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
1.54 Mб
Скачать

5. Метод главных компонент.

Теперь проверим, улучшится ли качество модели, если строить регрессию на главных компонентах. Метод главных компонент – это один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации.

 Сделав необходимые вычисления, получим матрицу факторных нагрузок:

Матрица компонентa

Компонента

1

2

3

4

5

6

возраст авто, дней

-,404

,740

,161

,289

-,423

-,019

пробег, км

-,306

,819

,207

-,041

,434

,058

цена авто , руб.(сс)

,375

,079

,735

-,545

-,122

-,045

курс доллара

-,017

-,433

,689

,570

,108

,016

возраст младшего водителя, полных лет

,928

,232

-,047

,121

-,075

,250

стаж наименее опытного водителя, полных лет

,867

,343

-,106

,238

,091

-,236

Метод выделения: Анализ методом главных компонент.

a. Извлеченных компонент: 6

Таблица 11 Матрица компонент

Первая полученная компонента, состоящая из х5-возраста младшего водителя и х6- стажа наименее опытного водителя, интерпретируется как характеристики водителя, вторая - технические характеристики автомобиля, а третья – стоимость автомобиля (+курс доллара).

Полная объясненная дисперсия

Компонента

Начальные собственные значения

Суммы квадратов нагрузок извлечения

Итого

% Дисперсии

Кумулятивный %

Итого

% Дисперсии

Кумулятивный %

dimension0

1

2,010

33,501

33,501

2,010

33,501

33,501

2

1,583

26,383

59,884

1,583

26,383

59,884

3

1,097

18,280

78,163

1,097

18,280

78,163

4

,778

12,968

91,131

,778

12,968

91,131

5

,408

6,803

97,934

,408

6,803

97,934

6

,124

2,066

100,000

Метод выделения: Анализ главных компонент.

Таблица 12 объясненная дисперсия

По критерию Кайзера необходимо отобрать 3 первых фактора, так как у них собственные значения больше 1.

Теперь посмотрим, как полученные компоненты коррелируют со стоимостью полиса:

Таблица 13- корреляционная матрица новых компонент

Как видно из таблицы – всего двя коэффициента корреляции значимы. При этом связь и в первом и во втором случае достаточно заметная.

Результаты регрессии главных компонент:

Коэффициентыa

Модель

Нестандартизованные коэффициенты

Стандартизованные коэффициенты

t

Знч.

B

Стд. Ошибка

Бета

1

(Константа)

1758,603

61,668

28,517

,000

Характеристики водителя

-114,436

62,294

-,229

-1,837

,073

Технические характеристики автомобиля

-30,441

62,294

-,061

-,489

,627

Стоимость автомобиля

237,586

62,294

,476

3,814

,000

R2 =0,283 R2adj =0,236 ст. ош. = 436

Таблица 14 результаты регрессии главных компонент

В получившейся регрессии на главных компонентах b1 и b2 не значимы и скорр намного ниже, чем в регресси на исходных переменных.

Таким образом, оптимальной моделью из всех рассчитанных представляется модель, где в качестве объясняющих признаков использованы факторы Х(3) (цена автомобиля, руб.) и Х(6) (стаж наименее опытного водителя, лет.).

Рассчитаем коэффициенты эластичности:

Это означает, что при росте цены автомобиля на 1%, цена полиса увеличивается на на 6,106 %.

Это означает, что при росте стажа наименее опытного водителя на 1% ВВП цена полиса падает на 1,73%.

В данной модели дисперсия стоимости полиса автострахования каско объясняется на 47,8 % - не очень высоким, но достаточным значением.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]