- •Лабораторная работа № 4-5 «Кластерный анализ»
- •Проведем кластерный анализ методом «дальнего соседа»
- •Построим графики отношения средних значений исходных показателей по кластерам к средним значениям исходных показателей по выборке в целом
- •6. Проведем кластерный анализ методом Уорда.
- •7.Построим графики отношения средних значений исходных показателей по кластерам к средним значениям исходных показателей по выборке в целом
- •Проведем кластерный анализ методом к-средних.
Лабораторная работа № 4-5 «Кластерный анализ»
Постановка задачи: построить классификации, используя методы «дальнего соседа», «Уорда» и «к-средних». Рассмотреть 2-х, 3-х, 4-х кластерные модели, используя функционалы качества, получить наилучшую классификацию. Написать выводы и их обосновать.
План проведение лабораторной работы:
Провести визуальный анализ на нормальной вероятностной бумаге попарного распределения переменных с целью выявления аномальных объектов
Провести кластерный анализ методом «дальнего соседа», рассмотреть 2-х, 3-х, 4-х кластерные модели. Для каждого разбиения составить таблицы по составу кластеров и таблицы средних значений по кластерам.
Построить графики для каждой модели отношения средних значений исходных показателей по кластерам к средним значениям исходных показателей по выборке в целом
Провести кластерный анализ методом «Уорда», рассмотреть 2-х, 3-х, 4-х кластерные модели. Для каждого разбиения составить таблицы по составу кластеров и таблицы средних значений по кластерам.
Построить графики для каждой модели отношения средних значений исходных показателей по кластерам к средним значениям исходных показателей по выборке в целом
Провести кластерный анализ методом «к-средних», рассмотреть 2-х, 3-х, 4-х кластерные модели. Для каждого разбиения составить таблицы по составу кластеров и таблицы средних значений по кластерам.
Проанализировать с учетом функционалов качества все полученные классификации, выявить лучшую из них, написать аргументированный вывод.
Имеется 17 транспортных компаний, занимающихся морскими перевозками в регионах Южной и Юго-Восточной Азии.
Х1 – стоимость доставки 1 тонны груза (тыс. долл.)
Х2 – срок доставки груза (дней)
Х3 – стоимость хранения и складирования одной тонны груза (долл.)
Х4 – срок отсрочки платежа (дней)
Х5 – репутация транспортной компании, характеризующая надежность поставки (баллов)
Х6 – опыт работы компании на рынке (лет)
Таблица № 1
Транспортная компания |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
1 |
1,35 |
35 |
150 |
30 |
4 |
3 |
2 |
1,6 |
38 |
200 |
30 |
6 |
5 |
3 |
1,15 |
29 |
100 |
60 |
7 |
8 |
4 |
1,4 |
36 |
50 |
30 |
5 |
6 |
5 |
1,1 |
34 |
50 |
45 |
6 |
9 |
6 |
1 |
42 |
200 |
15 |
3 |
5 |
7 |
1,35 |
37 |
50 |
60 |
3 |
7 |
8 |
1,3 |
38 |
150 |
30 |
8 |
5 |
9 |
1,25 |
35 |
100 |
30 |
4 |
2 |
10 |
1,65 |
31 |
50 |
90 |
5 |
3 |
11 |
1,05 |
35 |
250 |
60 |
6 |
12 |
12 |
1,7 |
22 |
50 |
90 |
8 |
9 |
13 |
1,65 |
35 |
100 |
60 |
5 |
7 |
14 |
1,85 |
31 |
50 |
60 |
9 |
10 |
15 |
1,25 |
24 |
300 |
45 |
2 |
6 |
16 |
1,45 |
25 |
200 |
30 |
7 |
4 |
17 |
1,25 |
29 |
250 |
30 |
5 |
15 |
Все элементы попали в границы эллипса.
Таким образом, визуальный анализ попарных распределений переменных на нормальной вероятностной бумаге не выявил аномальных объектов, следовательно, все компоненты могут участвовать в дальнейшем исследовании.
Проведем стандартизацию, для устранения различной размерности
Таблица № 3
|
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
1 |
-0,0957800542 |
0,419928755 |
0,17435526 |
-0,769366346 |
-0,757923828 |
-1,12000318 |
2 |
0,921883022 |
0,969066357 |
0,767163145 |
-0,769366346 |
0,272852578 |
-0,534155363 |
3 |
-0,909910515 |
-0,67834645 |
-0,418452625 |
0,607394484 |
0,788240781 |
0,344616363 |
4 |
0,107752561 |
0,602974622 |
-1,01126051 |
-0,769366346 |
-0,242535625 |
-0,241231454 |
5 |
-1,11344313 |
0,236882887 |
-1,01126051 |
-0,0809859312 |
0,272852578 |
0,637540272 |
6 |
-1,52050836 |
1,70124983 |
0,767163145 |
-1,45774676 |
-1,27331203 |
-0,534155363 |
7 |
-0,0957800542 |
0,78602049 |
-1,01126051 |
0,607394484 |
-1,27331203 |
0,0516924545 |
8 |
-0,299312669 |
0,969066357 |
0,17435526 |
-0,769366346 |
1,30362898 |
-0,534155363 |
9 |
-0,502845285 |
0,419928755 |
-0,418452625 |
-0,769366346 |
-0,757923828 |
-1,41292709 |
10 |
1,12541564 |
-0,312254715 |
-1,01126051 |
1,98415531 |
-0,242535625 |
-1,12000318 |
11 |
-1,31697575 |
0,419928755 |
1,35997103 |
0,607394484 |
0,272852578 |
1,516312 |
12 |
1,32894825 |
-1,95966752 |
-1,01126051 |
1,98415531 |
1,30362898 |
0,637540272 |
13 |
1,12541564 |
0,419928755 |
-0,418452625 |
0,607394484 |
-0,242535625 |
0,0516924545 |
14 |
1,9395461 |
-0,312254715 |
-1,01126051 |
0,607394484 |
1,81901719 |
0,930464181 |
15 |
-0,502845285 |
-1,59357579 |
1,95277892 |
-0,0809859312 |
-1,78870023 |
-0,241231454 |
16 |
0,311285176 |
-1,41052992 |
0,767163145 |
-0,769366346 |
0,788240781 |
-0,827079272 |
17 |
-0,502845285 |
-0,67834645 |
1,35997103 |
-0,769366346 |
-0,242535625 |
2,39508373 |