
Правительство Москвы
Департамент образования города Москвы
Московская государственная академия делового администрирования
Лабораторная работа №5-6
по эконометрике на тему:
"Построение классификаций транспортных компаний с помощью иерархических кластерных процедур и метода k-средних."
Выполнила:
Студентка группы 47М
Маковец Александра
Москва 2012
План:
Провести визуальный анализ исследуемых объектов в осях попарно взятых признаков, выявить наличие или отсутствие аномальных объектов (вкладка «Графики»).
Провести корреляционный анализ на выявление дублирующих и тесно связанных показателей, сделать выводы.
Провести процедуру стандартизации.
Построить классификацию методом «дальнего соседа», выделить 3-х и 4-х кластерные модели.
Построить графики отношений средних значений показателей по кластерам к средним значениям по выборке в целом для 3-х и 4-х кластерных моделей.
Построить классификацию методом Уорда, выделить 3-х и 4-х кластерные модели.
Построить графики отношений средних значений показателей по кластерам к средним значениям по выборке в целом для 3-х и 4-х кластерных моделей.
Построить классификации (3,4 кластерных моделей) по методу k-средних.
Сделать выводы, выявить наиболее содержательную кластерную модель, удовлетворяющую всем функционалам качества полученного разбиения.
Таблица 1
Исходный массив
N |
X1 |
X2 |
Х3 |
X4 |
X5 |
X6 |
1 |
1.35 |
35 |
150 |
30 |
4 |
3 |
2 |
1.6 |
38 |
200 |
30 |
6 |
5 |
3 |
1.15 |
29 |
100 |
60 |
7 |
8 |
4 |
1.4 |
36 |
50 |
30 |
5 |
6 |
5 |
1.1 |
34 |
50 |
45 |
6 |
9 |
6 |
1 |
42 |
200 |
15 |
3 |
5 |
7 |
1.35 |
37 |
50 |
60 |
3 |
7 |
8 |
1.3 |
38 |
150 |
30 |
8 |
5 |
9 |
1.25 |
35 |
100 |
30 |
4 |
2 |
10 |
1.65 |
31 |
50 |
90 |
5 |
3 |
11 |
1.05 |
35 |
250 |
60 |
6 |
12 |
12 |
1.7 |
22 |
50 |
90 |
8 |
9 |
13 |
1.65 |
35 |
100 |
60 |
5 |
7 |
14 |
1.85 |
31 |
50 |
60 |
9 |
10 |
15 |
1.25 |
24 |
300 |
45 |
2 |
6 |
16 |
1.45 |
25 |
200 |
30 |
7 |
4 |
17 |
1.25 |
29 |
250 |
30 |
5 |
15 |
Проанализируем распределение объектов в осях признаков, взятых попарно, на нормальной вероятностной бумаге. Для этого нужно зайти во вкладку «Графики» - «Графики рассеивания» - «Графики 2D».Убрать линию, зайти во вкладку «Дополнительно»(Advanced). В опции «Статистика» (справа сверху) установить галочку в окошечке «R-площадь». В опции «Эллипс» - флажок в окошке «Норма».
а) Рассмотрим распределение объектов в осях х1-х2. Вывод: проведенный визуальный анализ на нормальной вероятностной бумаге не выявил аномальных объектов.
б) Рассмотрим распределение объектов в осях х1-х3. Вывод: проведенный визуальный анализ на нормальной вероятностной бумаге не выявил аномальных объектов.
в) Рассмотрим распределение объектов в осях х1-х4. Вывод: по показателям х1 и х4 у компаний 9 и 17 совпали данные. х1 – стоимость доставки 1 тонны груза, х4 – срок отсрочки платежа (в днях).
г) Рассмотрим распределение объектов в осях х1-х5. Вывод: по показателям х1 и х4 у компаний 10 и 13 совпали данные. х1 – стоимость доставки 1 тонны груза, х5 – репутация компании на рынке.
д) Рассмотрим распределение объектов в осях х1-х6. Вывод: проведенный визуальный анализ на нормальной вероятностной бумаге не выявил аномальных объектов.
е) Рассмотрим распределение объектов в осях х2-х3. Вывод: по показателям х2 и х3 у компаний 9 и 13, 10 и 14 совпали данные. х2 – срок доставки груза, х3 – стоимость складирования и хранения.
ж) Рассмотрим распределение объектов в осях х2-х4. Вывод: по показателям х2 и х4 у компаний 1 и 9, 2 и 8, 11 и 13 совпали данные. х2 – срок доставки груза, х4 –срок отсрочки платежа (в днях).
з) Рассмотрим распределение объектов в осях х2-х5. Вывод: по показателям х2 и х5 у компаний 1 и 9 совпали данные. х2 – срок доставки груза, х5 –репутация компании на рынке.
и) Рассмотрим распределение объектов в осях х2-х6. Вывод: по показателям х2 и х6 у компаний 2 и 8 совпали данные. х6 – срок доставки груза, х6 –опыт работы компании.
к) Рассмотрим распределение объектов в осях х3-х4. Вывод: по показателям х3 и х4 у компаний 10 и 12, 14 и 7, 3 и 15, 1 и 8, 16 и 2 совпали данные.
л) Рассмотрим распределение объектов в осях х3-х5. Вывод: по показателям х3 и х5 у компаний 10 и 4совпали данные.
м) Рассмотрим распределение объектов в осях х3-х6. Вывод: по показателям х3 и х6 у компаний 2 и 6, 12 и 5совпали данные.
н) Рассмотрим распределение объектов в осях х4-х5. Вывод: по показателям х4 и х5 у компаний 9 и 1, 4 и 17совпали данные.
о) Рассмотрим распределение объектов в осях х4-х6. Вывод: по показателям х4 и х6 у компаний 2 и 8совпали данные.
п) Рассмотрим распределение объектов в осях х5-х6. Вывод: проведённый визуальный анализ на нормальной вероятностной бумаге не выявил аномальных объектов.
2.
Таблица 2