- •Расчетно-графическая работа
- •Оглавление
- •Введение
- •1.1 Постановка задачи:
- •1.2 Решение:
- •1.3. Вывод
- •Часть вторая. Корреляционный анализ в системе «statistica»
- •Исходные данные
- •2.2. Решение:
- •Окно выбора переменных для построения корреляционной матрицы
- •График распределения переменной x6 от переменной x11
- •Панель Brushing 2d (Кисть)
- •График распределения переменной x6 от переменной x11 с выделенными точками, лежащими далеко от прямой
- •График распределения переменной x6 от переменной x11 после удаления выбранных точек
- •Распределения переменной x6 от переменной x11 с подписями к выбранным точкам
- •Выбор переменных для построения графиков корреляций
- •Графики корреляционных зависимостей для переменных x4, x5, x7
- •Табличное представление корреляционной матрицы для переменных x4, x5, x7
- •Корреляционная матрица парных коэффициентов корреляции для переменных x4-x7 , x10-x13
- •Корреляционная матрица частных коэффициентов корреляции
- •2.3. Вывод
- •Кластерный анализ Вариант 32
- •3.1. Постановка задачи:
- •3.2. Решение:
- •3.2.1. Период 1995-2005
- •Дендрограмма, построенная методом одиночной связи
- •Метод k-средних
- •Средние кластерные
- •3.2.2. Период 2006-2009 Иерархический метод
- •Дендрограмма, построенная методом полной связи Дендрограмма, построенная методом Варда
- •Метод k-средних
- •Заключение
- •Библиографический список
3.2. Решение:
3.2.1. Период 1995-2005
Воспользуемся агломеративным иерархическим алгоритмом классификации. В качестве расстояния между объектами примем обычное евклидово расстояние. По правилу объединения можно перебрать все методы: метод одиночной связи; метод полной связи; взвешенное попарное среднее; невзвешенное попарное среднее; взвешенный центроидный метод невзвешенный центроидный метод; метод Варда.
Первым шагом необходимо получить матрицу расстояний. Для этого воспользуемся прикладным пакетом STSTIISTICA 6. В меню Анализ запускаем модуль Многомерный разведочный анализ, в котором выбираем графу Кластерный анализ/ Иерархическая классификация. В графе Дополнительно выбираем все переменные. После нажатия Оk, строим матрицу расстояний. Она выглядит следующим образом
Таблица 11 – матрица расстояний
0 |
348 |
352 |
136 |
281 |
291 |
160 |
290 |
121 |
191 |
269 |
174 |
145 |
322 |
348 |
0 |
25 |
232 |
80 |
66 |
203 |
65 |
255 |
172 |
102 |
195 |
226 |
44 |
352 |
25 |
0 |
238 |
82 |
74 |
208 |
70 |
258 |
182 |
95 |
195 |
232 |
49 |
136 |
232 |
238 |
0 |
162 |
172 |
65 |
171 |
73 |
72 |
163 |
80 |
38 |
202 |
281 |
80 |
82 |
162 |
0 |
35 |
131 |
28 |
181 |
114 |
51 |
123 |
155 |
56 |
291 |
66 |
74 |
172 |
35 |
0 |
148 |
22 |
196 |
117 |
67 |
143 |
166 |
37 |
160 |
203 |
208 |
65 |
131 |
148 |
0 |
147 |
71 |
70 |
136 |
52 |
70 |
180 |
290 |
65 |
70 |
171 |
28 |
22 |
147 |
0 |
194 |
118 |
56 |
138 |
165 |
34 |
121 |
255 |
258 |
73 |
181 |
196 |
71 |
194 |
0 |
114 |
176 |
99 |
62 |
225 |
191 |
172 |
182 |
72 |
114 |
117 |
70 |
118 |
114 |
0 |
126 |
88 |
80 |
147 |
269 |
102 |
95 |
163 |
51 |
67 |
136 |
56 |
176 |
126 |
0 |
120 |
153 |
79 |
174 |
195 |
195 |
80 |
123 |
143 |
52 |
138 |
99 |
88 |
120 |
0 |
92 |
171 |
145 |
226 |
232 |
38 |
155 |
166 |
70 |
165 |
62 |
80 |
153 |
92 |
0 |
195 |
322 |
44 |
49 |
202 |
56 |
37 |
180 |
34 |
225 |
147 |
79 |
171 |
195 |
0 |
Для периода 1995-2005 построили дендрограммы несколькими методами. Схожие дендрограммы получились с помощью пяти алгоритмов: метод одиночной связи; метод полной связи; взвешенное попарное среднее; невзвешенное попарное среднее; метод Варда.
Рассмотрим дендрограмму, построенную методом одиночной связи
Дендрограмма, построенная методом одиночной связи
Рассмотрим остальные схожие дендрограммы, построенные другими методами.
Дендрограмма, построенная методом полной связи
Дендрограмма, построенная методом невзвешенного попарного среднего
Дендрограмма, построенная методом взвешенного попарного среднего
Дентограмма , построенная невзвешенным центроидным методом
Дентограмма построенная взвешенным центроидным методом
Дендрограмма, построенная методом Варда
Таким образом, методом иерархических процедур, все дендрограммы выделяют 3 группы регионов (кластеров), схожих между собой по потребностям в работниках, заявленным организациями в государственные учреждения службы занятости населения.
Первая группа включает в себя: Пензенскую, Кировскую, Ульяновскую области, Чувашскую и Удмуртскую республики, республики Мордовия и Марий Эл. Вторая группа выделяет 6 регионов регионов: Саратовскую область, Пермский край, Оренбургскую область, Нижегородскую область, Самарскую область, республика Татарстан. Третья включает в себя республику Башкортостан.
Использовав все методов кластерного анализа, можно прийти к выводу, что были получены достаточно точные разбиения.