КОНСПЕКТ ЛЕКЦИЙ КОДЭИ
.pdfС помощью кнопки Graph of means (График средних) строятся графики средних значений характеристик машин для каждого кластера.
12.03.13 Доцент С.Т. Касюк |
43 |
12.03.13 Доцент С.Т. Касюк |
44 |
Изменим переменные для анализа.
Нажмем кнопку Variables (Переменные) в левом верхнем углу текущего окна и откроим диалоговое окно: Select variables for the analysis. Сделаем в нем установки, как показано на рисунке (мы выберем теперь только 3 параметра, характеризующих машины).
12.03.13 Доцент С.Т. Касюк |
45 |
Повторим действия, описанные ранее. Нажмем кнопку Graph of means (График средних), построим график средних значений характеристик машин для каждого кластера.
12.03.13 Доцент С.Т. Касюк |
46 |
Состав групп изменился. Теперь машины более отчетливо группируются. Мы «пожертвовали» размерностью, сократили число параметров и получили более отчетливо выраженные группы.
При проведении кластерного анализа необходимо обязательно поэкспериментировать с данными. Возможно, удастся найти оптимальную кластеризацию.
12.03.13 Доцент С.Т. Касюк |
47 |
Пример 2. Рассмотрим решение задачи кластеризации на данных результатов всех игр сборных европейских стран (суммарное количество игр в отборочных и финальных частях), участвующих в розыгрыше Кубка/Чемпионата Европы с 1960 по 2000 года.
Таблица результатов всех игр сборных Европы
48
Выберем метод K-means.
12.03.13 Доцент С.Т. Касюк |
49 |
Выбираем переменные
для анализа.
В поле Number of clasters
(Число кластеров) запишем число 4 (мы будем разбивать команды на 4 кластера).
В строке Number of iterations
(Число итераций) зададим число 10.
Результат кластерного анализа
12.03.13 Доцент С.Т. Касюк |
51 |
Посмотрим, как наблюдения будут распределяться по кластерам
12.03.13 Доцент С.Т. Касюк |
52 |