Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

КОНСПЕКТ ЛЕКЦИЙ КОДЭИ

.pdf
Скачиваний:
110
Добавлен:
14.03.2016
Размер:
28.31 Mб
Скачать

С помощью кнопки Graph of means (График средних) строятся графики средних значений характеристик машин для каждого кластера.

12.03.13 Доцент С.Т. Касюк

43

12.03.13 Доцент С.Т. Касюк

44

Изменим переменные для анализа.

Нажмем кнопку Variables (Переменные) в левом верхнем углу текущего окна и откроим диалоговое окно: Select variables for the analysis. Сделаем в нем установки, как показано на рисунке (мы выберем теперь только 3 параметра, характеризующих машины).

12.03.13 Доцент С.Т. Касюк

45

Повторим действия, описанные ранее. Нажмем кнопку Graph of means (График средних), построим график средних значений характеристик машин для каждого кластера.

12.03.13 Доцент С.Т. Касюк

46

Состав групп изменился. Теперь машины более отчетливо группируются. Мы «пожертвовали» размерностью, сократили число параметров и получили более отчетливо выраженные группы.

При проведении кластерного анализа необходимо обязательно поэкспериментировать с данными. Возможно, удастся найти оптимальную кластеризацию.

12.03.13 Доцент С.Т. Касюк

47

Пример 2. Рассмотрим решение задачи кластеризации на данных результатов всех игр сборных европейских стран (суммарное количество игр в отборочных и финальных частях), участвующих в розыгрыше Кубка/Чемпионата Европы с 1960 по 2000 года.

Таблица результатов всех игр сборных Европы

48

Выберем метод K-means.

12.03.13 Доцент С.Т. Касюк

49

Выбираем переменные

для анализа.

В поле Number of clasters

(Число кластеров) запишем число 4 (мы будем разбивать команды на 4 кластера).

В строке Number of iterations

(Число итераций) зададим число 10.

Результат кластерного анализа

12.03.13 Доцент С.Т. Касюк

51

Посмотрим, как наблюдения будут распределяться по кластерам

12.03.13 Доцент С.Т. Касюк

52