ЛР 5 / 5
.docxФедеральное агентство связи
Федеральное государственное бюджетное образовательное
учреждение высшего образования
Поволжский государственный университет
телекоммуникаций и информатики
Кафедра Информационных систем и технологий
Лабораторная работа №5
По дисциплине «Интеллектуальные системы и технологии»
Тема: «Кластеризация (самоорганизующаяся карта Кохонена)»
Выполнила: студентка гр. ИСТ-74у
Смолева В.А.
Руководитель :
__________________ Пальмов С.В.
Самара 2019
Лабораторная работа №5. Кластеризация (самоорганизующаяся карта Кохонена)
Цель работы: Научиться использовать самоорганизующиеся карты Кохонена для кластеризации данных
Задание №1
Выполните сегментацию абонентов телекоммуникационной компании.
18. Проанализируйте кластеры, ответив на следующие вопросы (ответы – в отчёт):
- какие кластеры обладают наименьшим разбросом значений параметров?
5 и 4 кластеры по сравнению с остальными имеют наименьший разброс, как по возрасту так и по другим значениям полей
- какие кластеры обладают наибольшим разбросом значений параметров?
7 и 2 кластеры имеют наибольших разброс, особенно по значениям возраста, звонки в другие страны, звонки на стационарные телефоны и прочие.
19. Выявите наиболее заметные особенности каждого кластера (например, наибольшее количество SMS за месяц среди всех кластеров) и, исходя из этого, присвойте каждому кластеру новое имя. Причину выбора имени для каждого кластера опишите в отчёте.
Водители поездов, 30 -35, количесвто sms много , днем мало разговариваю к вечеру больше
Предприниматели, 30 – 40 лет, звонки вечером, звонки в другие города, отправка sms выше среднего
Родственники, 26 – 40, наибольшая продолжительность разговора среди других, звонки вечером и ночью
Студенты, 20 – 28,средняя продолжительность разговора, звонков вечером много,количество sms больше среднего
Офисные работники,23-63, много звонков, большой затрат, наибольший охват разговора днем
Вахта, 49 – 60, много звонков вечером в другие города, стационарные
Сеть фабрик, 46 – 50, вечером умеренно разговаривают, другие города, стационарные.
Деревенские люди, 56 – 70, мало разговаривают по вечерам.
Задание №2
3. Разбейте данные на кластеры и, при помощи опции «Что если», попытайтесь выявить скрытые закономерности в Вашей БД (15 штук). Результаты поместите в отчёт. Сделайте выводы.
Закономерности
Если фирма = Rekam ТО цена = 4799
Если формат записи = AVI ТО цена = 5699
Если разрешение = 1280x720 ТО цена = 6599
Если цвет = красный ТО цена = 14999
Если стабилизатор = оптический, ТО цена = 15999
Если фирма = JVC И цвет = красный И фокусное расстояние = 2.9, ТО цена = 17000
Если формат записи = AVCHD И цвет = оранжевый И фокусное расстояние = 4.9, ТО цена = 5999
Если формат записи = MP4 И стабилизатор = нет И фирма = Sony, ТО цена = 16299
Если цвет = серебряный И разрешение = 960x480 И фокусное расстояние = 2.06, ТО цена = 8099
Если фирма = Canon И формат записи = MP4 И фокусное расстояние = 2.9, ТО цена = 21299
Если фирма = Panasonic И цвет=серый И разрешение = 2160x1440 И формат записи = AVCHD И фокусное расстояние = 7.8 И стабилизатор = оптический, ТО цена = 25000
Если фирма = Panasonic И цвет=черный И разрешение = 1920x1080 И формат записи = AVCHD И фокусное расстояние = 26.8 И стабилизатор = оптический, ТО цена = 23999
Если фирма = Sony И цвет=черный И разрешение = 2160x1440 И формат записи = CMOS И фокусное расстояние = 5.3 И стабилизатор = нет, ТО цена = 10599
Если фирма = Canon И цвет=серебряный И разрешение = 3840x2160 И формат записи = MP4 И фокусное расстояние = 4.08 И стабилизатор = оптический, ТО цена = 38999
Если фирма = Rekam И цвет=красный И разрешение = 320x240 И формат записи = AVI И фокусное расстояние = 1.3 И стабилизатор = нет, ТО цена = 2099
Вывод: При проверке закономерностей с помощью "Что-если" было выявлено 11 из 15 скрытых закономерностей. При проверке закономерностей, нужно было изменять карту, таким образом, чтобы использовались только те поля, которые есть в закономерности.