Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЛР 5 / 5

.docx
Скачиваний:
19
Добавлен:
03.08.2021
Размер:
437.86 Кб
Скачать

Федеральное агентство связи

Федеральное государственное бюджетное образовательное

учреждение высшего образования

Поволжский государственный университет

телекоммуникаций и информатики

Кафедра Информационных систем и технологий

Лабораторная работа №5

По дисциплине «Интеллектуальные системы и технологии»

Тема: «Кластеризация (самоорганизующаяся карта Кохонена)»

Выполнила: студентка гр. ИСТ-74у

Смолева В.А.

Руководитель :

__________________ Пальмов С.В.

Самара 2019

Лабораторная работа №5. Кластеризация (самоорганизующаяся карта Кохонена)

Цель работы: Научиться использовать самоорганизующиеся карты Кохонена для кластеризации данных

Задание №1

Выполните сегментацию абонентов телекоммуникационной компании.

18. Проанализируйте кластеры, ответив на следующие вопросы (ответы – в отчёт):

- какие кластеры обладают наименьшим разбросом значений параметров?

5 и 4 кластеры по сравнению с остальными имеют наименьший разброс, как по возрасту так и по другим значениям полей

- какие кластеры обладают наибольшим разбросом значений параметров?

7 и 2 кластеры имеют наибольших разброс, особенно по значениям возраста, звонки в другие страны, звонки на стационарные телефоны и прочие.

19. Выявите наиболее заметные особенности каждого кластера (например, наибольшее количество SMS за месяц среди всех кластеров) и, исходя из этого, присвойте каждому кластеру новое имя. Причину выбора имени для каждого кластера опишите в отчёте.

  1. Водители поездов, 30 -35, количесвто sms много , днем мало разговариваю к вечеру больше

  2. Предприниматели, 30 – 40 лет, звонки вечером, звонки в другие города, отправка sms выше среднего

  3. Родственники, 26 – 40, наибольшая продолжительность разговора среди других, звонки вечером и ночью

  4. Студенты, 20 – 28,средняя продолжительность разговора, звонков вечером много,количество sms больше среднего

  5. Офисные работники,23-63, много звонков, большой затрат, наибольший охват разговора днем

  6. Вахта, 49 – 60, много звонков вечером в другие города, стационарные

  7. Сеть фабрик, 46 – 50, вечером умеренно разговаривают, другие города, стационарные.

  8. Деревенские люди, 56 – 70, мало разговаривают по вечерам.

Задание №2

3. Разбейте данные на кластеры и, при помощи опции «Что если», попытайтесь выявить скрытые закономерности в Вашей БД (15 штук). Результаты поместите в отчёт. Сделайте выводы.

Закономерности

  1. Если фирма = Rekam ТО цена = 4799

  1. Если формат записи = AVI ТО цена = 5699

  1. Если разрешение = 1280x720 ТО цена = 6599

  1. Если цвет = красный ТО цена = 14999

  1. Если стабилизатор = оптический, ТО цена = 15999

  1. Если фирма = JVC И цвет = красный И фокусное расстояние = 2.9, ТО цена = 17000

  1. Если формат записи = AVCHD И цвет = оранжевый И фокусное расстояние = 4.9, ТО цена = 5999

  1. Если формат записи = MP4 И стабилизатор = нет И фирма = Sony, ТО цена = 16299

  1. Если цвет = серебряный И разрешение = 960x480 И фокусное расстояние = 2.06, ТО цена = 8099

  1. Если фирма = Canon И формат записи = MP4 И фокусное расстояние = 2.9, ТО цена = 21299

  1. Если фирма = Panasonic И цвет=серый И разрешение = 2160x1440 И формат записи = AVCHD И фокусное расстояние = 7.8 И стабилизатор = оптический, ТО цена = 25000

  1. Если фирма = Panasonic И цвет=черный И разрешение = 1920x1080 И формат записи = AVCHD И фокусное расстояние = 26.8 И стабилизатор = оптический, ТО цена = 23999

  1. Если фирма = Sony И цвет=черный И разрешение = 2160x1440 И формат записи = CMOS И фокусное расстояние = 5.3 И стабилизатор = нет, ТО цена = 10599

  1. Если фирма = Canon И цвет=серебряный И разрешение = 3840x2160 И формат записи = MP4 И фокусное расстояние = 4.08 И стабилизатор = оптический, ТО цена = 38999

  1. Если фирма = Rekam И цвет=красный И разрешение = 320x240 И формат записи = AVI И фокусное расстояние = 1.3 И стабилизатор = нет, ТО цена = 2099

Вывод: При проверке закономерностей с помощью "Что-если" было выявлено 11 из 15 скрытых закономерностей. При проверке закономерностей, нужно было изменять карту, таким образом, чтобы использовались только те поля, которые есть в закономерности.

Соседние файлы в папке ЛР 5