Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ІАД_ПЗС-1344_Поліщук_Лабораторний практикум.docx
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
10.73 Mб
Скачать
    1. Кластеризация при различных весах входных атрибутов. Акцент на выделении кластера Активная молодеж ь

  1. Импортировать в Deductor набор данных из файлов mobile.txt.

  2. Запустить Мастер обработки и выбрать узел Карта Кохонена.

Выполнить настройку нормализации входных столбцов (наиболее значимыми будут поля Возраст, Звонков ночью за месяц и Количество SMS за месяц) (рис. 8.32).

Рисунок 8.32 – Настройка нормализации данных

Большие значения в двух последних указанных полях как раз и должны характеризовать группу абонентов «Активная молодежь», поскольку для них характерны активное пользование SMS-сообщениями и звонки в ночное время.

Настроить карту Кохонена с параметрами из предыдущего примера.

  1. Проанализировав полученные карты, самостоятельно выделить кластер Активная молодежь (много ночных разговоров, много SMS, юный возраст) (рис. 8.33).

Получить статистику по полученному выделению.

  1. Выполнить автоматическую кластеризацию абонентов (рис. 8.35), воспользовавшись кнопкой , принудительно установив число кластеров, равным 3 (рис. 8.34).

Рисунок 8.33 – Полученные карты Кохонена

Рисунок 8.34 – Настройка кластеров

Рисунок 8.35 – Кластеризация

абонентов

Обратите внимание, что один из кластеров явно соответствует группе

Активная молодежь.

  1. Получить статистику по интересующему нас кластеру (рис. 8.36), настроить и проанализировать профили кластеров (рис. 8.37).

Рисунок 8.36 – Статистика по кластеру

Рисунок 8.37 – Оценка статистики

по заданному кластеру

  1. Получить карты Кохонена, делая акцент на формировании кластера VIP-клиенты – самые высокие расходы, продолжительные разговоры, частые международные звонки, много разговоров в рабочее время.

Сохраните результат в файле L8_2.ded.

    1. Кластеризация при ограничении набора входных атрибутов. Акцент на выделении кластера Активная молодеж ь

  1. Импортировать в Deductor набор данных из файлов mobile.txt

  2. Запустить Мастер обработки и выбрать узел Карта Кохонена.

Выбрать в качестве входных параметров поля Возраст, Звонков ночью за месяц и Количество SMS за месяц, остальные поля сделать выходными (рис. 8.38).

Рисунок 8.38 – Настройка назначений столбцов

3) Настроить параметры обучения как в предыдущих примерах. И запустить процесс построения карты Кохонена.

  1. Проанализировав полученные карты, самостоятельно выделить кластер Активная молодежь (много ночных разговоров, много SMS, юный возраст) (рис. 8.39).

Получить статистику по полученному выделению. Обратите внимание на однородность заполнения ячеек выходных полей. Какой вывод можно из этого сделать? Предложить данной группе абонентов оптимальный тарифный план.

  1. Выполнить автоматическую кластеризацию абонентов,

принудительно установив число кластеров, равным 3 (рис. 8.40).

Обратите внимание, что один из кластеров близок к той группе, которую мы выделяли ранее.

Рисунок 8.39 – Полученные карты Кохонена

Рисунок 8.40 – Автоматическая кластеризация абонентов

  1. Получить статистику по интересующему нас кластеру (рис. 8.41), настроить и проанализировать профили кластеров.

Рисунок 8.41 – Статистика по заданному кластеру

  1. Получить карты Кохонена, делая акцент на формировании кластера

«VIP-клиенты» – самые высокие расходы, продолжительные разговоры, частые международные звонки, много разговоров в рабочее время.

Сохраните результат в файле L8_2.ded.

Вопросы для проверки

  1. Как выделить множество ячеек на карте и посмотреть объекты, попавшие в них?

  2. Как поставить текстовую метку на ячейке?

  3. Как проще всего посмотреть статистику по объектам, попавшим в ячейку?

  4. Какой кластер в приведенной бизнес-задаче, скорее всего, не удалось бы обнаружить при масштабе карты 16x12?

  5. В каких случаях следует задавать значимость входных полей?

  6. Как карта Кохонена может использоваться в задаче восстановления пропусков в данных? Опишите шаги, необходимые для этого.

  7. Почему при кластеризации в обработчике Карта Кохонена могут быть выходные поля? Каково их предназначение?

  8. В каком случае для карты Кохонена лучше установить цветовую палитру в серых тонах? Почему?

  9. Как сегментируются покупатели супермаркета на основе расчета индекса НОР?

  10. Опишите, как можно проводить сегментацию товаров методами кластеризации.