Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторные роботы_Deductor.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
9.65 Mб
Скачать
    1. Порядок виконання роботи

  1. Повторіть в Deductor приклад з груповою обробкою.

2. Відкриєте сценарій Демоприклади з аналізу даних.ded.

3. Запустіть на виконання декілька вузлів а різних гілках.

4. Розташуйте візуалізатори вертикально.

5. Зверніть, а потім закрийте всі візуалізатори.

6. Додайте декілька вузлів у Вибране.

7. Відключіть всі незнайомі вам обробники.

8. Відкрийте Керівництво аналітика.

    1. Звіт про лабораторну роботу

Звіт містить наступні результати:

  1. Титульний лист.

  2. Мета роботи.

  3. Варіант студента.

  4. Опис кожного зробленого завдання згідно свого варіанту;

  5. Скриншоти кожного зробленого завдання згідно свого варіанту;

  6. Висновки.

    1. Контрольні запитання

  1. Для чого призначений вузол Групова обробка?

2. У чому принципова відмінність вузла Скрипт від Групова обробка?

3. Приведіть приклади, коли потрібно застосовувати Групову обробку.

4. У яких випадках потрібно включати прапор Використовувати кеш для результату?

5. Що роблять такі команди головного меню Вікно: Каскадом, Вертикально, Горизонтально?

6. Що таке «вибрані» узли?

3 Як перейти до «вибраних» вузлів?

4 Як за замовчуванням називається файл конфігурації?

5 Що зберігається в файлі конфігурації?

6 В якому каталозі перебувають демоприклади?

Лабораторна робота №5. Вирішення задач кластеризації засобами аналітичної платформи Deductor.

Мета роботи: навчитися вирішувати задачі кластеризації засобами аналітичної платформи Deductor.

5.1. Теоретичні основи роботи

Кластеризації - це групування об'єктів по схожості їх властивостей. Кожний кластер складається з подібних об'єктів, а об'єктів різних кластерів суттєво різняться.

В даній лабораторній роботі ми спробуємо здійснити кластеризацію абонентів телекомунікаційної компанії (оператора мобільного зв'язку).

При проведені кластеризації результатом є утворені кластери. Графічне представлення кластеру здійснюється у вигляді спеціального графіку, який називається карта Кохонена (рис. 1).

Тейво Кохонен – фінський вчений та дослідник, професор технологічного університету м. Хельсінки. Зробив величезний внесок у розвиток теорії штучний нейронних мереж, асоціативної пам’яті та розпізнавання образів, однак світову славу йому принесли мережі та карти Кохонена, які вирішують задачі кластеризації та багатомірної візуалізації.

Рис. 5.1. Зображення карти Кохонена.

Переваги використання даного візуалізатора (карти Кохонена) полягає в наступному:

• дозволяє зручно візуалізувати розміщення об'єктів, які мають багато характеристик (абонент - к-сть відправлених sms, mms за період, вихідний та вхідний трафік тощо).

• принцип побудови карти Кохонена зручний та відповідає звичайній рельєфній географічній карті.

Як читати карту Кохонена?

Нехай ми маємо абонентів телекомунікаційної компанії, кожен з яких характеризується декількома атрибутами, зокрема «середньомісячні витрати», «вік», «середня тривалість дзвінка» тощо. Була здійснена кластеризація абонентів і на рис. 5.2 зображено карту Кохонена, побудовану в результаті кластеризації для атрибуту «Среднемесячні витрати».

Отож, як зрозуміти структуру карти, що зображена на рис.5.2?

Тут все досить таки просто:

• «Точка А» і «Точка Б» символізують окремих абонентів (насправді, кожна точка - це група з декількох абонентів, які між собою надзвичайно подібні, але з деякою мірою спрощення вважатимемо це окремими клієнтами).

• Оскільки відстань між точками А і Б на карті є незначною, то можна стверджувати, що дані клієнти (точки А і Б) є подібні між собою за всією сукупністю атрибутів. Дана подібність визначається, як правило, за формулою

Евкліда і називається метрика.

• Однак, враховуючи, що кожна точка має різний колір, які дуже різняться між собою по кольоровій гамі (точка А - темно-синя, а точка Б - салатова), то можна стверджувати, що попри подібність даних клієнтів по всім ознаками, вони суттєво відрізняються по величині середньомісячних витрат на телефонні розмови. Внизу карти Кохонена зазначена відповідність кольорів на карті і кількісних показників. Як видно клієнт з точки А витрачає на мобільний зв'язок близько 225 грн.

Рис. 5.2. Карта Кохонена для атрибуту «Середньомісячні витрати».

Слід зауважити, що при кластеризації, як правило, будується по кожному атрибуту окрема карта Кохонена + декілька загальних карт. Важливо зрозуміти, що на кожній з карт кожен об'єкт (в даному випадку абонент) має одне і теж положення (точку), однак різний колір (рис. 5.3).

Рис. 5.3. Карти Кохонена для кожного з атрибутів