Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СПИТ МО-317 Шакиров А.Р. ЛР4.docx
Скачиваний:
30
Добавлен:
28.08.2022
Размер:
5.48 Mб
Скачать
  1. Кластеризация с помощью самоорганизующейся карты Кохонена

Самоорганизующаяся карта Кохонена является разновидностью нейронной сети. Она применяется, когда необходимо решить задачу кластеризации, т.е. распределить данные по нескольким кластерам.

Рассмотрим механизм кластеризации путем построения самоорганизующейся карты, основываясь на типичных характеристиках цветков. Исходная таблица находится в файле «Iris.txt». Запустим, мастер обработки и выберем из списка метод обработки «Карта Кохонена» (рис. 16)

Рис.16. Карта Кохонена

Качество кластеризации можно оценить, просмотрев карту «КЛАСС ЦВЕТКА». На ней видно, что большинство цветов были классифицированы правильно. Посмотрев на карту «МАТРИЦА-РАССТОЯНИЙ» можно сказать о существовании четкой границы между классом цветов Setosa и остальными. «ПРОЕКЦИЯ САММОНА» показывает о существовании двух наиболее больших групп.

  1. Поиск ассоциативных правил

Ассоциативные правила позволяют находить закономерности между связанными событиями. Рассмотрим механизм поиска ассоциативных правил на примере данных о продажах товаров в некоторой торговой точке в файле «Supermarket.txt».

Необходимо решить задачу анализа потребительской корзины с целью последующего применения результатов для стимулирования продаж.

Для поиска ассоциативных правил запустим мастер обработки. В нем выберем тип обработки.

После завершения процесса поиска полученные результаты можно посмотреть, используя появившиеся специальные визуализаторы «Популярные наборы», «Правила», «Дерево правил», «Что-если».

Популярные наборы — это множества, состоящие из одного и более элементов, которые наиболее часто встречаются в транзакциях одновременно. На сколько часто встречается множество в исходном наборе транзакций можно судить по поддержке. Данный визуализатор отображает множества в виде списка (рис. 17)

Рис.17. Популярные наборы

Визуализатор «Правила» отображает ассоциативные правила в виде списка правил. Этот список представлен таблицей со столбцами: «номер правила», «условие», «следствие», «поддержка, %», «поддержка, количество», «достоверность» (рис. 18)

Рис.18. Правила

Визуализатор «Дерево правил» — это всегда двухуровневое дерево. Оно может быть построено либо по условию, либо по следствию. При построении дерева правил по условию, на первом (верхнем) уровне находятся узлы с условиями, а на втором уровне - узлы со следствием. Второй вариант дерева правил - дерево, построенное по следствию. Здесь на первом уровне располагаются узлы со следствием (рис. 18)

Рис.18. Дерево правил

  1. Пример расчета автокорреляции столбцов

Важным фактором для анализа временного ряда и прогноза является определение сезонности. В Deductor Studio таким инструментом является автокорреляция. Корреляция подразумевает под собой зависимость значения одной величины от значения другой.

Если их корреляция равна единице, то величины прямо зависимы друг от друга, если нулю – то нет, если минус единица, то зависимость обратная.

Используем данные по продажам находятся в файле Trade.txt. Для осуществления автокорреляции вызовем мастер обработки и вызовем в качестве обработки автокорреляцию (рис. 19).

Рис.19. Результат автокорреляции

Вначале корреляция равна единице – это, как значение зависит само от себя. Далее зависимость убывает и затем виден пик зависимости от данных 12 месяцев назад. Это как раз и говорит о наличии годовой сезонности.

Соседние файлы в предмете Современные проблемы информационных технологий