- •Многомерная модель данных.
- •Концептуальное многомерное представление
- •3. Тест fasmi
- •4. Архитектура olap-систем
- •Интеллектуальный анализ данных
- •Интеллектуальный анализ данных
- •1. Добыча данных — Data Mining
- •2 Задачи Data Mining
- •2.1. Классификация задач Data Mining
- •2.2. Задача классификации и регрессии
- •2..3. Задача поиска ассоциативных правил.
- •2.4. Задача кластеризации
- •Классификация и регрессия
- •1. Постановка задачи
- •Представление результатов
- •1. Правила классификации
- •2. Деревья решений
- •3. Математические функции
- •3. Методы построения правил классификации
- •3.1. Алгоритм построения 1Rправил
- •5.3.2. Метод Naive Bayes
- •4. Методы построения деревьев решений
- •4.1. Методика "разделяй и властвуй"
- •4.2. Алгоритм покрытия
- •5. Методы построения математических функций
- •5.1. Общий вид
- •5.2. Линейные методы. Метод наименьших квадратов
- •Карта Кохонена
- •Поиск ассоциативных правил.
- •1. Постановка задачи 6.1.1. Формальная постановка задачи
- •6.2. Сиквенциальный анализ
- •3.1. Алгоритм Apriori
- •6.3.2. Разновидности алгоритма Apriori
- •Глава 7. Кластеризация.
- •7.1. Постановка задачи кластеризации
- •7.1.1. Формальная постановка задачи
- •7.1.2. Меры близости, основанные на расстояниях, используемые в алгоритмах кластеризации
- •7.2. Представление результатов
- •7.3. Базовые алгоритмы кластеризации
- •7.3.1. Классификация алгоритмов
- •7.3.2. Иерархические алгоритмы гломеративные алгоритмы
- •Дивизимные алгоритмы
- •7.3.3. Неиерархические алгоритмы
- •Алгоритм k-means (Hard-c-means)
- •Алгоритм Fuzzy c-Means
- •Кластеризация по Гюстафсону-Кесселю
- •7.4. Кластеризация данных при помощи нечетких отношений
- •7.4.1. Анализ свойств нечетких бинарных отношений применительно к анализу данных
- •Сравнение данных
- •Отношение альфа-толерантности
- •7.4.2. Отношение альфа-квазиэквивалентности
- •Построение шкалы отношения а-квазиэквивалентности как алгоритм анализа данных
- •Об использовании шкалы а-квазиэквивалентности для анализа данных
- •Примеры анализа данных при помощи шкалы а-квазиэквивалентности
Построение шкалы отношения а-квазиэквивалентности как алгоритм анализа данных
В предыдущем разделе была представлена теоретическая база для исследования взаимосвязей образцов данных. Рассмотрим обобщенный алгоритм анализа данных с использованием отношения а-квазиэквивалентности и шкалы данного отношения.




Об использовании шкалы а-квазиэквивалентности для анализа данных
Шкала а-квазиэквивалентности, построенная при помощи описанного алгоритма и представленная в виде упорядоченной по возрастанию последовательности, порождает семейство отношений эквивалентности. Каждое из данных отношений соответствует своему уровню а-квазиэквивалентности, причем важным свойством данных отношений эквивалентности является то, что выбор каждого последующего уровня а-квазиэквивалентности (и соответствующего отношения эквивалентности) порождает более детальное разбиение множествах Это "более детальное разбиение" получается разбиением классов эквивалентности, полученных при использовании предыдущего уровня а-квазиэквивалентности.
С другой стороны, чем меньше уровень а-квазиэквивалентности, тем меньше классов эквивалентности получается, и наоборот. Чем больше разность между соседними уровнями а-квазиэквивалентности, тем лучше обособлены кластеры точек.
Проиллюстрируем данные выводы примерами.
Примеры анализа данных при помощи шкалы а-квазиэквивалентности
В примерах используются двумерные образцы данных для достижения большей наглядности результатов анализа.
ПРИМЕР 1. Типичный набор данных для кластеризации.
Этот пример призван показать, что предложенный механизм анализа данных справляется с задачами, на которые ориентированы алгоритмы нечеткой кластеризации, подразумевающие некоторую заданную форму кластеров.
Дано: множество точек X = {x 1 …xI8} (табл. 7.3).
Таблица 7.3

Графически образцы данных из множества X можно представить точками на плоскости (рис. 7.12).
Покажем, как шкала а-квазиэквивалентности разбивает множество Х на классы эквивалентности.

Рис. 7.12. Входные данные для примера 1
Матрица евклидовых расстояний между точками будет выглядеть следующим образом (табл. 7.4).
Матрица отношения сходства образцов данных на множестве X выглядит следующим образом (табл. 7.5).
Матрица отношения а-квазиэквивалентности выглядит следующим образом (табл. 7.6). На основании последней таблицы получаем шкалу отношения а-квазиэквивалентности и соответствующие классы эквивалентности (табл. 7.7).
Данный набор разбиений в соответствии с уровнями отношения а-квазиэквивалентности удобно проиллюстрировать на рис. 7.13.
