- •Многомерная модель данных.
- •Концептуальное многомерное представление
- •3. Тест fasmi
- •4. Архитектура olap-систем
- •Интеллектуальный анализ данных
- •Интеллектуальный анализ данных
- •1. Добыча данных — Data Mining
- •2 Задачи Data Mining
- •2.1. Классификация задач Data Mining
- •2.2. Задача классификации и регрессии
- •2..3. Задача поиска ассоциативных правил.
- •2.4. Задача кластеризации
- •Классификация и регрессия
- •1. Постановка задачи
- •Представление результатов
- •1. Правила классификации
- •2. Деревья решений
- •3. Математические функции
- •3. Методы построения правил классификации
- •3.1. Алгоритм построения 1Rправил
- •5.3.2. Метод Naive Bayes
- •4. Методы построения деревьев решений
- •4.1. Методика "разделяй и властвуй"
- •4.2. Алгоритм покрытия
- •5. Методы построения математических функций
- •5.1. Общий вид
- •5.2. Линейные методы. Метод наименьших квадратов
- •Карта Кохонена
- •Поиск ассоциативных правил.
- •1. Постановка задачи 6.1.1. Формальная постановка задачи
- •6.2. Сиквенциальный анализ
- •3.1. Алгоритм Apriori
- •6.3.2. Разновидности алгоритма Apriori
- •Глава 7. Кластеризация.
- •7.1. Постановка задачи кластеризации
- •7.1.1. Формальная постановка задачи
- •7.1.2. Меры близости, основанные на расстояниях, используемые в алгоритмах кластеризации
- •7.2. Представление результатов
- •7.3. Базовые алгоритмы кластеризации
- •7.3.1. Классификация алгоритмов
- •7.3.2. Иерархические алгоритмы гломеративные алгоритмы
- •Дивизимные алгоритмы
- •7.3.3. Неиерархические алгоритмы
- •Алгоритм k-means (Hard-c-means)
- •Алгоритм Fuzzy c-Means
- •Кластеризация по Гюстафсону-Кесселю
- •7.4. Кластеризация данных при помощи нечетких отношений
- •7.4.1. Анализ свойств нечетких бинарных отношений применительно к анализу данных
- •Сравнение данных
- •Отношение альфа-толерантности
- •7.4.2. Отношение альфа-квазиэквивалентности
- •Построение шкалы отношения а-квазиэквивалентности как алгоритм анализа данных
- •Об использовании шкалы а-квазиэквивалентности для анализа данных
- •Примеры анализа данных при помощи шкалы а-квазиэквивалентности
Отношение альфа-толерантности
На основании полученной меры сходства предлагается построить семейство альфа-толерантных отношений, смысл которых заключается в степени схожести двух образцов данных относительно некоторого заданного образца. Для упрощения дальнейшего изложения введем следующее определение.
Определение 19 —
относительной
мерой сходства двух образцов данных
относительно
образца данных xq
будем
называть функцию
,
которая
определяется как:

Легко показать, что каждое отношение из семейства отношений £у ,...,£, является а-толерантным. Теперь покажем, как построить бинарное нечеткое отношение меры сходства образцов данных на множестве X. Для этого запишем нечеткое правило: если Е, (a,b) и ... и t>x (a,b), то tXa,b). Данное правило формализует следующее очевидное высказывание: "если два образца сходны относительно х исходны относительно Хо, то два образца данных сходны относительно множества X'. Исходя из изложенного, можно ввести следующее определение.
Подведем итоги:
построено нечеткое отношение а-толерантности, порождаемое мерой сходства из определения 20, которое объективным образом показывает сходство между парами объектов из множества X;
матрица данного отношения сама по себе несет информацию о взаимосвязи данных и может являться самостоятельным результатом анализа данных;
задавшись определенным коэффициентом а, отражающим допущение о том, какие образцы данных можно считать сходными, можно перейти к четкому отношению толерантности.
7.4.2. Отношение альфа-квазиэквивалентности
В классической теории множеств при помощи отношения толерантности можно построить классы эквивалентности на множестве образцов данных X и построить покрытие этого множества. Для этого необходимо найти совокупности транзитивно зависимых образцов данных на отношении толерантности. Для случая нечетких отношений определить свойство транзитивности, в силу недискретной характеристической функции отношения, можно различными способами, которые бы учитывали желаемую степень нечеткости проявления Двойства транзитивности.

Замечание 10.Как и в случае определения нечеткого отношения толерантности (замечание 6), определение четкого отношения эквивалентности может быть получено путем определения семейства нечетких отношений эквивалентности, каждый экземпляр в этом представлен определенной комбинацией из трех составляющих некого отношения эквивалентности — нечеткой симметричности (определения 13.1—13.5), нечеткой рефлексивности (определения 14.1—14.7) и нечеткой транзитивности (определения 21—23). Если на всем полученном ранее четком отношении а-толерантности, которое строится на всем множестве, "пытаться построить транзитивные связи, пользуясь определением Т-транзитивности, то можно потерять большое количество информации о классовых взаимосвязях данных, которые, в общем случае, можно наблюдать в матрице Четкого отношения а-толерантности. Поэтому в данной работе важным является следующее определение
Определение 24- нечеткая а-квазиэквивалентностъ. Нечеткое отношение R будем называть а-квазиэквивалентным, если оно обладает свойствами рефлексивности, нормальной а-симметричности и а-квазитранзитивности
Замечание 11! (о связи отношений эквивалентности и нечеткой а-квази-эквивалентности). От отношения нечеткой а-квазиэквивалентности можно перейти к отношению эквивалентности в классическом смысле, если определить некоторый уровень эквивалентности а и все элементы отношения, имеющие степень принадлежности ниже этого уровня, приравнять нулю, а остальные — единице.







Определение 30 —
порогом
a-квазиэквивалентности
на множестве
X
называется
число
при котором все элементы множестваX
являются
а-квазиэквивалентными,
а при любом
данное утверждение не соблюдается.
Другими словами, порог a-квазиэквивалентности
есть наибольшая нижняя
граница значений степеней принадлежности
отношения а-квазиэквивалентности.
Определение 31 —
уровень a-квазиэквивалентности.
Уровнем а-квазиэквивалентности называется
число
.
В классической теории множеств доказана следующая теорема.
ТЕОРЕМА 4 (без доказательства). Отношение эквивалентности R разбивает множество Хна попарно непересекающиеся классы эквивалентных элементов таким образом, что каждый элемент X принадлежит точно одному классу эквивалентности.
УТВЕРЖДЕНИЕ 2. Задание уровня a-квазиэквивалентности порождает разбиение множества X на классы эквивалентных элементов таким образом, что каждый элементе принадлежит точно одному классу эквивалентности.
ДОКАЗАТЕЛЬСТВО
По замечанию 11, задав уровень a-квазиэквивалентности, можно перейти к четкому отношению эквивалентности, а из теоремы 4 следует, что данное отношение порождает разбиение множества X на классы эквивалентных элементов таким образом, что каждый элемент X принадлежит точно одному Классу эквивалентности. Что и требовалось доказать.
Утверждение доказано.

