- •Многомерная модель данных.
- •Концептуальное многомерное представление
- •3. Тест fasmi
- •4. Архитектура olap-систем
- •Интеллектуальный анализ данных
- •Интеллектуальный анализ данных
- •1. Добыча данных — Data Mining
- •2 Задачи Data Mining
- •2.1. Классификация задач Data Mining
- •2.2. Задача классификации и регрессии
- •2..3. Задача поиска ассоциативных правил.
- •2.4. Задача кластеризации
- •Классификация и регрессия
- •1. Постановка задачи
- •Представление результатов
- •1. Правила классификации
- •2. Деревья решений
- •3. Математические функции
- •3. Методы построения правил классификации
- •3.1. Алгоритм построения 1Rправил
- •5.3.2. Метод Naive Bayes
- •4. Методы построения деревьев решений
- •4.1. Методика "разделяй и властвуй"
- •4.2. Алгоритм покрытия
- •5. Методы построения математических функций
- •5.1. Общий вид
- •5.2. Линейные методы. Метод наименьших квадратов
- •Карта Кохонена
- •Поиск ассоциативных правил.
- •1. Постановка задачи 6.1.1. Формальная постановка задачи
- •6.2. Сиквенциальный анализ
- •3.1. Алгоритм Apriori
- •6.3.2. Разновидности алгоритма Apriori
- •Глава 7. Кластеризация.
- •7.1. Постановка задачи кластеризации
- •7.1.1. Формальная постановка задачи
- •7.1.2. Меры близости, основанные на расстояниях, используемые в алгоритмах кластеризации
- •7.2. Представление результатов
- •7.3. Базовые алгоритмы кластеризации
- •7.3.1. Классификация алгоритмов
- •7.3.2. Иерархические алгоритмы гломеративные алгоритмы
- •Дивизимные алгоритмы
- •7.3.3. Неиерархические алгоритмы
- •Алгоритм k-means (Hard-c-means)
- •Алгоритм Fuzzy c-Means
- •Кластеризация по Гюстафсону-Кесселю
- •7.4. Кластеризация данных при помощи нечетких отношений
- •7.4.1. Анализ свойств нечетких бинарных отношений применительно к анализу данных
- •Сравнение данных
- •Отношение альфа-толерантности
- •7.4.2. Отношение альфа-квазиэквивалентности
- •Построение шкалы отношения а-квазиэквивалентности как алгоритм анализа данных
- •Об использовании шкалы а-квазиэквивалентности для анализа данных
- •Примеры анализа данных при помощи шкалы а-квазиэквивалентности
7.4. Кластеризация данных при помощи нечетких отношений
7.4.1. Анализ свойств нечетких бинарных отношений применительно к анализу данных
Отношения и свойства отношений
Рассмотрим набор непустых множество Х0,...,Хк.
четких
множеств дает обобщение характеристической
функции множества, которая носит название
функции принадлежности. В теории нечетких
множеств
элемент универсального множества
принадлежит заданному множеству
X
с
определенной степенью принадлежности,
принимающей значения из интервала
[0, 1]. Обобщая изложенное, можно записать:

Важным аспектом в теории нечетких множеств является обобщение свойств Отношений для случая нечетких множеств. Напомним определения свойств отношений, которые даются в классической теории множеств (обратите внимание, что определения даются для гомогенных бинарных отношений

Замечание 3. Хотя свойства симметричности и антисимметричности обладают взаимоисключающим характером, т. е. отношение не может быть одновременно симметричным и антисимметричным, тем не менее, отношение может одновременно не обладать ни одним из указанных свойств.
Определение
9 —
толерантность.
Отношение
R
называют
отношением толерантности, если оно
рефлексивно и симметрично.
Определение 10— эквивалентность. Отношение R называется отношением эквивалентности, если оно рефлексивно, симметрично и транзитивно.
Определение 11 — частичный порядок. Отношение R называется отношением частичного порядка, если оно рефлексивно, антисимметрично и транзитивно.
Определение 12— полный порядок. Отношение R называется отношением полного порядка, если оно является отношением частичного порядка и при этом (х, x2)eR либо (х2, x)eR для Vx, ,х2 е X .
Свойства нечетких отношений.
Обобщим данные свойства гомогенных бинарных отношений для случая нечетких отношений, т. е. ReF(x2).
Определение 13 — нечеткая рефлексивность и антирефлексивность.

Замечание 4.! Исходя из подобного определения нечеткого отношения рефлексивности можно записать следующее выражение, описывающее взаимосвязь свойств рефлексивности и антирефлексивности нечетких отношений на множестве X:

То есть, являясь в какой-то степени рефлексивным, отношение в то же время является и антирефлексивным, и наоборот.
Определение 14 — нечеткая симметричность и антисимметричность.
• 

Замечание 5.! Исходя из подобного определения нечеткого отношения рефлексивности можно записать следующее выражение, описывающее взаимосвязь свойств рефлексивности и антирефлексивности нечетких отношений на множестве X.

То есть, являясь в какой-то степени симметричным, отношение в то же время является и антисимметричным, и наоборот.
Замечание 6.! (о нечетком отношении толерантности). Поскольку отношение толерантности должно включать в себя нечеткое отношение симметричности и нечеткое отношение рефлексивности, возможны различные варианты отношения толерантности - от минимально заданного до варианта, существующего в классической теории множеств. Учитывая определения 13 и 14, можно построить целое семейство нечетких отношений толерантности, которые будут получаться не только комбинированным включением в определение различных вариантов свойств рефлексивности и симметричности, но и взаимным отношением параметров, используемых в соответствующих определениях. В данном семействе будут присутствовать отношения толерантности различной степени четкости, тем не менее, с точки зрения данной работы, особый интерес будет представлять следующий вид нечеткого отношения толерантности.
Определение— нечеткая а-толерантность. Нечеткое отношение R, обладающее свойствами четкой рефлексивности и нормальной асимметричности, назовем нечетким отношением альфа-толерантности.
Напомним свойства отношения нечеткой альфа -толерантности, которые получаются из свойств отношений четкой рефлексивности и нечеткой нормальной асимметричности:

Замечание 7.!
Поскольку отношение толерантности
имеет смысл нетранзитивного
подобия, оно является особенно ценным
в задаче первичного анализа данных,
т. к., с одной стороны, устанавливаются
степени схожести данных, а с
другой — не требуется транзитивность,
которая превращает отношение толерантности
в отношение эквивалентности, что в
случае нечеткого анализа накладывает
слишком жесткие условия на взаимосвязь
данных, о которых по постановке
задачи ничего неизвестно. Выбор именно
такого варианта нечеткого отношения
толерантности обусловлен следующими
объективными допущениями:
каждый экземпляр исследуемых данных полностью подобен самому себе;
степень подобия элемента а элементу b равна степени подобия элемента b элементу а.
Покажем, как построить подобное отношение на множестве исследуемых данных. Для начала определимся с понятием входных данных, которое используется в поставленной задаче.
