Добавил:
darkwarius13@gmail.com Рад если помог :). Можешь на почту спасибо сказать Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LR_HM14_2018.doc
Скачиваний:
62
Добавлен:
27.06.2021
Размер:
1.97 Mб
Скачать

3. Розв’язання задачі нечіткої кластеризації з використанням MatLab методом субтрактивної кластеризації (subtractive clustering)

Іноді кількість нечітких кластерів, необхідних для роботи алгоритму FCM, апріорі є невідомою. В цьому випадку доцільно використовувати реалізований в системі МatLab так званий алгоритм субтрактивної кластеризації.

Ідея методу субтрактивной кластеризації полягає в тому, що кожна точка даних передбачається в якості центра потенційного кластеру, після чого слід обчислити деяку міру здатності кожної точки даних представляти центр кластеру. Ця кількісна міра заснована на оцінці щільності точок даних навколо відповідного центра кластеру.

Цей алгоритм, який є узагальненням методу кластеризації Р. Ягера (R. Yager), заснований на виконанні наступних дій:

  1. вибрати точку даних з максимальним потенціалом для представлення центру першого кластера;

  2. видалити всі точки даних в околиці центра першого кластера, величина якої задається параметром Influence, щоб визначити наступний нечіткий кластер і координати його центру.

Ці дві процедури повторюються до тих пір, поки всі точки даних не опиняться всередині околиць радіусу Influence шуканих центрів кластерів. В загальному випадку малі значення цього параметра приводять до знаходження малого числа великих по кількості точок кластерів.

Якнайкращі результати можливо отримати при значеннях між 0.2 і 0.5 (за умовчанням 0.5).

Розглянемо розв’язання задачі визначення кількості кластерів для множини початкових даних, показаних на рис. 2, з використанням графічного інтерфейсу кластеризації. Для цього завантажимо початкові дані із зовнішнього файлу командою findcluster('fcmdata.dat'), виберемо метод кластеризації subtractive в списку Methods і натиснемо кнопку Start. Решту параметрів залишимо запропонованими за умовчанням:

- quashFactor – параметр, що використовується як коефіцієнт для множення тих значень (Influence), які визначають околицю центру кластера. Це здійснюється з метою зменшення впливу потенціалу граничних точок, що розглядаються як частина нечіткого кластера (за умовчанням це значення дорівнює 1.25);

- acceptRatio – параметр, що встановлює потенціал як частину потенціалу центру першого кластера, вище за яке інша точка даних може розглядатися як центр іншого кластера (за умовчанням це значення дорівнює 0.5);

- rejectRatio – параметр, що встановлює потенціал як частину потенціалу центру першого кластера, нижче за яке інша точка даних не може розглядатися як центр іншого кластера (за умовчанням це значення дорівнює 0.15).

Результат розв’язання задачі субтрактивної кластеризації зображений на рис. 4.4 і містить три нечітких кластера.

На закінчення слід зазначити, що результати нечіткої кластеризації мають наближений характер і можуть слугувати лише для попередньої структуризації інформації, що міститься в множині початкових даних.

Рис. 4.4.

При розв’язанні завдань нечіткої кластеризації, потрібно пам'ятати про особливості і обмеження процесу вимірювання ознак у сукупності об'єктів кластеризації. Оскільки нечіткі кластери формуються на основі евклидової метрики, відповідний простір ознак повинен задовольняти аксіомам метричного простору. В той же час для пошуку закономірностей в проблемній області, що мають неметричний характер, необхідно використовувати спеціальні засоби і інструментарій, що розроблений для інтелектуального аналізу даних (Data Mining).

4.4. Контрольні запитання

  1. Дайте визначення нечіткого покриття і нечіткого розбиття нечіткої множини.

  2. Сформулюйте в загальному вигляді задачу нечіткого кластерного аналізу.

  3. Опишіть алгоритм розв’язання задачі нечіткої кластеризації методом нечітких с-середніх (FCM).

  4. Опишіть алгоритм розв’язання задачі нечіткої кластеризації методом субтрактивної кластеризації (subtractive clustering).

  5. Як впливають на якість розв’язку додаткові параметри алгоритму кластеризації?

  6. Охарактеризуйте засоби розв’язання задачі нечіткої кластеризації в середовищі MatLab?

Соседние файлы в предмете Нечеткие множества