2.4. Двокаскадна декомпозиція простору

Підхід з декомпозицією всього простору n-вимірних даних полягає в поділі всіх координат на частини і побудови гіперкубів. Фактично рознесення значень точок n-вимірного простору у відповідний гіперкуб вимагає попереднього опрацювання даних, а саме сортування значень вибірки за всіма координатами.

Для декомпозиції простору використовуємо двокаскадну кластеризацію. Розбиваємо вхідну множину ключів Q(Q₁, Q₂, Q₃, … Q_N) на p підмножин O₁(Q₁, Q₂, Q₃, … Q_z), O₂(Q_z+₁, Q_z₊₂, Q_z₊₃, … Q_t), … , O_p(Q_t₊₁, Q_t₊₂, Q_t+₃, … Q_N). До кожної з підмножин, застосуємо алгоритм кластеризації, утворивши множини відповідних кластерів K₁(k₁, k₂, k₃, …), K₂(k_s, k_s₊₁, k_s₊₂, …), … , K_p(k_r, k_r₊₁, k_r₊₂, …), де k₁, k₂,…, k_i, ... – кластери, ключі в яких відносяться до відповідних підмножин O₁, O₂, …, O_p. Утворимо множину кластерів 1-го каскаду кластеризації K об’єднанням ( 2 .71). Застосуємо до цієї множини алгоритм кластеризації, розглядаючи кожен з кластерів k₁, k₂,…, k_i, ... як базовий, тобто листок дерева згортання. В результаті сформується множина кластерів 1-го каскаду. Таким чином отримуємо двокаскадну декомпозицію простору. Схема поділу та згортання зображена на рис. 2 .59.

Рис. 2.59. Двокаскадне дерево формування кластерів

Нехай простір складаєтсься із s n-вимірних даних: C = C(a, b, … , z). Вимірність а поділимо на n частин, b – на m частин, ..., вимірність z – на k частин. Поділ простору за вимірностями на частини за параметрами n, m, … , k позначимо вектором розбиття l = (n, m, …, k). Схематично поділ тривимірного простору зображено на рис. 2 .60.

Рис. 2.60. Схема поділу тривимірного простору на куби

Використаємо два способи поділу простору: гіперкуби різних розмірів, але з однаковою кількістю значень даних; другий – на гіперкуби з неконтрольованими кількостями значеннями даних, але контрольованими розмірами сторін, що задаються користувачем.

На рис. 2 .61 схематично зображено поділ двовимірного простору: а – вхідна множина, б – гіперкуби із однаковою кількістю точок, в – поділ за значеннями по кожній координаті.

а б в

Рис. 2.61. Схема поділу двовимірного простору

На рис. 2 .61, а зображено простір що складається із 20000 2-вимірних точок, згенерованих за нормальним законом розподілу. На рис. 2 .61, б вектор розбиття l = (2, 2) дає гіперкуби (прямокутники у 2-вимірному просторі) із однаковою кількістю точок, але різних за розмірами. На рис. 2 .61, в цей же вектор розбиття та поділ координатних проміжків на рівні частини дає однакові гіперкуби. На рис. 2 .61, б – кожна підмножина (кожен квадрант) містить по 5000 точок. На рис. 2 .61, в червоним кольором позначено 4540 точок, зеленим – 2030, синім – 11350, темносинім – 2080.

Складність алгоритму збільшується на сортування вибірки за всіма координатами, тобто стає рівною: O(p∙n_i³) + p∙O(N²).

Приведемо алгоритм поділу гіперкуба на куби із однаковою кількістю точок:

Крок 0. Отримати вектор l = (n, m, …, k) розбиття гіперкуба за його вимірностями a, b, …, z; i = 0; множина C – вхідна множина.

Крок 1. Обчислити count = [s / l₀].

Крок 2. Якщо l₀ = 1 то перейти на крок 7, інакше на крок 3.

Крок 3. Посортувати множину С за i-вимірністю.

Крок 4. j = 0. Поки j < l₀:

Крок 5. Поки кількість точок у C_tj не рівна count, перенести точку із множини С у C_tj, якщо С = перейти на крок 6, інакше j = j+1.

Крок 6. Перенести всі точки із множини С у C_tj.

Крок 7. Додати до множини С_t множину С.

Крок 8. Видалити зі списку l перший елемент l₀.

Крок 9. Якщо l = , то кожну підмножину з С_tдодати до множини результату С_res. Інакше i = i+1, для кожної підмножини С_t виконати алгоритм, починаючи з 1 кроку.

Множина С_tмістить підмножини проміжних результатів поділу гіперкуба. Множина С_res містить шукані підмножини розбиття гіперкуба. Крок 6 додає {s/l₀} точок до останньої підмножини у С_t.

У випадку коли необхідно поділити гіперкуб на куби за значеннями точок по кожній вимірності, поданий вище алгоритм зміниться в наступному кроці:

Крок 5. minMaxValue = C_0,_i + C_s_-1,_i. Поки координата точки С_і ≤ [(i + 1) ∙ minMaxValue/l₀], перенести точку із множини С у C_tj, якщо С = перейти на крок 6, інакше j = j+1.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 1415 / 1715 16 17 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.02.20161.24 Mб595bobalo(1).pdf
#
01.07.20257.52 Mб0book v3_1_1.doc
#
12.02.20161.69 Mб261Book-kxII_2.doc
#
01.07.20252.01 Mб0book_(2).doc
#
01.07.202516.55 Mб0book_1_1_3.doc
#
01.07.202518.93 Mб0book_2_1_3.doc
#
01.07.2025925.18 Кб0Borisov.doc
#
12.02.201693.09 Кб8Borovik_Vinnitsya_red.docx
#
01.04.2025447.49 Кб0Borovyk----- Kolbasovych.doc
#
06.11.2018141.31 Кб3BP Test 1.doc
#
01.07.2025141.82 Кб0BPiD_ekzamen_pitannya_ta_vidpovidi.doc