
- •Р.А. Мельник алгоритми Екстракції ознак образів для їх класифікації та пошуку
- •Передмова
- •Розділ 1.Огляд існуючих методів та алгоритмів і формулювання задачі
- •1.1.Огляд та сучасний стан опрацювання зображень
- •1.2.Огляд існуючих систем пошуку зображень на основі їх вмісту
- •Розділ 2. Триступенева декомпозиція візуальних образів
- •2.1.Підходи для декомпозиції зображень
- •2.2. Задача Декомпозиції образів
- •2.3. Формування мікро кластерів та кластерів
- •2.4. Формування регіонів та звязних областей
- •2.5. Керування видом та розмірами сегментів
- •Розділ 3.Формування та опрацювання ключів образів
- •3.1.Структурні властивості та коефіцієнти
- •3.2.Інтегральні 4-вимірні структурні властивості
- •3.3.Розподілені структурні властивості
- •3.4.Представлення структурних властивостей за допомогою гістограмних моделей
- •3.5.Формування ключів образів
- •3.6.Кластеризація ключів образів
- •Розділ 4.Застосування алгоритму триступеневої кластеризації
- •4.1. Опрацювання зображень кластеризацією з метою пошуку ключів образів
- •4.2.Пошук зображень за їх ключами
- •4.3.Аналіз зображень структури і поверхні
- •Розділ 5.Ієрархічна кластеризація – інструмент екстракції данх
- •5.1. Критерії та методи кластеризації
- •5.2.Керування точністю та складністю алгоритму кластеризації
- •2.3. Багатокаскадна декомпозиція даних
- •2.4. Двокаскадна декомпозиція простору
- •2.5. Дослідженння каскадної декомпозиції даних та простору
- •Література
2.5. Дослідженння каскадної декомпозиції даних та простору
Проілюструємо результати роботи алгоритмів на зображеннях розмірами 154×103 пікселів (рис. 2 .62, а – в). Вхідна вибірка – це координати x, y та color – середнє арифметичне кольорів пікселів. Всього дані містять 15862 3-вимірних точок. В експерименті з підгрупи (гіперкуба) прийнято вихід кластерів, рівний 10% від їх кількості у цій підгрупі.
На рис. 2 .62 зображено графічні результати кластеризації зображень, а числові характеристики зведено у табл. Error: Reference source not found. Представлено кінцеві кластери (позначені одним кольором) на певних рівнях ієрархічного дерева згортання при випадковому перемішуванні значень пікселів та каскадного згортання (б), при вказуванні координати х як пріоритетної та каскадного згортання (в) та відповідного ділення даних та простору (г, д). З рисунка видно, що точність перших двох алгоритмів не висока, а точність третього залежить від вектора розбиття. Зауважимо, що декомпозиційні алгоритми в представленому виді не плануються використовувати для кластеризації зображень, а для опрацювання даних іншої фізичної природи: гени, тексти, хімічні елементи тощо.
Рис. 2.62. Кластеризація експериментальних даних отриманих із зображень
а – вихідні зображення, б – без попередньої обробки каскадним згортанням, в – сортування за пріоритетною ознакою каскадним згортанням, г – розбиття на куби із однаковою кількістю точок за вектором розбиття (4, 4, 1), д – розбиття на куби із однаковою кількістю точок за вектором розбиття (2, 2, 1)
З табл. Error: Reference source not found видно, що за питомими об’ємом, густиною та дисперсією найкращі результати отримано застосуванням декомпозиції гіперкубів, що підтверджують графічні результати з рис. 2 .62.
Таким чином, для кластеризації даних великої розмірності найкращими алгоритмами та підходами є каскадна декомпозиція із попередньою обробкою (2-ий алгоритм) та декомпозиція до гіперкубів (4-ий алгоритм).
Керування вектором розбиття та кількістю кластерів 1-го каскаду.
Проілюструємо результати роботи алгоритмів на зображеннях розмірами 116 × 77 пікселів. Вхідна вибірка – це координати x, y та color – середнє арифметичне кольорів пікселів. Всього дані містять 8932 3-вимірних точок.
В першому експерименті з підгрупи (гіперкуба) прийнято вихід кластерів, рівний 10% від їх кількості у цій підгрупі (кількість кластерів 1-го каскаду) та вибрано наступні вектори розбиття l: (2, 2, 1), (2, 2, 2), (4, 4, 1), (4, 4, 2) та (4, 4, 4). В другому експерименті вибрано вектор розбиття l = (2, 2, 2), та кількість кластерів 1-го каскаду 2%, 5%, 10%, 15% та 20% від їх кількості у цій підгрупі.
На рис. 2 .63 представлено результати декомпозиції простору та каскадного згортання першого і другого експериментів.
Кількість кластерів 1-го каскаду = 10% Вектор розбиття l = (2, 2, 2)
а б в г
Рис. 2.63. Результати декомпозиції простору та каскадного згортання
1– l = (2, 2, 1); 2 – l = (2, 2, 2); 3 – l = (4, 4, 1); 4 – l = (4, 4, 2); 5 – l = (4, 4, 4);
6 – 2%; 7 – 5%; 8 – 10%; 9 – 15%; 10 – 20%;
а, в – кластери, розфарбовані випадковим кольором;
б, г − кластери, розфарбовані їх зваженою яскравістю
Зокрема, на рис. 2 .63, а−б наведено результуючі кластери, розфарбовані випадковим кольором та їх зваженою яскравістю для різних векторів розбиття. На рис. 2 .63, в−г представлено результуючі кластери, розфарбовані випадковим кольором та їх зваженою яскравістю для різної кількості кластерів 1-го каскаду.
а б в г
Рис. 2.64. Кластери на різних рівнях дерева згортання
1 – рівень 1449, кластерів 2; 2 – рівень 1448, кластерів 3; 3 – рівень 1446, кластерів 5;4 – рівень 1443, кластерів 8; 5 – рівень 1441, кластерів 10; 6 – рівень 1439, кластерів 12;
7 – рівень 1435, кластерів 16; 8 – рівень 1400, кластерів 51; 9 – рівень 1380, кластерів 71; 10 – рівень 1300, кластерів 151;
а, в − кластери, розфарбовані випадковим кольором;
б, г − кластери, розфарбовані їх зваженою яскравістю
а б
На рис. 2 .65 представлено результати декомпозиції 3- та 5-вимірних точок із різним вектором розбиття та кількістю кластерів 1-го каскаду 20%. Числові характеристики декомпозиції зведено у таблицю 3.
3-вимірні точки 5-вимірні точки
а б в г
Рис. 2.65. Результати декомпозиції простору та каскадного згортання
1– l = (2, 2, 2); 2 – l = (3, 3, 3); 3 – l = (4, 4, 4);
4 – l = (2, 2, 2, 2, 2); 5 – l = (2, 2, 4, 4, 4); 6 – l = (1,1, 9, 9, 9); а, в – кластери, розфарбовані випадковим кольором;
б, г − кластери, розфарбовані їх зваженою яскравістю