Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
book_1_1_3.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
16.55 Mб
Скачать

Вступ 2

Розділ 1. Огляд існуючих методів та алгоритмів 4

1.1.Огляд та сучасний стан опрацювання зображень 4

1.2. Огляд існуючих систем пошуку зображень на основі їх вмісту 5

РОЗДІЛ 2. ЕКСТАКЦІЯ РОЗПОДІЛЕНИХ ТА СТАТИСТИЧНИХ ОЗНАК ІНТЕНСИВНОСТІ зображень 9

2.1. Силуети кольору та інтенсивності 9

2.2. Ознаки зображень на основі поділу інтенсивності 16

2.3. Ознаки на основі поділу поверхні зображення 23

2.4. сегментування зображень за кумулятивною гістограмою 35

2.5. Сегментування за густиною пікселів 41

2.7. моделі гіпотетичного образу для СЕГМЕНТУВАННЯ ЗОБРАЖЕНЬ 51

2.8. Побудова та визначення ознак знімка. 57

Порівняно з методом пошуку зображень за силуетами зображень [16] у запропонованому методі точність знаходження бразів підвищено в 1,5-2 рази. 64

Література 64

Вступ

Задачі індексування та пошуку зображень на основі їх вмісту (Content-based image retrieval − CBIR) у великих сховищах даних із мільйонами образів є актуальними в сучасних інформаційних системах. Ефективна класифікація зображень зменшує час опрацювання зображень фільтруванням зайвих класів образів під час пошуку подібних до них. На сьогодні такі задачі стають все більш актуальними у сферах розпізнавання образів. Тому існує потреба у аналізі принципово нових методів декомпозиції та індексування, що дозволить за виділеними характеристиками образу ефективно здійснювати пошук у сучасних сховищах даних та їх розпізнавати. Однією із цілей в роботі є прискорення екстракції характеристик заданого образу.

Внаслідок невідповідності існуючого математичного забезпечення сучасним потребам пошуку та обробки образів відсутні ефективні програмні засоби індексування візуальних образів, які дають змогу розв’язати задачу пошуку образів у реальному часі. У зв’язку з цим виникла актуальна потреба у розробці ефективних математичних моделей, відповідних методів обчислення й алгоритмів, прикладного математичного, та програмного забезпечення як складових системи автоматизованого індексування та пошуку візуальних образів.

Робота присвячена дослідженню структурних властивостей зображення, отриманих алгоритмом триступеневої кластеризації. За результатами досліджень запропоновано використовувати структурні властивості та коефіцієнти як критерії для автоматизованого віднесення зображення до певного класу.

Основний вплив на розвиток теоретичних і практичних основ обробки і розпізнавання інформації різної фізичної природи, формування простору ознак, методології розв’язування оптимізаційних комбінаторних задач, методів та підходів ієрархічної декомпозиції, розробку принципів створення сучасних систем класифікації зробили дослідження українських і закордонних учених. Незважаючи на істотні досягнення в цій області, багато питань пошуку зображень за їх вмістом усе ще залишаються недослідженими і актуальними, зокрема, задачі підвищення швидкодії, точності та ефективності систем пошуку та класифікації зображень.

У роботі розвиваються підходи, основані на багатоступеневій декомпозиції та ієрархічній кластеризації простору даних. Такі підходи дозволяють зменшити розмірність задачі, що дозволяє суттєво зменшити обчислювальну складність процесу опрацювання образів.

В роботі проведено:

  1. Аналіз актуального стану, потреб і сучасних систем пошуку зображень на основі їх вмісту та огляду сучасних засобів проектування систем індексування та пошуку візуальних образів.

  2. Розроблено нові методи декомпозиції образу, оптимізації алгоритмів для зменшення їх складності. Отримані характерні властивості образів для формування їх ключів для класифікації образів, їх індексування та пошуку за ключами.

  3. Формалізовані та обґрунтувані відповідні математичні моделі процесів пошуку зображень.

Верифікація розроблених математичних моделей, методів та алгоритмів аналізу шляхом тестових досліджень і визначення точності та достовірності одержаних результатів.

Для розв’язування задач розпізнавання застосовуються евристичні методи, в тому числі з області штучного інтелекту. Один з можливих підходів поєднує методи кластеризації як складових мікрооб’єктів об’єктів розпізнавання, так і макрооб’єктів, які отримують внаслідок кластеризації. Нечітка кластеризація служить на першому рівні засобом зменшення простору пошуку оптимальних кластерів, а на другому - додатковим ресурсом для їх знаходження.

Практичні класи задач розпізнавання образів характеризуються складністю та великою кількістю параметрів [4]. Отримати розв’язки цих задач для практичного застосування за допустимі часові інтервали неможливо без врахування та виділення головних ознак об’єктів. Врахування менш суттєвих параметрів на пізніших етапах обчислень, прискорений та детальний пошук в стратегічно важливих напрямках зменшують простір пошуку потрібних образів [5].

Ознакою задач розпізнання образів є відтворення за допомогою ієрархічного дерева вкладеності складових мікрооб’єктів (мікрообразів) у проміжних вузлах дерева, а також ознак об’єктів розпізнання у проміжних вузлах дерева кластеризації образів. Це дерево вказує на спосіб композиції образа з певних компонент або, навпаки, декомпозиції образа на більш прості складові. Критеріями об’єднання, як правило, виступають геометричні, кількісні та якісні характеристики вузла тощо. Розбиття (або композиції) образу на складові компоненти різних рівнів ієрархії елементів зображається з допомогою ієрархічного дерева. На найнижчому рівні знаходиться множина базових мікрооб’єктів або таких, що розглядаються як неподільні. На проміжних рівнях знаходяться так звані мікрооб’єкти вищих рівнів ієрархії, що відповідають геометричним завершеним частинам цілого образа. Розмір мікрооб’єктів зростає при наближенні до кореневої вершини.

Наявність ієрархічного дерева дозволяє:

1) розкладати образи на так звані шари з підобразами – фрагментами образів та розглядати постановки задач розпізнавання на різних рівнях дерева;

2) при формуванні образу є можливим вибір однієї з декількох стратегій обходу дерева чим створюється можливість маніпуляції різних складових образів. Остання властивість є корисною для фільтрування шумів та завад.

Розділ 1. Огляд існуючих методів та алгоритмів

1.1.Огляд та сучасний стан опрацювання зображень

Традиційно, для пошуку зображень використовують їх текстові характеристики: ім’я файлу, заголовок, ключові слова тощо. Однак такий підхід має ряд недоліків. Перш за все необхідне втручання людини для опису вмісту зображень у відповідності до обраного набору підписів та ключових слів. У більшості випадків зображення містить декілька об’єктів, кожен з яких має свій набір атрибутів. Крім цього, потрібно описати просторові відношення між цими об’єктами, щоб зрозуміти його зміст. Оскільки розміри баз даних зображень зростають, використання ключових слів стає не тільки складним але і недостатнім для представлення зображення. Інша проблема даного підходу полягає у неадекватності єдиного текстового опису зображення. Як результат є необхідність для автоматизованого отримання примітивних властивостей зображень і пошук зображень на основі цих властивостей.

Для великої бази даних із понад десятками тисяч образів ефективна індексація є важливим інструментом в CBIR-системах. Успішна класифікація зображень зменшує час опрацювання зображень фільтруванням зайвих класів образів під час пошуку подібних до них [Error: Reference source not found].

Сучасні CBIR-системи працюють у два етапи: індексування та пошук. На етапі індексування кожний образ у базі даних представляється вектором властивостей. Існуючі універсальні системи CBIR відносять до однієї із трьох категорій залежно від підходу отримання властивостей образу: гістограма, кольорове розташування і пошук за регіонами. Такими властивостями, зокрема, є: колір [Error: Reference source not found, Error: Reference source not found], форма [Error: Reference source not found, Error: Reference source not found], структура [Error: Reference source not found] і розташування [Error: Reference source not found]. Отримані властивості зберігаються в окремій базі даних візуальних властивостей. На етапі пошуку обчислюються властивості із образу-запиту користувача. Використовуючи критерії подібності, отриманий вектор властивостей порівнюється з векторами у базі даних візуальних властивостей. Користувач у відповідь отримує образи, які максимально відповідають запиту.

Системи пошуку за регіонами використовують локальні властивості регіонів (ідеальних об’єктів) у протилежність глобальним властивостям повного зображення. Прикладом такої системи є SIMPLIcity [Error: Reference source not found, Error: Reference source not found]. Якщо об’єкти в межах зображення сегментовані і кожна властивість об’єкта отримана автоматично, то такі особливості роблять можливу систему пошуку зображень за регіонами [Error: Reference source not found]. Представлення візуального образу адекватним числом кластерів (об’єкти у зображенні) може краще відобразити його вміст, однак цей підхід є часозалежним.

В роботі [Error: Reference source not found] запропоновано навчальний компонент для CBIR системи. Він передбачає контролююче тренування системи на різних фрагментах образу. Szummer та Picard [Error: Reference source not found] розвинули систему класифікації внутрішніх та зовнішніх сцен. Інші приклади семантичної класифікації зображень включають працю порівняння міста та ландшафту [Error: Reference source not found] і знаходження обличчя [Error: Reference source not found]. Wang та Fischler [Error: Reference source not found] показали, що точне семантичне представлення є корисним для задач порівняння зображень.

Ця робота спрямована на розроблення математичного і програмного забезпечення для індексування, класифікації та аналізу візуальних образів методами кластерного аналізу.

В цій дисертаційній роботі основна увага приділяється питанням екстракції структурних властивостей зображень для CBIR-систем, методам декомпозиції даних та простору для зменшення алгоритмічної складності, підходам для індексування та класифікації, використання структурних властивостей для аналізу візуальних образів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]