- •Розділ 1. Загальна інформація про lsu і інститут компютерних наук та інженерії
- •Розділ 2. Добування даних з соціальних мереж, дослідження графів та програмних засобів їх аналізу
- •2.1. Важливість добування даних з соціальних мереж
- •2.2. Як дані соціальних мереж можна представити у вигляді графу
- •2.3. Міри центральності
- •2.7. Завдання на базі практики
- •Розділ 3. Результати отримані на базі практики
- •3.1. Демонстраційний додаток
- •3.2. Проблеми, що виникли
- •Розділ 4. Аналіз зображення зразку крові
- •4.1. Додаток для аналізу зображення зразку крові
- •4.2. Обрані засоби
- •4.2. Архітектура ядра
- •4.3. Алгоритми
- •Висновки
- •Список літератури
- •Додаток a. Uml діаграма класів ядра
- •Додаток б. Uml діаграма послідовностей для класифікації
- •Додаток в. Визначення звязних компонент
- •Додаток г. Гістограма спільних ознак інтенсивності
- •Додаток д. Класифікація клітин
4.3. Алгоритми
Як вже було згадано, попередня обробка зображення дозволить спростити зображення перед визначенням обєктів або привести його до певного розміру перед класифікацією. Визначення обєктів на зображенні з мільйонами відтінків кольорів є складною задачею. Набагато краще якось спростити зображення, так щоб в результаті можна було легко сказати чи належить конкретний піксель обєкту чи це фоновий піксель. Одним з підходів до такого спрощення є бінаризація зображення. Було вирішено використовувати її для попередньої обробки перед визначенням обєктів. Отже, сам детектор буде використовувати бінаризоване зображення. Пороговий алгоритм Отсу [10] був використаний для цих цілей. Це алгоритм, який визначає глобальний поріг інтенсивності кольору для зображення. Якщо інтенсивність пікселя вище порогової, він вважається таким, що належить обєкті, інакше – це фоновий піксель. Я провів експеримент щоб дізнатись найкращий спосіб визначення порогу. Я довідався, що різні підходи пошуку локальних порогів не сильно покращують якість бінаризаціі, проте сильно негативно впливають на швидкодію алгоритму. Тому було вирішено використовувати простий пошук глобального порогу.
Є два популярні підходи визначення обєктів:
Переміщення гнучкого вікна вздовж зображення, обчислення ознак для кожного вікна і порівняння їх з загальними ознаками. Цей підхід визначає окремі обєкти і класифікує їх одночасно. Однак, це дуже дорогий підхід. Алгоритм повинен перебрати всі комбінації розмірів і розміщень вікна [11].
Визначити звязні компоненти на бінаризованому зображенні. Це дуже швидкий алгоритм і він часто використовується для сегментації зображень. Основним його недоліком є те, що в один компонент може потрапити кілька клітин. [12].
Було вирішено застосувати визначення звязних компонент через їх простоту реалізації та швидкодію. Основний недолік цього підходу може бути вирішений застосуванням гнучкого вікна для кожного знайденого обєкту. Результат визначення обєктів поданий в Додатку В. Однак, все ще існує недолік. Більшість клітин мають яскравий центр з нижчою інтенсивністю кольору ніж порогова, а отже не будуть включені в звязні компоненти. Було вирішено застосувати алгоритм, який перетворбє бінаризоване зображення в матрицю, нумерує кожен звязний компонент, знаходить порожні області між однаковими номерами компонент та заповнює їх.
Маючи координати обєктів, ми можемо приступати до класифікації клітин. Потрібно вибрати всі пікселі, що відповідають кожному обєкту і застосувати класифікатор для них. Класифікатор повинен отримати ознаки з цих наборів пікселів і порівняти їх з спільними ознаками обчисленими для навчальної вибірки різних типів клітин. Визначивши пару ознак з найменшою різницею ми отримаємо клас (тип) конкретної клітини крові. Гістограма спільних інтенсивностей кольорів зображена в Додатку Г. Однак одна конкретна ознака не може справитись з цим усім. Дуже важливо застосувати комбінацію різних ознак. Більше того, лейкоцити мають близько пяти різних підтипів, що можуть бути класифіковані за різною формою ядра, і статистичні ознаки пікселів не застосовні в цьому випадку. Було вирішено використовувати локальні ознаки, що будують граф з вершинами в важливих точках зображення [13]. Результати класифікації подані в Додатку Д. Класифікація всього зображення може бути проведена застосуванням кластерного аналізу до отриманих даних про пропорцію кількостей і характеристики клітин.
