Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kaba_DP_ua.docx
Скачиваний:
2
Добавлен:
04.09.2019
Размер:
2.64 Mб
Скачать
    1. Метод orc

Оптичне розпізнавання символів (англ. optical character recognition, OCR) - механічний або електронний переказ зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для подання в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на веб-сторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова чи фрази, зберігати його в більш компактній формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тесту електронний переказ, форматування або перетворення в мову. Оптичне розпізнавання тексту є досліджуваною проблемою в областях розпізнавання образів, штучного інтелекту та комп'ютерного зору.

Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; в ранніх версіях для програмування було необхідно зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. В даний час найбільше поширені так звані «інтелектуальні» системи, з високим ступенем точності розпізнають більшість шрифтів. Деякі системи оптичного розпізнавання тексту здатні відновлювати початкове форматування тексту, включаючи зображення, колонки та інші нетекстові компоненти.

Точне розпізнавання латинських символів в друкованому тексті в даний час можливо тільки якщо доступні чіткі зображення, такі як скановані друковані документи. Точність при такій постановці завдання перевищує 99%, абсолютна точність може бути досягнута тільки шляхом наступного редагування людиною. Проблеми розпізнавання рукописного «друкарського» і стандартного рукописного тексту, а також друкованих текстів інших форматів (особливо з дуже великим числом символів) в даний час є предметом активних досліджень.

    1. Порівняльна характеристика

Таблиця 2.5.1 – Порівняння аналогів

Властивості

Назва методу

Віоли-Джонса

SURF

SIFT

ORC

Інваріантність до масштабу

+

+

+

+

Інваріантність до обертання

-

+

+

+

Чутливість до освітлення

-

+

+

+

Ризик перенавчання

+

-

-

-

Детектування декількох об’єктів одноразово

+

-

-

+

Складність

O(n3)

O(n3)

O(n3)

O(n3)

Час на

створення еталону

5-30 діб.

30-60 хв.

30-60 хв.

2-8 год.

  1. Мета кваліфікаційної роботи

Метою магістерської роботи, є дослідження методів контурного аналізу, вивчення проблем та досягнень в цій галузі. Розробка автоматизованої системи розпізнавання об’єктів на базі алгоритмів контурного аналізу, яка дозволить провести аналіз ефективності двох методів розпізнавання об'єктів за допомогою контурного аналізу та каскаду Хаара. Так як на сьогоднішній день, немає універсальних методів, необхідно визначити ефективність та швидкодію роботи методів, виявити переваги і недоліки методів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]