Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Отчет по практике1.docx
Скачиваний:
12
Добавлен:
15.08.2019
Размер:
4.24 Mб
Скачать

Интерфейс разработанной программы

На рисунке 10 изображен интерфейс разработанной программы

Рис. 10 Интерфейс разработанной программы

В данный момент интерфейс программы предназначен для исследований работы алгоритма сегментирования, поэтому справа выводится сегментированное изображение (а слева – исходное загруженное изображение).

Тестирование

Произведено исследование работы разработанного алгоритма на углах в диапазоне (-40, 40). Исследования проводились на отсканированных учебниках (примеры на рисунках – страница из книги «Компьютерные сети: принципы, технологии, протоколы» Олифера В. И Олифера Н.)

Найденные границы строк обозначены синими и красными линиями.

На рисунках 11,12,13 изображено определение границ строк с наклоном, 20, 30 и 40 градусов. На всех тестах строки определены верно, несмотря на зашумление с правого края страницы.

Рис. 11 Выделение текстовых линий на изображении с углом 20 градусов

Рис. 12 Выделение текстовых линий на изображении с углом 30 градусов

Рис 13. Выделение текстовых линий на изображении с углом 40 градусов

Сегментирование изображений на слова при заданном истинном угле 20 градусов представлено на рисунке 14.

Сегментирование изображений на слова, при программно определенном угле 19.5 градусов (при истинном угле 20 градусов), представлено на рисунке 15. На рисунках можно заметить, что сегментирование на слова произведено практически одинаково, что еще раз подтверждает, что точность, с которой находится угол, вполне достаточна для последующих этапов распознавания. На рисунках можно заметить, что в некоторых словах разделились отдельные символы, однако в основном сегментирование просто выделило отдельные слова. Это связано с маленьким межбуквенным интервалом. Есть 2 варианта решения этой задачи: либо вводить дополнительную процедуру для сегментации на отдельные символы, либо сегментацию эту поводить непосредственно при распознавании отдельных символов.

Рис 14. Выделение слов на изображении с углом 20 градусов. Угол изначально задан верный

Рис 15. Выделение слов на изображении с углом 20 градусов. Угол найден программно

Заключение

В ходе преддипломной практики были исследованы алогоритмы нахождения угла наклона строк при произвольной ориентации страницы, а также алгоритм сегментирования изображения на строки и слова. Исследования показали пригодность разработанных ранее алгоритмов.

Этап сегментирования очень важен в распознавании текста, особенно первичное сегментирование на строки, поскольку если сегментирование проведено неправильно, дальнейшее распознавание невозможно. Поэтому к данному этапу следует подходить с особой тщательностью. Важно, что рассмотренные методы пригодны не только для распознавания горизонтально расположенных строк, но и для строк, расположенных под углом.

На данном этапе трудно провести сравнение с существующими методами сегментирования строк, поскольку нет в свободном доступе программного обеспечения для отдельных этапов распознавания текста. Авторы исследований в своих статьях описывают результаты реализации методов, не предоставляя разработанного программного обеспечения, а также всей базы данных, на которой проводились исследования.