Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
[МРО] Пример курсовой работы.docx
Скачиваний:
35
Добавлен:
26.03.2016
Размер:
1.93 Mб
Скачать
    1. Распознавание.

Распознавание образов - это отнесение исходных данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные из общей массы несущественных данных. В основе работы программ распознавания текста лежит достаточно серьёзный математический аппарат. И это оправдано сложностью задачи, особенно самого процесса распознавания.

Системы распознавания бывают следующих типов:

  1. системы распознавания объектов с учителем;

  2. системы распознавания объектов без обучения;

В системах распознавания без обучения первоначально заданной информации достаточно, чтобы разделить все множество объектов на классы в соответствии с каким-либо набором признаков.

Работу системы с учителем можно разделять на две части: обучение и распознавание. В ходе обучения системы ей предъявляются отдельные объекты с указанием того, к какому классу относится данный объект. Затем происходит распознавание: предъявляется неизвестный объект и система сама должна определить его принадлежность. Это решение принимается на основании решающих правил.

В данном курсовом проекте используется система распознавания без учителя. Для этого был сформирован набор признаков, позволяющий осуществить распознавание цифр на сканированном бланке задания по курсовой работе.

2.Постановка задачи

Целью курсового проекта является разработка приложения, позволяющего распознать срок сдачи законченного проекта на сканированном изображении бланка задания по курсовой работе. Приложение реализовано в среде MSVisualStudioна языке C#.

Входные данные:

  • Сканированное изображение бланка задания по курсовой работе *.bmp

Ограничения:

  • На изображении должна быть сторона, на которой расположенсрок сдачи законченного проекта

  • Никакого лишнего фона у изображения быть не должно.

  • На изображении не должно быть шумов, точек, пикселей и т.п., не имеющих отношения к распознаваемой части.

  • Рекомендуемый размер изображения 1:1 (1024х724).

  • Срок сдачи проекта должен быть написан цифрами (в т.ч. и название месяца).

  • Цифры должны быть написаны раздельно и с отступом.

  • На этапе распознавания, изображение должно быть бинаризованным.

Выходные данные:срок сдачи законченного проекта.

При выполнении курсового проекта необходимо решить следующие задачи по обработке изображения:

      • Загрузка изображения

      • Бинаризацияметодом 40% (эмпирически был установлен рекомендуемый процент, равный 8%)

      • Сегментация области интереса

      • Утоньшение изображения(метод LRTB)

      • Фильтрация изображения (эррозия и расширение)

      • Распознавание срока сдачи проекта (цифры)

На основании этого были построены функциональные схемы приложения, в формате IDEF приведены на рисунках 1,2.

Среда разработки – MSVisualStudioC#.

Операционная система – Windows 7.

3.Описание используемых алгоритмов

3.1Бинаризация.

В рамках данногопроекта были реализованы два алгоритма бинаризации: по порогу и метод 40%.

      1. Пороговый метод

Если значения объектов и фона достаточно однородны, то можно использовать одно пороговое значение для всего изображения (глобальное). В этом случае задается значение яркости, которое выступает в качестве порога. Все пиксели полутонового изображения обращаются в 1, если их яркость меньше порога, остальные 0:

Пользователь вводит порог t от 0 до 255. Далее интенсивность каждого исследуемого пикселя вычисляется по формуле:

где - цвет пикселя на исходном изображении,

- цвет пикселя на новом изображении,

- пороговое значение.

Рисунок 3.1.1 – Бинаризация пороговым методом(порог 200).

Внашей программе есть ещё один метод бинаризации: метод 40%.

      1. Метод 40%

  • Вычисляется количество пикселей, установленных в постановке задачи бинаризации

  • Строится гистограмма градация яркости изображения

  • Отсчитываются количество пикселей по градациям, начиная с 0 и до момента, когда они будут превышать заданное количество пикселей (п.1)

  • Градация, на которой остановились становится порогом бинаризации.

Рисунок 3.1.2 – Бинаризация методом 40% (порог 8%)

Следует отметить, чторазница между результатами несущественна, особенно если учесть, что порог подобран эмпирическим методом, поэтому чтобы не загромождать код оставим только один метод – метод 40%.