Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
22
Добавлен:
26.03.2016
Размер:
1.82 Mб
Скачать

1.2 Способы сегментации

Проблема сегментации зачастую возникает при рассмотрении задачи оптического распознавания текста. Сегментация — это процесс разделения цифрового изображения на несколько сегментов. Цель сегментации заключается в упрощении и/или изменении представления изображения, чтобы его было проще и легче анализировать. Сегментация изображений обычно используется для того, чтобы выделить объекты и границы (линии, кривые, и т. д.) на изображениях.

Результатом сегментации изображения является множество сегментов, которые вместе покрывают всё изображение, или множество контуров, выделенных из изображения. Все пиксели в сегменте похожи по некоторой характеристике или вычисленному свойству, например по цвету, яркости или текстуре. Соседние сегменты значительно отличаются по этой характеристике. Существуют следующие методы сегментации:

Выделение краёв:

Границы и края областей сильно связаны, так как часто существует сильный перепад яркости на границах областей. Поэтому методы выделения краёв используются как основа для другого метода сегментации. Недостаток – обнаруженные края часто бывают разорванными. Но чтобы выделить объект на изображении, нужны замкнутые границы области.

Методы с использованием гистограммы:

Методы с использованием гистограммы очень эффективны, когда сравниваются с другими методами сегментации изображений, потому что они требуют только один проход по пикселям. В этом методе гистограмма вычисляется по всем пикселям изображения и её минимумы и максимумы используются, чтобы найти кластеры на изображении. Цвет или яркость могут использоваться при сравнении. Недостаток этого метода — затруднительный поиск значительных минимумов и максимумов на изображении.

7

Метод мод:

Метод мод обычно используется при бинаризации полутоновых изображений, однако его принципы можно использовать и при выполнении сегментации. Заключается метод в том, что полученная на предыдущем этапе сегментации гистограмма, имеющая два ярко выраженных пика, может быть разделена на две части, и одни объекты или признаки, которые находятся ближе к одному пику, можно отнести к одному классу, а объекты или признаки, которые находятся ближе ко второму пику, могут быть отнесены к другому классу.

В данном курсовом проекте, учитывая область работы, было бы предпочтительнее использовать метод выделения краев, так как он позволяет избавиться от трудоемких вычислений и быстрее всего сегментировать участки изображения.

1.3 Способы распознавания

Распознавание образов - это отнесение исходных данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные из общей массы несущественных данных. В основе работы программ распознавания текста лежит достаточно серьёзный математический аппарат. И это оправдано сложностью задачи, особенно самого процесса распознавания.

Системы распознавания бывают следующих типов:

- системы распознавания объектов с учителем;

- системы распознавания объектов без обучения.

В системах распознавания без обучения первоначально заданной информации достаточно, чтобы разделить все множество объектов на классы в соответствии с каким-либо набором признаков.

Работу системы с учителем можно разделять на две части: обучение и распознавание. В ходе обучения системы ей предъявляются отдельные объекты с указанием того, к какому классу относится данный объект. Затем происходит распознавание: предъявляется неизвестный объект и система сама должна определить его принадлежность. Это решение принимается на основании решающих правил.

В данном курсовом проекте было рекомендовано использовать систему распознавания без учителя. Для этого был сформирован набор признаков, позволяющий осуществить распознавание цифр и букв на сканированном чертеже.

8

Соседние файлы в папке Мартинович Виталий