- •Обзор предметной области
- •Способы перевода цветного изображения в полутоновое
- •Методы бинаризации
- •Способы сегментации
- •Способы распознавания.
- •2. Постановка задачи
- •3. Адаптация и описание используемых алгоритмов
- •3.1 Перевод цветного изображения в полутоновое rgb(yuv)
- •3.1 Бинаризация пороговым методом и методом 120
- •3.2 Сегментация строк и промежутков между словами и буквами методом гистограмм
- •3.3 Сегментация слов и букв методом мод
- •3.4 Попиксельное итеративное утоньшение бинарного изображения
- •3.5 Распознавание
- •4. Программная реализация
- •4.1 Схема программного обеспечения
- •4.2 Описание функций и методов
- •4.3Тестирование и руководство для пользователя
Методы бинаризации
Бинаризацией называется процесс преобразования полутонового изображения в изображение, яркость пикселей которого может иметь только два значения – 0 или 1.Такое изображение называется бинарным.
В зависимости от вида изображения применяются различные методы бинаризации:
Метод средней яркости (локальный метод):
Вычисляем среднюю яркость
Определяем граничное значение яркости по формуле:
ГЗ=255 – СЯ, где ГЗ- граничное значение, СЯ- средняя яркость.
Пиксель становится черным, если среди его соседей есть хотя бы один пиксель яркость которого удовлетворяет условию:
Яркость ≤ ГЗ, либо яркость анализируемого пикселя ≤ яркости связного с ним +Step, Step= 1…2.
При этом важно чтобы связующий пиксель был уже включен в группу пикселей, которые будут отмечены как черные.
Метод «Мод»:
Выполняется построение гистограммы яркости. По построенной гистограмме выбирается значение яркости соответствующее впадине или минимуму между двумя максимальными вершинами гистограммы. Недостатком данного метода является зависимость результата от гистограммы.
Метод 120:
Строится гистограмма
Находится максимальный уровень серого в диапазоне t=[0, 120]
Черный цвет устанавливается у пикселей, яркость которых меньшелибо равна порогового значения плюс 12…15, в остальных случаях цвет белый.
Метод 40%:
Строится гистограмма
Находится количество пикселей, соответствующий заданному проценту
Отсчитывается количество пикселей по градациям яркости, начиная с 0 и до момента, когда это количество будет превышать количество пикселей, заданных в постановке задачи бинаризации, и градация, на которой произошла постановка становится порогом бинаризации.
Пороговый метод:
Определяется порог яркости t. Все что больше этого порога считается белым, все что меньше — черным.
При переводе в бинарное изображение могут быть потери или наоборот шумы из-за неточности сканера, поэтому после бинаризации может следовать фильтрация.
Для бинаризации изображения, получаемого с экрана смартфона, целесообраазно было бы использовать, например, пороговый метод либо метод 120.
Способы сегментации
Проблема сегментации зачастую возникает при рассмотрении задачи оптического распознавания текста. Сегментация — это процесс разделения цифрового изображения на несколько сегментов. Цель сегментации заключается в упрощении и/или изменении представления изображения, чтобы его было проще и легче анализировать. Сегментация изображений обычно используется для того, чтобы выделить объекты и границы (линии, кривые, и т. д.) на изображениях. Более точно, сегментация изображений — это процесс присвоения таких меток каждому пикселю изображения, что пиксели с одинаковыми метками имеют общие визуальные характеристики.
В настоящее время существует довольно много систем сегментации и обработки текстовых изображений. Наиболее известной из них является программный продукт “FineReader” компании ABBYY. Данный продукт является универсальным инструментом при работе с текстовыми изображениями. Он позволяет выделить текст на изображении и распознать его.
Результатом сегментации изображения является множество сегментов, которые вместе покрывают всё изображение, или множество контуров, выделенных из изображения. Все пиксели в сегменте похожи по некоторой характеристике или вычисленному свойству, например по цвету, яркости или текстуре. Соседние сегменты значительно отличаются по этой характеристике. Существуют следующие методы сегментации:
Выделение краёв:
Границы и края областей сильно связаны, так как часто существует сильный перепад яркости на границах областей. Поэтому методы выделения краёв используются как основа для другого метода сегментации. Недостаток – обнаруженные края часто бывают разорванными. Но чтобы выделить объект на изображении, нужны замкнутые границы области.
Методы с использованием гистограммы:
Методы с использованием гистограммы очень эффективны, когда сравниваются с другими методами сегментации изображений, потому что они требуют только один проход по пикселям. В этом методе гистограмма вычисляется по всем пикселям изображения и её минимумы и максимумы используются, чтобы найти кластеры на изображении. Цвет или яркость могут использоваться при сравнении. Недостаток этого метода — затруднительный поиск значительных минимумов и максимумов на изображении.
Метод мод:
Метод мод обычно используется при бинаризации полутоновых изображений, однако его принципы можно использовать и при выполнении сегментации. Заключается метод в том, что полученная на предыдущем этапе сегментации гистограмма, имеющая два ярко выраженных пика, может быть разделена на две части, и одни объекты или признаки, которые находятся ближе к одному пику, можно отнести к одному классу, а объекты или признаки, которые находятся ближе ко второму пику, могут быть отнесены к другому классу.
В данном курсовом проекте, учитывая область работы, было бы предпочтительнее использовать метод гистограмм и метод мод, так как они позволяют избавиться от трудоемких вычислений и быстрее всего сегментировать участки изображения.