Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Распознавание образов.doc
Скачиваний:
8
Добавлен:
01.05.2025
Размер:
2.78 Mб
Скачать

2. Ввод изображений

Изображение, представленное в аналоговой форме, необходимо преобразовать в некоторую числовую матрицу, прежде чем приступать к его обработке на компьютере. Процесс такого преобразования называется дискретизацией и состоит из двух процессов: выборки и квантования. Первый из них заключается в выборе на поле наблюдения некоторого множества точек. В каждой выбранной точке измеряются характеристики изображения, которые используются на всех последующих этапах обработки изображения. Результаты полученных измерений необходимо описать конечным числом символов: соответствующая процедура называется процессом квантования. Характеризуя плотность размещения выбранных точек, часто говорят о пространственном разрешении, а характеризуя точность представления результатов указанных измерений, о тоновом ( или цветовом) разрешении.

3. Преобразование изображений

Преобразование изображения класса 1 в изображение класса 2. Этот процесс называется сегментацией и обеспечивает выделение областей приблизительно одинаковых цвета и/или яркости.

Преобразование изображения класса 2 в изображение класса 3. Одним из допустимых преобразований этого типа является построение (отслеживание) контура, а другим прореживание. Первое обеспечивает отражение заданной области в некоторую замкнутую кривую, а второе - отображение области в некоторый граф, называемый остовом области.

Преобразование изображение класса 3 в изображение класса 4. Процесс такого преобразования, называемый иногда сегментацией кривых, предназначен для отыскания критических точек контура. В случае многоугольников этими точками являются углы.

Преобразование изображения класса 4 в изображение класса 3. Это преобразование включает процессы интерполирования, обеспечивающего проведение гладкой кривой через некоторое множество точек, и аппроксимации, обеспечивающей проведение гладкой кривой вблизи некоторого множества точек.

Преобразование изображения класса 3 в изображение класса 2. Если в качестве входной информации задается контур, то возникает задача заполнения контура, которая часто рассматривается как задача штриховки. В последнем случае яркость или цвет некоторой области не остаются одинаковыми, а изменяются в соответствии с определенными правилами. Если входной информацией служит остов, то для восстановления области следует использовать процедуру расширения.

Преобразование изображения класса 2 в изображение класса 1. Изображение, воспроизведенное на экране в нескольких цветах, часто оказывается ущербным в эстетическом отношении, так как глаз человека легко обнаруживает контуры.

Компьютерный практикум № 6

Целью практикума является разработка алгоритма и реализация программы “Распознавание автомобильных номерных знаков структурным методом”.

Особенностью решения задач распознавания номерных знаков является функционирование систем данного типа в условиях реального мира с учетом неконтролируемых внешних воздействий, вызывающих различного рода помехи и искажения, что делает невозможным построение строго детерминированных алгоритмов. Перспективным подходом к решению данной задачи является использование структурных методов и средств обработки изображений.

Как известно, классификация изображений по выбранному набору признаков может производиться двумя основными методами: сравнением с эталоном и с помощью построения разделяющих поверхностей. При использовании первого метода выбираются эталонные изображения каждого класса и вычисляются их векторы признаков, которые рассматриваются как центры классов в пространстве признаков. Для распознаваемого изображения также вычисляется вектор признаков и вычисляется степень близости к центрам классов с помощью метрики, введенной в пространстве признаков. Изображение считается принадлежащим к тому классу, векторы которого оказались самым близким. Более гибкой классификации можно добиться, если задать в пространстве признаков векторы определенного значения, разделяющие различные классы. В данной работе для распознавания символов номера должен быть выбран структурный подход распознавания символов.

Решение данной задачи подразумевает не только процесс идентификации номерного знака, но и решение задачи предварительной обработки, необходимой для улучшения качества изображения, а также выделения области изображения, содержащего номерной знак из общего фона изображения. В литературе [10] известны следующие методы обработки изображений:

  1. алгоритм медианной фильтрации, служащий для сглаживания изображения и удаления импульсных помех;

  2. алгоритм увеличения контрастности изображения, необходимый для обработки низко контрастных изображений;

  3. алгоритмы дисперсионной фильтрации и фильтрации Фурье, применяемые для выделения номерного знака из общего фона изображения;

  4. алгоритмы сегментации номерного знака на составляющие символы;

  5. реализация программы, необходимой для непосредственного распознавания номерных знаков.

Исходя из всего вышеперечисленного, обобщенную структурную схему функционирования разрабатываемой системы автоматической идентификации номерных знаков автомобилей можно условно разделить на две основные части:

  • подсистема предварительной обработки;

  • подсистема сегментации изображения и программа распознавания символов номерного знака.

Подсистема предварительной обработки и сегментации изображения в свою очередь также делится на три части:

  • улучшение качества изображения (удаление импульсных шумов и увеличение контрастности изображения);

  • выделение номерного знака из общего фона изображения;

  • сегментация номерного знака на отдельные символы.

Таким образом, обобщенная структурная схема системы распознавания номерных знаков автомобилей имеет следующий вид.

Рис 7.8. Структурная схема системы автоматической идентификации номерных знаков автомобилей

Подсистема распознавания, представленная в практической работе, должна включать в себя формирование векторов из полученных сегментированных изображений и непосредственно распознавание.

Задачами практикума являются:

  • улучшение качества изображения на основе алгоритма медианной фильтрации;

  • выделение автомобильного номерного знака из общего фона изображения;

  • сегментация автомобильного номерного знака на отдельные символы;

  • распознавание номерного знака структурным методом.

Реализация задания

В качестве примера представлен графический интерфейс программы распознавания автомобильных номерных знаков, выполненной в среде Delphi 7. Программа позволяет распознать 3 буквы и 3 цифры номера. Для распознавания используется структурный метод.

В программе используются следующие основные компоненты:

PanPaint: TPanel-для размещения рабочих компонентов программы;

LBResult: TListBox- для вывода результатов анализа;

Image1: TImage- для отображения загруженного изображения;

OpenDialog1: TOpenDialog -для загрузки изображения;

PBPaint: TPaintBox- для рисования кодированного изображения;

Panel1: TPanel для размещения рабочих компонентов программы;

PB16x16: TPaintBox-для отображения и обработки аппроксимировано го изображения образа;

Button1: TButton -для загрузки изображения;

BAnalyze: TButton -для запуска распознавания;

TMas16x16-тип для хранения векторов образа;

function Create_16x16- функция генерации векторов;

procedure drawing-процедура очищения поля для ввода нового образа;

procedure Draw- процедура попиксельного переноса;

procedure TFormDemo.BAnalyzeClick- процедура запуска анализа;

procedure TFormDemo.Button1Click- процедура загрузки изображения для анализа;

procedure BChars-создание векторов для букв;

procedure BNumeric- создание векторов для цифр;

Внешний вид программы

(1) (4)

(2)

(3) (5)

1.-Окно для отображения кодированного изображения.

2.-Окно для отображения сегментированного и аппроксимированного изображения.

3.-Загрузка изображения из файла.

4.-Результаты анализа (% совпадение векторов изображения с заданными выводится максимально похожий).

5.-Запуск анализа.

Результаты работы программы

1)Нажав кнопку «Загрузка из файла»- загрузить изображение.

2)Нажав кнопку «Анализ» - получить результаты распознавания.

При изображении без шума

После загрузки изображения был проведен анализ и выведены

результаты.

Программа работает с результатом 100% правильного распознавания.

На изображение накладывается равномерный шум программой Acdsee Photo manger функцией Make noise.

Равномерный шум — шум, у которого вероятность каждого значения одинакова в заданном диапазоне. Равномерный шум не встречается в реальных условиях, но используется как упрощённая модель воздействия помех.

При изображении с амплитудой шума 20:

После загрузки изображения был проведен анализ и выведены

результаты.

Программа работает с результатом 84% правильного

распознавания.

При изображении с амплитудой шума 50:

После загрузки изображения был проведен анализ и выведены

результаты.

Программа работает с результатом 34% правильного распознавания.

Замечание.

При выполнении компьютерного практикума имеет смысл выбрать пороговый метод сегментации. Существующие методы распознавания большей частью специализированы для выполнения какой-либо одной задачи и имеют жесткие ограничения на формат и ориентацию распознаваемых объектов. Целью построения предлагаемого метода было создание алгоритма, инвариантного к повороту и линейным искажениям, возникающим при оцифровке вводимого документа. Это достигается путем перехода от растрового представления объектов к векторному, позволяющему избавиться от сложностей анализа двумерных массивов информации, представляющих образ.