- •1.Персептрон и его роль в становлении распознавания образов.
- •3. Предложить алгоритм автоматической классификации для задачи построения скелета объекта изображения.
- •2. Понятие расстояния в распознавании образов.
- •4. Примеры применения распознавания образов.
- •6. Разработать алгоритм кластерного анализа для построения областей одного цвета.
- •9. Разработка алгоритма самообучения для построения границ областей изображения.
- •21. Предложить алгоритм классификации для задач выделения контура объекта изображения.
- •Оператор Собеля
- •7. Аналогия и задачи распознавания.
- •10. Задача распознавания образов и классификации. Постановка.
- •13. Метод разделяющей функции.
- •14. Гипотеза компактности. Ее значение в распознавании образов.
- •15. Разработать алгоритм таксономического анализа для выделения важных признаков. Ваш вариант.
- •16. Понятие сходства и задача распознавания.
- •17. Привести пример классификации шкал измерений.
- •23. Типы шкал. Примеры.
- •18. Задача выделения осевых линий объектов изображения как задача автоматической классификации.
- •20. Алгоритм классификации типа Форэл.
- •25. Детерминистские методы решения задачи распознавания.
- •26. Метод автоматической классификации типа корреляционных плеяд.
- •28. Задача распознавания без учителя. Метод корреляционных плеяд.
- •29. Реализация метода по определению мер важности объектов в методе потенциальных функций.
- •30. Представить процесс работы системы распознавания рукопечатного текста.
- •39. Представить процесс распознавания рукописного текста. Ваш вариант.
- •31. Задача распознавания без учителя на основе метода потенциальных функций, Алгоритм решения.
- •32. Алгоритм распознавания, основанный на вычислении оценок – перечислить 6 этапов.
- •33. Построить алгоритм таксономического анализа.
- •35. Тестовый подход и его значение для распознавания образов.
- •36.Предложить алгоритм выделения областей постоянной яркости изображения.
- •34. Важность объектов. Выделение значимых объектов при решении задач распознавания.
- •37. Примеры применения распознавания образов:
- •40.Задача распознавания с учителем. Метод комитетов.
- •41.Задачи, решаемые алгоритмами распознавания, основанными на вычислении оценок.
- •42. Привести классификацию шкал по Стивенсону.
- •43. Задача распознавания с обучением как задача оптимизации.
- •44. Представить структуру ппп по распознаванию и классификации образов.
- •45. Представить процесс работы системы Fine Reader.
45. Представить процесс работы системы Fine Reader.
Базовые принципы
Целостность (integrity) — объект рассматривается как совокупность своих частей и (для зрительных образов) пространственных отношений между ними. В свою очередь и части получают толкования только в составе всего объекта. Этот принцип помогает строить и уточнять гипотезы, быстро отсекая маловероятные.
Целенаправленность (purposefulness) — поскольку любая интерпретация данных преследует определенную цель, то и распознавание представляет собой процесс выдвижения гипотез об объекте и целенаправленной их проверки. Система, действующая в соответствии с этим принципом, будет не только экономнее расходовать вычислительные мощности, но и реже ошибаться.
Адаптивность (adaptability) — система сохраняет накопленную в процессе работы информацию и использует ее повторно, т. е. самообучается. Этот принцип позволяет создавать и накапливать новые знания и избегать повторного решения одних и тех же задач.
Предварительная обработка и структурный анализ изображения
На этапе предварительной обработки и анализа графических данных перед любой OCR-системой стоят две основные задачи: подготовка изображения к процедурам распознавания и выявление логической структуры документа — с тем, чтобы в дальнейшем иметь возможность воссоздать ее в электронном виде.
Распознавание символов. Классификаторы
Для распознавания символов в программе FineReader используются специальные механизмы, именуемые классификаторами и порождающие список гипотез, которые затем целенаправленно проверяются. Входными данными для классификаторов можесть служить не только графическая информация, но и сформированный в ходе распознавания список гипотез. В последнем случае классификатор не выдвигает новых гипотез, а лишь изменяет веса имеющихся, подтверждая или опровергая их. Такой подход, в котором также четко прослеживаются принципы IPA, обеспечивает более интеллектуальный анализ изображения и наиболее точное распознавание документа.
В OCR-решениях ABBYY задействованы шесть классификаторов — растровый, признаковый, признаковый дифференциальный, контурный, структурный и структурный дифференциальный, применяющиеся в зависимости от контекста документа, входных параметров изображения и задач распознавания. Набор используемых классификаторов во многом зависит от сложности обрабатываемого изображения и результатов первого прохода распознавания.
Рассмотрим вкратце свойства и особенности каждого из перечисленных классификаторов.
Растровый классификатор. Один из самых простых и быстрых классификаторов, принцип действия которого основан на прямом сравнении изображения символа с эталоном. Степень несходства при этом вычисляется как количество несовпадающих пикселей. Для обеспечения приемлемой точности растрового классификатора требуется предварительная обработка изображения: нормализация размера, наклона и толщины штриха. Эталон для каждого класса обычно получают, усредняя изображения символов обучающей выборки. В OCR-решениях ABBYY растровый классификатор, как правило, используется на начальных этапах распознавания для оперативного порождения предварительного списка гипотез.
Признаковый классификатор. Логика работы этого классификатора заключается в формировании для каждого изображения символа N-мерного вектора признаков и его последующем сравнении с набором эталонных векторов той же размерности. Формирование вектора (извлечение признаков) производится во время анализа предварительно подготовленного изображения. Эталон для каждого класса получают путем аналогичной обработки символов обучающей выборки. Назначение признакового классификатора — то же, что у растрового: быстрое порождение списка предварительных гипотез.
Признаковый дифференциальный классификатор. В задачи этого модуля входит обработка похожих друг на друга объектов, таких, например, как буква «m» и сочетание «rn». Он анализирует только те области изображения, где может находиться информация, позволяющая отдать предпочтение одному из вариантов. Так, в случае с «m» и «rn» ключом к ответу служит наличие и ширина разрыва в месте касания предполагаемых букв. Признаковый дифференциальный классификатор представляет собой набор признаковых классификаторов, оперирующих полученными для каждой пары схожих символов эталонами.
Контурный классификатор. Первоначально был создан и использовался для распознавания рукописного текста средствами ICR-технологий (Intelligent Character Recognition), затем был успешно применен и для обработки печатных документов. Механизм работы во многом схож с принципом действия признакового классификатора, а различие состоит в том, что для извлечения признаков контурный классификатор использует контуры, предварительно выделенные на изображении символа.
Структурный классификатор. Еще один классификатор, заимствованный из мира ICR-систем и анализирующий, как следует из названия, структуру символов: различные составляющие элементы, куски окружностей и отрезков, фрагменты, соединения, крайние точки, разрывы и тому подобное. Реализация структурного классификатора позволила разработчикам ABBYY избавиться от сбоев OCR-платформы при обработке букв различного размера и создать шрифтонезависимое решение, отрабатывающее на завершающих этапах распознавания. Входными данными для структурного классификатора являются изображение символа и ранжированный список гипотез, сформированный по результатам работы остальных распознавателей. Собственных гипотез не выдвигает, подтверждая либо опровергая ранее выдвинутые гипотезы.
Структурно-дифференциальный классификатор. Как и признаково-дифференциальный, этот классификатор решает задачи различения похожих объектов, например таких, как символы C и G. Анализируя соответствующие части изображения, вычисляя значения признаков, структурно-дифференциальный классификатор позволяет различать каждую конкретную пару символов, опираясь на накопленные при обучении сведения. Характеризуется высокой точностью распознавания и требовательностью к вычислительным ресурсам компьютера. Используется в основном для обработки тех пар символов, которые не удалось хорошо различить признаковым дифференциальным классификатором.
