Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Соловьев.docx
Скачиваний:
49
Добавлен:
26.03.2016
Размер:
978.1 Кб
Скачать

Способы распознавания.

Распознавание образов - это отнесение исходных данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные из общей массы несущественных данных. В основе работы программ распознавания текста лежит достаточно серьёзный математический аппарат. И это оправдано сложностью задачи, особенно самого процесса распознавания.

Системы распознавания бывают следующих типов:

  • системы распознавания объектов с учителем;

  • системы распознавания объектов без обучения;

В системах распознавания без обучения первоначально заданной информации достаточно, чтобы разделить все множество объектов на классы в соответствии с каким-либо набором признаков.

Работу системы с учителем можно разделять на две части: обучение и распознавание. В ходе обучения системы ей предъявляются отдельные объекты с указанием того, к какому классу относится данный объект. Затем происходит распознавание: предъявляется неизвестный объект и система сама должна определить его принадлежность. Это решение принимается на основании решающих правил.

В данном курсовом проекте было рекомендовано использовать систему распознавания без учителя. Для этого необходимо сформировать набор признаков, позволяющий осуществить распознавание ключевого слова среди претендентов, которые будут получены после сегментации.

2. Постановка задачи

Целью курсового проекта является разработка приложения для ОС Android, позволяющего найти ключевое слово на изображении текста, полученном при помощи создания скриншота экрана. Приложение реализовано в среде Android Studio на языке Java.

Входные данные:

  • Изображение-скриншот с ключевым словом и текстом в *.jpg без сжатия.

Ограничения:

  • Ключевое слово должно располагаться первой строкой на изображении, дальше должен идти сам текст для поиска.

  • Ключевое слово должно быть одним.

  • Ключевое слово и текст должны быть напечатаны шрифтом Roboto размером не менее 10pt.

  • При наличии цветных посторонних объектов, текст и ключевое слово должны быть напечатаны черным цветом.

Выходные данные: изображение текста с выделенными на нем красным цветом найденные слова, кроме этого гистограмма количества пикселей в строках и диаграмма расстояний между символами.

При выполнении курсового проекта необходимо решить следующие задачи по обработке изображения:

  • Создание скриншота;

  • Перевод изображения из цветного в полутоновое методом RGB(YUV);

  • Бинаризация пороговым методом с порогом по умолчанию = 128, либо бинаризация методом 120;

  • Сегментация строк методом гистограмм;

  • Поиск расстояний между символами и словами методом гистограмм;

  • Сегментация слов чередующимся цветом с помощью метода мод и выделение претендентов на основании количества символов;

  • Утоньшение изображений ключевого слова и претендентов методом попиксельного итеративного утоньшения;

  • Распознавание ключевого слова среди претендентов на основании информативных признаков.

На основании вышеперечисленного были построены функциональные схемы приложения в формате IDEF 1 и 2 уровня, которые приведены на рисунках 1,2. IDEF схема 3 уровня построена для последних двух пунктов.