Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

savinkin_yue_razrabotka-intellektualnoy-sistemy-avtomatizacii-cifrovogo-dokumentooborota-na-osnove-algoritmov-op_47138

.pdf
Скачиваний:
13
Добавлен:
14.01.2018
Размер:
8.44 Mб
Скачать

Бинаризация изображения с автоматическим выбором режима черной гелевой и синей ручки

Тренеровка нейросети системы оптического распознавания символа на реальных данных

Автоматическое распознавание данных

Возможность ручного исправления данных

Экспорт распознанных данных в JSON

36

7 Экспериментальное тестирование объекта разработки;

В реальных условиях система была протестирована во время проведения международной олимпиады “Открытый сетевой конкурс информационных технологий – 2017”. Система использовалась в тестовом режиме для регистрации участников, пришедших участвовать локально.

Система показала себя стабильно, работала быстро и выдавала результаты работы с точностью до 85%. Но основная цель тестирования системы – набрать реальные данные, вводимые пользователями. База данных из рукопечатных символов была использована для дополнительной тренировки системы , что позволило натренировать систему до точности в 99%.

37

8 Внедрение объекта разработки на предприятии.

Внедрение объекта разработки на предприятии будет происходить в два этапа:

Сбор данных для улучшения модели распознавания (пройдено)

Разработка финальной версии анкеты и полноценное внедрение системы (

ожидается до начала учебного года.

После тестирования программы во время проведения международной олимпиады “Открытый сетевой конкурс информационных технологий – 2017” был пройден этап сбора данных для улучшения модели распознавания. В ходе этого мероприятия программа была обучена самым частым паттернам рукопечатного письма. Точность распознавания символов увеличилась до 99%, что позволило перейти к этапу внедрения системы на предприятии.

Для облегчения внедрения программы в процесс документооборота на предприятии было решено разработать основную версию анкеты, которая будет использована при вступительных экзаменах. При создании финальной версии подразумевалось, что не будет необходимости менять поля, а только дату и название мероприятия. Такая тактика позволит ускорить внедрение системы путем упрощения обучения персонала организации. При разработке инструкции и создании интерфейса было проведено исследование user experience, позволяющие изучить требования пользователей к данной системе. Таким образом весь интерфейс интуитивно понятнен.

В ближайшее время будет предпринята попытка интеграции данной системы распознавания рукопечатного текста в систему EduApp, обеспечивающую электронный документооборот на предприятии ЧУ ДО “Школа программистов”.

38

9 Заключение

В процесса прохождения преддипломной практики мною было проведено исследование в области разработки и обработки анкет в промышленных масштабах,

а также в сфере разработки специализированного программного обеспечения. В ходе практики была разработана проектная часть данной выпускной квалификационной работы. В результате чего, была создана программа, содержащая конструктор анкет

иявляющаяся прототипом системы распознавания созданных и заполненных анкет с использованием системы распознавания рукопечатного текста и последующей обработки считанной информации.

За время работы я научился применять полученные в процессе обучения знания

инавыки, на практике научился составлять техническую документацию, в том числе,

ЕСКД, улучшил свои навыки по нахождению требуемой информации в печатных источниках, освоил современные паттерны программирования, а также получил практический опыт разработки программ данного вида с нуля. На этапе оценки необходимости данной программы мною было изучено много различных программ и документов по разным видам распознавания текста. Я получил опыт в сфере оценки скорости и простоты использования систем, призванных упростить работу предприятий. Мной также получены навыки по упрощению использования систем,

сложных для восприятия работниками по обработке данных, не имеющих достойной квалификационной подготовки.

39

10 Список использованных источников

[1]ABBYY FormReader 6.5. Поддержка Abbyy URL: https://www.abbyy.com/ruru/support/flexicapture/fr65/pl/specs/ (дата обращения: 05.04.2017).

[2]ABBYY FlexiCapture Поддержка Abbyy URL: https://www.abbyy.com/ruru/flexicapture/features/ (дата обращения: 05.04.2017).

[3]Система электронного документооборота и автоматизации бизнес-процессов Е1

Евфрат http://www.evfrat.ru/ (дата обращения: 05.04.2017).

[4]Official ZXing ("Zebra Crossing") project home URL: https://github.com/zxing/zxing (дата обращения: 10.04.2017).

[5]ГОСТ Р 56042-2014

[6]Daniel Lélis Baggio “Mastering OpenCV with Practical Computer Vision Projects”

[7]ПЕЛЕВИН Е.Е., БАЛЯСНЫЙ С.В. Оптимальные алгоритмы выделения контуров изображения в системе технического зрения // Juvenis scientia. 2016. №6 С.6-8.

[8]Кудрина Мария Александровна. Использование преобразования Хафа для обнаружения прямых линий и окружностей на изображении // Известия Самарского научного центра РАН. 2014. №4-2 С.476-478.

[9]OCR - Optical Character Recognition. Ubuntu documentation URL: https://help.ubuntu.com/community/OCR (дата обращения: 08.04.2017).

40

Приложение 1. Техническое задание

1 Общие положения

1.1 Наименование системы

1.1.1 Полное наименование системы

Полное наименование – система автоматизации цифрового документооборота “ШП –

АНКЕТА”.

1.1.2 Краткое наименование системы

Краткое наименование – “ШП – Анкета”, Система.

1.2 Основания для проведения работ

Работа выполняется на основании задания на ВКР и договором между Заказчиком и

Разработчиком.

1.3 Наименование организаций – Заказчика и Разработчика

1.3.1 Заказчик

Заказчик: ЧУ ДО “Школа Программистов” Адрес фактический: Московская обл., Мытищи г., ул. Юбилейная, 13, корп.2

Телефон: +7 (495) 796-69-15

1.3.2 Разработчик

Разработчик: Савинкин Юрий Евгеньевич Телефон: +7 (977) 802-84-82

1.4 Цели, назначение и область использования системы

Создать инструмент для генерации анкет;

Стандартизировать анкеты абитуриентов;

Обеспечить нумерацию каждой копии анкеты;

Создать инструмент для распознавания анкет;

Обеспечить возможность ручного контроля качества распознавания анкет.

41

1.5 Очередность создания системы

Ниже представлена предполагаемая очередность создания системы:

1.Анализ существующих технических решений в предметной области;

2.Подготовка технического задания на объект разработки/исследования;

3.Разработка методов решения поставленных задач;

4.Обоснования выбора способов реализации решения задач проекта;

5.Обоснование выбора инструментальных и программных средств для решения задач проекта;

6.Исследование и разработка структуры программного обеспечения объекта разработки;

7.Разработка прикладного программного обеспечения объекта разработки;

8.Создание пробной версии программного обеспечения объекта разработки;

9.Экспериментальное тестирование объекта разработки;

10.Внедрение объекта разработки на предприятии.

1.6 Основные технические решения

1.6.1 Решения по структуре системы

1.6.1.1 Логическая и компонентная архитектура системы

Перечень используемых для создания Системы программных средств приведен ниже:

Приложение – генератор анкет (ШП – Анкета.Генератор, версия v0.1)

Приложение – распознаватель анкет (ШП – Анкета.OCR, версия v0.1)

Облачное приложение, интегрированное в LMS EDUAPP ( не является объектом разработки данного проекта, но включено в состав комплекса “ШП – Анкета” ) (ШП – Анкета.Импорт, версия v0.1)

42

1.7 Решения

по

режимам

функционирования,

диагностирования работы системы

Предлагается следующая реализация решения по режимам функционирования

системы:

Основной режим, в котором все подсистемы выполняют свои основные функции.

Профилактический режим, в котором недоступна функция импорта распознанных данных в LMS EDUAPP.

Восновном режиме функционирования система обеспечивает:

Работу пользователей в режиме – 24 часа в день, 7 дней в неделю (24/7)

Выполнение своих функций – генерацию, распознавание и импорт данных в систему.

ВПрофилактическом режиме функционирования система обеспечивает:

Возможность генерации и распознавания анкет.

Принимается предварительное решение о том, что общее время проведения профилактических работ не должно превышать 1% от общего времени работы системы в основном режиме (>7 часов в месяц).

1.8 Решения по персоналу и режимам его работы

Таблица 1

Возможные вариантами привязки ролей пользователей и администраторов системы к организационной структуре Заказчика.

Роль

Подразделение

 

 

Дизайнер анкеты

Департамент развития

 

 

Оператор Системы

Технический департамент

 

и/или

 

Отдел заботы об учениках

 

 

43

1.9Сведения об обеспечении заданных в техническом задании потребительских характеристик системы,

определяющих ее качество

Таблица 2

Трассировка требований, заданных в техническом задании, и описанных проектных

решений

Требование

Метод реализации

 

 

 

 

Создать инструмент для генерации анкет;

Реализуется

путем

Стандартизировать анкеты абитуриентов;

использования приложения “ШП

Обеспечить нумерацию каждой копии анкеты.

– Анкета.Генератор”

 

 

 

 

Создать инструмент для распознавания анкет;

Реализуется

путем

Обеспечить возможность ручного контроля

использования приложения “ШП

качества распознавания анкет.

– Анкета.OCR”

 

 

 

 

1.10 Состав и размещение комплексов технических средств

Клиентская часть комплекса “ШП – Анкета” мобильна, т.е. может работать на любом стандартно сконфигурированном комплексе “Компьютер администратора отдела заботы об учениках” с подключенным и сконфигурированным сканером.

1.11 Методы и средства разработки

Для реализации системы будут использованы средства разработки Microsoft Visual Studio 2016 с подключенным плагином JetBrains ReSharper.

Для разработки системы будет использован язык C# и Lean – подход для разработки программных средств.

44

1.12 Мероприятия по подготовке объекта автоматизации к

вводу системы в действие

1.12.1Мероприятия по подготовке информационной базы

Заказчику необходимо сверстать тестовую анкету и протестировать систему на тестовой выборке учеников, тем самым определив необходимые для OCR-

распознавания данные

1.12.2Мероприятия по подготовке персонала

Обучение сотрудников отдела развития проводится Разработчиком, во время тестового ввода в эксплуатацию комплекса “ШП – Анкета”.

В дальнейшем, обучение сотрудников производится силами отдела развития.

1.12.3Мероприятия по организации рабочих мест

Для полного функционирования Системы достаточно использовать стандартно сконфигурированный комплекс “Компьютер преподавателя” или “Компьютер администратора отдела заботы об учениках” с подключенным и сконфигурированным сканером.

Для работы на других компьютерах, необходимо что бы была установлена ОС

Windows с поддержкой платформы .Net версии >3.0, с подключенным интернетом и подключенным и сконфигурированным сканером.

45