Паутов_П.А._Диплом_Финиш
.pdfРисунок 3. Судебное решение
Данный вид документов содержит больший объем информации по судебному делу, чем постановление суда. А именно: номер дела, ФИО заемщика,
его дата рождения, номер кредитного договора (важное поле), дата выдачи кредита, дата вынесения решения и дата его вступления в законную силу, суммы взыскиваемой просроченной задолженности и сумма на оплату государственно пошлины.
21
Исполнительный лист – это вид исполнительного документа, который выдается судом взыскателю на основании вступления судебного постановления или решения в законную силу (Рисунок 4).
Рисунок 4. Исполнительный лист
Исполнительный лист содержит такую информацию, как номер дела,
наименование и адрес суда, ФИО заемщика, год и место рождения, адрес проживания, сумму взыскиваемой просроченной задолженности и сумму на оплату государственной пошлины, наименование и адрес взыскателя, дату
22
вынесения решения и дату его вступления в законную силу (или указывается на немедленное исполнение).29
Обычно исполнительный лист выдается по каждому решению суда, но в некоторых случаях бывает так, что один исполнительный лист выдается на несколько решений.
Исполнительный лист является самым важным объектом исследования в данной дипломной работе, т.к. это ключевой документ при работе с просроченной задолженностью на судебной стадии (legal). Он содержит множество необходимой информации для корректного определения данных по заемщику, что в дальнейшем играет важную роль в распределении и направлении суд сотрудником.30
Теперь обратимся к документам, которые мы получим в результате. Так как основной задачей сотрудника банка, ответственного за сопровождение документации, является передача бумажных носителей информации в территориальные офисы банка, то на выходе нам необходимо получить акт приема-передачи документов. Он включает в себя различную информацию по передаваемым документам: номер ссуды, ФИО заемщика, дату выдачи документа, номер документа и так далее, в зависимости от необходимости включения той или иной информации (Рисунок 5).
29Дудкина А. С. Организационно-распорядительный документооборот // NovaInfo. Ru. – 2017. – Т. 1. – №. 64. – С. 89-93.
30Яковлева Е. В. Предмет правонарушений против порядка управления, посягающих на официальный документооборот // Актуальные проблемы борьбы с преступлениями и иными правонарушениями: материалы пятнадцатой международной научно-практической конференции/под ред. Ю.В. Анохина. – Барнаул: Барнаульский юридический институт МВД России, 2017. –Ч. 1. – 284 с. – 2017. – С. 187.
23
Рисунок 5. Примерная форма акта приема-передачи
Стандартной и регламентированной формы акта приема-передачи не существует, т.к. в разных организациях он может выглядеть по-разному, но общий смысл такого документа во всех компаниях одинаков, и его примерное содержание таково: Дата передачи документов, описание различной информации по документам, подпись отдающей стороны, подпись принимающей стороны.
2.3Сравнительный анализ программ для распознавания текста
Вданной части работы, рассмотрим необходимое программное обеспечение для распознавания и перевода вышеприведенных документов из
графического формата в текстовый. Безусловно, лидер программ в
24
распознавании текста является ABBYY FineReader, но, чтобы удостовериться в этом, проведем сравнительный анализ еще нескольких программ для распознавания текста из графического файла. В результате мы сможем, во-
первых, оценить рынок доступных ПО для распознавания текста, во-вторых,
указать сильные и слабые стороны каждого из них.
ABBYY FineReader 12 – это профессиональное программное обеспечение, с помощью которого можно распознавать текст из графического файла и переводить его в различные редактируемые форматы. Программа точно определяет текст и структурно его переводит в нужный формат. Она позволяет не перепечатывать текст в ручную, а это, в свою очередь, сокращает затраты на обработку. Данное ПО используется в фирмах и организациях, которые постоянно работают с бумажной документацией. ABBYY FineReader
конвертирует файлы из форматов PDF, TIFF, JPEG в форматы PDF, DOC, XLSX, TXT и другие (Рисунок 6).
Рисунок 6. Начальное окно программы ABBYY FineReader 12
25
Далее проведем анализ на выявление слов с ошибками и качество
обрабатываемого документа на примере 10 исполнительных листов (Таблица 1,
Рисунок 7)
Таблица 1 Данные, полученные при обработке документов программой
ABBYY FineReader 12
|
|
|
|
Количество |
|
|
Слов с |
|
|
Без |
|
|
Качество |
|
|
№ |
|
|
|
|
ошибками |
|
|
|
|
|
|||
|
|
|
слов |
|
|
|
|
ошибок |
|
|
обработки % |
|
||
|
|
|
|
|
|
(нет слов) |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
111 |
|
11 |
|
100 |
|
90,09 |
|
||||||
2 |
124 |
|
10 |
|
114 |
|
91,94 |
|
||||||
3 |
273 |
|
3 |
|
270 |
|
98,90 |
|
||||||
4 |
151 |
|
13 |
|
138 |
|
91,39 |
|
||||||
5 |
144 |
|
16 |
|
128 |
|
88,89 |
|
||||||
6 |
178 |
|
9 |
|
169 |
|
94,94 |
|
||||||
7 |
199 |
|
2 |
|
197 |
|
98,99 |
|
||||||
8 |
201 |
|
3 |
|
198 |
|
98,51 |
|
||||||
9 |
121 |
|
25 |
|
96 |
|
79,34 |
|
||||||
10 |
126 |
|
25 |
|
101 |
|
80,16 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Среднее |
|
162,8 |
|
11,7 |
|
151,1 |
|
91,32 |
|
||||
|
значение |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
MIN |
|
111 |
|
2 |
|
96 |
|
79,34 |
|
||||
|
MAX |
|
273 |
|
25 |
|
270 |
|
98,99 |
|
ABBYY Fine Reader 12
Количество слов
300
250
200
150
100
50
0
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Номер документа
Всего слов
Слов без ошибок
Рисунок 7. Соотношение слов без ошибок к общему количеству слов (обработано ABBYY FineReader 12)
26
Как видим из показанной выше диаграммы, программа ABBYY FineReader 12 очень качественно обрабатывает документы, переводя их из графического формата в текстовый формат. В среднем, количество распознанных слов составляет 91,3 %. Данное программное обеспечение показало себя, как качественный продукт. Также стоит отметить, что ключевые поля, по которым в дальнейшем будут выгружаться данные из документа, были распознаны хорошо и без ошибок, а значит, основную задачу оптимизации и автоматизации возможно реализовать.
Плюсы: высокое качество распознавания текстов, широкий выбор входных и выходных форматов документов, простой и понятный пользовательский интерфейс
Минусы: данное ПО платное, не имеется открытого доступа к исходным кодам программы (используя их, можно было бы запускать программу с помощью написанного кода на С#)31
FREE ONLINE OCR SERVICE – это бесплатный онлайн сервис для распознавания текста из различных форматов. Его легко и просто использовать любому пользователю, т.к. нет необходимости загружать и устанавливать программу на компьютер. Данный продукт поддерживает множество языков для распознавания (в том числе и русский).
Форматы выходных файлов в FREE ONLINE OCR SERVICE приведены на рисунке 8.
Рисунок 8. Поддерживаемые форматы в FREE ONLINE OCR SERVICE
31 Гюлмамедов Т. О. разработка информационной системы на платформе «1С: Документооборот» // Теоретические и практические аспекты развития научной мысли в современном мире: сборник статей. – 2017. –
С. 32
27
Имеется возможность перевести текст в один из трех форматов: Microsoft Word, Microsoft Excel и Text Plain. В основном, для быстрого распознавания текста этих форматов достаточно. Так как имеется необходимый в данной дипломной работе формат .txt, то сравним качество обработанного документа и вероятность некорректного перевода текста (Таблица 2, Рисунок 9).
Таблица 2 Данные, полученные при обработке документов программой
FREE ONLINE OCR SERVICE
|
|
|
|
Количество |
|
|
Слов с |
|
|
Без |
|
|
Качество |
|
|
№ |
|
|
|
|
ошибками |
|
|
|
|
|
|||
|
|
|
слов |
|
|
|
|
ошибок |
|
|
обработки % |
|
||
|
|
|
|
|
|
(нет слов) |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
111 |
|
14 |
|
97 |
|
87,39 |
|
||||||
2 |
124 |
|
61 |
|
63 |
|
50,81 |
|
||||||
3 |
273 |
|
120 |
|
153 |
|
56,04 |
|
||||||
4 |
151 |
|
20 |
|
131 |
|
86,75 |
|
||||||
5 |
144 |
|
22 |
|
122 |
|
84,72 |
|
||||||
6 |
178 |
|
156 |
|
22 |
|
12,36 |
|
||||||
7 |
199 |
|
5 |
|
194 |
|
97,49 |
|
||||||
8 |
201 |
|
12 |
|
189 |
|
94,03 |
|
||||||
9 |
121 |
|
73 |
|
48 |
|
39,67 |
|
||||||
10 |
|
126 |
|
43 |
|
83 |
|
65,87 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Среднее |
|
162,8 |
|
52,6 |
|
110,2 |
|
67,51 |
|
||||
|
значение |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
MIN |
|
111 |
|
5 |
|
22 |
|
12,36 |
|
||||
|
MAX |
|
273 |
|
156 |
|
194 |
|
97,49 |
|
FREE ONLINE OCR SERVICE
|
300 |
|
слов |
250 |
|
200 |
||
Количество |
||
150 |
||
|
||
|
100 |
50
0
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Номер документа
Всего слов
Слов без ошибок
Рисунок 9. Соотношение слов без ошибок к общему количеству слов (обработано FREE ONLINE OCR SERVICE)
28
Исходя из полученных результатов, можно сделать вывод, что данный сервис имеет высокий уровень распознавания текста. В среднем, количество распознанных слов составляет 67,5 %. Данный сервис является хорошим способом быстро распознать графический файл и перевести его в текстовый формат, но для оптимизации реального бизнес-процесса данный продукт не подходит из-за узкого спектра функциональных возможностей.
Плюсы: простота в использовании, быстрый доступ с любого устройства с выходом в интернет, множество языков для распознавания.
Минусы: в отличие от загруженных программ для оптического распознавания текста, данный продукт не имеет таких широких функциональных возможностей.
CuneiForm – это программа, используемая для распознавания текста документов и дальнейшего перевода в редактируемый вид. Данный продукт бесплатный и доступный любому пользователю. В результате работы программы можно получить файл в нужном формате с отредактированным текстом.
Форматы выходных файлов в CuneiForm представлены на рисунке 10.
Рисунок 10. Поддерживаемые форматы в CuneiForm
Исходя из увиденного выше, делаем вывод, что данное ПО не поддерживает одни из основных форматов файлов, как Microsoft Word (расширение .doc) и Acrobat Reader DC (расширение .pdf). Следовательно,
данный продукт будет проигрывать по широте использования тому же ABBYY
29
FineReader 12. Но в этой дипломной работе как раз необходим текст исполнительного листа в формате .txt, поэтому сравним качество обработанного документа и вероятность некорректного перевода текста (Таблица 3,
Рисунок 11).
Таблица 3 Данные, полученные при обработке документов программой OCR
CuneiForm
|
№ |
|
|
Количество слов |
|
|
Слов с ошибками |
|
|
Без |
|
|
Качество обработки |
|
|
|
|
|
|
(нет слов) |
|
|
ошибок |
|
|
% |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|||
1 |
111 |
|
18 |
|
93 |
|
83,78 |
|
||||||
2 |
124 |
|
120 |
|
4 |
|
3,23 |
|
||||||
3 |
273 |
|
273 |
|
0 |
|
0,00 |
|
||||||
4 |
151 |
|
147 |
|
4 |
|
2,65 |
|
||||||
5 |
144 |
|
141 |
|
3 |
|
2,08 |
|
||||||
6 |
178 |
|
175 |
|
3 |
|
1,69 |
|
||||||
7 |
199 |
|
166 |
|
33 |
|
16,58 |
|
||||||
8 |
201 |
|
175 |
|
26 |
|
12,94 |
|
||||||
9 |
121 |
|
119 |
|
2 |
|
1,65 |
|
||||||
10 |
126 |
|
122 |
|
4 |
|
3,17 |
|
||||||
|
Среднее значение |
|
162,8 |
|
145,6 |
|
17,2 |
|
12,78 |
|
||||
|
MIN |
|
111 |
|
18 |
|
0 |
|
0,00 |
|
||||
|
MAX |
|
273 |
|
273 |
|
93 |
|
83,78 |
|
OCR CuneiForm
Количетсво слов
300
250
200
150
100
50
0
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Номер документа
Всего слов
Слов без ошибок
Рисунок 11. Соотношение слов без ошибок к общему количеству слов (обработано OCR CuneiForm)
30