Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Паутов_П.А._Диплом_Финиш

.pdf
Скачиваний:
22
Добавлен:
14.01.2018
Размер:
2.3 Mб
Скачать

Рисунок 3. Судебное решение

Данный вид документов содержит больший объем информации по судебному делу, чем постановление суда. А именно: номер дела, ФИО заемщика,

его дата рождения, номер кредитного договора (важное поле), дата выдачи кредита, дата вынесения решения и дата его вступления в законную силу, суммы взыскиваемой просроченной задолженности и сумма на оплату государственно пошлины.

21

Исполнительный лист – это вид исполнительного документа, который выдается судом взыскателю на основании вступления судебного постановления или решения в законную силу (Рисунок 4).

Рисунок 4. Исполнительный лист

Исполнительный лист содержит такую информацию, как номер дела,

наименование и адрес суда, ФИО заемщика, год и место рождения, адрес проживания, сумму взыскиваемой просроченной задолженности и сумму на оплату государственной пошлины, наименование и адрес взыскателя, дату

22

вынесения решения и дату его вступления в законную силу (или указывается на немедленное исполнение).29

Обычно исполнительный лист выдается по каждому решению суда, но в некоторых случаях бывает так, что один исполнительный лист выдается на несколько решений.

Исполнительный лист является самым важным объектом исследования в данной дипломной работе, т.к. это ключевой документ при работе с просроченной задолженностью на судебной стадии (legal). Он содержит множество необходимой информации для корректного определения данных по заемщику, что в дальнейшем играет важную роль в распределении и направлении суд сотрудником.30

Теперь обратимся к документам, которые мы получим в результате. Так как основной задачей сотрудника банка, ответственного за сопровождение документации, является передача бумажных носителей информации в территориальные офисы банка, то на выходе нам необходимо получить акт приема-передачи документов. Он включает в себя различную информацию по передаваемым документам: номер ссуды, ФИО заемщика, дату выдачи документа, номер документа и так далее, в зависимости от необходимости включения той или иной информации (Рисунок 5).

29Дудкина А. С. Организационно-распорядительный документооборот // NovaInfo. Ru. – 2017. – Т. 1. – №. 64. – С. 89-93.

30Яковлева Е. В. Предмет правонарушений против порядка управления, посягающих на официальный документооборот // Актуальные проблемы борьбы с преступлениями и иными правонарушениями: материалы пятнадцатой международной научно-практической конференции/под ред. Ю.В. Анохина. – Барнаул: Барнаульский юридический институт МВД России, 2017. –Ч. 1. – 284 с. – 2017. – С. 187.

23

Рисунок 5. Примерная форма акта приема-передачи

Стандартной и регламентированной формы акта приема-передачи не существует, т.к. в разных организациях он может выглядеть по-разному, но общий смысл такого документа во всех компаниях одинаков, и его примерное содержание таково: Дата передачи документов, описание различной информации по документам, подпись отдающей стороны, подпись принимающей стороны.

2.3Сравнительный анализ программ для распознавания текста

Вданной части работы, рассмотрим необходимое программное обеспечение для распознавания и перевода вышеприведенных документов из

графического формата в текстовый. Безусловно, лидер программ в

24

распознавании текста является ABBYY FineReader, но, чтобы удостовериться в этом, проведем сравнительный анализ еще нескольких программ для распознавания текста из графического файла. В результате мы сможем, во-

первых, оценить рынок доступных ПО для распознавания текста, во-вторых,

указать сильные и слабые стороны каждого из них.

ABBYY FineReader 12 – это профессиональное программное обеспечение, с помощью которого можно распознавать текст из графического файла и переводить его в различные редактируемые форматы. Программа точно определяет текст и структурно его переводит в нужный формат. Она позволяет не перепечатывать текст в ручную, а это, в свою очередь, сокращает затраты на обработку. Данное ПО используется в фирмах и организациях, которые постоянно работают с бумажной документацией. ABBYY FineReader

конвертирует файлы из форматов PDF, TIFF, JPEG в форматы PDF, DOC, XLSX, TXT и другие (Рисунок 6).

Рисунок 6. Начальное окно программы ABBYY FineReader 12

25

Далее проведем анализ на выявление слов с ошибками и качество

обрабатываемого документа на примере 10 исполнительных листов (Таблица 1,

Рисунок 7)

Таблица 1 Данные, полученные при обработке документов программой

ABBYY FineReader 12

 

 

 

 

Количество

 

 

Слов с

 

 

Без

 

 

Качество

 

 

 

 

 

 

ошибками

 

 

 

 

 

 

 

 

слов

 

 

 

 

ошибок

 

 

обработки %

 

 

 

 

 

 

 

(нет слов)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

111

 

11

 

100

 

90,09

 

2

124

 

10

 

114

 

91,94

 

3

273

 

3

 

270

 

98,90

 

4

151

 

13

 

138

 

91,39

 

5

144

 

16

 

128

 

88,89

 

6

178

 

9

 

169

 

94,94

 

7

199

 

2

 

197

 

98,99

 

8

201

 

3

 

198

 

98,51

 

9

121

 

25

 

96

 

79,34

 

10

126

 

25

 

101

 

80,16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее

 

162,8

 

11,7

 

151,1

 

91,32

 

 

значение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

MIN

 

111

 

2

 

96

 

79,34

 

 

MAX

 

273

 

25

 

270

 

98,99

 

ABBYY Fine Reader 12

Количество слов

300

250

200

150

100

50

0

1

2

3

4

5

6

7

8

9

10

Номер документа

Всего слов

Слов без ошибок

Рисунок 7. Соотношение слов без ошибок к общему количеству слов (обработано ABBYY FineReader 12)

26

Как видим из показанной выше диаграммы, программа ABBYY FineReader 12 очень качественно обрабатывает документы, переводя их из графического формата в текстовый формат. В среднем, количество распознанных слов составляет 91,3 %. Данное программное обеспечение показало себя, как качественный продукт. Также стоит отметить, что ключевые поля, по которым в дальнейшем будут выгружаться данные из документа, были распознаны хорошо и без ошибок, а значит, основную задачу оптимизации и автоматизации возможно реализовать.

Плюсы: высокое качество распознавания текстов, широкий выбор входных и выходных форматов документов, простой и понятный пользовательский интерфейс

Минусы: данное ПО платное, не имеется открытого доступа к исходным кодам программы (используя их, можно было бы запускать программу с помощью написанного кода на С#)31

FREE ONLINE OCR SERVICE – это бесплатный онлайн сервис для распознавания текста из различных форматов. Его легко и просто использовать любому пользователю, т.к. нет необходимости загружать и устанавливать программу на компьютер. Данный продукт поддерживает множество языков для распознавания (в том числе и русский).

Форматы выходных файлов в FREE ONLINE OCR SERVICE приведены на рисунке 8.

Рисунок 8. Поддерживаемые форматы в FREE ONLINE OCR SERVICE

31 Гюлмамедов Т. О. разработка информационной системы на платформе «1С: Документооборот» // Теоретические и практические аспекты развития научной мысли в современном мире: сборник статей. – 2017. –

С. 32

27

Имеется возможность перевести текст в один из трех форматов: Microsoft Word, Microsoft Excel и Text Plain. В основном, для быстрого распознавания текста этих форматов достаточно. Так как имеется необходимый в данной дипломной работе формат .txt, то сравним качество обработанного документа и вероятность некорректного перевода текста (Таблица 2, Рисунок 9).

Таблица 2 Данные, полученные при обработке документов программой

FREE ONLINE OCR SERVICE

 

 

 

 

Количество

 

 

Слов с

 

 

Без

 

 

Качество

 

 

 

 

 

 

ошибками

 

 

 

 

 

 

 

 

слов

 

 

 

 

ошибок

 

 

обработки %

 

 

 

 

 

 

 

(нет слов)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

111

 

14

 

97

 

87,39

 

2

124

 

61

 

63

 

50,81

 

3

273

 

120

 

153

 

56,04

 

4

151

 

20

 

131

 

86,75

 

5

144

 

22

 

122

 

84,72

 

6

178

 

156

 

22

 

12,36

 

7

199

 

5

 

194

 

97,49

 

8

201

 

12

 

189

 

94,03

 

9

121

 

73

 

48

 

39,67

 

10

 

126

 

43

 

83

 

65,87

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее

 

162,8

 

52,6

 

110,2

 

67,51

 

 

значение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

MIN

 

111

 

5

 

22

 

12,36

 

 

MAX

 

273

 

156

 

194

 

97,49

 

FREE ONLINE OCR SERVICE

 

300

слов

250

200

Количество

150

 

 

100

50

0

1

2

3

4

5

6

7

8

9

10

Номер документа

Всего слов

Слов без ошибок

Рисунок 9. Соотношение слов без ошибок к общему количеству слов (обработано FREE ONLINE OCR SERVICE)

28

Исходя из полученных результатов, можно сделать вывод, что данный сервис имеет высокий уровень распознавания текста. В среднем, количество распознанных слов составляет 67,5 %. Данный сервис является хорошим способом быстро распознать графический файл и перевести его в текстовый формат, но для оптимизации реального бизнес-процесса данный продукт не подходит из-за узкого спектра функциональных возможностей.

Плюсы: простота в использовании, быстрый доступ с любого устройства с выходом в интернет, множество языков для распознавания.

Минусы: в отличие от загруженных программ для оптического распознавания текста, данный продукт не имеет таких широких функциональных возможностей.

CuneiForm – это программа, используемая для распознавания текста документов и дальнейшего перевода в редактируемый вид. Данный продукт бесплатный и доступный любому пользователю. В результате работы программы можно получить файл в нужном формате с отредактированным текстом.

Форматы выходных файлов в CuneiForm представлены на рисунке 10.

Рисунок 10. Поддерживаемые форматы в CuneiForm

Исходя из увиденного выше, делаем вывод, что данное ПО не поддерживает одни из основных форматов файлов, как Microsoft Word (расширение .doc) и Acrobat Reader DC (расширение .pdf). Следовательно,

данный продукт будет проигрывать по широте использования тому же ABBYY

29

FineReader 12. Но в этой дипломной работе как раз необходим текст исполнительного листа в формате .txt, поэтому сравним качество обработанного документа и вероятность некорректного перевода текста (Таблица 3,

Рисунок 11).

Таблица 3 Данные, полученные при обработке документов программой OCR

CuneiForm

 

 

 

Количество слов

 

 

Слов с ошибками

 

 

Без

 

 

Качество обработки

 

 

 

 

 

 

(нет слов)

 

 

ошибок

 

 

%

 

 

 

 

 

 

 

 

 

 

 

 

 

1

111

 

18

 

93

 

83,78

 

2

124

 

120

 

4

 

3,23

 

3

273

 

273

 

0

 

0,00

 

4

151

 

147

 

4

 

2,65

 

5

144

 

141

 

3

 

2,08

 

6

178

 

175

 

3

 

1,69

 

7

199

 

166

 

33

 

16,58

 

8

201

 

175

 

26

 

12,94

 

9

121

 

119

 

2

 

1,65

 

10

126

 

122

 

4

 

3,17

 

 

Среднее значение

 

162,8

 

145,6

 

17,2

 

12,78

 

 

MIN

 

111

 

18

 

0

 

0,00

 

 

MAX

 

273

 

273

 

93

 

83,78

 

OCR CuneiForm

Количетсво слов

300

250

200

150

100

50

0

1

2

3

4

5

6

7

8

9

10

Номер документа

Всего слов

Слов без ошибок

Рисунок 11. Соотношение слов без ошибок к общему количеству слов (обработано OCR CuneiForm)

30