Скачиваний:
47
Добавлен:
21.02.2014
Размер:
80.38 Кб
Скачать

3. Этапы создания электронной книги

3.1 Сканирование

На этом этапе происходит ввод книги в компьютер в виде изображений в формате TIFF с использованием сканера. Сканирование производится с разрешением 300 точек на дюйм в черно-белых цветах. Это позволяет формату TIFF сжимать графический файл в несколько раз без потери качества. Отсканированные изображения сохраняются на диске с именем, образованным от номера отсканированной страницы.

3.2 Распознавание

На этом этапе происходит выделение текста из отсканированных изображений и преобразование его в обычный текст, подлежащий редактированию. Для этого в программе ABBYY FineReader 4.0 Professional создавался пакет, в который открывалось несколько десятков файлов, так как обрабатывать по несколько файлов сразу выгоднее с точки зрения экономии времени, чем по одному.

Открытые в пакете страницы книги нужно разделить на блоки. Эти блоки указывают программе ABBYY FineReader 4.0 Professional что необходимо распознавать. В них также указывается тип распознаваемой информации: текст или таблица.

После распознавания необходимо отредактировать полученную информацию. Это удобнее сделать с помощью этой же программы, так как она позволяет видеть оригинальное изображение буквы или другого знака в то время, как курсор передвигается по тексту. Кроме того, ABBYY FineReader 4.0 Professional неуверенно распознанные слова выделяет другим цветом, что облегчает поиск ошибок.

3.3 Редактирование

Так как основная, самая трудоемкая часть курсового проекта, выполняется в программе Microsoft Word, то его необходимо рассмотреть более подробно.

Word - мощный текстовой процессор, предназначенный для выполнения всех процессов обработки текста: от набора и верстки, до проверки орфографии, вставки в текст графики в стандарте *.pcx или *.bmp, распечатки текста. Он работает с многими шрифтами, как с русским, так и с любым из двадцати одного языка мира. В одно из многих полезных свойств Word входит автоматическая коррекция текста по границам, автоматический перенос слов и правка правописания слов, сохранение текста в определенный устанавливаемый промежуток времени. Word обеспечивает поиск заданного слова или фрагмента текста, замену его на указанный фрагмент, удаление, копирование во внутренний буфер или замену по шрифту, гарнитуре или размеру шрифта, а так же по надстрочным или по подстрочным символам. Наличие закладки в тексте позволяет быстро перейти к заложенному месту в тексте. Можно так же автоматически включать в текст дату, время создания, обратный адрес и имя написавшего текст. Word позволяет открывать много окон для одновременной работы с несколькими текстами, а так же разбить одно активное окно по горизонтали на два и выровнять их.

Редактирование проводилось следующим образом. Распознанный текст копировался через буфер обмена в документ Microsoft Word 9.0. Там он окончательно редактировался и оформлялся соответствующим образом. С помощью программы MicrosoftPhotoEditor3.01 каждый рисунок выделялся из отсканированных изображений и после уменьшения в 2 раза вставлялся в необходимом месте в документ Microsoft Word.

Соседние файлы в папке курсовой проект