Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Яковлев Б.С..doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
10.84 Mб
Скачать

Программная распечатка

Описание ситуации: данный пример имеет две особенности, влияющие на качество распознавания:

  • программа передает отступы от левого края листа не пробелами, а с помощью задания отступов абзаца; при экспорте в .txt левый отступ не сохраняется; некоторые строки объединяются в один абзац и при экспорте объединяются в одну строку;

  • много ошибок при распознавании конструкций языков программирования.

Решение:

  • Для распознавания таких документов существует специальная опция программы Форматированный пробелами текст. Устанавливается в группе Тип страницы на закладке Распознавание диалога Опции (меню СервисОпции).

В этом случае в распознанном тексте сохранится деление на строки; отступы от левого края будут  переданы пробелами; каждая строка выделена в отдельный абзац, а расстояния между абзацами переданы пустыми строками. Все это позволит сохранить исходное форматирование текста при сохранении в формате Txt.

Для хорошего распознавания распечаток программ требуется установить специальный язык распознавания. Для этого:

В списке языков на панели - Стандартная выберите значение Выбор из полного списка языков и в открывшемся диалоге Язык распознаваемого текста выберите пункт C++.

Замечание: Если распознаваемая программная распечатка помимо программного кода содержит текстовые комментарии, то для хорошего распознавания необходимо выбрать несколько языков распознавания: язык программирования и язык, на котором написаны комментарии.

Таблица с неполным количеством черных разделителей Описание ситуации: все строки таблицы между черными горизонтальными линиями (разделителями) объединены в одну строку таблицы.

Если в таблице встречается смешанное разделение на строки и столбцы, при котором некоторые строки разделены черными разделителями, а некоторые нет, программа может разбить таблицу на строки неправильно. Решение: Программу можно "заставить" выделять каждую строку текста в отдельную строку таблицы, отметив специальную опцию на закладке Распознавание (меню СервисОпции) в группе Таблицы: В каждой ячейке таблицы не более одной строки текста.

Сложная таблица

Описание ситуации: неправильный анализ таблиц со сложной нерегулярной структурой: неправильное разделение таблицы на строки и столбцы; неправильное выделение картинок в ячейках таблицы; плохое распознавание вертикального и инвертированного текста.

Решение: Воспользуйтесь инструментами ручной разметки таблиц, расположенными на панели Изображение:

 - чтобы добавить вертикальную линию;

 - чтобы добавить горизонтальную линию;

 - чтобы удалить линию.

Для ячеек таблицы, содержащих только картинки, в диалоге Свойства блока (меню ВидСвойства), отметьте пункт - Считать ячейку картинкой.

Для выделения картинок внутри ячеек с текстом в отдельные блоки, воспользуйтесь инструментом на панели Изображение: . Для ячеек таблицы, содержащих вертикальный текст, в диалоге Свойства блока (меню ВидСвойства) в поле Направление текста укажите направление текста в ячейке; для ячеек с инвертированным текстом отметьте пункт Инвертированный.

Элементы управления панели Форматирование используют для изменения представления готового текста или при его редактировании.