Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
all in one. Informatic.Lektsii.docx
Скачиваний:
8
Добавлен:
21.04.2019
Размер:
1.79 Mб
Скачать

Преобразование текста из формата txt в doc (rtf)

При использовании Word файлы, как правило, хранятся в форматах doc или rtf. Эти форматы обеспечивают существенно большие возможности для представления и обработки текстов, чем txt и даже HTML. Но за всё надо платить! Форматы doc и rtf занимают в 2 – 3 раза больше места, чем txt и HTML. Обычно это несущественно, т.к. современные компьютеры имеют достаточно большие объёмы оперативной и долговременной памяти. Но при хранении документов на съёмных носителях (CD-Rom, Floppy, Jet Flash), а особенно при передаче их по каналам связи (Internet) такое увеличение объёма становится неприятным, а нередко и критическим. В этих случаях файлы Word`а преобразуют в формат txt (реже HTML). Сделать такое преобразование несложно, достаточно в команде Сохранить как… указать требуемый тип файла. Произвести обратное преобразование намного сложнее. Мы рассмотрим преобразование из txt в doc (rtf), потому что преобразование из HTML можно рассматривать как его частный случай.

Преобразование из txt в doc (rtf) основано главным образом на использовании команд Найти и Заменить, т.к. ручная обработка большого документа (до 1000 страниц и более) весьма трудоёмка. Это преобразование состоит из следующих шагов, порядок которых существенен:

  1. Открыть преобразуемый текстовый файл. Для этого обязательно войти в Word и выполнить команду Открыть.

  2. Сохранить файл в формате doc (rtf) – Сохранить как…, указать тип файла.

  3. Включить кнопку Непечатаемые знаки.

  4. Внимательно просмотреть документ и определить его структурные особенности:

    • наличие рисунков и таблиц;

    • наличие списков;

    • наличие переносов и других специальных символов;

    • уровни и особенности заголовков;

    • особенности обычного текста;

    • другие особенности.

  5. Рисунки и таблицы надо переместить (вырезать) в другой документ (файл), пометив в исходном их месторасположение, чтобы в конце преобразования восстановить их.

Надо учесть, что в формате txt таблицы обычно изображаются средствами псевдографики. В Word`е при преобразовании они искажаются и трудно восстановимы. Поэтому проще по окончании преобразования создать их заново, используя команду Сравнить рядом с… в разделе Окно и копирование. Рисунки в процессе преобразования могут перемещаться, что создаёт определённые проблемы при форматировании.

  1. Списки (особенно многоуровневые) при преобразовании также нередко искажаются.

При этом нумерованные списки могут быть приняты за заголовки, а маркированные – за диалоги. Поэтому, в общем случае, их тоже рекомендуется переместить в другой документ, а потом восстановить. Но в ряде случаев это делать необязательно.

  1. То же самое относится к колонкам. Их также рекомендуется переместить в другой (отдельный) документ и там переформатировать. Для выделения прямоугольного фрагмента, что требуется в данном случае, используется клавиша Alt.

  2. При подготовке текстов в Лексиконе и ряде других текстовых редакторах полученный текст, хотя и имеет тип txt, но содержит специальные для этого Редактора знаки – например "", а также знак дефиса для переносов и номера страниц. Их необходимо удалять в первую очередь.

Переносы удаляются командой Заменить. Для этого в поле Найти указывается ¶ а поле Заменить на очищается, и далее нажимается кнопка Заменить все. При этом могут быть удалены дефисы в словах типа где-то, как-то. Но их можно будет потом восстановить при проверке правописания.

Необходимо обращать внимание на отсутствие форматирования, которое указывается под полем словом Формат и описанием форматирования. Если оно присутствует, то надо нажать кнопку Больше, а потом Снять форматирование.

Номера страниц часто бывают с обоих сторон огорожены дефисами. Кроме того, в команде Найти (и Заменить) имеется знак Любая цифра.

Очень неприятно наличие в документе значка "". Word нередко понимает его как "ВСЕ" и зависает. Команда Заменить на нём обычно приводит к зависанию Word`а, но часто его можно удалить (или заменить) в полуавтоматическом режиме, используя команду Найти.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]