Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Літературна мозаїка учні.rtf
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
53.53 Mб
Скачать

1. Пошук тексту книги в електронному вигляді

Після того як ви оберете тему проекту, для подальшої роботи вам знадобиться текст книги в електронному вигляді. Є кілька шляхів отримання такого тексту.

  • Ви можете знайти його в мережі Інтернет за допомогою пошу­кової системи або в одній з електронних бібліотек, наприклад у бібліотеці Максима Мошкова, розташованій за адресою lib.ru.

  • Якщо ви маєте паперовий варіант тексту, його можна скану­вати та розпізнати за допомогою пакета оптичного розпізна­вання тексту.

Пошук електронного тексту в мережі Інтернет можна здійснювати через веб-каталоги або пошукові системи за ключовими словами. Однією з найпопулярніших таких систем в Інтернеті є пошуко­ва система www.google.com. У країнах СНД популярності набули пошукові системи Яндекс (www.yandex. ru), Рамблер (www.rambler.ru), Апорт (www.aport.ru). Найбільша українська система пошуку — Мета (www.meta-ukraine.com.ua або www.meta.com.ua). Оберіть систему, яка вас найбільше влаштовує; якщо пошук буде невдалим, звертайтеся до інших пошукових систем.

Коли сайт з текстом книги знайдено, у вас з’являється можли­вість або скачати файл із текстом (зазвичай він зберігається у файловому архіві з розширенням rar чи zip), або, якщо текст на­ведено на сайті, виділити його, скопіювати в буфер обміну та, відкривши програму Word, вставити до нового документа, після чого зберегти його на жорсткому диску.

Усі етапи роботи розглядатимемо на прикладі книги Павла Загребельного «Роксолана», що зберігається в бібліотеці Максима Мошкова за адресою http://www.lib.ru/SU/UKRAINA/ZAGREBEL_NIJ/ roksolan.txt. Ми завантажили її текст і зберегли в папці проекту.

2. Перетворення тексту формату txt на текст формату

Microsoft Word

Найчастіше тексти в мережі Інтернет зберігаються саме у цьому форматі, тому ми розглянемо його докладно. У разі відкриття такого файлу в програмі Word ви можете перейти у вікно вибору кодування. Справа в тому, що значна частина ТХТ-файлів, що зберігаються в мережі Інтернет, записана в кодуванні MS-DOS. Тому, якщо вікно вибору кодування відкрилося, потрібно вибра­ти саме це кодування. У текстовому полі в нижній частині вікна можна побачити початковий фрагмент тексту файлу. Якщо коду­вання обрано вірно, цей текст можна буде прочитати.

Текст у форматі TXT має такі особливості:

  • для переходу до наступного рядка в ньому використовується клавіша Enter, що призводить до введення символу абзацу, тобто кожен рядок перетворюється на окремий абзац;

  • замість довгого тире у тексті набрано знак дефісу;

  • відступи абзаців утворені в результаті введення кількох сим­волів пробілу або символу табуляцїї;

  • для вирівнювання тексту за шириною між словами може використовуватися не один, а два чи три символи пробілу;

  • часто для вирівнювання тексту за шириною використовують­ся переноси, що у разі переведення тексту у формат Microsoft Word може призвести до спотворення слів або заважає фор­матуванню документа;

  • у деяких текстах перед знаками пунктуації (крапкою, ко­мою, знаком оклику тощо) міститься символ пробілу, що є помилкою;

  • можливі випадки, коли текст з обох боків виділено за допомо­гою символів підкреслення (слово), що означає курсивне написання, або за допомогою зірочок (*слово*), що означає напівжирний шрифт.

Більшість із перелічених проблем проілюстровано на рис. 2.3.