Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вис_Инф_Т_Nbook28_ukr пособие для курсовой.doc
Скачиваний:
7
Добавлен:
19.11.2019
Размер:
6.7 Mб
Скачать

3Технології гіпертекстових видань

Гіпертекст належить до систем автоматизації діяльності по обробці інформації і служить для полегшення пошуку потрібної інформації. Гіпертекстові системи забезпечують реалізацію засобами обчислювальної техніки асоціативного підходу до представлення інформації. Вони імітують здатність людського інтелекту здійснювати збереження великих обсягів інформації і пошук її за допомогою асоціацій у процесах комунікації і мислення.

Ідея гіпертексту полягає в тому, щоб дати можливість людині сприймати інформацію в послідовності, що відповідає його інтересам. Сьогодні гіпертекстової документ являє собою багато фрагментів інформації (статей), об'єднаних у деяку мережну структуру. Як інформаційні фрагменти можуть виступати текст, графічний образ, анімація, відеоролики і навіть програма.

Гіпертекстові документи одержали широке поширення в електронних виданнях.

Ідея гіпертексту широко використовувалася при складанні довідників і енциклопедій. Наприклад, у тексті статті енциклопедії по якому-небудь питанню зустрічаються посилання типу дивися статтю таку-то, утримуючі доповнення і пояснення до поточної проблеми. В даний час використовувана технологія гіпертексту забезпечує доступ до великих масивів текстової інформації, що не піддається упорядкування звичайними способами.

Гіпертекстові системи пристосовані для створення інформаційних систем у погано структурованих предметних областях. Ці технології застосовуються тоді, коли користувач не може чітко сформулювати свої інформаційні потреби, а робить це в процесі пошуку інформації. Традиційні методи інформаційного пошуку, наприклад по ключових словах, можуть служити додатковим засобом у прикладних гіпертекстових системах, забезпечуючи ефективний доступ до великих інформаційних масивів.

Ще одним втіленням гіпертекстової технології, що базується на багаторічному досвіді в області програмного забезпечення (ПО) роботи з графічними даними, є програмний пакет Adobe Acrobat. Цей пакет містить усі необхідні компоненти для створення складних інформаційних систем. Пакет включає засіб створення документів, оформлений у виді драйвера принтера або як автономне середовище розробки, і засіб перегляду цих документів. Причому засіб перегляду безкоштовний практично для всіх платформ. Документи можуть містити як внутрішні гіперпосилання, так і посилання на будь-які інші документи в корпоративній мережі. Для полегшення пошуку необхідної інформації в пакеті передбачений модуль індексації вмісту документів і інтелектуального пошуку з урахуванням особливостей багатьох європейських мов.

Більшість сучасних пошуково-довідкових систем у тім або іншому ступені підтримують технологію гіпертексту. Тут гіпертекстова технологія використовується для полегшення пошуку потрібної інформації по продукту і по його можливостям. Як приклад програмної реалізації технології гіпертексту можна привести довідкові системи, вбудовані в MS Windows. Найбільш розвиті в технічному відношенні довідкові системи, побудовані на технології Help- файлів, дозволяють навіть автоматизувати деякі дії користувача. Так, довідкова система пакета MS Word на запити користувача про те, як виконати визначену процедуру, не тільки надає вичерпний опис дій, але навіть пропонує виконати деякі з них автоматично.

У системах документообігу і колективної роботи з документами гіпертекстова технологія застосовується для створення зв'язків між однотипними документами і для організації послідовної обробки документів. Так, у розвитому програмному пакеті підтримки корпоративної діяльності користувачів Lotus Notes елементи гіпертекстової технології використовуються для зв'язування двох і більш документів.

Асоціативні зв'язки між інформаційними фрагментами полегшують засвоєння знань і роблять гіпертекстову технологію незамінної для створення засобів навчання. Гнучкість гіпертексту дозволяє викладачеві індивідуалізувати процес навчання, зробити його наочним і цікавим при помірних витратах на розробку навчальних курсів.

Гіпертекстова технологія може успішно застосовуватися для створення процесорів ідей. Даний тип гіпертекстових систем використовується для організації процесу підготовки і супроводу великих документів, що містять текст, графіку, інформацію з баз даних і електронних таблиць. Кінцевою метою виступає генерація лінійного й удобочитаємого документа (у виді книги, доповіді, звіту і т.п.) по різнорідним і різноплановим даним. Тут істотними є відстеження впливу змін даних в окремих інформаційних фрагментах на документ у цілому і його коректній реорганізації для різних додатків (наприклад, для видання рекламного буклету, проспекту, доповіді). Крім того, немаловажне значення має підтримка одночасної роботи декількох авторів з фрагментами єдиного видання, їхньої взаємодії в локальній мережі, розподіленого збереження інформації, ведення версій документів, узгодження їхнього остаточного змісту.

Реалізуються гіпертекстові документи на CD-ROM і в мережах Internet. При використанні CD-ROM гіпертекстової документ може створюватися на основі технологій баз і банків даних, Help-технологій і мови гіпертексту HTML.

Найбільш популярним напрямком застосування гіпертекстових технологій у мережах Internet є Web-публікації (World Wide Web), організовані в Локальні архіви, сайти або Web-сторінки.

Ззззз Функції гіпертекстових електронних видань

Гіпертекстові видання є часткою гіпертекстових систем і мають справу з електронними текстами, а також графікою й іншими компонентами електронних видань. Вони виконують багато функцій, необхідних при обробці текстової або іншої інформації: створення текстової бази даних, уведення текстів через клавіатуру, включення до складу електронного видання графіки, анімації, відео- і аудіоінформації, завантаження компонентів видання з файлів; функції редакторів, включаючи перенесення блоків інформації з одного місця видання в інше, постачання матеріалу різними атрибутами; пошук матеріалу по атрибутах, по рядках символів (стрингам), створення, збереження і пошук різного роду інформації, друк і т.п.

Разом з тим, дозволяючи встановити зв'язок і забезпечуючи переходи по цих зв'язках, гіпертекстові системи починають виконувати більш розвиті функції обробки текстової й іншої інформації.

Укажемо деякі з цих специфічних функцій, виконуваних гіпертекстовими електронними виданнями:

  • підтримка посилальних зв'язків (виклик тексту або іншого фрагмента, на який дається посилання) як усередині деякого матеріалу (електронний словник, енциклопедія, каталог і т.п.), так і усередині деякого сховища інформаційних компонентів видання в цілому;

  • пошук інформації за допомогою браузинга в програмах перегляду;

  • ведення структури (нарощуваної) видання;

  • навігація по зв'язках з метою вивчення або засвоєння знань з розглянутої у виданні предметної області;

  • виділення в ході навігації «віртуальних» структур, сукупностей у чомусь близьких інформаційних блоків (стосовно до тексту ці сукупності іноді називають «контекстами»);

  • запам'ятовування «шляхів», компонування в ході навігації лінійних текстів;

  • автоматична побудова з гіпертекстової мережі зв'язних текстів з використанням евристичних алгоритмів;

  • вбудовування в текст інших компонентів електронного видання;

  • організація демонстрації електронного видання.

Розвиті гіпертекстові системи, призначені для кінцевих користувачів (читачів), виконують більшість цих функцій.

Зззз Принципи побудови гіпертекстових видань

Відповідно до словника гіпертекст розглядається як «мультимедійний додаток з використанням тексту і (або) графіки. Гіпертекст допускає таке представлення документів, що імітує асоціативне структурування понять людиною в протиставлення лінійному порядкові проходження понять у книгах, фільмах і в мові».

Фактично гіпертекст – це технологія роботи з текстовими даними, що дозволяє встановлювати асоціативні зв'язки типу гіперзв'язків або гіперпосилань між фрагментами, статтями і графікою в текстових масивах. Завдяки цьому стає доступної не тільки послідовна, лінійна робота з текстом, як при звичайному читанні, але і довільний асоціативний перегляд відповідно до встановленої структури зв'язків, а також з урахуванням особистого досвіду, інтересів і настрою користувачів. Гіпертекстової документ як би одержує додаткові виміри. З одного боку, він подібний звичайному текстовому документові, що має фіксований початок і кінець. З іншого боку, гіпертекст одночасно організовано по тематичн лінії, по індексах і бібліографічним покажчикам.

З погляду реалізації гіпертекст являє собою багато іменованих фрагментів (сторінок, статей або інших елементів) інформації, об'єднаних у мережеву структуру за допомогою системи зв'язків між фрагментами.

Ці зв'язки в гіпертекстових документах виступають як гіперпосилання – зв'язки між різними фрагментами гіпертексту, що представляють собою посилання на конкретне місце в публікації, куди здійснюється перехід при активізації даного гіперпосилання. Звичайно гіперпосилання певним чином виділяються в тексті документа й активізуються шляхом кліка (однократного натискання курсором миші) або натискання визначеної функціональної клавіші. Гіперпосилання може бути оформлене, наприклад, як підкреслений фрагмент тексту, Рисунок, фрагмент малюнка. Особливої уваги заслуговує спосіб здійснення гіперзв'язків шляхом зіставлення різним частинам графічного зображення (наприклад, карти) різних гіперпосилань. Усі гіперпосилання можна розділити на дві принципово різні категорії.

Локальні гіперпосилання – це посилання на інші частини того самого документа, відкіля вони здійснюються (наприклад, посилання зі «змісту» на глави публікації, посилання з однієї глави на іншу, від якого-небудь терміна на його визначення, розташоване в словнику термінів даної публікації і т.п.).

Глобальні гіперпосилання – це посилання на інші документи, у загальному випадку на які-небудь ресурси, розташовані поза даним документом, наприклад в іншому файлі, логічно не зв'язаному з документом і існуючому незалежно від нього, або на сторінці вилученого Web-сервера.

При цьому, якщо локальні гіперпосилання практично завжди здійсненні, тобто виконання даного посилання приводить до появи тієї частини документа, куди повинний здійснюватися перехід по посиланню, то для глобальних гіперпосилань можливі випадки, коли необхідний ресурс, на який виробляється посилання, по тим або інших причинах відсутній. Таким чином, при використанні в електронних публікаціях подібних посилань необхідно обновляти публікації при змінах, зв'язаних з тими документами, на які виробляється посилання. Дана проблема особливо актуальна при публікаціях на CD-ROM, тому що CD-ROM, приміром, трирічної давнини може містити багато посилань на ресурси WWW, що у даний момент не є актуальними. Це необхідно враховувати при підготовці електронних публікацій, тобто або передбачити можливість відновлення даних, насамперед посилань, або мінімізувати число «сумнівних» посилань на ресурси, що можуть перетерпіти істотні зміни в часі.

Фрагменти і система зв'язків гіпертекстового документа можуть бути як статичними (які визначені в процесі створення документа і більше не змінюються), так і періодично змінюваними або навіть динамічно генерованими.

Так, наприклад, більшість довідкових систем прикладних програмних пакетів і операційних систем по ознаці статичності інформаційного наповнення варто віднести до статичних, тому що частота їхнього відновлення звичайно зв'язана з розробкою нової версії програми (у кращому випадку з періодичністю в рік).

З іншого боку, більшість (по деяким даним до 70%) сторінок, виставлених для огляду в службі World Wide Web глобальної мережі Internet, генерується динамічно при запитах користувача з обліком його робітничого середовища і параметрів перегляду, що задаються. У більшості випадків структура посилань і розміщені в сайті дані міняються періодично в міру їхнього відновлення. В існуючій практиці виробляється облік поточних подій, наприклад свята Новий рік, релігійних дат, інших важливих для тематичного сайту подій. Так, у багатьох сайтів під новий рік з'явилися елементи новорічної атрибутики.

Як інформаційне наповнення (фрагментів) можуть виступати текстові і графічні дані, мультимедійні дані, такі, як анімаційні і відеоролики (відеокліпи), їхній звуковий супровід, і навіть програмні модулі, написані на спеціально призначених для цього мовах програмування (Java, JavaScript, BasicScript) або на мовах програмування загального призначення, типу Си++, Perl,...

Об'єкти гіпертекстової мережі утворять наступну ієрархічну структуру: мережа, підмережа, фрагмент, мітка. Підмережа являє собою деяку підмножину фрагментів мережі, зв'язаних між собою й об'єднаних якоюсь ознакою – значеннєвим або функціональним. В інформаційних блоках можуть бути виділені спеціальні поля (наприклад, кольором або розміром), використовувані для зв'язування інформаційних фрагментів у гіпертекстову мережу. Такі поля називають гіпертекстовими мітками (кнопками). Активізація зв'язку приводить до переходу користувача до наступного інформаційного фрагмента. У залежності від типу зв'язку перехід може бути постійним або тимчасовим. В останньому випадку користувач одержує можливість ознайомитися з приміткою, поясненням, тлумаченням терміна і повернутися до первісного інформаційного фрагмента.

Відповідно до ієрархії в гіпертекстовій мережі можуть бути присутні наступні типи зв'язків: мітка-мітка, мітка-фрагмент, мітка-підмережа, фрагмент-фрагмент, фрагмент-мітка, фрагмент-підмережа, підмережа-мітка. У деяких першоджерелах мітки називають кнопками.

Звичайно прикладні гіпертекстові системи підтримують кілька типів зв'язків. Однак для повноцінної роботи використовуються чотири перших з перерахованих вище типів зв'язків. Якщо з реалізацією зв'язку типу мітка-інший об'єкт не виникає проблем (користувач просто вказує на мітку курсором і натискає керуючу клавішу), то для реалізації зв'язків типу фрагмент-фрагмент необхідн інший спосіб.

Наприклад, за допомогою гарячої клавіші активізується меню, у якому представлені імена усіх фрагментів, з якими зв'язаний даний фрагмент. Перехід здійснюється після вибору цільового об'єкта.

Гіпертекстові документи, як правило, будуються на основі використання одного або декількох типів зв'язків. Наприклад, у випадку, коли текстовий фрагмент являє собою цілком видиму на екрані сторінку, достатньо наявності зв'язків мітка-сторінка і сторінка-сторінка. Якщо ж гіпертекстова система допускає наявність фрагментів, розмір яких перевищує вікно, у якому вони демонструються, то виникає необхідність використання зв'язку типу мітка-мітка (кнопка-кнопка) і фрагмент-мітка (фрагмент-кнопка) так, щоб при переході по зв'язку здійснювалося правильне позиціювання фрагмента у вікні.

Процес переміщення користувача по інформаційних фрагментах називається навігацією. Гіпертекстові мережі дозволяють здійснювати послідовний перегляд інформації, як це ми робимо, перегортаючи книгу; ієрархічний перегляд (глава, параграф, сторінка) і, найважливіше, – довільну навігацію по гіпертекстовій мережі, обумовлену особистим досвідом, інтересами і настроєм користувача. Останнє накладає додаткову відповідальність на автора гіпертекстового документа, що повинний не тільки забезпечувати високу якість змісту інформаційних фрагментів і осмислені їхні взаємозв'язки, але і передбачати можливі маршрути проходження по ньому користувача.

Як указувалося вище, у залежності від типу зв'язку перехід може бути постійним або тимчасовим. В останньому випадку користувач одержує можливість ознайомитися з приміткою, поясненням, тлумаченням терміна і повернутися до первісного інформаційного фрагмента.

Трохи більш важкими в реалізації, але значно підвищувальна корисність гіпертексту як засобу пошуку необхідної інформації є зв'язки, що мають різну силу. Сила являє собою механізм, що дозволяє врахувати силу зв'язків гіпертекстових фрагментів, зв'язаних гіперпосиланням. Так, наприклад, зв'язок статей про виробника комп'ютера і про самий комп'ютер набагато сильніше, ніж статей про цей комп'ютер і магазин, що торгує комп'ютерами. Облік сил зв'язків між фрагментами не дозволяє користувачеві занадто віддалитися від матеріалів, присвячених цікавлячій його темі, і тим самим знижує можливість інформаційного перевантаження користувача, що є серйозною проблемою гіпертекстових систем. Завдання ж граничної сили забезпечує плавне регулювання можливого радіуса дії користувача. Одним з механізмів відображення сили зв'язку є використання різних кольорів або відтінків одного кольору для виділення міток.

Відображення різним кольором (розцвічування) зв'язків дозволяє також виділити підмережі в загальній мережі гіпертекстової системи. Так, наприклад, можна тематично розділити фрагменти в загальному списку усіх фрагментів мережі, призначивши кожній темі свій колір. Механізм розцвічування зв'язків дозволяє реалізувати такий могутній апарат представлення знань, як семантичні мережі.

Істотною особливістю гіпертекстових систем є їхня орієнтація на активну роботу користувача в інтерактивному режимі. Здійснюючи навігацію по інформаційних фрагментах, користувач одержує можливість по-різному представляти інформацію, що полегшує її розуміння і забезпечує створення нових знань. Усе це дозволяє говорити про гіпертекстові системи (виданнях) як про знання-орієнтовані.

Для створення гіпертекстового видання насамперед потрібна визначена база даних, де будуть зберігатися інформаційні блоки (статті) і зв'язки між ними. Необхідні також інструменти для створення, ведення, редагування і маніпулювання елементами інформаційного наповнення, конструювання гіпертекстових сторінок з цих елементів. І як завершальний етап – повинні бути створені засоби демонстрації користувачеві підготовлених матеріалів у виді готових сторінок і зв'язків, що забезпечують навігацію за гіпертекстовою структурою видання.

З погляду кінцевого споживача або користувача готового гіпертекстового видання (системи) останнє являє собою деякий програмний комплекс, що забезпечує відтворення фрагментів заздалегідь побудованої гіпертекстової мережі і її елементів, а також засобу навігації по мережі і деякі додаткові сервісні можливості.

Як уже відзначалося, гіпертекстові видання орієнтовані на активну взаємодію з читачем (користувачем) в інтерактивному режимі. Тому середовище перегляду гіпертекстів повинно мати інтуїтивно зрозумілий, гнучкий і функціонально повний користувальницький інтерфейс, що враховує наявність конкретних навичок, кваліфікації і потреб читача, з механізмами для настроювання цього середовища під його індивідуальні вимоги. У більшості випадків основу сучасного інтерфейсу представляє проблемно-орієнтоване графічне середовище, що стало сьогодні стандартом де-факто. Багатьом професіоналам це середовище представляється оптимальним рішенням проблеми організації взаємодії людини з гіпертекстовим виданням, тому що з її допомогою можна використовувати такі засоби, як різні гарнітури і типи шрифтів, стильове оформлення, графічні ілюстрації, анімацію і більш широку колірну гаму представлення тексту і графіки. Однак графічне середовище накладає жорсткі вимоги на апаратне забезпечення робочого місця, тому варто завжди виходити з конкретних потреб читача.

Елементарні засоби навігації містять у собі дії типу: перейти, повернутися, переглянути, перегортати і т.п. Бажано передбачити можливість видачі цих команд принаймні трьома способами: за допомогою меню, гарячих клавіш, маніпуляторів типу миші.

Читач повинний мати засобу для повернення до раніше розглянутих фрагментів (функція відкоту). Дана функція може бути реалізована декількома способами: швидкий перехід до останнього в ланцюжку переглянутих фрагментові або надання користувачеві заголовків усіх переглянутих їм фрагментів із проханням вибрати той рівень, до перегляду якого необхідно повернутися. У більшості гіпертекстових видань реалізовані обидва способи.

Для полегшення роботи з гіпертекстовим середовищем можливо (а в комерційних продуктах необхідно) застосування наступних сервісних інструментів користувача.

Список усіх фрагментів мережі гіпертекстового видання (системи). Доцільно організувати цей список у виді ієрархічної системи, на верхньому рівні якої утримуються тільки загальні формулювання тем фрагментів, а при зниженні від рівня до рівня в існуючій ієрархії досягається усе більша деталізація і конкретизація.

Пошуковий механізм. Дозволяє шукати в мережі гіпертекстового видання фрагменти (статті), що містять необхідну інформацію з ключових слів і (або) приписаним при побудові видання атрибутам фрагментів. Як атрибути можуть виступати, наприклад, назви, ім'я автора, вартість фрагмента, дата його останньої модифікації і т.п.

Книжкова закладка. Надає користувачеві можливість відзначати цікавлячий його інформаційний фрагмент.

Записна книжка. Забезпечує реалізацію для користувача функції збереження своїх довільних коментарів до переглянутих фрагментів і можливість їхнього наступного перегляду.

Засоби друку й експорту гіпертекстових фрагментів у стандартних форматах файлів для одержання твердої копії фрагмента документа або електронної копії для її наступної обробки.

Засоби збереження стану системи. Використовуються для продовження роботи з гіпертекстовим виданням після змушеної або запланованої перерви починаючи з того місця, на якому робота з виданням була перервана.

Засоби візуалізації структури, що дозволяють користувачеві спостерігати всю гіпертекстову мережу або її частину з тим або іншим ступенем деталізації і з різних ракурсів. Дають користувачеві можливість представити структуру усього або частини гіпертекстового видання для більш ефективної роботи з документом.

ЗЗЗЗМатематична модель гіпертексту

Гіпертекст – це нелінійно організований текст, тобто текст із нелінійною структурою. Звичайному (одномірному) текстові, який можна інтерпретувати як один довгий рядок символів, що читається в одному напрямку, протипоставлений багатомірний текст. В окремих місцях такого багатомірного тексту читання можна продовжувати в декількох різних напрямках у залежності від інформаційної потреби. Гіпертекст може відрізнятися від звичайного тексту порядком проходження матеріалу, способом його представлення. Елементи гіпертексту можуть розміщатися у виді ієрархічного дерева або мережної організації, він може мати кілька рівнів короткого викладу і деталізації матеріалу і т.д. Тексти, складені природною мовою, зберігаються, будучи організованими по новому принципі. При цьому приходиться відмовитися від використовуваних зараз підходів до підготовки видань або інших документів і перейти до складної нелінійної форми організації матеріалу. Для пояснення нелінійної форми побудови гіпертекстових видань розглянемо одну з відомих математичних моделей гіпертексту.

Використовуємо наступні позначення.

Нехай М и R – кінцеві непорожні множини:

M = {m1, m2,..., mn}; R = {R1, R2,..., Rk}; .

Елементами множин М и R будемо позначати об'єкти і відносини між ними відповідно. Тоді гіпертекст у найбільш загальному виді (Г0 ) описується як сукупність наступних чотирьох компонентів:

Г0 = (T, I, S, Q),

де Т – тезаурус гіпертексту; I – інформаційна складового гіпертексту. Містить у собі зміст інформаційних статей Ii , у які містяться дані про всіх mi М, тобто

I = i Ii ;

S – алфавітний (або хронологічний) словник усіх найменувань mi М; Q – список головних тим гіпертексту.

Тезаурус гіпертексту складається з тезаурусних статей. Тезаурусна стаття може бути представлена у виді

ti = {mi , Ami },

де ti – тезаурусна стаття об'єкта mi ; Ami – багато об'єктів, з якими mi зв'язаний відносинами з R із указівкою типу відносини.

Наприклад, якщо об'єкт ma зв'язаний з іншими об'єктами з множини М відносинами Ri, Rj,..., Re , те

Ama = {Ri(mi1, mi2, ..., mit), Rj(mj1, mj2, ..., mjs),..., Re(me1, me2, ..., mep) },

(mi1, ..., mit) зв'язані з об'єктом ma відношенням Ri ,

(mj1, ..., mjs) зв'язані з об'єктом ma відношенням Rj ,

me1, ..., mep) зв'язані з об'єктом ma відношенням Re .

Тут істотно відзначити, що в Ami утримуються тільки найближчі «родичі» для mi .

Усю сукупність тезаурусних статей, тобто тезаурус гіпертексту, можна представити в такий спосіб:

Т = {m1, m2, ..., mi, ..., mn), Am1, Am2,..., Ami, ..., Amn}.

Тезаурус гіпертексту графічно можна представити у виді мережі, у вузлах якої знаходяться текстові описи об'єктів, а ребра мережі вказують на існування зв'язку між об'єктами і дозволяють визначити тип зв'язку (рис. 2.4).

Найбільш важливим компонентом гіпертексту Г0 є сукупність гіпертекстових статей Г:

Г = i Гi , Г Г0 ,

де Гi складається з опису об'єкта mi (інформаційна стаття Ii ) і переліку родинних об'єктів (тезаурусна стаття ti ):

Гi = (ti , Ii ).

Видача інформації, уведення нових даних здійснюються, як правило, Гi -порціями.

Для аналітичного осмислення і наступної автоматизації процедури пошуку семантичних даних у гіпертекстовому масиві необхідно скласти математичний опис цієї процедури. Важливість задачі підтверджується також тим, що проблема пошуку виникає при внесенні нової інформації в гіпертекст. У цьому випадку необхідно виділити всі родинні об'єкти, щоб установити необхідні тезаурусні зв'язки.

Для опису процедури пошуку можуть застосовуватися наступні моделі:

1) пошук найближчої по складу і змістові гіпертекстової статті:

ρ (Гi , Гс ) min,

де ρ – деяка характеристика близькості складу і змісту гіпертекстових статей; Гс – стаття, що вводиться, або стаття, що шукають, Гі Г;

2) пошук гіпертекстових статей з найбільш бажаними властивостями:

f(Гi ) max,

де f характеризує деякі бажані властивості, наприклад наявність однакового родового об'єкта, Гi Г;

3) комбінований випадок:

f (Гi ) max, ρ (Гi , Гс ) ≤ρ0 ,

де ρ0 – деяке обмеження, Гi Г.

Останні три співвідношення застосовуються не тільки при пошуку даних по запитах абонентів, але і для перебування раніше сформованих статей з метою встановлення перехресних посилань при надходженні в гіпертекст нової інформації.

Для коректного відновлення гіпертексту важливого значення набуває визначення елементарних операцій над тезаурусом. У семіотиці використовується наступний підхід. В узагальненому виді тезаурус представляється як зв'язування двох параметрів: (М, А), де А – відображення MR у М, зважене відносинами з R. Нехай задані тезауруси:

T1 = (M1, A1), T2 = (M2, A2), ..., Tq = (Mq, Aq).

Визначення 1. Тезаурус Т = (М, А ) будемо називати об'єднанням тезаурусів Ti, де i = 1, ..., q, і позначати Т = i Ti, якщо М = i Mi і для mi M Am i Aim.

Користуючись даним визначенням, можна здійснити злиття декількох незалежно підготовлених тезаурусів.

Визначення 2. Тезаурус Т = (М, A) будемо називати перетинанням тезаурусів Ti, i =1, ..., q і позначати Т = i Ti, якщо М і Mi і для mi M Am i Aim.

Визначення 1 і 2 дозволяють маніпулювати з пересічними незалежно підготовленими тезаурусами.

ЗЗЗЗ Гіпертекстові Web-документи

Одним із самих популярних засобів поширення електронних публікацій (поряд з CD-ROM) є мережі Internet. Для того щоб охарактеризувати середовище, у якому існують електронні публікації даного типу, розглянемо основні поняття, зв'язані з Internet.

Internet – це сукупність обчислювальних мереж. Ця глобальна мережа надає користувачеві ряд сервісних послуг, зв'язаних з розміщенням, збереженням, передачею електронних публікацій і доступом до них. Послуги реалізуються на базі серверів Internet. Такими серверами є FTP, Gopher, поштові (сервери e-mail), сервери новин (сервери News), сервери WWW (Web-сервери) та ін.

Областю самого масового застосування гіпертекстових технологій є мережна служба World Wide Web (WWW) глобальної мережі Internet. Ця служба забезпечує інтуїтивно зрозумілий доступ на основі технології гіпертексту до даних у глобальній мережі. Для цих цілей розроблені програми-браузери і спеціальні програмні засоби автоматизації процесу створення Web-документів (локальних архівів, сайтів, Web-сторінок).

Відносна легкість створення Web-публікацій і доступу до них сприяла розвитку Intranet (Інтранет) – часток мереж, заснованих на Internet-технологіях. Intranet дозволяє з'єднати офіси в одному будинку або в різних частинах земної кулі, виключивши доступ до даних сторонніх осіб.

До появи технології WWW доступ до даних по Internet був можливий лише в текстовому режимі і вимагав гарного знання різних аспектів роботи цієї мережі. Тому користувачами Internet у той час були в основному наукові установи і професійні програмісти, яким був потрібний швидкий доступ до різних спеціальних матеріалів у локальних архівах і обмін інформацією з колегами. Технологія WWW значно розширила можливості Internet, забезпечивши максимально простий доступ до інформації непрофесійним користувачам. Тепер доступ у Internet відкритий не тільки компаніям, що працюють на ринку інформаційних послуг і комп'ютерної техніки, але і не має ніякого відношення до комп'ютерних технологій. Багато фірм і навіть приватні особи використовують переваги миттєвого розповсюдження інформації з Internet.

Технологія World Wide Web споконвічно ґрунтувалася на ідеї гіпертекстового зв'язку вузлів глобальної мережі по усім світі. І в цьому плані технологію WWW можна розглядати як одну з форм реалізації гіпертекстових технологій у специфічному середовищі, що має свої принципові особливості.

З моменту появи технологія WWW безупинно удосконалювалася. І якщо на початковій стадії розвитку вона надавала лише текстову інформацію з убудованими в неї статичними графічними елементами, то на сьогоднішній момент World Wide Web надає користувачеві можливість працювати з будь-якими даними і навіть спеціалізованими програмними модулями, убудованими у фрагменти гіпертекстової мережі. У WWW існують могутні пошукові засоби, що дозволяють серед незліченного різноманіття інформації знайти необхідну. Однак, незважаючи на ці механізми і переваги гіпертексту, пошук необхідної інформації у величезному морі локальних архівів, Web-сторінок і сайтів залишається непростою справою. Для цього до складу Internet включені спеціальні пошукові, довідкові сервери й інші сервісні засоби, що полегшують процес пошуку необхідної інформації.

В даний час широке поширення одержали Web-публікації у виді гіпертекстових Web-документів. Web-публікації працюють за технологією клієнт – сервер. Web-сервер – це програма, запущена на комп'ютері, призначеному для надання документів іншим комп'ютерам, що посилають відповідні запити. Web-клієнт – програма, що дозволяє користувачеві запитувати документи із сервера. Сервер задіяний тільки тоді, коли запитується документ. Така технологія є ефективної, оскільки вимагає незначних ресурсів сервера. Наприклад, Web-сервер на Windows NT може надавати Web-документи приблизно двомстам одночасно підключеним до нього користувачам. Для встановлення з'єднання з Web-сервером використовується адреса комп'ютера, що називається універсальним покажчиком ресурсу – URL (Uniform Resource Locator). Сервер у відповідь на запит посилає комп'ютерові клієнта текст або інша інформація у виді фрагмента (звук, напівтонові або кольорові зображення, анімація або цифрове відео), на який у документі встановлені гіперпосилання. Сервер передає інформацію у форматі HTML (HyperText Markup Language – мова розмітки гіпертексту). Документи мовою HTML, також називані Web-документами, надають користувачеві можливість, указавши на ключове слово або фразу, одержати доступ до відповідного файлу (фрагментові) або перейти в інший HTML-документ, що зв'язаний із зазначеним ключовим елементом тексту гіперпосиланням. Такі гіпертекстові зв'язки між файлами і документами фізично розташовані на серверах по усім світі. Це є головною відмінністю Web-документів від звичайних гіпертекстових документів. Таким чином, у ролі середовища для гіпертекстових Web-документів виступають мережа Internet і її подсети (набір документів, що тематично і логічно зв'язані між собою).

У Web-браузері для пошуку інформації використовується спеціально розроблена система іменування, що у сполученні із системою адресації встановлює однозначний вибір сервера і документа, що вимагається. Практично для цих цілей використовується так називана URL-адреса. У результаті здійснюється з'єднання з документом або ресурсом. Коли користувач указує на гіпертекстове посилання в Web-документі, насправді виробляється запит на відкриття URL. У Web-документах установлюються гіперпосилання не тільки на інші Web-документи, але і на різні мережеві послуги.

Структура URL є типовою. Як приклад можна вказати URL одного з відомих провайдерів Internet: http://www.telecom.ru. У цьому URL http – протокол доступу до ресурсу, www – ім'я комп'ютера, telecom – домен другого рівня, ru – домен першого рівня. Більш докладно це питання буде розглянутий нижче.

Правила, за якими спілкуються між собою клієнти і сервери Web, називаются HTTP (HyperText Transmission Protocol – протокол передачі гіпертексту). Усі Web-програми повинні підтримувати HTTP для передачі і прийому гіпертекстових і гіперграфічних Web-документів і гіпермедіа. Стандартна мова, використовувана для створення і публікації Web-документів, називається HTML. Web-документи, створювані мовою HTML, зберігаються у файлах з розширеннями *.HTML або *.HTM. Вони являють собою текстові ASCII-файли з командами форматування, що містять інформацію про компонування документа: шрифтах, стилях тексту, заголовках, абзацах, списках і гіперпосиланнях. Можна використовувати в тексті HTML-документа вставки на мовах JavaScript і VBScript. Додатка CGI (Common Gateway Interface – стандартний шлюзовий інтерфейс) і ISAPI (Internet Server Application Programming Interface – інтерфейс прикладного програмування сервера Internet) дозволяють організувати зв'язок між документами HTML і СУБД для відображення інформації, що утримується в БД, і роботи з нею. При цьому існує можливість звернутися до СУБД через інтерфейс ODBC або через інтерфейс цієї СУБД, а результат запиту оформити у виді документа HTML і повернути користувачеві. Дані способи взаємодії з БД можуть застосовуватися при організації електронних публікацій з динамічно обновлюваними даними; наприклад, діаграма, що приводиться в якій-небудь публікації, буде динамічно обновлятися відповідно до вмісту БД.

Сторінки сервера WWW містять посилання на інші сторінки, оформлені або як спеціальним образом виділені текстові рядки, або як графічні об'єкти й органи керування. Сторінка може посилатися на сторінки, розташовані не тільки на самому сервері WWW, але і на будь-якому іншому, підключеному до мережі Internet. У тому числі можливі посилання на сервери інших служб Internet: Gopher і New (сервер новин), електронні поштові адреси (для відправлення повідомлень у процесі перегляду сторінки).

Сторінки сервера WWW можуть містити не тільки статичну, але і динамічну інформацію, наприклад, що витягається з бази даних шляхом запитів до неї. На сторінках сервера WWW організуються дискусії в реальному часі, причому як текстові, так і голосові, є можливість проведення відеоконференцій.

На серверах WWW розміщаються електронні публікації періодичних видань. Ці видання, на відміну від своїх паперових аналогів, мають можливість оперативного відновлення інформації, публікації її безпосередньо відразу після надходження, що підвищує актуальність їхнього використання як джерела інформації.

Коли Web-клієнт по URL шукає який-небудь документ на Web-сервері, сервер передає браузерові клієнта файл із вихідним текстом документа мовою HTML, браузер інтерпретує команди розмітки HTML і відповідно до них визуалізує документ на екрані монітора користувача.

Користувач установлює з'єднання із сервером WWW за допомогою спеціальної програми перегляду сторінок WWW-браузера (навігатора). Найбільш відомими браузерами є Netscape Navigator і Microsoft Internet Explorer. При установці з'єднання користувач вказує адресу сервера WWW. Додатково він може вказати шлях до файлу сторінки WWW, що повинна бути відображена після підключення до сервера. Отримана текстова сторінка (складена мовою HTML) інтерпретується браузером і відображається в його вікні. Потім з'єднання із сервером розривається. Якщо на сторінці є графічні зображення, то браузер повторно встановлює з'єднання із сервером, одержуючи від нього файли графічних зображень.

Можлива взаємодія користувача із сервером WWW в інтерактивному режимі. При цьому користувач може заповнити яку-небудь форму, що містить полючи для введення цифрової або символьної інформації, і передати її серверові, натиснувши на відповідну кнопку у формі. Сервер, одержавши дані з полів форми, запустить створену спеціально для цієї форми програму, що обробить отримані дані, динамічно сформує документ HTML і поверне його користувачеві.

Для створення і редагування HTML-документів є багато програм, який можна розділити на дві групи: автономні редактори і шаблони для текстових процесорів. HTML-редактори можуть бути з контролем синтаксису і без цієї функції. Перевага редакторів з контролем синтаксису в тім, що вони дозволяють створити коректний HTML-текст. Але при спробі відкрити документ, що містить нестандартні теги, цей редактор швидше за усе видасть повідомлення про помилку. HTML-редактори без контролю синтаксису не роблять перевірки коректності документа, але дозволяють застосовувати нестандартні теги. Серед редакторів з контролем синтаксису можна назвати HotMeta і HotDog.

Для створення компонентів Web-публікацій використовуються й інші програми-інструменти. Зокрема, редактори навігаційних карт – інструменти для побудови зображень Web-публікацій з виділеними областями, що відповідають гіперзв'язкам. Варто звернути увагу на такі особливості, як наявність різноманітних інструментальних засобів для визначення форми активних областей, можливість малювати активні області складної і довільної форми, функція масштабирования для точного сполучення активної області з визначеним фрагментом зображення, генерація вихідного тексту HTML, що спрощує процедуру доповнення сторінки навігаційною картою. У кращих програмах-редакторах навігаційних карт маються засоби для додання активним крапкам будь-якої форми, генерування HTML-сторінок і тестування в оперативному режимі. До них можна віднести: CrossEye (Software), LiveImage (Meditech), Web Hotspots (1Atomata) і багато хто інші. Найбільш відомими програмами створення і редагування Web-публікацій є Microsoft FrontPage 2000 і Macromedia Dreamweaver. Ці програми будуть розглянуті далі більш докладно.

Однак створені в тому або іншому програмному середовищі Web-документи або їхні компоненти можуть не проглядатися в програмах-браузерах Netscape Navigator і Internet Explorer або візуалізуватись з перекручуваннями. Це обусловлено різними можливостями браузерів по інтерпретації тегів THML, роботи з таблицями і т.д.

У зв'язку з цим багато програмістів або найбільш кваліфіковані користувачі Internet воліють підготовляти Web-документи безпосередньо в середовищі мови HTML, періодично перевіряючи результати своєї діяльності на відповідній програмі-браузері.

При розробці електронного документа приходиться враховувати ряд факторів, одним із яких є обмежена швидкість каналів зв'язку. Цей фактор приходиться враховувати, наприклад, при розробці дизайну електронної публікації. Для звичайної ілюстрації наявність кольорових ілюстрацій практично не позначається на тривалості пошуку необхідної інформації. Інша справа в електронних документах. Надлишок кольорових зображень і відеоінформації зв'язано зі збільшенням обсягу даних, розміщених на сторінці документа. Це приводить до уповільнення відображення документів або їхніх фрагментів на екрані монітора, обумовленому відносно низкою пропускною здатністю каналів зв'язку. У результаті користувач, кінцевою метою якого є пошук необхідної інформації, змушений витрачати час на перегляд матеріалу, що надалі може виявитися і непотрібним.

При підготовці електронних публікацій необхідно орієнтуватися на типову швидкодію устаткування, яким розташовують потенційні одержувачі публікацій, і потім при підготовці дизайну видання враховувати питання оптимізації взаємодії користувача з документом, у тому числі базуючи на результатах тестування процесу роботи з публікацією в рамках заданих значень продуктивності використовуваних технічних засобів.

Стосовно до Web-публікацій при створенні дизайну переданих сторінок звичайно орієнтуються на середні характеристики модему, швидкість якого складає до 1 Мбіт/с.

При поширенні документів на CD/DVD швидкодія комп'ютера як такого є менш значимим фактором, оскільки більшість комп'ютерів відображають сторінку швидше, ніж вона передається по мережі.

Особливо актуальна проблема швидкостей при передачі графічної інформації в публікації. Існує специфіка створення графічних зображень для World Wide Web, зв'язана з обмеженими палітрою і смугою пропущення Internet. При цьому необхідно шукати компроміс між високоякісною кольоровою графікою і тривалістю завантаження зображення з мережі Internet. Для того щоб забезпечити прийнятна якість зображення при мінімальному розмірі графічного файлу, служить ряд утиліт стиску, редагування, настроювання й оптимізації графіки Web.

До подібним до утиліт можна віднести редактори навігаційних карт (інструменти для побудови зображень Web з виділеними областями, що відповідають гіперзв'язкам), оптимізатори палітри (для пристосування палітри GIF до існуючого зображення, формування спеціалізованих палітр і застосування їх до груп файлів) і засобу анімації зображень (мультиплікаційний ефект при цьому досягається зв'язуванням декількох зображень).

Ці утиліти не заміняють основні програмні пакети створення і редагування зображення, однак доповнюють його і служать для оптимізації графіки з метою її використання на Web-сторінках.

Для використання звуку і відеозображення в електронних публікаціях також існують свої способи представлення і формати стиску, методи підготовки їхній до включення в електронні публікації.

Наприклад, якщо вимоги до відтворення підготовленого відеозображення не відповідають можливостям носія, то можна діяти за наступними правилами:

  • мінімізувати тривалість;

  • мінімізувати дозвіл;

  • мінімізувати частоту кадрів;

  • мінімізувати глибину кольору;

  • використовувати при зйомці статичну камеру (якщо камера рухається, те в кадрі відбувається зміна великої кількості інформації й алгоритми компресії стають малоефективними);

  • використовувати різку зміну кадру (зміна кадру з поступово змінюється прозорістю значно збільшує розмір файлу);

  • мінімізувати первісні перешкоди (якщо шум не можна придушити, те використовуються спеціальні фільтри);

  • зжати відеоінформацію і перевірити ступеня стиску.

Для представлення відеоданих на CD спочатку рекомендувалися наступні параметри: дозвіл – 320х280 пікселів, частота кадрів – 15 кадр/с, швидкість передачі – 300 Кбайт/с, глибина кольору – 16 біт. Для Internet: дозвіл – 160?120, частота кадрів – 10 кадр/з, глибина кольору – 8 біт. Аналогічні міри приймаються і при роботі зі звуком. Для представлення звуку на CD рекомендувалися: частота оцифровки – 22 Гц, ступінь стиску – 3:1, глибина кольору – 8 біт. Для Internet: частота оцифровки – 11 Гц, ступінь стиску – 5:1, глибина кольору – 8 біт. Зараз час ці параметри можуть бути в кілька разів вище.

Електронні документи використовуються й в інших сервісних службах Internet. Розглянемо деякі з них.

Сервери новин. Сервери новин являють собою засіб оперативного обміну різною інформацією між усіма користувачами мережі Internet. На сервері новин зберігаються так називані конференції, кожна з яких має свою тему. Підключивши до сервера новин, можна одержати список назв конференцій. Вибравши цікавлячу тему, можна в інтерактивному режимі переглянути список розташованих у ній статей, а також одержати текст потрібної статті. Крім текстових статей у конференціях зберігаються програмні файли, графічні зображення, аудіо- і відеозапису, а також інша інформація. У конференцію можна послати свою статтю, програму або будь-яку іншу інформацію. Як особливість деяких конференцій можна відзначити те, що при інтенсивному обміні думками послані в них статті зберігаються усього кілька днів. Таким чином, сервери новин можна вважати засобом для представлення й одержання електронних публікацій «оперативного» характеру.

Поштові сервери. Поштові сервери забезпечують передачу і збереження електронної пошти, яку можна розглядати як один зі способів поширення електронних публікацій. Крім тексту електронний лист може містити додаткові додатки у виді довільних файлів. При цьому двійкові файли для передачі перетворяться по визначених алгоритмах у текстові, а потім на прийомній стороні – знову в двійкові. Для коректної роботи такого механізму необхідна відповідність установок параметрів перетворення на передавальній і приймаючій сторонах, зокрема, при здійсненні кодування інформації. Таким способом можна передавати звукові листи в «конверті» електронного листа.

Сервери Gopher. На відміну від серверів FTP, здатних зберігати будь-які файли, сервери Gopher призначені для збереження тільки текстової інформації. Однак тексти тут зберігаються у виді, що допускає їхній перегляд в інтерактивному режимі.

Маючи доступ до сервера Gopher за допомогою браузера, користувач одержує можливість вибору з меню, що відбиває вміст розділів сервера. При виборі рядка такого меню здійснюється перехід у меню наступного рівня або в режим перегляду текстового документа. Документ може містити гіпертекстові посилання на інші документи, що спрощує навігацію.

Сервери Gopher зручно використовувати для збереження текстових статей, коротких заміток, документації або іншій аналогічній текстовій інформації. Однак у даний час сервери Gopher майже витиснуті серверами WWW, що мають більш широкі можливості.

ЗЗЗЗЗ Підготовка публікацій у середовищі Adobe Acrobat

Система для електронних документів Acrobat компанії Adobe Systems з'явилася в 1993 р. Програма Adobe Acrobat вважається лідером в області засобів універсального обміну документами, створеними в різних програмних середовищах. У той же час ця програма вплинула на способи створення і поширення електронних публікацій з вихідною текстовою основою. Acrobat будується за технологією PostScript, але деякі внутрішні зміни файлів Acrobat поліпшили досить вільну архітектуру PostScript, результатом чого стала висока якість підготовки публікацій. Вважається, що ця програма призначена для створення документів високоякісного дизайну. Документи створюються у форматі PDF (Portable Document Format), підтримуваному багатьма програмними системами підготовки видань.

Уміст PDF-файлу створюється не в Adobe Acrobat, а в інших програмах. Для цього можна скористатися текстовими редакторами, графічними пакетами, програмами верстки або інших додатків. Потім у режимі виводу результату створений документ перетвориться в документ формату PDF.

Для створення PDF-файлу в середовищі Acrobat використовуються дві програми: PDF Writer і Distiller. Таким чином, середовище створення Acrobat-документів включає ряд компонентів (рис. 2.7).

Рисунок 3.1 – Операція створення документа в Adobe Acrobat

Самий верхній містить Distiller (дистилятор) – програму, що транслює PostScript-файли в PDF-файли. Наступний рівень включає Exchange (обмін) і Catalog (каталог). Exchange надає користувачеві можливість компонувати, переставляти документи, додавати до них різні функціональні можливості. Програма Catalog використовується для створення індексних файлів документів.

Самим нижнім рівнем є Reader. Це програма зчитування, що відображає документи для користувача і підтримує функціональних можливостей у документах програми Acrobat. Acrobat Reader доступна для більшості комп'ютерних систем, до того ж Adobe Systems поширює її безкоштовно.

Найпростіший шлях створення PDF-файлу – перетворення PostScript-файлу за допомогою програми Distiller у PDF-формат. Користувачеві необхідно установити відповідні параметри, що керують процесом перетворення: рівень стиску формату JPEG для кольорових зображень або автоматичний режим створення сторінок.

Другий варіант створення PDF-файлів з вихідних документів передбачає використання PDF Writer, псевдопринтера (драйвера), що є частиною продукту Exchange. Програма PDF Writer активізується, як при печатці документа, і виробляє PDF-версію документа.

Вибір програми-виробника PDF-документів – PDF Writer або Distiller – залежить від характеру роботи, типу самого документа і його вмісту. PDF Writer використовується для швидкого перетворення у формат PDF простих ділових документів. Distiller застосовується для перетворення у формат PDF документів з PostScript-графікою (у форматі EPS-Encapsulated PostScript) і растровими зображеннями, що вимагають стиску або зміни розширення. Distiller дозволяє перетворювати документи Adobe FrameMaker, Adobe PageMaker, QuarkXPress або інших видавничих програм, здатних генерувати PostScript-файли професійної якості. Крім того, Distiller використовується для пакетної обробки файлів на диску комп'ютера або в мережі.

Як тільки первісні PDF-файли створені для кожного фрагмента документа, можна використовувати додаток Catalog для створення індексу для одного або більш документів і додаток Exchange для приміщення додаткової структури у файл. Це сама відповідальна операція в процесі перетворення. Саме тут вносяться елементи електронного видання в PDF-документ. До цих елементів можна віднести механізм підтримки перегляду, усілякі примітки, індексування і редагування зв'язків. У середовищі Exchange мається можливість включати в електронний документ зображення, що рухаються, (анімацію) і звукові кліпи (у Acrobat-документ). Exchange також дозволяє поєднувати документи, видаляти сторінки з документів або, навпаки, додавати них.

Таким чином, користувачеві надається можливість створювати документ посегментно і потім компонувати сегменти в документ. У цілому процес створення документів у Acrobat нагадує традиційний процес роботи над документом на додрукарській стадії, за винятком процесу створення зв'язків і додавання відео- і звукових компонентів електронного документа.

Acrobat-документи базуються на PDF-форматі. PDF – це міжплатформний формат файлів, що сумісний з будь-якими системами. Для перегляду PDF-документів використовується програма Acrobat Reader або Exchange. Якщо в Web-сторінку включається PDF-файл, то користувачам, що переглядають цей документ, може бути запропоновано звернутися до Web-сторінки Adobe Systems, де можна безкоштовно завантажити Acrobat Reader.

Формат PDF має наступні характерні риси:

  • PDF зберігає структуру, стиль, шрифти і текстовий формат оригіналу. PDF-документи коректно відображаються на всіх комп'ютерах незалежно від платформи й операційної системи. Опублікована у форматі PDF Web-сторінка буде завжди виглядати однаково, такою, якою її створив автор.

  • У PDF-файл можуть включатися текст і графіка, а також звук, відеокліпи, гіпертекстові посилання, інтерактивні поля бланків і інші елементи мультимедіа.

  • Для економії дискового простору PDF-документи підтримують стандарти стиску JPEG, CCITT4, CCITT3, ZIP і LZW.

  • PDF-файли можуть містити в собі шрифти для відображення вмісту або довантажувати шрифти під час перегляду за допомогою дескрипторів шрифтів, кожний з яких включає назву шрифту, параметри символу, опис стилю. Якщо необхідний шрифт відсутній на комп'ютері, де виробляється перегляд документа, то система здійснює підбір найбільш підходящого шрифту.

  • PDF-файл містить таблицю перехресних посилань (так називану xref), що дозволяє різко знизити залежність обробки посилань на об'єкти від кількості сторінок документа.

  • PDF-документи можна переглядати посторінково або друкувати безпосередньо з Web. Web-сервер дозволяє заощаджувати час, передаючи користувачеві для завантаження тільки запитану сторінку. Друкувати можна відразу весь документ або тільки сторінка на вибір. PDF зручний для публікації в Web великих електронних документів.

  • Для захисту PDF-документа від змін або обмеження доступу до важливих даних можна використовувати систему пароля. Пароль підвищує захищеність документа при публікації його в Internet.

  • Інструменти Acrobat Reader дозволяють змінювати масштаб перегляду PDF-сторінки. Це особливо зручно при роботі з графікою і складними діаграмами.

  • МодульWеb-пошука дозволяє складати індекси для PDF-документів з метою швидкого пошуку по мережі Web інформації, що утримується в них.

  • PDF-документ має трьохрівневу архітектуру:

1-й рівень: текст і зображення, що утримуються в документі.

2-й рівень: розширення, такі як закладки, гіпертекстові посилання, статті й ін.

3-й рівень: базова інформація (інформація про шрифти, таблиця перехресних посилань, інші структури забезпечення навігації документа).

Принципи оформлення екранних публікацій – завдання розміру сторінок, вибір шрифтів, кольору, дозволу, розробка макета – такі ж, як і при підготовці звичайних документів, але кожен елемент тут варто проаналізувати і при необхідності переробити для зручності перегляду його на екрані. У звичайних публікаціях під час обговорення питань, зв'язаних з кольором і дозволом, приходиться робити вибір між якістю і вартістю матеріалів, а електронна версія змушує вибирати між якістю зображення й обсягом відповідного файлу. Визначившись з найважливішими елементами сторінок, треба вирішити, які програми і який формат найкраще підійдуть для їхнього компонування.

У роботі на стадії додрукарського процесу з традиційними виданнями (на папері) бере участь колектив: складачі, коректори, редактори і верстальщики. При створенні електронних публікацій і видань також потрібна участь цих фахівців. Але крім зазначених необхідні ще фахівці, що мають досвід у створенні електронних видань, у першу чергу Web-дизайнери, фахівці зі сканування цифрових зображень, а також виготовлювачі дисків (CD-ROM). В області підготовки Web-документів замість фахівців з друку працюють Web-майстри, на яких покладені функції розробки загальної концепції Web-сайту і його практичної реалізації.

Хотілося б також відзначити розходження між електронною підготовкою традиційного видання до друку, при якій матеріали, необхідні для друкованої публікації, керуються і збираються за допомогою комп'ютера, і електронними публікаціями, при створенні яких використовуються авторські системи. Причому авторські системи є не тільки середовищем створення електронної публікації, але і визначають інтерфейс взаємодії споживача з публікацією і установлюють функціональні можливості публікації.

Авторські системи схожі на середовища програмування, тому що автор або розроблювач публікації повинний визначати компоненти інтерфейсу, відгуки на результати й операції, що буде виконувати публікація.

Завдяки точній передачі атрибутів форматування документа, компактному розмірові файлу, зручному пошукові текстової інформації, можливості друку і сумісності з відомими Web-браузерами документи у форматі PDF підходять для поширення документів по Web, у корпоративних мережах великих компаній, по електронній пошті і для публікації на CD-ROM.

ЗЗЗЗ Технологія Help-файлів

Однієї з найстарших технологій створення гіпертекстових документів є технологія Help-файлів. Первісне призначення даної технології – створення на її основі довідкових систем для розроблювальних програм. Якість довідкової системи є одним з вирішальних факторів вибору програми користувачем. Як правило, довідкова система містить всю інформацію, необхідну як для початківців, так і для досвідчених користувачів.

Звичайно довідкова система володіє наступними функціональними можливостями:

  • надання загальної інформації про призначення і застосування програмного продукту;

  • можливість використання меню і діалогових панелей;

  • методичні рекомендації з виконання різних процедур;

  • приведення прикладів виконання різних функцій і процедур;

  • глоссарій;

  • система пошуку інформації з контексту;

  • графічні ілюстрації.

Довідкові системи будуються по вже традиційній схемі і включають:

  • Розділи – фрагменти довідкової системи, що можуть містити як текстову інформацію, так і графічні зображення. Роздягнув має заголовок; ідентифікатор; набір ключових слів, по яких здійснюється пошук розділу; посилання на інші розділи.

  • Перехресні посилання, що представлені для користувача у виді виділеного кольором і підкресленням тексту або у виді графічних піктограм.

  • Зміст – окремий роздягнув довідкової системи, що описується спеціальним образом при створенні довідкової системи і містить прямі або непрямі посилання на всі інші розділи.

  • Органи керування. За допомогою органів керування здійснюється навігація по довідковій системі; спуск по ієрархічному дереву інтерфейсу; реалізація процедур відкоту з метою повернення на один з попередніх етапів пошуку і т.д.

Для розробки довідкових систем створено велику кількість спеціальних програмних засобів. Усю їхню сукупність можна розділити на дві групи: засновані на використанні MS Word і автономні. У програмних пакетах Doc-To-Help, RoboHelp 95, HelpBreeze і Help Workshop для генерування RTF-файлу, що є основою довідкової системи, застосовується текстової редактор Word (починаючи з Word 97 – це видавнича система). Зазначені програмні засоби вбудовують свої команди в меню Word і додають інструментальні панелі для дій, специфічних для довідкової системи. Інша група програмних пакетів – Help Magician Pro і ForeHelp – самостійна і немає необхідності у використанні MS Word. У цих програмних засобах реалізується концепція створення середовища розробки, максимально наближеної до остаточного варіанта створюваної довідкової системи.

Майже усі програмні засоби орієнтовані на роботу з операційними системами Windows. Програмам, що орієнтовані на використання програми Word, необхідна версія 7.0 і вище.

Програма Doc-To-Help (WexTech Systems Inc.) дозволяє створювати як друковану документацію, так і довідкову систему на базі єдиного вихідного тексту. Для визначення тим і переходів у файлі підказок Doc-To-Help використовує ієрархію заголовків документа, передбачену в пакеті MS Word. Doc-To-Help також використовує ієрархічну структуру для визначення закладки Contents (Зміст).

У цьому програмному середовищі існують можливості роботи з міні-кнопками і кнопками швидкого реагування. Можна реалізувати діалог редагування макрокоманди, у результаті чого продукт видає екранну довідку по кожній макрокоманді і її аргументах. Можливо також упровадження AVI-файлу.

Використанню Help-технологій при створенні гіпертекстових документів сприяє і високий рівень автоматизації в зазначених програмних середовищах, що якісно знижує рівень вимог до програмної підготовки користувача.

В даний час Help-технології широко використовуються для створення різноманітних електронних підручників і навчальних посібників.

У середовищі професіоналів існує думка, що можливості Help-технологій ще не до кінця розкриті. У зв'язку з цим у журналах по комп'ютерних технологіях і в Internet широко обговорюються сховані дотепер функціональні можливості цих технологій.

ЗЗЗЗМова Розмітки Гіпертексту

Гіпертекстовий WWW-документ може містити стилізований і форматований текст, графіку і гіперзв'язки з різними ресурсами Internet. Щоб реалізувати всі ці можливості, була розроблена спеціальна комп'ютерна мова, названа HyperText Markup Language (HTML), тобто, Мова Розмітки Гіпертексту.

Формат HTML де-факто обраний основним форматом представлення учбово-методичних матеріалів. Це обумовлено тим, що:

  • створення і редагування матеріалів можливо не тільки в спеціальних редакторах, але й у різних програмах для редагування текстів (від Блокнота до Microsoft Office);

  • підготовлені матеріали, без яких або додаткових модифікацій можливо розміщати в мережі Internet;

  • формат HTML підтримує включення різних мультимедійних елементів (графічних елементів, гіперпосилань, анімації, звуку, відео);

  • даний формат також містить у собі мови програмування JavaScript і VBScript, що дає додаткові можливості для підготовки учбово-методичного матеріалу.

ЗЗЗЗЗСкладові HTML-документа

Документ, написаний на HTML, представляє із себе текстовий файл, якому можна писати і редагувати за допомогою будь-яких текстових редакторів. Він містить у собі:

  • власне текст,

  • спеціальні послідовності символів,

  • теги розмітки.

Графічна і звукова інформація, що включається в HTML-документ за допомогою спеціальних команд, зберігається в окремих файлах. Програми перегляду HTML-документів, такі як, наприклад, Netscape Navigator, інтерпретують теги розмітки і розташовують текст і графіку на екрані відповідним чином. Для файлів, що містять HTML-документи, прийняте розширення .htm (на серверах з операційною системою DOS) або суффикс.html (на серверах з операційними системами UNIX, Windows 95/NT і ін.).

Текст. Послідовність символів, що складає текст, може складатися з пробілів, табуляцій, символів переходу на новий рядок, символів повернення каретки, букв, розділових знаків, цифр, і спеціальних символів (наприклад, +, #, $, @), за винятком наступних чотирьох символів, що мають у HTML спеціальний зміст:

< (Less Than)

> (Greater Than)

& (Ampersand)

" (Double Quote)

Символ табуляції, символ повернення каретки і символ переходу на новий рядок вважаються еквівалентними пробілу.

Зарезервовані символи представляються наступними послідовностями: Зарезервовані символи представляються наступними послідовностями:

< <

> >

& &

" "

Крім кодування зарезервованих символів, спеціальні послідовності служать для кодування букв національних алфавітів.

< <

> >

& &

" "

Крім кодування зарезервованих символів, спеціальні послідовності служать для кодування букв національних алфавітів.

Теги (Tags) призначені для форматування і розмітки документа. Кожен тег починається символом < і закінчується символом >. У назвах тегів рядкові і прописні букви вважаються еквівалентними. Наприклад, тег <br> може бути записаний як <BR>.

Існує два види тегів: парні і непарні. Дія будь-якого парного тега починається з того місця, де зустрівся відкриваючий тег і закінчується при зустрічі відповідного закриваючого тега (ознакою якого є символ /, що міститься відразу після < ) або кінця файлу. Наприклад, текст, що міститься за тегом курсивного накреслення <I> і триваючий до його закриваючого парного тега </I> виводиться на екран курсивом.

Непарний тег викликає "одиничну" дію в тім місці, де він зустрічається. Наприклад, тег <BR> служить для переходу на новий рядок при виводі тексту.

Багато тегів можуть включати додаткові параметри, або атрибути, що модифікують ефект даного тега, наприклад: <P> – тег початку параграфа, <P ALIGN=CENTER> тег початку параграфа, вирівняного по центрі вікна.

ЗЗЗЗ Структура HTML-документа

Типовий HTML-документ має головну частину і тіло. Початок документа відзначається тегом <HTML>, а кінець – тегом </HTML>.

Синтаксис

<HTML>

<HEAD><TITLE>...</TITLE>

</HEAD>

<BODY>...</BODY>

</HTML>

Головна частина документа (Head) є службовою. Вона звичайно містить у собі назву документа (див. далі). Крім того, в ній часто міститься <META>-інформація – ключові слова й опис документа, що читаються деякими програмами-роботами.

Синтаксис

<HEAD>...</HEAD>

Приклад

<HEAD><TITLE>MY Homepage</TITLE></HEAD>

На дисплеї

На дисплей разом з іншою частиною документа не виводиться

Назва документа (Title) міститься усередині його головної частини. Вона виводиться не разом із самим документом, а в смузі заголовка вікна програми перегляду. Воно також використовується і для інших цілей. Наприклад, коли програма перегляду створює так називану закладку, тобто запам'ятовує місцезнаходження документа, до якого ви збираєтесь надалі повернутися, цій закладці привласнюється ім'я, що береться з назви документа.

Поле title у документі є обов'язковим. Його не слід робити довшим ніж 64 символа. Назва документа повинна бути осмисленою, оскільки це поле читається програмами-роботами і заноситься в бази даних пошукових систем.

Синтаксис

<TITLE>...</TITLE>

Приклад

<HEAD><TITLE>MY Homepage</TITLE></HEAD>

На дисплеї

Виводиться окремо від самого документа в заголовку вікна переглядач^-переглядача-програми-переглядача

Тіло (Body) визначає "видиму" частину HTML-документа. У документі повинне бути тільки одне тіло.

Синтаксис

<BODY>...</BODY>

Приклад

<BODY>Це малюсінький HTML-документ</BODY>

На дисплеї

Це малюсінький HTML-документ.

Коментар (Comment) – це текст, що ігнорується програмою перегляду. Коментар призначений у першу чергу для самого автора документа і може містити дату створення, версію, зауваження і т.п. Коментарі можуть знаходитися в будь-якій частині документа, але не усередині тегів. На дисплей не виводиться.

Синтаксис

<!-- текст_коментарю -->

Зауваження: у виді коментарю в HTML-файл можуть бути поміщені різні інструкції для WWW-сервера й інших службових програм. Наприклад, при відповідній настройці WWW-сервера коментар <!--#exec cgi="/cgi-bin/counter"-->, включений у HTML-файл, буде викликати запуск програми counter щораз, коли хто-небудь "бере" цей файл із сервера.

ЗЗЗЗЗ Теги форматування тексту

Параграф (Paragraph). Тег параграфа може використовуватися і як парний, і як непарний тег. Він служить ознакою початку нового параграфа (тобто, абзацу). Програма перегляду виводить перед початком параграфа порожній рядок і починає параграф з нового рядка.

У сформованій практиці використання мови HTML як атрибут тега початку параграфа <P> можна задати параметр ALIGN, що установлює вирівнювання (виключку) параграфа по лівому полю, центру або правому полю. Якщо цей параметр не задавати, вирівнювання проводиться по лівому полю.

Синтаксис

  • Як непарний тег: <P>

  • Як парний тег: <P>...</P>

  • З указівкою вирівнювання:

    • по лівому полю: <P ALIGN=LEFT>

    • по центру: <P ALIGN=CENTER>

    • по правому полю (підтримується не всіма програмами перегляду): <P ALIGN=RIGHT>

Приклад

<P>Це перший параграф<P ALIGN=RIGHT>Це другий.

<P>А це – третій.

<P ALIGN=CENTER>Цей параграф вирівняний по центрі</P>

На дисплеї

Це перший параграф.

Це другий.

А це – третій.

Цей параграф вирівняний по центру.

Зауваження: прийом, коли для збільшення відстані між параграфами вводять декілька послідовних тегів <P><P><P>, не є правильним з погляду мови HTML і не буде підтримуватися в майбутньому. Тому автори не рекомендують використовувати його при форматуванні документа. "Правильна" програма перегляду "стисне" декілька повторюваних тегів <P> в один.

Горизонтальна лінія (Horizontal Rule) звичайно використовується для поділу тексту на логічні частини. На місці цього тега малюється горизонтальна лінія. Зверніть увагу, що даний тег завершує поточний параграф і викликає перехід на новий рядок.

У сформованій практиці використання мови HTML тег <HR> часто використовується з декількома параметрами, що визначають довжину лінії по горизонталі в пікселах або процентних частках ширини екрана (WIDTH), її ширину в пікселах (SIZE), положення на екрані (ALIGN) – ліворуч, по центрі, праворуч, – а також вид (атрибут NOSHADE виводить лінію чорного кольору).

Синтаксис

<HR>

<HR ALIGN=LEFT|CENTER|RIGHT SIZE=nn WIDTH=mm | mm% NOSHADE>

Приклад

Перша логічна частина<HR>Друга<HR><P ALIGN=CENTER>

Третя<HR ALIGN=CENTER WIDTH=50%>

Як виглядає на дисплеї

Перша логічна частина.

Друга.

Третя.

Заголовки (Headings) використовуються для виводу заголовків і підзаголовків. Усього доступно шість рівнів, від 1 до 6, у порядку убування їхньої значимості. Рекомендується, щоб кожен документ містив заголовок першого рівня (звичайно ця назва документа, що може і не збігатися з назвою, поміщеною в поле title). Стандарт мови не рекомендує "перестрибувати" через рівні, тобто, наприклад, використовувати заголовок третього рівня після заголовка першого рівня. Це може "спантеличити" деякі програми перегляду і послужити причиною неправильного форматування документа. Також, цього "не люблять" конвертер^-конвертери-програми-конвертери з формату HTML в інші формати.

За допомогою необов'язкового параметра ALIGN заголовок може бути вирівняний ("виключений") по лівому полю, центрові або правому полю.

Тег заголовка, на відміну від тега параграфа, повинний використовуватися тільки як парний тег.

Синтаксис

Без вирівнювання

<H1>...</H1>

<H2>...</H2>

<H3>...</H3>

<H4>...</H4>

<H5>...</H5>

<H6>...</H6>

З вирівнюванням

<H1 ALIGN=LEFT>...</H1>

<H1 ALIGN=CENTER>...</H1>

<H1 ALIGN=RIGHT>...</H1>

(для інших п'яти рівнів аналогічно)

Приклад використання (див. практикум)

Зауваження: майте через, що деякі програми перегляду самі вибирають стиль представлення заголовків кожного рівня, наприклад курсивний шрифт і невеликий відступ від лівого поля для заголовка <H3></H3>. Навіть та сама версія програми Netscape під Windows і під UNIX буде показувати вашу сторінку по-різному (у UNIX розміри букв звичайно менше). Помнете, що як автор, ви не можете цілком контролювати засобами HTML вид вашого документа у вікні програми перегляду.

Нумерований список (Ordered List) служить для представлення інформації у виді пронумерованого списку. Кожен елемент списку (List Item) виводиться програмою перегляду з нового рядка, на початку якої автоматично проставляється порядковий

Синтаксис

<OL>

<LI>...

<LI>...

...

</OL>

Приклад використання (див. практикум)

Ненумерований список (Unordered List, Unnumbered List) використовується для представлення інформації у виді простого списку. Кожному елементові списку на екрані звичайно передує символ, іноді називаний "куля" (bullet).

Синтаксис

<UL>

<LI>...

<LI>...

...

</UL>

Приклад

<UL>

<LI>Це – перший елемент списку<LI>Другий елемент.

<LI>Третій елемент.

</UL>

Як виглядає на дисплеї

  • Це – перший елемент списку.

  • Другий елемент.

  • Третій елемент.

Меню (Menu List) використовується для представлення інформації у виді меню, у якому кожен запис займає один рядок. Це дозволяє зробити список більш компактним у порівнянні з конструкцією <UL>...</UL>. Формат такого списку залежить від використовуваної програми перегляду HTML-документа, однак багато програм перегляду використовують <MENU> як "синонім" <UL>. Кожному елементові списку на екрані звичайно передує символ "куля".

Синтаксис

<MENU>

<LI>...

<LI>...

...

</MENU>

Приклад

<MENU>

<LI>Це – перший елемент меню.<LI>Другий елемент.

<LI>Третій елемент.

</MENU>

Як виглядає на дисплеї

? Це – перший елемент меню.

? Другий елемент.

 Третій елемент.

Глосарій (Definition List). Як випливає з назви, цей формат використовується для оформлення глосаріїв. Терміни (terms) містяться в рядки, що починаються тегом <DT>, а визначення (definitions) – у рядки, що починаються <DD>. Уся конструкція оточується тегами <DL> і </DL>. Програма перегляду виводить терміни і визначення по-різному, наприклад, терміни без відступу, а наступні за кожним з них визначення – з відступом від лівого поля. Якщо в <DL> заданий атрибут COMPACT, деякі програми перегляду виводять визначення термінів на одному рядку із самими термінами.

Синтаксис

<DL>

<DT>...<DD>...

<DT>...<DD>...

...

</DL>

Приклад

<DL>

<DT>Верхів'я

<DD>Частина ріки, близька до її джерел.

<DT>Вестибуль

<DD>Велике приміщення, що відокремлює вхід від внутрішніх частин будинку.

</DL>

Як виглядає на дисплеї

Верхів'я

Частина ріки, близька до її джерел.

Вестибуль

Велике приміщення, що відокремлює вхід від внутрішніх частин будинку.

Зауваження: не слід використовувати тег <DD> для створення відступу. Наприклад, програма перегляду Arena виділяє вміст <DT> жирним шрифтом, за яким відразу ж (без перекладу рядка) випливає вміст <DD>.

Вкладені списки (Nested Lists). Списки одного або різних типів можуть бути вкладені один в іншій. Необхідно бути особливо уважним при розташуванні тегів початку і кінця кожного списку! Щоб не помилитися, зручно записувати елементи вкладеної конструкції з невеликим відступом, як показано в наступному прикладі.

Приклад

<OL>

<LI>Це перший елемент пронумерованого списку. Він містить вкладений список.

<UL>

<LI>Перший елемент вкладеного списку.

<LI>Другий.

<LI>Третій.

</UL>

<LI>Другий елемент пронумерованого списку.

</OL>

Як виглядає на дисплеї

  1. Це перший елемент пронумерованого списку. Він містить вкладений список.

    • Перший елемент вкладеного списку.

    • Другий.

    • Третій.

  2. Другий елемент пронумерованого списку.

Теги, що задають фізичні стилі тексту

Синтаксис тега Жирний шрифт (Boldface)

<B>...</B>

Приклад

Натисніть клавішу <B>Enter</B>, коли ви готові.

Як виглядає на дисплеї

Натисніть клавішу Enter, коли ви готові.

Синтаксис тега Курсив (Italics)

<I>...</I>

Приклад

Є дані, що <I>de facto</I> він є керівником цієї організації.

Як виглядає на дисплеї

Є дані, що de facto він є керівником цієї організації.

Синтаксис тега Текст із підкресленням (Underline)

<U>...</U>

Приклад

Є дані, що <u>de facto</u> він є керівником цієї організації.

Як виглядає на дисплеї

Є дані, що de facto він є керівником цієї організації.

Варто мати на увазі, що більшість програм перегляду використовує підкреслення для виділення гіперпосилань, тому ми б не рекомендували використовувати тег підкреслення, щоб не заплутати читача.

Підрядкові і надрядкові індекси

Підрядкові і надрядкові індекси (Subscripts and Superscripts) широко використовуються при написанні математичних і хімічних формул. На жаль, теги, що здійснюють форматування надрядкових і підрядкових символів, у стандарті HTML 2 відсутні.

Проте багато програм перегляду вже довгий час підтримують теги, що наведені нижче і можна сподіватися, що вони будуть включені в найближчий стандарт мови.

Синтаксис

Підрядковий індекс:

<SUB>...</SUB>

Надрядковий індекс:

<SUP>...</SUP>

Приклад

SO<SUB>4</SUB><SUP>2-</SUP> + Ba<SUP>2+</SUP> = BaSO<SUB>4</SUB>

Як виглядає на дисплеї

SO42- + Ba2+ = BaSO4

Розмір і колір шрифту

(Font Size and Color)

У стандарті мови HTML 2 засоби керування розміром і кольором шрифту відсутні, так що описаний у цьому розділі тег <FONT> є нестандартним розширенням HTML.

Розмір шрифту виражається в деяких умовних одиницях, що змінюються від 1 до 7, і задається за допомогою атрибута SIZE тега FONT. Можна задати або абсолютний розмір, або його зміна щодо розміру, встановленого в програмі перегляду за замовчуванням (такому розмірові приписують значення 3). Колір ділянки тексту задається за допомогою атрибута COLOR.

Синтаксис

Абсолютний розмір:

<FONT SIZE="nn">...</FONT>

де nn – розмір шрифту в довільних одиницях (від 1 до 7).

Відносний розмір:

<FONT SIZE="+nn">...</FONT>

або

<FONT SIZE="-nn">...</FONT>

де nn – число пунктів, на які шрифт буде збільшений (зменшений) щодо шрифту, прийнятого за замовчуванням.

Колір:

<FONT COLOR="#RRGGBB">...</FONT>

де RR, GG і BB характеризують частки, відповідно, червоний, зелений і синій компонент у кольорі, яким буде виділена частина тексту, що розташована між відкриваючим і закриваючої тегами. Значення RR, GG і BB виражаються в шестнадцятерічній системі числення.

Приклад

<font size="-2">Привіт! </font>Привіт!! <font color="#FF0000" size="+4">Привіт!!!</font>

Як виглядає на дисплеї

Привіт! Привіт!! Привіт!!!

Зауваження: тег FONT варто застосовувати з великою обережністю. По-перше, він не підтримується багатьма програмами перегляду. Крім того, програми-роботи не вміють правильно працювати з виділеним текстом і не розуміють заголовки, створені за допомогою <FONT>, а не <H1>. Нарешті, виділений кольором текст може виявитися невидимим, якщо на комп'ютері користувача встановлена "невдала" палітра.

Документ, написаний на HTML, являє собою текстовий файл, що містить власне текст, що несе інформацію читачеві, і теги розмітки (markup tags). Теги являють собою визначені стандартом HTML послідовності символів, укладені між знаками < і >. Згідно тегам розмітки програма розташовує текст на екрані, включає в нього малюнки, що зберігаються в окремих графічних файлах, і формує гіперзв'язку з іншими документами або ресурсами Internet. Файл мовою HTML приймає "гіпертекстовий вигляд" тільки тоді, коли він інтерпретується програмою перегляду. Давайте для ілюстрації сказаного розглянемо короткий приклад.

Зразок

<html>

<head><title>A Simple HTML Document (title)</title>

<meta name="Microsoft Border" content="none, default">

</head><body><h>A Simple HTML Document</h1>

<p>A document to be published on the

Web can include the following features (картинка):

<ul>

<li>Stylized text <li>Inline images <img SRC="face.gif" ALT="Face" WIDTH="32" HEIGHT="32">

<li>Links to other information

</ul>

<p>To assist the authors

in writing Web pages, many useful <a HREF="http://www.yahoo.com/Computers_and_Internet/">

utilities</a> have been designed.

</body>

</html>

Як ми бачимо, цей нехитрий документ починається з тега <HTML>, що повідомить програмі перегляду, що даний файл – це документ мовою HTML. Закінчується документ тегом </HTML>, що є закриваючої тегом, парним тегу <HTML>.

Далі – між тегами <HEAD> і </HEAD> – випливає головна частина документа, усередині якої, між тегами <TITLE> і </TITLE>, знаходиться назва документа. Назва виводиться не разом із самим документом, а в смузі заголовка вікна програми перегляду (title bar), а також використовується і для інших цілей.

Потім – між тегами <BODY> і </BODY> – міститься основна частина документа, так називане тіло.

Між тегами <H1> і </H1> розташовується заголовок (heading), що програма перегляду виводить великим і/або жирним шрифтом.

Тег <P> відзначає початок параграфа, текст якого виводиться з нового рядка. Кожному параграфові передує порожній рядок. Зверніть увагу на те, що довжина рядка тексту, виведеного програмою перегляду, у загальному випадку, не збігається з довжиною рядка у вихідному HTML-файлі і визначається розміром вікна програми перегляду і розміром символів шрифту, що ця програма використовує для виводу тексту.

Теги <UL> і </UL> відзначають початок і кінець так називаного непронумерованого списку (unnumbered list), кожному елементові якого передує тег <LI> (list item). Кожен елемент списку програма перегляду виводить з нового рядка і випереджає символом .

Тег <IMG SRC="face.gif" ALT="Face"> (image source) включає в документ зображення, що зберігається у файлі face.gif. Про графічні файли далі буде розказано більш докладно. Атрибут ALT="Face" задає так називаний альтернативний текст (у даному випадку, Face), що неграфічні програми перегляду виводять на екран замість відповідного малюнка. Цей же текст буде видний, якщо в графічній програмі перегляду відключити автоматичне завантаження зображень (що звичайно робиться при повільній роботі мережі).

Тег <A HREF= "http://www.yahoo.com/Computers_and_Internet/"> відзначає початок якоря гіперпосилання (hyperreference anchor), або, як його називають частіше, якоря гіперзв'язку (hyperlink anchor). Атрибут HREF="URL" указує URL документа, на який робиться посилання. Синтаксис URL, розглянутий вище (стор. 11), цілком збігається із синтаксисом URL у гіперзв'язках. Зверніть увагу: URL гіперпосилання розташований у подвійних лапках, – їхній пропуск є досить частою помилкою починаючих авторів. Якір гіперпосилання закінчується тегом </A>. Як ми вже говорили, програма перегляду виділяє якір з навколишнього тексту кольором і/або підкресленням і/або жирним шрифтом. Коли покажчик миші знаходиться на якорі, то він звичайно приймає вид вказівного перста (у чому ви можете переконатися, підвівши покажчик до будь-якого найближчого якоря в тексті). Якщо в такий момент клацнути клавішею миші, то програма перегляду почне завантажувати зв'язаний з цим якорем документ.

Гіперзв'язок із сервером електронної пошти (Mail Server)

Більшість програм перегляду дозволяє відправити електронний лист за адресою, що вказується в HTML-документі, що переглядається. Синтаксис "поштового" якоря нагадує синтаксис якоря груп новин, розглянутого вище. Для роботи із сервером електронної пошти програма перегляду читача документа також повинна бути попередньо настроєна.

Синтаксис

<A HREF="mailto:електронний_адреса">Якір</A>

ЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗЗ

Як ми вже говорили вище, файл із документом, закодованим мовою HTML, – це текстовий файл. Графічну інформацію, що відноситься до даного документа, розміщають не в самому HTML-файлі, а в окремих файлах; при цьому в HTML-файл поміщають спеціальні команди включення графіки. Ці команди вказують програмі перегляду з яких файлів зчитувати графічну інформацію і як розташовувати малюнки на екрані.

Для успішної роботи з графікою необхідно ознайомитися зі способами представлення графічної інформації і з основними форматами графічних файлів. У даному невеликому розділі неможливо розповісти про всіх особливостях роботи з графікою, тому ми приводимо лише дані і ради, покликані допомогти спочатку.

Кодування графічної інформації. Існують два основних способи кодування графічної інформації: векторний і растровий. При векторному, на якому ми не будемо докладно зупинятися, Рисунок представляється у виді комбінації простих гПКетричних фігур – крапок, відрізків прямій, окружностей, прямокутників і т.п. При цьому для повного опису малюнка необхідно знати вид і базові координати кожної фігури, наприклад, координати двох кінців відрізка, координати центра і діаметр окружності й і. д.. Цей спосіб кодування ідеально підходить для малюнків, що легко розкласти на найпростіші фігури, наприклад, для технічних креслень.

Растровий спосіб, з яким нам необхідно ознайомитися докладніше, полягає в тім, що все зображення по вертикалі і горизонталі розбивається на досить дрібні прямокутники – так називані елементи зображення, або пікселі (Picture Element = pixel або pel). У файлі, що містить растрову графіку, зберігається інформація про колір кожного піксела даного зображення. Чим менше прямокутники на які розбивається зображення, тим більше дозвіл (resolution), тобто, тим більше дрібні деталі можна закодувати в такому графічному файлі.

Розмір (size) зображення, що зберігається у файлі, задається у виді числа пікселів по горизонталі (width) і вертикалі (height). Для орієнтування вкажемо, що на дисплеї IBM PC з відеокартою VGA можна розмістити растровий Рисунок з максимальним розміром 640х480, тобто, 640 пікселів по горизонталі і 480 по вертикалі. Монітори комп'ютерів з відеокартою SVGA звичайно використовують дозвіл 800х600 і вище.

Крім розміру зображення, важливої є інформація про кількість кольорів, закодованих у файлі. Колір кожного піксела кодується визначеним числом біт (bit), тобто елементарних одиниць інформації, з якими може мати справа комп'ютер (див. також стор. 25). Кожен біт може приймати два значення – 1 і 0. У залежності від того, скільки біт відведений для кодування кольору кожного піксела, можливе кодування різного числа різних кольорів. Неважко зміркувати, що якщо для кодування відвести лише один біт, те кожен піксел може бути або білим (значення 1), або чорним (значення 0). Таке зображення називають монохромним (monochrome). Далі, якщо для кодування відвести чотири біти, то можна закодувати 24=16 різних кольорів, що відповідають комбінаціям біт від 0000 до 1111. Якщо відвести 8 біт – то такий Рисунок може містити 28=256 різних кольорів (від 00000000 до 11111111), 16 біт – 216=65536 різних кольорів (так називаний High Color). І, нарешті, якщо відвести 24 біта, те потенційно Рисунок може містити аж 224=16777216 різні кольори і відтінку – цілком достатньо навіть для самого вимогливого художника! В останньому випадку кодування називається 24-bit True Color, або іноді Millions of Colors. Варто звернути увагу на слово потенційно: навіть якщо у файлі і приділяється 24 битка на кожен піксел, це ще не означає, що ви дійсно зможете насолодитися такою багатою палітрою – адже технічні можливості моніторів обмежені.

Формати графічних файлів. Для збереження растрової графічної інформації було розроблено багато різних форматів графічних файлів, що відрізняються способом збереження кольору пікселів малюнка, а також можливостями розміщення у файлі додаткової інформації. Для нас найбільший інтерес представляють наступні чотири формати: Windows Bitmap, оскільки він є "рідним" для Microsoft Windows, GIF і JPEG, оскільки саме вони найбільше широко застосовуються для збереження малюнків на WWW-серверах, а також новий формат PNG.

Windows Bitmap (BMP – "би-эм-пи") – це досить простий формат, що передбачає запис кольору пікселів, що йдуть послідовно ліворуч праворуч і знизу нагору. Файли з графікою в цьому форматі звичайно мають розширення .bmp. Інформація про колір кожного піксела зберігається у виді послідовності біт; для кожного піксела у файл міститься рівно стільки біт, скільки використовується для кодування його кольору. У результаті розміри таких графічних файлів досить великі. Наприклад, файл, що містить 256-цветный Рисунок 500х400 буде мати розмір трохи більший, ніж 500х400х8=1600000 біт =200000 байт=195 кілобайт, а якщо це Рисунок з кодуванням кольору 24 бітами, то розмір складе майже 600 кілобайт. Формат цей цікавий для нас тільки тому, що в ньому вміють зчитувати і записувати графікові більшість графічних програм для Microsoft Windows, починаючи із самої найпростішої – Paintbrush – і закінчуючи професійними типу Adobe PhotoShop. У результаті, цей формат може бути використаний для переносу графіки з однієї програми в іншу.

Формат GIF ("джиф") був розроблений спеціально для пересилання графічних файлів по мережах CompuServe. Файли в цьому форматі мають розширення .gif. У середньому, розмір файлу з кольоровим зображенням у форматі GIF складає від 10 до 50 відсотків від розміру файлу з тим же зображенням у форматі BMP, описаному вище. Компактність запису досягається завдяки використанню спеціальних алгоритмів кодування, що дозволяють значно зменшити розмір файлу при повному збереженні всієї графічної інформації. Формат GIF ідеально підходить для монохромних і 16-кольорових малюнків, а також 256-кольорових малюнків (а більше 256-ти кольорів у цьому форматі і не збережеш), не утримуючої великої кількості дрібних деталей.

Формат PNG (Portable Network Graphics) з погляду користувача схожий на GIF, але забезпечує приблизно на 30% більш щільний стиск, більш швидке декодування і збереження параметрів гамма-корекції, що забезпечують високу вірність відтворення колірної гами при переході з однієї комп'ютерної платформи на іншу. Крім того, у ньому можна зберігати зображення 24-bit True Color. Поки ще цей формат розповсюджений не дуже широко, але вже рекомендований консорціумом WWW як стандарт і можна екати, що незабаром він у значній мірі замінить GIF. В даний час єдиною програмою перегляду, здатної відображати малюнки у форматі PNG, є Arena. Версія 3.0 програми Netscape Navigator не здатна розшифрувати PNG-файли і для їхнього перегляду вимагає установки якої-небудь зовнішньої програми (external viewer), у якості якої можна використовувати одну з графічних програм, обговорюваних нижче (про програми-помічників див. також стор. 23).

Формат JPEG ("джейпег") був запропонований наприкінці 80-х Об'єднаною Групою Експертів в Області Фотографії і відразу ж завоював загальну вдячність. Файли з графікою в цьому форматі мають розширення .jpg. Цей формат забезпечує досить високий ступінь стиску файлів з кольоровими малюнками (значно переважаючої можливості GIF) при незначній утраті колірної інформації. Програми, що вміють зберігати файли у форматі JPEG, дають можливість задати ступінь збереження інформації при стиску. При виборі величини останньої у випадку високих вимог до якості малюнка випливає поэкспериментировать, установлюючи різний ступінь збереження інформації і зчитуючи отриманий файл програмою перегляду, домагаючись при цьому прийнятного компромісу між розміром файлу і якістю зображення. У більшості випадків прийнятним виявляється якість, що дається використовуваної вами графічною програмою за замовчуванням. При використанні формату JPEG варто пам'ятати наступне:

  • JPEG абсолютно не підходить для монохромних зображень.

  • У зв'язку з тим, що перетворення в цей формат супроводжується втратою частини колірної інформації, таке перетворення необхідно виконувати тільки один раз після повної підготовки файлу з малюнком перед приміщенням його на WWW-сервер. Не слід зберігати в цьому форматі робочі версії малюнка між сесіями редагування (для цього застосовуйте BMP або GIF, або інші формати в залежності від використовуваного програмного забезпечення).

Які ж ради можна дати авторам, щоб їхні документи могли бути проіндексовані найбільше ефективно?

  • Оформляйте документ у повній відповідності з форматом мови HTML 2, перевіряючи правильність мови за допомогою програм перевірки. Досвід ведення документації на сервері одним з авторів показує, що після виправлення усі формальних помилок документи починають запитуватися набагато частіше!

  • Перевірте документ на відсутність орфографічних помилок. Не використовуйте абревіатури і (особливо в англомовних документах) неіснуючі слова, наприклад, crystallochemistry замість crystal chemistry. Помнете, що по таких словах ніхто ваш документ шукати не буде!

  • Придумайте коротке і информационно-насыщенное назву (title) і заголовок (header). Назву напишіть латинськими буквами, бажано англійською мовою. Оформите заголовок за допомогою <H1>...</H1>.

  • Помістите найбільш істотну інформацію в початок документа, витісняючи деталі в кінець.

  • Не використовуйте рамки (frames) і зображення-карти (imagemaps) без необхідності, оскільки роботи поки не вміють обробляти цю інформацію.

  • Допишіть у розділ <HEAD>..</HEAD> META-інформацію по наступному зразку:

<HEAD>

<TITLE>...</TITLE>

<META NAME="description" CONTENT="тут помістите короткий опис вашої сторінки – у тім виді, у якому б ви хотіли його бачити показаним пошуковими системами">

<META NAME="keywords" CONTENT="тут помістите всі стосовні до документа ключові слова (або ключові фрази), розділені комами, так, щоб одне слово не використовувалося більш семи разів">

</HEAD>

Короткий опис і ключові слова варто писати по-англійському, тому що досить велика кількість пошукових систем поки не розуміє інформацію російською мовою. Довжина полів CONTENT формально не повинна перевищувати 1000 символів, але розумно – принаймні для розділу description – обмежитися 200 символами, тому що пошукові системи не відображають більший обсяг інформації.

Порадьтеся зі своїм системним адміністратором, чи варто зареєструвати документ в одного або декількох роботів. Часто ця робота робиться самим системним адміністратором.