Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник_Палагута.doc
Скачиваний:
10
Добавлен:
13.11.2019
Размер:
6.6 Mб
Скачать

1.4. Мови розмітки – тенденції розвитку

Комп’ютері технології передбачають обробку двох типів файлів: бінарних і текстових. Бінарний файл є послідовністю бітів – нулів і одиниць, що записані обробляючою програмою і лише цією програмою можуть бути прочитані. У бінарних файлах зберігаються як власно данні, так і метадані (meta data) – інформація про інформацію. Наприклад, програма Microsoft Word створює бінарні файли зі стандартним розширенням doc, у яких крім текстової інформації зберігається опис параметрів форматування документа - до яких фрагментів тексту які параметри форматування слід застосовувати. Опис параметрів форматування і є метаданими, виконується за правилами, що визначаються певною програмою (у даному випадку програмою Word), тому можуть бути прочитані та оброблення лише даною програмою. Бінарні файли швидко обробляються, ефективні з точки зору зберігання метаданих. Недоліком бінарних файлів є належність їх певній обробляючій програмі, що спричиняє труднощі в організації обміну інформацією.

Текстові файли, як і бінарні, утворюються послідовністю бітів, що стандартним образом перетворюються на числа, яким відповідають певні символи. Завдяки стандартам текстові файли можуть бути прочитані багатьма додатками, у тому числі різними текстовими редакторами. На початку свого розвитку Інтернет здійснював обмін переважно текстовою інформацією. Як бачимо, бінарні файли мають такі переваги, як простота розуміння відповідною програмою, можливість зберігання метаданих, а текстові – універсальність і взаємозамінність.

Бурхливий розвиток комп’ютерних технологій і, в першу чергу глобальної мережі Інтернет, обумовив потреби у таких форматах даних, які поєднували б універсальність текстових файлів і можливості зберігання метаданих у файлах. Пошуки такого універсального формату тривають постійно, протягом усього часу розвитку комп’ютерних технологій програмісти шукають шляхи обміну інформацією між різними програмами і системами.

Однією з більш ранніх спроб об’єднати універсальність з широкими можливостями зберігання інформації була мова SGML (Standard Generalized Markup Language – стандартна узагальнена мова розмітки). У 1986 році Міжнародна організація по стандартизації (International Organization for Standardizations, ISO) прийняла перший стандарт ISO – 8879 Standard Generalized Markup Language. SGML - це основана на текстовому форматі мова, яка може використовуватися для розмітки даних. Мова SGML була розроблена як стандартна мова розмітки даних для будь-якої потреби і застосовувалася переважно у великих системах управління документами. При роботі з великої кількістю складних даних SGML виявилась досить складною мовою, що, незважаючи на її потужність, не сприяло достатньому розповсюдженню цією мови у практику.

На основі SGML створено мову HTML (HyperText Markup Language – мова розмітки гіпертексту), яка виникла і отримала широке розповсюдження завдяки бурхливому розвитку такого сервісу Інтернет, як World Wide Web. Мова HTML вирішує дві основні задачі:

описує гіпертекстову інформацію (тобто різнорідні дані на одній сторінці – текст, малюнки, мультимедіа тощо) так, щоб у будь якому браузері Web – сторінка виглядала однаково;

організує взаємозв’язок між сторінками за допомогою гіперпосилань.

На теперішній час мова HTML стала практично стандартом, головним інструментом розробки Web – сайтів. HTML – документи вмішують крім власно інформації, що розповсюджується, подається у World Wide Web і метадані – теги, які описують параметри форматування фрагментів документа, тобто визначають їх зовнішній вигляд у браузері.

Незважаючи на широке успішне розповсюдження мови HTML сфера її застосування обмежена – подання інформації у браузері. Використовувати HTML – документи як джерело інформації для подальшої обробки із застосуванням різних програм практично неможливо. Однак, у Інтернеті циркулює величезна кількість файлів – документів, невимірні потоки даних. Ці данні потребують не лише зображення, а і обробки – об’єднання масивів, зберігання, пошуку потрібних даних, формування різних вихідних документів по запитах користувача. Вирішення цих задач і покладено на мову XML (Extensible Markup Language – розширювана мова розмітки), яка стала стандартом починаючи з 1998 р.

Мова XML зосереджується на описі даних, а не параметрів їх форматування. XML – документи вміщують, крім власно інформації, опис даних – метадані, що характеризують їх структуру, взаємозв’язки елементів даних. Ці метадані дають змогу за допомогою різних програмних інструментів обробити XML – документи при розв’язанні різних задач. До таких інструментів належать мови XPath, XSLT, XQuery та ін. Іноді кажуть, що XML – це не мова, а стандарт для створення мов, які задовольняють критеріям роботи з XML – документами.

XML – технології на теперішній час переживають бурхливий розвиток, активно застосовуються у багатьох сферах людської діяльності, у тому числі і в економіці.