- •Лекция 1. Идеология и основные принципы построения ресурсов web – пространства.
- •1. Введение в гипертекстовую технологию web и общие принципы построения гипертекста.
- •Определения и особенности гипертекста
- •Общая характеристика мультимедиа и различные формати даних
- •2. Исторические аспекты языков разметки sgml, html, xml, (X)html. Объявление типа документа (dtd).
- •История sgml, html, xml, xhtml
- •3. Классификация сайтов и гипертекстовых документов.
- •Приведем классификацию сайтов по следующим показателям:
- •По физическому расположению:
- •Информационные ресурсы:
- •Классификация Web-документов
2. Исторические аспекты языков разметки sgml, html, xml, (X)html. Объявление типа документа (dtd).
Язык разметки должен определять ряд специальных инструкций, правил и соглашений для описания структуры элементов документа и отношений между элементами этой структуры.
Специальные инструкции, их еще называют маркерами или тэгами, в структурированных документах должны определенным образом кодироваться, то есть выделяться среди основного текста.
Их главное назначение — служить управляющими инструкциями для программных средств обработки структурированных текстов.
Остановимся на истории возникновения таких языков разметки как SGML (Standard Generalized Markup Language, стандартный обобщенный язык разметки), HTML (HyperText Markup Language, язык разметки гипертекстов) и XML (eXtensible Markup Language, расширяемый язык разметки).
История sgml, html, xml, xhtml
Прародителем языков разметки является SGML (Standardized Generalized Markup Language, универсальный стандартизованный язык разметки). Хотя SGML был создан еще в начале 60-х, он был утвержден международной организацией по стандартизации (International Standards Organisation, ISO) в качестве стандарта ISO 8879:1986 ”Information processing. Text and office systems. Standard Generalized Markup Language(SGML)” только в 1986 году.
Незначительная популярность SGML обусловлена тем, что этот язык достаточно (сравнительно) сложен.
Разметка, определяемая в рамках SGML, основывается на двух постулатах:
1) разметка должна описывать структуру документа, а не указывать, что с документом или его частями должно происходить;
2) разметка должна быть строгой, чтобы программы и базы данных могли быть использованы для хранения и обработки размеченных документов.
Основным компонентом структурированного текста является элемент. Таким образом, можно сказать, что каждый структурированный документ состоит из некоторого набора семантических элементов, связанных друг с другом по определенным правилам.
Синтаксическое представление элемента документа показано на Рис. 1.
Рис. Пример SGML-элемента.
Тело элемента (содержательный текст) обрамляется открывающим и закрывающим маркерами. Каждый маркер состоит из имени элемента, уникального для элементов одинаковой семантики, и может иметь некоторое количество атрибутов. Атрибуты предназначены для более детального описания текста среди семантически однородных элементов.
Чтобы документ являлся синтаксически корректным с точки зрения SGML, необходимо, чтобы его разметка подчинялась некоторому набору правил, определяемых стандартом ISO. Одно из правил состоит в том, что допускается лишь полная вложенность одного элемента в другой. Таким образом, в каждом документе всегда будет один корневой элемент и некоторое количество иерархически вложенных элементов.
Виды документов. Для интерпретации текста, размеченного SGML, необходим специальный DTD-файл (Document Type Definition), в котором описаны все элементы разметки языка (в дальнейшем будем называть их тегами).
Однако, существование DTD позволяет автору документа создавать свои уникальные теги. Браузеру необходимо только указывать путь к DTD-файлу, и он становится способен адекватно отображать SGML-документ.
В 1991 году Тимом Бернесом-Ли, был разработан DTD, который был "вмонтирован" в браузер, содержал небольшое количество тегов и предназначался для разметки технической документации. Так появился на свет HTML (Hyper Text Markup Language, язык разметки гипертекста). Таким образом, HTML, является одной из реализаций SGML (или SGML-приложением).
Со времени (момента) своего создания HTML постоянно развивался. Однако разработчики последующих версий HTML постоянно отходили от начальной концепции языка. HTML все больше и больше превращался из языка разметки в язык оформления документа, где не обязательно указывать, каким структурным элементом является тот или иной текст, а достаточно указать, как он должен отображаться на экране. Ко всему набор тегов HTML до сих пор весьма ограничен (и, так как, нет доступа к модификации его DTD - не дополняем).
World Wide Web Consortium. Видя необходимость упорядочить разработку HTML, Бернерс-Ли в 1994 году основал World Wide Web Consortium (W3C). W3C продолжает надзирать за HTML и связанными с ним Web-технологиям и выпускает обновленные и стандартизованные версии HTML в виде публикаций, которые с 1995 года называются рекомендациями (Recommendations).
Консорциум W3C принимает меры к тому, чтобы вернуть HTML на путь истинный. Во-первых, создание каскадных таблиц стилей дало авторам надежное решение для указания стилевой информации и для хранения ее отдельно от содержимого документа. Кроме того, с появлением каждой новой рекомендации HTML элементы и атрибуты, относящиеся к представлению, объявляются устаревшими и, наконец, окончательно выводятся из употребления.
Названые выше причины послужили тому, что компания Sun Microsystems осуществила разработку языка XML (Extensible Markup Language, расширяемый язык разметки). XML, также, как и HTML, является SGML-приложением. Однако в отличие от HTML, позволяет создавать собственные DTD (то есть, фактически, собственные теги), не содержит средств для оформления документа, и в отличие от SGML достаточно прост и удобен.
Хотя XML и более перспективный язык для разметки документов, однако распространенность и простота HTML объясняют его лидирующее положение при выборе средств разработки HTML-документов.
Когда была выпущена рекомендация XML, консорциум W3C получил модернизированный и ориентированный на Web стандарт для создания языков разметки. И поэтому неудивительно, что одной из главных задач стала переработка HTML; (SGML-приложения ) в XML-приложение. Результатом стал XHTML.
XHTML (Extensible Hypertext Markup Language). В контексте XML XHTML - это язык для описания содержимого гипертекстовых документов, которые должны просматриваться или читаться в каком-либо клиенте-браузере. Данный язык использует DTD, в котором определяются такие элементы, как абзацы, заголовки, списки и гиперссылки. Используется пространство имен http://www. w3.org/1999/xhtml.
В контексте Web-дизайна XHTML - это обновленная версия HTML, а также современная рекомендация W3C для создания Web-страниц. Эта рекомендация включает те же элементы и атрибуты, что и Рекомендация HTML, но там, где HTML был создан в соответствии с более свободными правилами SGML, XHTML был переписан в соответствии с синтаксисом XML. Это означает, что XHTML-документы должны быть хорошо сформированными, а это требует использования практики создания более строгой разметки. XHTML на данный момент является доминирующим способом использования XML в Web.
XHTML – это переработка HTML в соответствии с требованиями XML, то есть в нем используется тот же словарь (элементы и атрибуты) как в HTML, но синтаксические правила взяты из XML, который является более строгим языком, чем HTML.
Подробную и более новую информацию вы можете найти на сайте W3C w3c.org/MarkUp.
Три разновидности HTML и XHTML. Хотя у W3C есть представление о том, как HTML должен работать, они также понимают, что должно пройти какое-то время, прежде чем старые браузеры выйдут из употребления и Web-авторы начнут форматировать документы должным образом. По этой причине рекомендации HTML и XHTML включают в себя три немного разных документа-спецификации: «Strict» (Строгий), «Transitional» (Переходный) и еще один, предназначенный только для документов с фреймами. В этих документах, которые называются определениями типа документа (DTD) определяется каждый элемент, атрибут и сущность, а также правила их использования. DTD для XHTML написаны в соответствии с правилами и соглашениями XМL, a DTD HTML используют синтаксис SGML. Браузер использует данные DTD для «расшифровки» разметки и проверки ее допустимости.
Варианты DTD. Strict (Строгий) DTD. Из этой версии исключены все устаревшие элементы и атрибуты с целью обеспечения разделения структуры документа и его представления. В идеале теги документа должны описывать только смысл и структуру документа, а все представление должно реализовываться таблицами стилей.
Transitional (Переходный) DTD.Данный DTD включает в себя все устаревшие элементы и атрибуты для обеспечения обратной совместимости с доставшимися в наследство возможностями многих браузеров. Устаревшие элементы считаются допустимыми, но их использование не поощряется. Данный DTD позволяет Web-авторам упростить переход от имеющихся привычек к следованию стандартам. Многие Web-авторы в настоящее время используют Transitional DTD, пока индустрия ждет, когда современные браузеры обеспечат совершенную и единую поддержку CSS, а старые браузеры сойдут со сцены.
Frameset DTD.Данный DTD включает в себя те же элементы, что и Transitional DTD, с добавлением элементов, предназначенных для создания Web-страниц с фреймами (frameset, frame и noframe). Frameset DTD стоит особняком, поскольку структура документа с фреймами (где элемент body заменен элементом frameset) имеет фундаментальные отличия от обычных HTML-документов.
Важно указывать, какую версию вы используете при помощи объявления DOCTYPE, поскольку современные браузеры используют эту информацию для включения «строгого» соответствия стандартам при форматировании. И конечно, если вы указали DTD, вам необходимо строго следовать ему в документе, чтобы документ был допустимым (иными словами, не нарушать никаких правил, заданных в DTD).
