- •Введение в html Рэй Данкан
- •Html: общие сведения.
- •Команды структуры.
- •Команды форматирования текстового потока.
- •Команды форматирования заголовков.
- •Команды форматирования символов.
- •Команды форматирования списков.
- •Специальные символы
- •Команды вставки графики.
- •Команды гипертекстовых связей.
- •Как связаться с автором.
Специальные символы
Спецификация HTML определяет набор символов для документов HTML как набор 8-разрядных однобайтовых символов ISO 8859/1, который также известен как Латинский алфавит N 1 (Latin-1). Это набор из 256 символов, который содержит много графических элементов и символов с диакритическими знаками, необходимых для текстов на большинстве европейских языков, в том числе и на английском. Младшие 128 кодов символов ISO 8859/1 практически те же, что и в ASCII, и этот поднабор иногда называют International Reference Version, или ISO-646.
На практике из-за ограниченного набора символов клавиатуры и в целях переносимости на другие процессоры и платформы большинство документов HTML содержат знаки только из первой половины кодовой таблицы ASCII. Но в издательской деятельности часто необходимы многие иные символы, например с диакритическими знаками или преобразованные другим способом, значки валют, торговой марки и копирайта, не входящие в набор ASCII. Кроме того, нам понадобится какой-то способ вывода символов, которые могли бы быть интерпретированы как части команд форматирования HTML: < (меньше), > (больше), & (амперсанд) и " (кавычка).
Чтобы сделать это, HTML предусматривает специальные "escape-последовательности", которые могут использоваться для кодирования символов, не входящих в таблицу ASCII, и ограничителей команд HTML. В спецификациях HTML эти escape-последовательности называются символьными объектами (character entities). Вот наиболее важные из них:
Escape-последовательность |
Отображается как |
< |
< |
> |
> |
& |
& |
" |
" |
Специальные символы могут также кодироваться цифровой escape-последовательностью, где число соответствует коду символа ISO 8859.
Escape-последовательность |
Отображается как |
< |
< |
> |
> |
& |
& |
" |
" |
© |
© |
® |
® |
Полный список escape-последовательностей весьма длинен; лучший перечень содержится в спецификации HTML 2.0, которая доступна в виде гипертекста во многих узлах системы WWW (попробуйте сперва http://info.cern.ch).
Отметим, что, согласно спецификации HTML, escape-последовательности для специальных символов чувствительны к регистру символов. Но некоторые программы просмотра (в том числе Netscape Navigator) воспринимают символы верхнего регистра так же, как и нижнего.
Команды вставки графики.
Одно из самых захватывающих свойств WWW - ее мультимедиа-возможности, т. е. вставка рисунков, пиктограмм, видеоклипов и звука наравне с текстом и представление результатов в визуально насыщенном, привлекательном и цельном виде. Эта базовая ориентация на графику, как я полагаю, - главная причина стремительного взлета World-Wide Web, появившейся в 1994 г. буквально из ничего и практически сразу затмившей своих чисто текстовых предшественников, медленно росшей глобальной сети клиентов и серверов Gopher.
Однако безболезненная интеграция графики, которую ощущают пользователи программы просмотра Web, скорее кажущаяся, чем реальная. С точки зрения автора документа, правильная работа с графикой требует огромных расходов времени. Ведь нужно решить множество проблем: приобретение информации и соблюдение прав собственности, эстетические проверки корректности гипертекстовых связей, технические вопросы работы с графическими форматами и отображения палитры и, наконец, чрезвычайно важные вопросы производительности.
На простейшем уровне графические элементы вставляются в текст с помощью управляющего кода <IMG>. Он содержит унифицированный адрес ресурса URL, определяющий действительное положение графического объекта в отдельном файле, и некоторые подробности его вывода на экран. Другими словами, графика на самом деле не включается в документ HTML, а вызывается по ссылке. Адрес может быть абсолютным или относительным, так что сам графический объект может находиться или на той же машине, что и обращающийся к нему документ HTML, или на любом другом адресуемом сервере Web, или даже на собственном жестком диске пользователя. Полный вид кода <IMG> такой:
<IMG SRC="URL" [ALIGN=TOP|MIDDLE|BOTTOM] [ALT="text"]>
Когда пользователь просматривает документ HTML, программа отдельными транзакциями извлекает все графические объекты, упоминающиеся в документе, и затем объединяет их в выводимый объект в соответствии с дополнительным параметром выравнивания (по умолчанию - BOTTOM). Необязательный параметр ALT задает текст, который будет выведен вместо рисунка программами просмотра Web, работающими только в текстовом режиме, например Lynx. Большинство графических программ просмотра могут работать со встраиваемыми изображениями нескольких типов, в том числе с JPEG-файлами, растровыми изображениями формата X и GIF-файлами из CompuServe. Чаще всего используется формат GIF, хотя из-за недавних юридических разборок положение в 1996 г. может быстро измениться.
Давайте посмотрим простой пример встраиваемой графики. Приведенный ниже фрагмент в документе HTML отображает графический файл JOHNDOE.GIF в левой части окна просмотра, а текст "John Doe" - в правой, при этом линейка, на которой располагается текст, будет находиться на половине высоты рисунка.
<P>
<IMG SRC="JOHNDOE.GIF" ALIGN=MIDDLE>
John Doe<P>
Заметьте, что адрес графического файла - относительный, так что программа просмотра будет пытаться найти его там же, где и сам документ HTML, содержащий ссылку на него.
Проверка адреса и вопросы производительности - больное место для мультимедиа-публикаций Web. Поскольку документы HTML и их встроенная графика в действительности находятся в разных файлах на сервере Web, ссылка на файл в документе и реальный файл легко могут рассогласоваться. Путешествуя по сети, вы часто можете видеть, что ваша программа просмотра Web отображает вместо некоторого вставляемого рисунка обобщенную пиктограмму, означающую: "Я не могу найти нужный файл по адресу, указанному в коде <IMG>". Могут происходить и менее серьезные ошибки, например, когда содержимое графического файла было исправлено или полностью изменено после создания документа HTML, содержащего на него ссылку, либо когда при коллизии имен файлов на удаленной системе или при ошибке в задании адреса будет показано не то изображение. Когда в Web появятся более сложные авторские системы,, проблемы этого рода, несомненно, станут менее значительными.
Проблемы производительности в обозримом будущем тоже никуда от нас не уйдут. Несколько килобайт кодированного текста HTML могут превратиться во многие страницы форматированного текста на экране, но даже крохотный графический объект с 256 цветами, отличный от пиктограммы, займет как минимум несколько килобайт, а полноэкранная картинка легко может потребовать более 100 Кбайт. Несложно представить, до чего замедлится производительность программы просмотра при интенсивном использовании графики, особенно для тех пользователей, кто связывается с Internet с помощью модема со скоростью 14,4 кбит/с и соединения SLIP или по арендованной линии с пропускной способностью 56 кбит/с.
Первая широко используемая программа просмотра Web - Mosaic 1.0.3 - не позволяла пользователю делать что-либо, пока все графические файлы, упоминаемые в документе HTML, не будут получены, если только загрузка рисунков не была отменена полностью. Когда я впервые начал использовать Mosaic, у моей фирмы было только относительно низкоскоростное (56 кбит/с) соединение со скелетом Internet. Помню, как я скрипел зубами в ожидании, пока Mosaic покажет рассредоточенный между пиктограммами, большими картами и рисунками документ Web, созданный бездумным автором на машине с мультимегабитным доступом к Internet, наивно полагающим, что и все остальные в мире имеют такой же.
Программы просмотра второго поколения, такие, как Netscape Navigator, до некоторой степени обходят проблему производительности, проводя получение графических файлов в "фоновом" режиме и позволяя пользователю листать текст документа или переходить к другому документу до окончания загрузки файла. Но как автор документов Web вы можете лучше позаботиться о читателе, используя графические элементы только там, где это действительно необходимо, и предусмотрительно помещая в документ маленькие копии ("thumbnail") иллюстраций, позволяющие быстро переключиться на свои полноразмерные оригиналы.