Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ в психологии / 1 / учебники / Н.В. Максимов, Л.И. Алешин - Информационные технологии - 2004.pdf
Скачиваний:
1032
Добавлен:
18.04.2015
Размер:
8.03 Mб
Скачать

Тема 17. Проектирование и сопровождение сайтов в Интернете

В 1969 году Тед Нельсон (Ted Nelson) предложил поистине революционную идею гипертекста, которой было суждено перевернуть весь информационный мир. По его замыслу, каждый термин в произвольно взятой информационной статье может быть связан с другой статьёй, подробно раскрывающей смысл этого термина, причём эта дополнительная статья в свою очередь также может содержать отсылки к другим материалам. В результате родилась идея «информационной сети», удачно реализованная в конце 80-х годов в виде Интернета,

использующая специальный язык HTML (Hypertext Markup Language –

язык гипертекстовой маркировки).

HTML и Интернет

Язык HTML – средство формирования гипертекстовых документов.

Гипертекстовый документ – файл, содержащий различные виды информации и имеющий в своей структуре ссылки (гиперссылки) на другие файлы или сам являющийся документом, на который есть ссылка в другом файле, расположенном на некотором сервере в любой точке планеты. Гипертекстовый документ, размещённый на сервере с использованием WWW, называют Web-страницей (веб-страницей).

Гиперссылка может представлять электронный адрес, текст, рисунок и т.п. Обычно фрагмент текста, являющийся гиперссылкой, выделяют цветом (отличным от основного) и подчёркиванием. Признаком наличия гиперссылки является изменение вида курсора мыши, оказавшегося на ней. Он становится похожим на ладонь руки с указательным пальцем.

Гипертекстовые ссылки встроены в текст документа и хранятся как его часть. Благодаря этому языку можно не только формировать гипертекстовые документы, но и осуществлять связь текста и изображения с документами, расположенными на другом веб-сервере. Гипертекстовая структура позволяет сократить путь к интересующей пользователя информации, даёт возможность ему самому решать, на что обратить внимание в каждом конкретном случае. Как правило, при такой структуре даже связанная информация подаётся маленькими порциями, что ускоряет переход к нужному фрагменту.

Структура гипертекстовых (HTML) документов формируется с помощью последовательности тегов – элементов языка HTML, включающих тексты в формате ASCII.

Тег или тэг (англ. «Tag») является признаком объекта, управляющим кодом. Любая страница начинается с тега <HTML> и заканчивается тегом </HTML>. Легко заметить, что теги представляют собой некоторые операторы (команды, дескрипторы), заключенные в

341

скобки типа «< >», причём ими начинается и заканчивается целая страница или некоторый фрагмент. В конце команды ставится слеж «/» с именем, используемым в её начале. Таким образом, первый дескриптор включает некоторое действие, а второй – его выключает. Это правило касается парных дескрипторов. Существуют операторы, не требующие их выключения (закрытия).

В качестве примера приведём запись следующих заголовков «Министерство культуры и науки Российской Федерации» и «Московский государственный университет», последовательно размещённых на одной странице. Она может выглядеть следующим образом:

<HTML>

<HEAD>

<TITLE> Министерство культуры и науки Российской Федерации

</ TITLE> </HEAD> <BODY>

Московский государственный университет

</BODY>

</HTML>

Ссылка обозначается парными тегами <a> и </a>. Кроме парных бывают разовые теги, например, для обозначения перехода на другую строку в одном абзаце используется непарный тег <br>. Для указания признака объекта и (или) его состояния к тегам добавляются атрибуты. Так, для ссылок в качестве атрибута используется адрес фрагмента текста в документе или собственно документа. Таким образом, команда на переход к другому ресурсу будет выглядеть следующим образом: <a href=”URL”>имя ссылки</a>.

Чтобы при установке мыши на пиктограмме появлялся поясняющий текст, следует в тэг (<a href=...) включить параметр (title="текст пояснения"), например,

<a href="help-1.htm" title= «Помощь и полезные советы»>.

В таком тексте не должно быть кавычек, символов «<» (меньше), «>» (больше), "/" и т.п. Их заменяют записями типа " < >.

Кроме того, используется CGI (Common Gateway Interface – общий шлюзовой интерфейс) – программа для связи HTML-браузеров с другими ПП и (или) текстами, находящимися на серверной стороне.

Создание и публикация (размещение) электронных документов, веб-страниц и веб-сайтов

Поскольку электронный документ создаётся и хранится на любом машинном носителе данных, то методы создания электронных документов для страниц, выставляемых на сайте, не отличаются от

342

методов создания документов прикладных программах, например, в любом текстовом редакторе. Более того, документ созданный в ряде компьютерных ПП, может быть сохранён в формате веб-страницы (HTML). Такой вариант наиболее приемлем для начинающих, так как созданные подобным образом страницы содержат добавленные в файла избыточные данные (лишние теги и служебная информация), ненужные для веб–страниц. Работать подобная веб-страница, конечно, будет, но медленно. Это особенно важно в Российском секторе Интернета, так как скорости работы в нём невелики и время загрузки такой страницы в браузер вызывающего её пользователя будет значительным. Поэтому для создания веб-страниц приспосабливают существующие простые текстовые редакторы, например, входящие в состав ОС Windows или используют специальные программы.

В первом случае порой так поступают те, кто давно привык создавать веб-страницы, хорошо владеет HTML, а научился создавать страницы именно в простейших редакторах, так как иных не имели возможности иметь. У профессионалов в этом случае веб-страницы получаются быстро и хорошо. Отстраивать их можно достаточно просто, если параллельно включить в автономном режиме программубраузер и периодически входить в неё для контроля результатов деятельности.

Во многих случаях целесообразно использовать специальные ПП, в которые по мере необходимости загружать материалы для вебстраниц, сделанные в других ПП, например, текст – в Word, табличные данные – в Excel, а графические объекты – в Photoshop и PowerPoint. Более того, такие программы позволяют ускорить создание страниц за счёт автоматизации ряда простых рутинных процедур, например, создания шаблона страницы и таблиц, изменения стилей и размеров шрифтов, цвета, включения наиболее часто используемых тегов и т.д., а также возможности не переходя в другую программу периодически просматривать полученные результаты. В качестве таких программ предлагаются многие ПП, например, FrontPage, Publisher, HomeSite, Dreamweaver, Noteped, Site_Cre и др.

Для проверки полученных результатов целесообразно воспользоваться несколькими распространенными браузерами, установленными на компьютере создателя сайта. Это необходимо не только для отладки создаваемого сайта, но и для того, чтобы учесть как разные браузеры отображают страницы и, при необходимости, внести соответствующие коррективы. Дело в том, что пользователи, которые будут заходить впоследствии на созданный сайт, использую разные браузеры. В ряде случаев, полученные ими изображения могут разочаровать и расстроить их, что приводит к нежеланию обращаться к такому сайту в дальнейшем.

Большинство веб-страниц оптимизировано для просмотра при разрешающей способности больше, чем 600х800 точек на дюйм, а

343

цветовом режиме High Color (16 разрядов) и более.

Рассмотрим основные аспекты создания веб-страниц сайта. Первая (главная, домашняя или по-английски «Home Page»)

страница – лицо сайта. На неё случайно или специально попадают («заходят») пользователи (посетители) Интернета. Обычно на первой странице размещаются элементы, обозначающие (идентифицирующие) её «хозяина» (название или имя, реквизиты, фото и др.), а также названия основных тем, ресурсов и услуг, предлагаемых сайтом. Последние представляют собой гипертекстовые ссылки к более подробным элементам иерархической структуры сайта, позволяющим пользователю быстро и удобно находить искомые информационные ресурсы, в том числе на других сайтах. Часто на первой странице устанавливаются: счётчик посещений, ссылки на партнёров, кнопки переключения на русский или английский язык и др. Рекомендуется не злоупотреблять фото- и мультимедиаматериалами, так как они увеличивают время загрузки страниц, что достаточно часто влечёт за собой отказ пользователя продолжать работу с таким сервером. Важным качественным показателем оформления страниц является их стилевое единообразие.

Обычно разработчики страницы (программисты и веб-дизайнеры) уделяют много внимания внешнему виду этих страниц. Для этого используются различные цвета и «обои» фоновых изображений, цветные иллюстрации, мультипликации, шрифтовые изображения, бегущая строка и др. В них включают аудио- и видео клипы. При этом объём пересылаемой по сети информации увеличивается и разработчикам приходится выбирать компромиссные решения, связанные с необходимостью обеспечения высокой скорости загрузки страницы на ПК пользователя и её дизайном.

Кроме дизайна первой страницы, пользователей в большей степени привлекает удобство пользования и возможность найти именно те данные, которые им нужны. Важно также организовать удобные переходы с одних страниц на другие (навигация по страницам сервера), чтобы пользователю не требовалось многократно повторять длительные промежуточные переходы, а также слишком часто возвращаться на первую страницу. Для удобства работы пользователей на сайтах создаются страницы с названием «Карта сайта».

Многие разработчики сайтов предлагают вести статистику посетителей (учитывать ресурсы, к которым наиболее часто обращается пользователь, и его мнение о них), а также размещать конференции (форумы и т.п.) для обсуждения различных проблем. При этом практически все обращают внимание на необходимость постоянной актуализации содержания сайтов.

«Жизнь» сайта определяется тремя составляющими:

1)его созданием,

2)дальнейшим обслуживанием и актуализацией,

344

3) хранением на сервере.

Планируя объём и содержание информации, выставляемой на сервере, следует хорошо представлять на каких пользователей она должна быть ориентирована, как они могут получить доступ к ней, каковы их потребности.

Созданные страницы сайта необходимо загрузить на сервер провайдера или собственный сервер, имеющий возможность работать в Интернете и предоставлять пользователям свои ИР. Если сервер известен (выбран), то необходимо получить на нём адрес сайта и место для его размещения. Адрес и место на сервере провайдера могут быть платными и бесплатными.

Так, в бесплатном варианте необходимо связаться по Интернету с этим сервером (набрать в адресной строке браузера его имя) и запустив не нём программу регистрации сайтов, ответить на все (или почти все) вопросы провайдера. При ответе на эти вопросы определяется имя сайта и пароль доступа к режимам управления им. Как только эти атрибуты будут получены, можно загрузить на него страницы созданного сайта. Загрузка заключается в копировании этих файлов на сервер через FTPсервер или специальное меню загрузки, представляемое провайдером для выполнения создателями сайтов необходимых действий с их сайтами.

Создание и сопровождение сайтов

Сайт размещается, как правило, на одном из серверов какого-либо провайдера. Создание и сопровождение сайта осуществляется через Интернет. Чтобы работать в Интернете, необходимо к нему подключиться (получить доступ). Для подключения к Интернету используют временное и постоянное соединение.

Временное подключение подразумевает использование коммутируемого телефонного канала для соединения ПК пользователя, на время его работы с провайдером в Интернете, (англ. «dial-up» – связь по вызову, сеансный доступ). Основными его недостатками являются периодические изменения скорости обмена данными и возможность обрыва сеанса связи, что в значительной степени характеризует качество отечественных коммутируемых телефонных каналов связи. Кроме того, целесообразно, чтобы модем пользователя максимально был подобным модему, используемому провайдером.

Постоянное подключение характеризуется использованием выделенных телефонных или иных прямых проводов (в том числе радиоканала), а также специальных модемов (обычно, синхронных) для подключения с их помощью к центральному компьютеру провайдера и работы в Интернете. Этот способ является единственно возможным для организаций, создающих сайты, порталы и т.п. на своей территории и

345

обеспечивающие их круглосуточную работу, предоставляя пользователям доступ к различным ИР. Кроме этих факторов, постоянное подключение обеспечивает более высокую пропускную способность и надёжность работы, чем временное. Однако его реализация может быть связана с решением значительных технических и финансовых проблем. Данный способ с помощью маршрутизатора позволяет подключить к собственному сайту значительное количество компьютеров. В этом случае организация, его использующая, может стать субпровайдером информационных услуг.

На первом этапе создания собственного сайта возможен и компромиссный вариант, когда его копия находится на сервере провайдера. В этом случае связь с сайтом может осуществляться по коммутируемому каналу, а при необходимости непосредственного соединения с организацией канал блокируется от разъединения, и работа ведётся как бы по выделенному каналу.

Хранить копию собственного сайта на некотором сервере (зеркальное отражение сайта) предпочтительно и в случае постоянного подключения организации к выбранному ей провайдеру. Заметим, что смена провайдера не является чем-то необычным или сложным и зависит от качества и стоимости услуг, предоставляемых конкурирующими организациями – провайдерами Интернета. Проблема в большей степени заключается в уведомлении пользователей о смене доменного адреса сайта. Однако при правильном подходе к данной проблеме смена адреса может и не понадобиться. Суть вопроса заключается в том, чтобы в адресе сайта не присутствовало имя сервера провайдера. Решение этой задачи заключается в оплате услуг провайдера за выделение уникального доменного имени. Например, библиотека имени Есенина в г. N подключилась к провайдеру «aha.ru» и получила имя «libE@N.aha.ru». В тоже время она могла запросить выделение ей адреса, например, «Esenina_lib@N.ru». В этом случае смена провайдера может не отразиться на адресе сайта.

Всё чаще на сайтах формируют и предлагают пользователям тематические страницы, поддержка (актуализация) которых требует постоянного внимания, однако не связана с большими финансовыми и трудовыми расходами. Подобной деятельностью занимаются Вебмастера и соответствующие специалисты. Последние являются, например, редакторами страниц и несут ответственность за их содержание (контент). Если сайт, например, предполагается установить на сервере провайдера, то подготовленные в согласованной с провайдером форме «страницы» пересылаются ему и там размещаются. В случае необходимости их достаточно просто обновить подобным же образом. При этом провайдеры выделяют на своём сервере для такого сайта бесплатное пространство (от 500 Кб до несколько десятков Мб).

Создание собственного сервера с размещением его на сервере провайдера (компромиссный, гибридный вариант) может оказаться

346

выгодным вариантом для организаций, не способных сразу обеспечить себе выделенный канал, а также платить значительные средства за создание собственного сервера на своей территории. Основные затраты приходятся на его создание, а также оплату до нескольких сотен долларов в месяц за его размещение у провайдера. При этом можно создать сайт в одном месте, хранить в другом, а вносить изменения с третьего места. Последнее может быть связано, например, с работой Веб-мастера, в обязанности которого входит внесение новых материалов, удаление устаревших, обновление ссылок и исправление ошибок в работе сайта.

Организация собственного сервера и размещение на нём вебстраниц требует значительных финансовых затрат и постоянной поддержки его в актуальном состоянии силами соответствующих специалистов. Это могут быть программисты, Веб-дизайнеры, администраторы и др. Такие серверы работают круглосуточно, что также является проблемой для некоторых организаций. Отметим, что Веб-дизайнер или Веб-мастер занимается главным образом созданием веб-страниц, привлекательных и информативных для пользователей. Подготовка обычных веб-страниц – процедура, доступная многим благодаря широко распространённому ПО, а также таким текстовым редакторам, как Word, WordPad и др.

Обычно минимальная стоимость создания сервера равна нескольким тысячам долларов (компьютер, УБП, модем, выделенная линия, специальное программное обеспечение и др.), а ежемесячная оплата канала и поддержки работы сервера – несколько сотен долларов.

Индексация, метаданные

Не малую роль в продолжительном существовании сайта играет его посещаемость, определяемая, в первую очередь, грамотной регистрацией его в наиболее известных и посещаемых поисковых машинах, например, «Рамблер» и «Яндекс». Такая регистрация называется индексацией сайта. Индексация сайтов осуществляется поисковыми системами в большей степени с учётом заголовков на главной странице сайта и ключевых слов, размещённых в тексте файла этой страницы. Последние прописываются на языке HTML в поле метаданных – мета тег <meta name = «keywords» CONTENT=" ">.

Ключевые слова отделяются друг от друга запятой.

Терминологически метаданные определяются как «данные о данных», используемые для осуществления поиска ресурсов, вывода результатов поиска, управления ресурсами, взаимодействия с ними и в других процессах. Идея метаданных возникла в начале 1990-х годов и была связана с необходимостью идентификации, поиска и нахождения сетевых ресурсов.

Рейтинг зарегистрированного сайта можно определить, например,

347

с помощью Rambler’s Top100 (top100.rambler.ru), SpyLog (www.spylog.ru) One.ru (www.one.ru) и др.

Яндекс осуществляет индексацию следующим образом. Когда поисковая машина обнаруживает новую или измененную страницу, она её индексирует: страница разбивается на элементы (текст, заголовки, подписи к картинкам, ссылки и так далее), содержание которых заносится в индекс. При этом учитываются позиции слов (их положение в документе или его элементе). Сам документ в базе не хранится, так как Яндекс создает компактный индекс.

Рекомендуемое максимальное число символов для содержимого тега <TITLE> – примерно 60.

О метаданных для ключевых слов было сказано выше. Описание страницы также следует включать в метаданные:

<META NAME="description" CONTENT=" ">.

Автоматическое реферирование электронных данных в Интернете

Как отмечалось во второй теме, даже в узкоспециальной предметной области ныне настолько значительны массивы данных, что их не в состоянии обработать ни один специалист. Ряд специалистов, исследователей процесса аналитической обработки информации, полагает, что процедуры традиционного анализа информации будет постепенно заменяться специальными компьютерными программами, где аналитик в интерактивном режиме имеет возможность использовать свой интуитивный и формальный опыт работы.

Методы автоматизированного анализа текстов применяются не так давно. К ним в основном относится тематическое рубрицирование потока документов со статистическим подсчётом встречаемых слов и словосочетаний. Для автоматизации процедуры рубрицирования применяют так называемые авторубрикаторы.

Сжатие (свёртывание) документов имеет большое практическое значение для многих. Сочиненные людьми тексты обладают одинаковой структурой. Эту закономерность обнаружил и сформулировал Джорж Зипф (G. K. Zipf) в 1949 году. Благодаря ему, компьютеры научились «понимать» смысл текста и самостоятельно выделять ключевые слова. Сегодня все поисковые системы используют в своей работе присущие текстам закономерности.

Последовательность действий такова:

1.Выбирают текст-источник – любой текст, посвящённый исследуемой теме.

2.Помещают его в левое окно приложения «Анализатор текстов»

инажимают кнопку «ОК». Программа вычислит в этом тексте частоту вхождения каждого слова и выведет результат в правом окне. Цифры напротив слов – количество упоминаний этих слов в тексте. Из рассмотрения программа исключает стоп-словамалозначащие слова:

348

«на», «в», «и», «не» и т.д.

Формируют запрос. Для этого выбирают диапазон слов, ориентируясь на их частоту вхождения в исследуемом тексте. Рекомендуется брать слова из середины списка. Например, аналогично варианту, представленному на рис. 17-1.

Теперь эти слова можно включить в запрос поисковой машины (через логическое «ИЛИ» или пробел) для поиска документов, посвящённых этой теме, подобных этому документу или использовать опции «Анализатора» для создания из текста-источника его реферата.

0047 - ### stop-

 

 

 

 

words###

слова0001

 

-

флажок

0006

 

-

 

0004

 

-

текст

0001

-

устроены

0003

 

-

текстов

0001

-

уровнем

0002

 

-

частоту

0001

-

умолчанию

0002

 

-

слов

0001

 

-

теме

0002

-

ключевые

0001

 

-

тексты

0002

-

источник

0001

 

-

текстам

0002

 

 

-

0001

 

-

текста

закономерности

0001

 

-

такое

0002

 

-

если

0001

 

-

такова

0002

-

выбираем

0001

 

-

таким

0002

- вхождения

0001

 

-

такие

0002

 

-

весьма

0001

 

 

-

0002 - анализатор

сформулировал

0001

 

-

языке

0001

 

-

стоп

0001

 

 

-

0001

 

-

список

эффективен

0001

- сочиненные

0001

 

-

эти

0001

-

снимите

0001

 

-

хотите

0001

 

-

смысл

0001

 

 

-

0001

 

-

следует

формируем

0001 - ситсеме

0001

 

 

-

 

 

 

 

формирования

 

 

 

 

Рис. 17-1. Таблица частот вхождения слов в текст, полученная в результате его автоматического анализа

В результате лучшие программы позволяют создавать смысловые портреты (рефераты) обрабатываемых текстов на основе количества упоминаний и близости встречаемости различных значащих, по мнению программы, слов.

Оценку полученных результатов в любом случае осуществляет человек. При этом процесс преобразования информации из документной

349

Соседние файлы в папке учебники