Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ все ответы 13-53[1].doc
Скачиваний:
12
Добавлен:
25.09.2019
Размер:
332.8 Кб
Скачать
  1. Гипертекстовые технологии.

Гипертекст — это организация текстовой информации, при которой текст представляет собой множество фрагментов с явно указанными ассоциативными связями между этими фрагментами.

Основная идея гипертекстовых технологий состоит в том, что поиск документальной информации происходит с учетом множества взаимосвязей, имеющихся между документами, а значит, более эффективно, чем при традиционных методах поиска.

Гипертекст можно рассматривать как своеобразную базу данных, которая организуется в виде открытой, свободно наращиваемой и изменяемой сети, узлы которой (линейные тексты) соединяются самим пользователем. От обычной базы данных гипертекст отличается прежде всего тем, что в нем отсутствуют априорно заданные ограничения на характер связей (как, например, в иерархических структурах).

Элементы гипертекста (текстовые фрагменты) называются узлами. Узлы, между которыми возможен переход, считаются смежными, а сама возможность перехода называется связь. Совокупность смежных узлов образует окрестность данного узла.

Последовательно соединенные связями узлы образует цепь. Характер связей между узлами может быть различным. Переход может осуществляться между: текстом и комментарием к нему, между разными редакциями текста, между текстом и его возможными продолжениями, между текстами, отвечающими или возражающими друг другу, между текстами пересекающимися по содержанию и т. д.

Создание гипертекста состоит, прежде всего, в формировании системы переходов от узла к узлу (системы ссылок). В зависимости от типа гипертекстовой системы такая система может задаваться как разработчиками, так и пользователем в процессе работы с гипертекстом.

Движение в гипертекстовой сети, совершаемое в процессе чтения гипертекста, называется навигацией.

Гипертекстовые технологии широко используются в различных прикладных системах:

в настольных издательских системах — для создания документов большого объема со свойствами гипертекста (т. е. с системой ссылок);

в системах управления документами (СУД) — например, для сведения в один итоговый документ информации, содержащейся в разнородных документах;

в системах подготовки электронных документов, позволяющих составлять гипертекстовые документы с возможностью осуществления навигации.

Наиболее известным инструментом создания гипертекста остается система HyperCard. Одним из перспективных направлений развития гипертекстовых систем является технология гипермедиа — соединение технологии гипертекста и технологии мультимедиа (интеграция текста, графики, звука, видео).

  1. Поиск информации в www.

Для поиска информации в Internet разрабатывались различные систе­мы, но наиболее удачные программные продукты появились в последние несколько лет. Эти системы позволяют искать информацию в Web-страницах, в группах новостей и хранилищах файлов.

Стратегия современных поисковых серверов базируется на трех ос­новных подходах :

  • создании каталогов;

  • создании индексов;

  • гибридном методе.

Поисковые инструменты первого типа чаще всего называют предметными, или тематическими каталогами. Компания, владеющая таким каталогом, непрерывно ведет огромную работу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимое WWW-серверов и других сетевых ресурсов, разбросанных по всему миру. Результатом является постоянно обновляющийся иерархический каталог, на верхнем уровне которого собраны самые общие категории, такие как “бизнес”, ”наука”, ”искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого.

Предметные каталоги предоставляют и возможность поиска по ключевым словам. Однако поиск этот происходит не в содержимом самих WWW-серверов, а в их кратких описаниях, хранящихся в каталоге.

К наиболее известным предметным каталогам Internet относятся Yahoo, WWW Virtual Library, Galaxy и некоторые другие

Поддержка Web-индексов предполагает создание и непрерывное по­полнение огромной базы данных по индексируемым документам.

Существуют программы, в которые загрузили несколько тысяч общеизвестных URL-адресов. Будучи запущена на компьютере с доступом к WWW, эта программа начинает автоматически скачивать из сети документы по этим URL, причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Программы такого типа называются роботами. Они ограничиваются сбором статистической информации и построением словоуказателей (индексов) по текстам документов. Собираемая роботом база данных — индекс — хранит в себе сведения о том в каких WWW-документах содержаться те или иные слова.

Именно такой автоматически собираемый индекс и лежит в основе поисковых систем второго рода, которые часто так и называют — автоматические индексы. Автоматических индексов WWW-страниц существует немало: WebCrawler, Lycos, Excite, Inktomi, Open Text и другие. Некоторые из них (например, Lycos) представляют собой более или менее удачный синтез предметного каталога и автоматического индекса.

Поисковые системы глобального масштаба свое основное внимание концентрируют на англоязычных ресурсах Сети. Задачу поиска информации на серверах в пределах отдельных стран выполняют системы локального характера, специально адаптированные к особенностям конкретных языков. Существуют подобные поисковые средства и в России. Всех их объединяет возможность обработки материалов во всех кириллических кодировках.

К лидирующим в настоящее время относятся системы Rambler, Апорт и Яndex.