Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
!!!ГОСы информатика и вычислительная техника.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
3.93 Mб
Скачать
  1. Системы автоматизированного поиска в Internet: состав и области применения.

Компании всего мира широко используют сеть Internet - эту всемирную информационную супермагистраль для поиска и получения информации практически любого вида. В сети Internet имеются тысячи баз данных и десятки навигационных систем. Для облегчения и ускорения поиска необходимой информации используются вспомогательные программы, интегрированные в структуру Internet и составляющие ядро автоматизированных систем поиска и получения информации.

Сеть Internet работает с тремя основными системами поиска информации - Gopher, Wais и WWW.

Система Gopher. Это достаточно известное и распространенное средство поиска информации в сети Internet, позволяющее находить информацию по ключевым словам и фразам. При работе с Gopher пользователю предлагается пройти сквозь ряд вложенных меню, из которых доступны файлы различных типов. Gopher, будучи распределенной системой экспорта структурированной информации, является сервисом прямого доступа и требует, чтобы и сервер, и клиент были полноценно подключены к Internet.

Система Gopher позволяет получать информацию без указания имен и адресов авторов. Пользователь просто сообщает системе, что именно ему нужно, и система находит необходимые данные.

В настоящее время в Internet имеется свыше 2000 Gopher-систем, часть из которых узкоспециализированные, а часть содержит более разностороннюю информацию. Это усложняет поиск информации. В случае возникновения затруднений можно воспользоваться службами ARCHTE и VERONICA. Служба VERONICA осуществляет поиск более чем в 500 системах Gopher, освобождая пользователей от необходимости просматривать соответствующие меню вручную, а служба ARCHTE автоматизирует навигацию и поиск файлов в FTP-серверах.

Система WAIS. Это информационная система широкого профиля, представляющая собой комплекс программ, предназначенных для индексирования больших объемов неструктурированной (как правило, просто текстовой) информации, поиска по таким материалам и извлечения из них запрашиваемых данных. Эти функции выполняются с помощью программ индексирования, программ локального поиска по полученным индексам, а также серверных и клиентских программ, взаимодействующих между собой по специальному протоколу Z39.50.

Задача поиска данных в больших объемах неструктурированной информации весьма нетривиальна, пока не существует ее общепринятого решения. В системе WAIS реализован приемлемый вариант решения этой задачи, поэтому она получила достаточную известность как один из сервисов Internet. Однако в последнее время эта система самостоятельно почти не используется, а во многих случаях применяется как вспомогательное средство, например, для индексирования документов, хранящихся на

WWW-сервере. В сети Internet имеется более 200 WAIS-библиотек, в которых большая часть материалов относится к области исследований и компьютерных наук.

В Internet реализуются две стороны поиска информации, разные по методам, но единые в целях: каталоги и поисковые серверы. Условно можно сказать, что каталоги - средства сфокусированного поиска информации, а поисковые серверы - рассеянного. Использование этих средств позволяет быстро и эффективно находить необходимую информацию в глобальной сети.

Поисковые серверы (search engune) - это специальное программное обеспечение, которое, автоматически просматривая все ресурсы сети Internet, может найти запрашиваемые ресурсы и проиндексировать их содержание. Пользователь передает поисковому серверу фразу или набор ключевых слов, описывающих интересующую его тему. Выполняя такой запрос, сервер сообщает пользователю список соответствующих ресурсов. В Internet имеется множество поисковых серверов, охватывающих практически все доступные ресурсы. При этом разные серверы охватывают различные, частично перекрывающиеся, области информации в сети. Они используют различающиеся методы индексирования документов и способы оценки значимости слов в них. Имеются специализированные серверы поиска по отдельным типам ресурсов сети и универсальные, охватывающие все виды сервисов.

Каталоги Internet - средства хранения тематически систематизированных коллекций ссылок на различные сетевые ресурсы, в первую очередь на документы WWW. Ссылки в такие каталоги заносятся администраторами, которые стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. В результате пользователь должен найти интересующий его вопрос в каталоге, и ему не нужно самому собирать все ссылки по этому вопросу, так как работа по поиску и систематизации ссылок уже проделана. Каталоги обычно имеют древовидную структуру и похожи на очень большой список закладок. Каталоги обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам в своей базе данных, предоставление списков последних поступлений, автоматическое оповещение по электронной почте о свежих поступлениях и др. Существует каталог русскоязычных ресурсов сети Internt.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]