Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
366
Добавлен:
21.01.2014
Размер:
4.27 Mб
Скачать

Поисковые системы

К глобальным поисковым системам относят информационные системы, позволяющие осуществлять поиск в Web-пространстве, объединенным протоколом http.

В число хорошо зарекомендовавших себя и наиболее известных поисковых систем входят Alta Vista (http//www.aitavista.digital.com), HotBot (http://www.hot-bot.com), Ultra InfoSeek (http://ultra.infoseek.com), OpenText (http://www.opentext.com), WebCrawler (http://www.webcrawler.com), Lycos (http://www.Lycos.com), Excite (http://library.ucr.edu), Magellan (http//:www.meknley.com), MetaCrawler (http://www.metacrawler.com) и др.

Болee молодые поисковые системы «Новый русский поиск» (http://www.open web.ru/koi8/cgi-bin), «Паук» (http://spider.raser.ru), значительно превосходят предшествующие как в сфере увеличения глубины и широты поиска, так и в области предоставления пользователям большего комфорта. Технологические усовершенствования зримо проявляются в увеличении числа булевых операторов (or/или, and/и, not/не и др.), позволяющих более точно формулировать запрос скорости поиска, росте количества обследуемых документов и степени глубины этого обследования.

Расширение пользовательских возможностей воплощается в создании простых и удобных интерфейсов максимально облегчающих составление запроса освобождающих пользователей от овладения специальными знаниями, типа булевой логики. Все больше и больше систем обретают полиязычность, т.е. способность обрабатывать ресурсы на самых различных языках включая русский, хотя проблема кириллицы в целом в Интернет все еще не решена.

Основное преимущество поисковых систем глобального масштаба — их оперативность. Пользователем задается ключевое слово — поисковый механизм выдает результаты поиска и точные адреса тex документов, в которых это ключевое слово встречается. Однако, обладая очень широкими возможностями, поисковые системы не всегда являются лаконичными.

Выделенные два типа поисковых систем разнятся в первую очередь с точки зрения технологии поиска: работающие с индексами (ссылками) и работающие с каталогами (классификаторами). В первом случае, системы получают информацию от каждого сервера, индексируют ее, а всю найденную информацию добавляют в свои базы данных (AltaVista, InfoSeek и др.). В другом случае, системы отыскивают сервера с высоким трафиком, добавляют их в свои базы и классифицирую их по степени убывания спрашиваемости (excite, WebCrawier и др.). Кроме того, есть и такие системы, в которых главным действующим лицом является человек — эксперт, организующий поисковые образы и категории, устанавливающий перекрестные ссылки и пополняющий базы данных (Yahoo!, Point и др.).

Остановимся на характеристике наиболее популярных глобальных поисковых систем:

AltaVista (http://www.altavista.com) — чрезвычайно быстрая поисковая система компании DEC (Digital Equipment Corporation), одна и самых больших баз данных для поиска в Сети, содержащая информацию о более 150 млн. страниц WWW и 14 тысяч групп новостей электронных конференции. Она позволяет осуществлять поиск, в том числе и по ключевым словам на русском языке, ранжирует найденные страницы по степени соответствия запросу. Ключевые слова запроса в ответе выделяет жирным шрифтом, но система не производит сортировку полученных адресов. Система позволяет сохранить результаты поиска в виде закладок. AltaVsta – одна из немногих систем, которая продолжает полнотекстовую обработку всей сети Интернет.

В системе используется довольно сложный механизм составления запроса, включающий комбинации отдельных слов, словосочетаний и знаков пунктуации (кавычек, точек с запятой, двоеточия, скобок), математических знаков (плюса и минуса) или привычных булевых операторов AND, OR, NOT и NEAR.

Поиск данных по типу библиотеки «публичные библиотеки в России» предполагает усложненный вариант запроса [публичн* near биолиот* and Росси*]. Пользователям так же предоставляется возможность ограничивать запрос по дате создания или последнего обновления документа. Поисковая система рассматривает заглавные буквы как отдельные буквенные символы вне их связи с прописными буквами. Когда слово найдено на WWW странице или в статье новостей его написание сохраняется в системном списке слов.

Лучше в запросе всегда писать прописными буквами. Заглавные буквы задают поиск слов именно в таком написании. Запрос может быть представлен и в виде словосочетания - President of Russia (словосочетание из 3 слов); при этом система безразлична к пробелам и знакам пунктуации (если только они не разделяют отдельные слова).

Следующей авторитетной поисковой системой является HotBot (http://www.hotbot.com) — индексирует около 110 млн. докумен­тов в Web, а также Usenet News. Углубленный поиск (Expert Search) в HotBot дает широ­кие возможности для детализации запроса. Это достигается за счет использования многоступенчатого меню предлагающего различные варианты составления поискового предпи­сания. Можно осуществить поиск по сочетанию в документе нескольких различных тер­минов, поиск по отдельной фразе, поиск конкретного лица или электронного адреса. Дан­ная система имеет понятный и удобный интерфейс. Однако при обращении к такой поисковой системе более успешны результаты поиска информации о Западной Европе и США. Поисковая система HоtBot менее восприимчива к китайскому и русскому языкам.

Одним из лидеров поисковых систем стала норвежская система (NothernLight.com) FastSеarсh, охватывающая более 200 млн. адресов.

Русскоязычные ресурсы Интернет

С точки зрения русскоязычности всю совокупность поисковых средств условно можно разделить на две группы.

К первой относятся поисковые средства всемирного масштаба, допускающие поиск русскоязычных материалов; ко второй — отечественные поисковые системы, естествен­ным образом ориентированные на выявление документов на русском языке. Естественно, что для российских пользователей большое значение имеет возможность находить русскоязычные материалы.

К лидирующей группе отечественных поисковых систем относятся системы Yandex (http://www.yandex.ru), Rambler (http://www.rambler.ru), Апорт (http://www.aport.ru), Русская машина поиска (http://search.interrussia.com) и др.

Yandexновейшая разработка поисковой системы, вырвавшаяся в лидеры среди российских поисковых систем. Индексирует наряду с российскими доменами зарубежные русские Web узлы. От других систем аналогичного типа отличается глубоким морфологическим анализом обрабатываемых терминов.

Rambler — система, созданная и поддерживаемая с осени 1996 г. специально для выявления материалов на серверах в пределах бывшего СССР. Это первая профессиональная отечественная поисковая система, ставшая одним из лидеров российских систем. Она поддерживает все кодировки кириллицы, обеспечивает полнотекстовый (файлы до 100 Kb) поиск более чем на 500 тыс. страниц 15 тыс. российских узлов и стран ближнего зарубежья. Количество проиндексированных страниц ежедневно увеличивается в среднем на 10 тыс. система имеет дружественный интерфейс, позволяющий легко составить поисковое предписание.

Отечественные поисковые системы лишены недостатков, связанных с кириллическими кодировками. В большинстве своем, они не только обрабатывают WWW-страницы в любых кодах, включая Macintosh, но и представляют результаты поиска для удобства пользователя в одной кодировке, давая ссылку на оригинальную. Однако по другим показателям они очень отличаются друг от друга: в то время как некоторые из них по потенциалу и уровню сервиса приближаются к зарубежным разработкам, другие воплощают в себе практически все возможные недостатки инструментов подобного рода.

Поисковые средства справочною типа представлены в Интернет следующими своими основными системами:

Yahoo! (http://www.yahoo.com);

LookSmart (http://www.looksmart.com);

Magellan (http://www.mckinley.com);

Galaxy (http://galaxy.cinet.net);

Созвездие Internet (http://www.stars.ru).

Справочная система Yahoo! представляет собой крупнейший предметный каталог ресурсов WWW. Ее авторы – сотрудники Стэндфордского университета — создали солидную систему поиска), удобную для первоначального ознакомления с информа­ционным наполнением различных отраслей знания.

При ее загрузке на экран выводится их общий перечень:

ИСКУССТВО,

ОБРАЗОВАНИЕ,

БИЗНЕС,

ЕСТЕСТВЕННЫЕ НАУКИ,

СОЦИАЛЬНЫЕ НАУКИ и т.д.

Посещая любой раздел, пользователь имеет возможность видеть дробную его детализацию, вплоть до конкретных учреждений или лиц. Иерархическая структура справочника дает возможность шаг за шагом обследовать интересующие предметные области.

На каждой ступени иерархии после названии разделов в скобках указывается число обследованных им pecуpcoв. Как и другие поисковые системы Yahoo! дает название и аннотации WWW-страниц.

Созвездие Internet – система, размещенная на известном сервере ИнфоАрт — одна из новейших разработок. Интерфейс выполнен на высоком уровне с применением фреймов и качественной графики. Справочник имеет разветвленную иерархическую структуру.

Разработка новых поисковых систем продолжается…

II. Информация сайта ФАА (Росархив). Статья В.П. Козлова «Публичность архивов и свобода архивной информации». Статья О.Е. Глаголевой «Изучение архивов в России. Что обуславливает успех?» (авторский текст, перевод с английского).

Для дополнительного обучения:

- Гультяев А. Самое главное о… Поиск в Интернете. – СПб., 2004. – 125 с.

- Крупник А.Б. Поиск в Интернете: Самоучитель. – СПб., 2003

- Якушина Е.В. Изучаем Интернет, создаем веб-страничку. – СПб., 2003

ГОСТЫ

МЕЖГОСУДАРСТВЕННЫЙ СОВЕТ ПО СТАНДАРТИЗАЦИИ, МЕТРОЛОГИИ И СЕРТИФИКАЦИИ

М Е Ж Г О С У Д А Р С Т В Е Н Н Ы Й С Т А Н Д А Р Т

Система стандартов по информации,

библиотечному и издательскому делу

БИБЛИОГРАФИЧЕСКАЯ ЗАПИСЬ.

БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ

Общие требования и правила составления

Издание официальное

Москва

ИПК Издательство стандартов

2004

1 РАЗРАБОТАН Российской книжной палатой Министерства Российской Федерации по делам печати, телерадиовещания и средств массовых коммуникаций, Российской государственной библиотекой и Российской национальной библиотекой Министерства культуры Российской Федерации, Межгосударственным техническим комитетом по стандартизации ТК 191 «Научно-техническая информация, библиотечное и издательское дело»

2 ВНЕСЕН Госстандартом России

3 ПРИНЯТ Межгосударственным Советом по стандартизации, метрологии и сертификации (протокол № 12 от 2 июля 2003 г.)

За принятие проголосовали:

Наименование государства

Наименование национального органа по стандартизации

Армения

Армгосстандарт

Беларусь

Госстандарт Республики Беларусь

Казахстан

Госстандарт Республики Казахстан

Кыргызия

Кыргызстандарт

Молдова

Молдовастандарт

Российская Федерация

Госстандарт России

Таджикистан

Таджикстандарт

Туркменистан

Главгосслужба «Туркменстандартлары»

Узбекистан

Узгосстандарт

Украина

Госстандарт Украины

3 Постановлением Государственного комитета Российской Федерации по стандартизации и метрологии от 25 ноября 2003 г. № 332-ст межгосударственный стандарт ГОСТ 7.1–2003 введен в действие непосредственно в качестве государственного стандарта Российской Федерации с 1 июля 2004 г.

4 Взамен ГОСТ 7.1-84, ГОСТ 7.16-79, ГОСТ 7.18-79, ГОСТ 7.34-81, ГОСТ 7.40-82