Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Л.р.№3.doc
Скачиваний:
1
Добавлен:
01.09.2019
Размер:
671.23 Кб
Скачать

Поисковая система Yandex .

В   1997г.   по   адресу:   http://www.yandex.ru    открылась   новая российская поисковая машина Yandex (или Я ndex ). По набору своих поисковых возможностей она не уступает самым сложным поисковым машинам Запада, специально рассчитана на русскоязычные запросы и учитывает особенности русской лексики, предлагает несколько больше возможностей для интеллектуального поиска.

Аналогично AltaVista , Yandex различает заглавные и прописные буквы. Если ключевое слово написано прописными буквами, то поисковая машина не различает прописные и заглавные буквы, т.е при задании ключевого слова computer в поиске будут учитываться и Computer , и COMPUTER , и др. Тогда, как если в поисковом образе будет содержаться хотя бы одна заглавная буква, при поиске будут приниматься во внимание только слова, имеющие данное начертание.

В Yandex нет необходимости использовать оператор неопределенности (аналогичный звездочке в AltaVista ), так как при задании ключевого слова прописными буквами в процессе поиска будут использоваться и слова, стоящие в других падежах, в различных склонениях, в единственном и множественном числе.

В Yandex так же, как в AltaVista можно строить простые и сложные запросы. Но построение сложных запросов требует более высокой квалификации лица, проводящего поиск.

Для соединения ключевых слов в простых запросах используются операторы, обозначаемые символами: &, |, ~, (, ). Среди них только тильда (~) имеет другое назначение - в Yandex она обозначает отрицание (и эквивалентна знаку “- ” в AltaVista ). Однако, указанные операторы имеют существенную особенность: ключевые слова, соединяемые ими, должны находиться в пределах одного абзаца.

Удваивание оператора связи указывает, что слова должны находиться в пределах всего текста (а не только одного абзаца).

В Yandex предусмотрен “поиск с расстоянием” - можно указать, что ключевые слова в искомом тексте должны находиться на расстоянии не более, например, трех слов (и в одном абзаце). Расстояние задается символом /, за которым следует цифра, определяющая расстояние. Например, задав предписание:

круглый /3шар поисковая машина будет искать документы, содержащие в пределах одного абзаца слова “круглый” и “шар”, причем, разделены они могут быть не более, чем тремя словами. Если расстояние задано отрицательным числом, это значит, что второе слово предшествует первому.

Вместо одного слова в поисковом предписании можно использовать целые выражения. Логически самостоятельные элементы этих выражений могут заключаться в скобки.

Особенности поиска информации в Интернет.

Интернет как глобальное средство обмена информацией нередко используется для поиска необходимых данных. Способов поиска информации множество (в скобках указаны случаи, когда такой способ поиска наиболее применим): Поиск с помощью поисковых машин (конкретные вещи) Каталоги и коллекции ссылок (более общие понятия) Рейтинги (самые популярные ресурсы) Конференции, чаты и страницы ссылок на тематических сайтах (редкие, специализированные вещи). Ограниченные временные, физические и финансовые возможности людей вынуждают чаще всего применять для этого специальные каталоги и поисковые машины (поисковики) – своего рода библиотекари, индексирующие доступный им массив информации в Интернет. В данном разделе выделены особенности и рассмотрены общие правила работы наиболее известных каталогов и поисковых систем.

Каталоги представляют собой систематизированные группы адресов, объединенные, как правило, по тематике. К удобству их применения можно отнести то, что, если пользователю известна тема искомого документа, он будет исследовать соответствующую ветвь каталога, не отвлекаясь на посторонние, не относящиеся к делу документы. Однако, объем каталога ограничен физическими возможностями редакторской группы и ее субъективностью в выборе материала. В них отсутствует информация на узкие, специальные темы, да и саму тематику искомого документа не всегда можно сформулировать в пределах классификации каталога. Ниже приведены возможности зарубежных и российских каталогов.

Yahoo! - Самый популярный каталог, содержащий обширную информацию о десятках тысяч Web -узлов. Первый уровень иерархии содержит 14 тематических категорий, которые разветвляются еще на 4 -5 подуровней. Имеет собственную машину поиска, позволяющую: 1) искать по базе Yahoo !, по Usenet или по адресам электронной почты; 2) ограничить поиск материалами, размещенными за последний день, неделю, месяц, год или 3 года; 3) выдать статьи, содержащие хотя бы одно ключевое слово или все ключевые слова; 4) искать по однокоренным словам или только по указанным ключевым; 5) выдать результаты по 10, 25, 50 или 100 на одной странице (подробнее ниже). Excite Reviews - Содержит обзоры 60 тыс. узлов Интернет (иерархический каталог) City . Net - сведения о странах и городах.

Galaxy - Иерархический каталог с подробным описанием тематических категорий на первой странице. Осуществляет поиск по категории поиска, по одному или нескольким ключевым словам, краткий и подробный вывод результатов поиска, переход на страницы Gopher и Telnet .

Yellow Pages - Поиск информации о 16 млн. американских компаниях в различных областях деятельности, а также персональные данные и электронные адреса частных лиц.

Russia on the Net - Первый каталог русских ресурсов.

Созвездие Интернет - Охватывает около 400 серверов. Возможность усечения терминов. Содержит названия и краткие характеристики серверов. Привлекательная графика. Небольшая зона поиска, слабая иерархия.

Желтые страницы Интернет - Около 1200 Web -серверов. Большой объем информации, хорошо продуманная структура.

Сокровища Интернет - Каталог Web -ресурсов на сервере Relcom . АУ! - Молодой, быстроразвивающийся каталог.

Поисковых серверов всего известно более 150, различающихся по регионам охвата, принципам проведения поиска (а следовательно, по входному языку и характеру воспринимаемых запросов), объему индексной базы, скорости обновления информации, способности искать "нестандартную" информацию и тому подобное. Основными критериями выбора поисковых серверов являются объем индексной базы сервера и степень развитости самой поисковой машины, то есть уровень сложности воспринимаемых ею запросов. Традиционно поисковые системы имеют три элемента:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]