Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция07(рус).docx
Скачиваний:
5
Добавлен:
02.12.2018
Размер:
137.73 Кб
Скачать

7.6. Поиск в Internet

Задача поиска необходимой информации была бы практически неисполнимой, если бы не специальные поисковые службы, которые позволяют выполнять поиск по заданным пользователем запросах. На серверах таких служб есть специальные программы (их называют роботами или пауками), которые собирают информацию в Web и возвращают на свой сервер все найдены страницы. Из накопленной таким образом информации формируются особенным образом проиндексированніе базы.

7.7. Поисковые серверы

Дальше приведены описания самых популярных поисковых служб.

AltaVista Search

httр://www.altavista.digital. com

Узел AltaVista Search был организован в 1995 г. Он владеет огромной базой данных с индексацией за полным текстом и могучими поисковыми средствами.

AltaVista - это наилучший вариант для поиска, для которого используются его совершенные поисковые средства, которые настраиваются. Результаты, получаемые при простом поиске по ключевым словам, не на столько впечатляющие. Заказав простой поиск, заданный в AltaVista по умолчанию, пользователь получит тысячи документов. Поскольку при этом сортировка результатов за категориями не выполняется, придется вручную просматривать предоставленную информацию. В AltaVista не предусмотрены средства для распределения за категориями, получения списков активных (hot) узлов, новостей или других возможностей поиска по содержанию, которыми оснащенно много узлов-конкурентов.

Для того, чтобы получить возможность пользоваться могучими инструментами AltaVista, пользователю следует освоить методику составления сложных запросов. На странице сложного поиска Advanced Search узла AltaVista предоставлен полный набор поисковых средств, однако все эти операторы есть и на странице простого поиска. Пользователь может задавать логические операторы (AND, OR и NOT), указывать максимальный интервал между ключевыми словами (см. табл. 7.1), выполнять поиск с учетом заглавных и строчных букв, а также ограничивать поиск по дате. Можно добавлять символы как в конце ключевого слова (чтобы учесть окончание множественного числа или суффиксы), так и в середине слова (чтобы учесть возможные альтернативные написания). Пользователь может ограничить сферу поиска определенными элементами.

Таблица 7.1

Перечень параметров и операторов поиска

Параметр/оператор

Описание

Параметры элементарного поиска

+

Если перед словом стоит знак "+", оно должно быть обязательно присутствует на странице

_

Если перед словом стоит знак "-", оно должно быть обязательно отсутствующим на странице

*

Будет выполнен поиск фразы, которая состоит из слов, разделенных знакомый ":"

« »

Указанный в кавычках фрагмент обязательно должен присутствовать на странице в том виде, в котором он задан в кавычках

*

Звездочка может располагаться в произвольной части слова и заменяет собой цепочку любых символов (*oad - искать за словах, что заканчивается на ;’oad")

Операторы усовершенствованного поиска

AND (&)

Оба фрагмента должны находиться на странице

OR(!)

Хотя бы один фрагмент должен находиться на странице

NOT (!)

Указанный фрагмент не должен находиться на странице

NEAR(~)

Заданы фрагменты должны находиться на одной странице на расстоянии не больше десяти слов

0

Служит для объединения слов в выражения

Одна из самых ценных функций страницы сложного поиска Advanced носит название “критерия ранжирования результатов”. С помощью этой функции пользователь имеет возможность назначить взвешивающие коэффициенты ключевым словам, чтобы важнейшие для него документы оказывались в списке ответов первыми.

Узел AltaVista предоставляет пользователю могучие и удобные средства поиска конкретной информации, но для простого поиска по ключевым словам этот узел не очень хороший, поскольку можно запутаться в полученных результатах поиска.

Excite

httр://www. excite. com

Данный узел имеет могучий поисковый механизм, возможность автоматического индивидуального настраивания информации, которая предоставляется, а также составлены квалифицированным редакционным персоналом описания множественного числа узлов. Excite выгодно отличается от других поисковых узлов тем, что позволяет вести поиск в службах новостей и публикует обзоры Web-стораниц.

В поисковом механизме Excite используются как средства стандартного поиска по ключевым словам, так и эвристические методы поиска по содержанию. Благодаря такому сочетанию, можно найти полностью соответствующие по значению страницы Web, даже если они не содержат указанные пользователем ключевые слова. База данных этого узла состоит из более чем 50 млн. страниц с индексацией за полным текстом.

В результатах поиска выводятся название найденной страницы, полный указатель URL, краткая аннотация и степень соответствия запроса. Функция “More Like This” обеспечивает эффективный способ запроса по образцу для поиска аналогичных страниц. Функция "Sort Site" позволяет группировать полученные результаты по наглядным областям: все страницы области помещаются в один абзац с названием узла. Благодаря этому легче увидеть, сколько узлов уже просмотрено и сколько соответствующих страниц было найдено.

Кроме этого пользователь может ограничить поиск (например Web или Usenet). Для сложного поиска в Excite предусмотрены стандартные логические операции, в частности с вложенными логическими условиями. Значимость каждого поискового элемента можно повысить, прибавив знак вставки (^) и указав взвешивающий коэффициент. Если в заданном пользователем сочетании с двух слов первое начинается из заглавной буквы, Excite считает, что ведется поиск собственного имени. В Excite нет специального интерфейса для формирования сложных запросов, однако он располагает обширной справочной системой.

Excite содержит описания-аннотации более чем 60 тыс. узлов Web, размещенные в соответствии с иерархией заглавий предметных областей. Длина каждой аннотации составляет около четырех строк.

Услуга Excite Live! дает возможность получить доступ к журналу новостей Web, в который можно внести и свою информацию. Функция, которая входит в состав NewsTracker отбирает информацию приблизительно из 400 журналов Web в соответствии с указанными пользователем начальными темами и поисковыми словами. Чтобы облегчить поиск, NewsTracker даже предлагает связанные слова. На странице с полученными результатами есть экранная кнопка Liked It - необходимая функции NewsTracker для того, чтобы уточнить, какие статьи вызывают наибольший интерес. Также в арсенал ценных средств Excite входит набор карт и необходимы инструменты поиска людей в сети.

Кроме ключевых слов в критерии поиска Excite могут быть включены дополнительные параметры и операторы, которые определяют специфику поиска. К дополнительным параметрам и операторам относятся: “+". "-" “( )", AND, OR, AND NOT. Недостатком Excite является несколько хаотический интерфейс.

HotBot

http://www. hotbot. com

HotBot - это база данных, которая содержит около 54 млн. документов, индексированных за полным текстом, и один из наиболее полных поисковых механизмов в Web. Его простые в использовании средства поиска при логических условиях и средстве для ограничения поиска типом среды и Cyberplace (любой областью или узлом Web), что запоминает, помогут пользователю найти необходимую информацию, отсевая при этом ненужную. Вместо использования при составлении критериев логических выражений HotBot предоставляет возможность выбрать необходимые параметры из списков, которые раскрываются

HotBot, разработанный совместимо фирмами Hotwired и Inktomi Соф., упорядочивает результаты поиска за рядом критериев, например за тем, сколько раз встречается какой-то срок в конкретном документе, есть ли он в заглавии или в управляющем коде. Интерфейс HotBot владеет богатыми возможностями. Начальный экран поиска позволяет указать все или некоторые поисковые термины, фразы, чье-то имя или URL Средства поиска конкретного лица обеспечивают ограниченный поиск за близостью.

Чтобы повысить приоритет одних слов и исключить другие, следует щелкнуть клавишей мыши по кнопке Modify. HotBot позволяет ограничить рамки поиска определенным типом носителя или файлами с определенным расширением, например GIF. Существует также возможность ограничить поиск географическим регионом, территорией или просто одним узлом Web. Все поисковые средства HotBot представлены простыми в использовании меню или селективными кнопками. С помощью его интерфейса не составляет трудности построить свою поисковую страницу и установить собственные значения, которые принимаются по умолчанию.

Lycos

httр //www.lycos.com

В состав Lycos входят огромная база данных с числом URL свыше 66 млн. и технологии собственной разработки, в которой основное внимание предоставляется статистическому анализу содержания страниц, а не индексации за полным текстом. Итог такого объединения - поисковый механизм, который обеспечивает часто значительную простоту решения задачи поиска.

Как и многие из основных поисковых узлов, Lycos содержит разнообразную интересную информацию, в частности новости, обзоры узлов, ссылки на популярные узлы, карты городов, а также средства для поиска адресов разных лиц и поиска в Web изображений и звуковых клипов.

Простая за построением основная страница Lycos - окно для введения запроса и окно со списком, предназначенным для поиска по всей Web-группе узлов, объединенных определенной тематикой, или узлах, которые содержат изображение и звуковые клипы, - позволяет пользователю выполнить несложные поиски.

Lycos упорядочивает полученные ответы за степенью соответствия запроса по нескольким критериям, например, за числом поисковых терминов, которые встретились в аннотации к документу (приводится вместе с каждым ответом), интервалом между словами в конкретной фразе документа, местоположением терминов в документе.

Можно добиться улучшения результатов поиска, если воспользоваться имеющимися операторами. Точка, поставленная после термина, заблокирует его употребление как основу слова, потому Lycos предоставит ответы только при полном совпадении с этим сроком. Знак "минус" исполняет роль логического оператора NOT, а знак доллара - универсального символа. Нет возможности оформить запрос на "страницы, подобные данной" с помощью полученного ответа.

Существует возможность задать условия поиска конкретнее, обратившись к странице Custom Search. В Lycos не предусмотрены средства для работы со всеми деталями синтаксиса логических операторов, операторами близости для выполнения поиска по точному совпадению фраз и другие поисковые функции, которые есть у других подобных узлов. Однако в интерфейсе настраивания запроса есть возможность включить в запрос на поиск за несколькими сроками базовых операторов AND и OR, можно также заказать поиск совпадений с разной степенью точности - от низкой к высокой (но не абсолютной).

Lycos оснащен и другими средствами для поиска в Web. Наиболее интересный из них - каталог мультимедиа, предназначенный для поиска изображений и звуковых клипов в Web. При этом пользователю не просто передается ссылка на узел, который бережет изображения, которые интересуют, звуковые файлы и видеоклипы: щелкнув мышью на полученном ответе, Lycos предоставит сам файл.

Представленные в каталоге Sites Subject системы Lycos узлы подразделяются на 16 категорий, которые можно пересматривать и через них получать быстрый доступ к узлам, отличным интенсивным траффикам (самым популярным). В обзорах 5%-ного списка узлов (Тор 5% Sites), выбранных наугад при пересмотре, наводятся оценки их содержания, представления информации и оценки в целом.

WebCrawler

http/www. webcrawler. com

WebCrawler предоставляет широкие возможности синтаксиса для конкретизации запросов, а также большой выбор аннотаций узлов при сравнительно несложном интерфейсе.

Следом за каждым полученным ответом WebCrawler помещает небольшую пиктограмму с приблизительной оценкой соответствия запроса. Функция Show Summaries выводит на экран страницу с коротким резюме для каждого ответа, его полным URL, точной оценкой соответствия, а функция Similar Pages использует этот ответ в запрпосах по образцу как его ключевые слова.

Графического интерфейса для настраивания запросов в Web-Crawler нет. Синтаксические конструкции достаточно простые: привычные логические операторы AND, OR и NOT, оператор близости NEAR (для него предусмотрен ключ, который показывает интервал между ключевыми словами), дужки для вложенных запросов; фразы, за которых выполняется поиск, заключаются в кавычки. В WebCrawler существует оператор ADJ, указывающий, что два слова должны следовать непосредственно одно за другим в порядке их введения. Тот же эффект может быть достигнут с помощью кавычек. Однако не допускается использование универсальных символов, а также невозможно назначить взвешивающие коэффициенты ключевым словам. Кроме того, не существует возможности ограничения поля поиска определенной областью.

WebCrawler предлагает 15 категорий содержания, и, щелкнув мышью на одной из них, можно найти несколько подкатегорий с короткими аннотациями множественного числа интересных узлов. Можно немедленно связаться с одного из таких узлов или продлить поиск узлов, которые содержат информацию по теме, которая интересует. К числу других полезных особенностей относятся список 25 самых популярных узлов, а также бежит строка, которая дает возможность прослеживать активные запросы, которые вводятся другими пользователями.

Yahoo!

http://www. уahoo.com

Yahoo! - первый и, как и раньше, один из самых популярных поисковый узел Web. Он может служить хорошей отправной точкой для любых обобщенных поисков в Web, поскольку с помощью его обширной системы классификации пользователь наверно найдет узел с хорошо организованной информацией, если в индексах Yahoo! она учтена.

Содержание Web подразделяется на 14 общих категорий, перечисленных на домашней странице Yahoo!. В зависимости от специфики запроса пользователя существует возможность или работать с этими категориями, чтобы ознакомиться с подкатегориями и списками узлов, или искать конкретные слова и сроки по всей базе данных. Пользователь может также ограничить поиск в пределах любого раздела или подраздела Yahoo! В этом случае запрос будет касаться только заданного подмножества базы данные.

Благодаря тому что классификация узлов выполняется людьми, а не компьютером, качество ссылок привычно очень высоко. Однако, если заказанный пользователем поиск не увенчался успехом, то и уточнить его будет непросто, поскольку средств для этого в Yahoo! маловато. Эти средства представлены в графической форме, в которой можно задать базовые логические операторы AND и OR; можно задать поиск по точным совпадением текста или по основам слов. В состав Yahoo! входит поисковый механизм AltaVista, потому в случае неудачи при поиске на Yahoo! автоматически происходит его повторение, но уже с использованием поискового механизма AltaVista. Потом полученные результаты передаются в Yahoo! Если пользователь захочет выполнить свой запрос с помощью другого поискового механизма, ему следует щелкнуть мышью на необходимой связи с нужным поисковым механизмом в нижней части страницы с ответами.

При выполнении поиска с помощью Yahoo! сначала будет выведен на экран список категорий, к которым отнесен запрос пользователя, а затем перечень узлов Yahoo! и категории, которым эти узлы отвечают. Запрос будет загружен в текстовое окно и выполнен в AltaVista, если ни одна из попыток в Yahoo! не принесла результаты.

Недостатком ограничения поиска категориями и заглавиями узлов является то, что число полученных результатов существенно меньше, чем при использовании многих других поисковых узлов.

Yahoo! также обеспечивает широкий выбор дополнительных услуг. Пользователю предоставляется возможность отправлять запрос в DesaNews для поиска в Usenet и в Four11, чтобы узнать адрес электронной почты. Yahoo! хорошо справляется с поиском в узлах, расположенных в определенном регионе, охватывая при этом как города, так и страны. Функция Yahooligans формирует подмножество указателя Yahoo!, отбирая только соответствующие для детей узлы. Следует также отметить страницу новостей My Yahoo!, которая настраивается. Значительные инвестиции в разработку Yahoo! были сделаны родительской компанией издательства PC Magazine - фирмой Softbank.

Хотя с помощью Yahoo! трудно добиться достаточной точности ответов при поиске по конкретным терминам, поиск по категориям, составленный людьми, а не машиной позволяет получать высококачественную информацию для обобщенных запросов. Интеграция из AltaVista и связки со многими другими поисковыми узлами Web также обусловливают твердые позиции данного поискового сервера.

Rambler

httр://www. rambler. ru

Эта русскоязычная поисковая служба владеет хорошими возможностями поиска.

Это одна из пока еще редких русскоязычных поисковых систем. Разделы, перечисленные на домашней странице Rambler, детально освещают русскоязычные Web-ресурсы. В том случае, если пользователю необходимо работать в специфической отрасли, ему следует воспользоваться предложенной классификацией информации. Удобной возможностью работы на Rambler является предоставление списка самих посещаемых узлов по каждой предложенной тематике.

Стандартные средства поиска позволяют оперировать непосредственно из строки "Поиск", расположенного в верхней части страницы Rambler.

Справа помещена колонка гида, которая содержит вступительную часть еженедельного обзора гида, окно подписки на почтовую рассылку по данной тематике и координате гида, что курирует раздел.

В нижней части страницы собраны полезные ссылки, воспользовавшись которыми можно прибавить сайт, предложив поместить его именно в эту подкатегорию каталога. Здесь же можно установить счетчик для учета числа посетителей на своих страницах и получения самой разнообразной статистической информации; познакомиться с предложениями из рекламных мероприятий и вакансиями в List.ru

МЕТА

http //www. meta-ukraine.com

Украинская поисковая система МЕТА предназначена для поиска по украинским серверам, а также серверам с украинской тематикой во всем мире .

Официальное открытие сервера состоялось в ноябре 1998 года. С момента своего создания МЕТА поддерживается командой харьковских разработчиков.

Поисковая система МЕТА работает по технологии, аналогичной к реализованной в одной из ведущих русскоязычных поисковых систем Internet- Апорт. Таким образом, МЕТА унаследовала всю мощность и ряд уникальных свойств Апорта, таких как реконструкция текста, точная подсветка ключевых слов запроса в реферативном описании найденного ресурса, поддержка морфологии русских и английских языков и тому подобное.

МЕТА является полнотекстовой поисковой машиной словарного типа, поддерживает развитой язык запросов, поиск по отдельным полям документов, ограничение по дате. Предусмотрены разные формы выдачи результатов, объединения копий документа, которые находятся на разных серверах, реконструкция текста и другие сервисно поисковые функции. Область поиска можно дополнительно ограничить одной или несколькими региональными подрубриками (Киев, Харьков, Зарубежье).

Общее количество результатов поиска представлено в начале страницы. Ответы, сами ответы запроса, показываются вверху списку, с указанием количества предложений, соответствующих запросу. Кроме ссылки на найденный документ с указанием даты создания и кодировки документа, выдается название страницы, дата создания файла и кодировки документа. В том случае, если один и тот же документ расположен на разных серверах, или представлен в разных кодировках, будет показан только один ответ с несколькими ссылками.

Важна уникальная особенность Меты - поддержка поиска с учетом морфологии украинского языка.

Основное назначение системы - быть надежным и осведомленным проводником по украинским ресурсам Internet. В данное время при развитии дополнительных информационно-поисковых сервисных служб, прежде всего, учитывается спрос на информацию украинских пользователей Internet. С учетом новых запросов были введены разделы Справка, Евро-поиск. Финансы и ряд других информационных разделов.