Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб раб05.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
261.12 Кб
Скачать

1.3. Индексные поисковые системы

Большинство поисковых систем мира - индексные поисковые системы, которые еще называют поисковыми указателями, поисковыми серверами, словарными поисковыми системами, автоматическими индексами, поисковыми машинами Search Engines - в англоязычных источниках и т.п. В Интернете их функционирует несколько сотен. Перед ними стоит задача как можно лучше охватить информационное Web-пространство и представить его пользователям в удобном виде.

Принцип работы с индексными поисковыми системами базируется на использовании ключевых слов. Разыскивая информацию из некоторой темы, пользователь должен подобрать ключевые слова, которые описывают эту тему, и задать их индексной поисковой системе как запрос. Пользователям такой поисковой системы предоставляется форма, или пульт управления поиском, для введения ключевого слова (слов) или фразы. Поисковая система находит в своих базах данных, которые называются индексами или указателями) адреса Web-ресурсов,  которые содержат ключевые слова, и выдает клиенту страницу с ссылками на эти ресурсы. Такая Web-страничка называется отчетом о результатах поиска. 

Существуют следующие виды индексных поисковых систем:

  • глобальные;

  • локальные;

  • региональные;

  • специализированные.

При формировании собственной базы данных индексная поисковая система может следить за обновлением заведомо заданного набора документов, каталогов или конечного числа узлов, отобранных по определенному принципу. Такие системы, реализованные в Интернете, называют локальными. Глобальные поисковые системы, в отличие от локальных, решают более сложная задача - наиболее полно охватить все информационные ресурсы Сети.

Построение региональных и специализированных поисковых систем предусматривает активную фильтрацию информации. Специализация поисковой системы осуществляется на базе некоторого профиля или тематики. Это может быть поиск людей и организаций, компьютерного оснащения, файлов мультимедиа и т.п.

Региональные поисковые системы в основном фильтруют информацию на основе распознавания домена верхнего уровня сервера, например, ua -для Украины, ru - для России, uk - для Великой Британиии и т.п. Но такие системы не учитывают большого количества ресурсов, размещенного региональными разработчиками на традиционно популярном домене com.

Важнейшей характеристикой индексных поисковых систем есть количество проиндексированных документов. Первой в мире поисковой системой, которая провозгласила об увеличение индексной базы данных к миллиарду уникальных Web-документов, стала система Google(http://www.google.com; "Google" означает 10 в степени 100). Индексная поисковая система Google  основана в 1996 году студентами докторантуры одного и того же Стенфордского университета Ларри Пейджем и Сергеем Брином. В основу работы системы положен принцип частоты ссылок на некоторый Web-ресурс. Считалось, что каждая ссылка на некоторая сайт есть "голосом", увеличивающим ценность сайта. Тем не менее каждая ссылка из сервера Yahoo! или About.com есть более ценным, чем сотни ссылок из неизвестных домашних страниц. Поэтому ссылке приписывают определенные весовые коэффициенты. В данном случае Yahoo! и About.com рассматриваются как авторитетные источники, которые содержат ссылки на качественные Web-ресурсы. В начале 2003 года британская фирма Interbrand провела исследование, в ходе которого 1315 экспертов с 72 стран назвали поисковую систему Google наилучшей. Услугами Google пользуются близко 60 миллионов лиц на месяц, система ведет поиск среди более чем 3 миллиардов ссылок на информационные ресурсы сети Интернет, обслуживает близко 17 млн. запросов в день.

Адреса некоторых глобальных англоязычных индексных поисковых систем:

 (http://www.altavista.com/)

  (http://www.hotbot.com/)

 (http://teoma.com/)

  (http://www.alltheweb.com/).

Одной из популярнейших русских индексных поисковых систем есть ситема Яндекс (http://www.yandex.ru), которая была создана в сентябре 1997 года. Слово "Яндекс" появилось как название технологии - "языковой индекс". 

Вокруг поисковой системы компанией Яндекс построен известный Web-портал yandex.ru. Слово "портал" (от лат. porta - двери, ворота) пришло в Интернет из архитектуры в значении "главный вход". Web-портал объединяет информационные ресурсы, услуги и ссылка на другие ресурсы под маркой какой-то известной компании. То есть портал - это большой и известный сайт, который пользуется популярностью значительного количества пользователей. Портал yandex.ru включает поисковую систему и более двадцати сервисов: "Яндекс.Маркет", "Народ", "Яндекс.Почта", "Яндекс.Lingvo", "Яндекс.Деньги", "Яндекс.Новости" и т.п. Количество сотрудников, которые обслуживают систему Яндекс, - 100 лиц. К поисковой базе каждую секунду обращаются 35 пользователей, обрабатывается 3 миллионы запросов в день.

Адреса некоторых российских индексных поисковых систем:

 (http://www.yandex.ru)

 (http://www.rambler.ru)

 (http://www.aport.ru)

 (http://www.turtle.ru/).

В Украине первые индексные поисковые системы появились в 1997 году. Адреса некоторых украинских индексных поисковых систем:

 (http://meta.ua/)

 (http://www.uaport.com/)

 (http://search.avanport.com/).

 Рейтинговые системы

Среди поисковых систем выделяют еще рейтинговые системы. Сущность идеи рейтинговой системы состоит в том, что на основной странице сервера располагается список наиболее популярных тем, внутри каждой из которых организуется список тематических разделов. Пользователь выбирает нужную тему и получает ограниченный список Web-узлов, посвященных данной теме. Рядом с каждым Web-узлом приводится его оценка популярности, которая измеряется количеством обращений к нему за последнее время.

По одной из ссылок рейтинговой системы пользователь переходит на рекомендованный Web-узел. При этом увеличиваются показатели счетчика количества переходов. Те, кто будут пользоваться рейтинговой системой позднее, увидят возрастания популярности данного Web-узла.

Поиск источников информации с помощью рейтинговой системы можно рассматривать как поиск по рекомендациям. Далеко не всегда высокий рейтинг объективно отвечает качества Web-ресурса, к которому ведет популярная гиперссылка, как и не каждый шлягер есть высокохудожественным произведением. Тем не менее в тех случаях, когда речь идет об информации, которая имеет общественный интерес, например, новости политики, экономики, культуры, спорта и т.п., показателю популярности можно доверять.

Примерами систем рейтингового поиска есть российская система  

 (http://www.rambler.ru від англ. "rambler" - "бродяга")

и украинская система

 (http://www.topping.com.ua от англ. "topping" - "верхушка")

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]