
- •Информационные системы в веб-пространстве
- •Оглавление
- •Введение
- •Глава 1 Информационные системы как объект рассмотрения
- •1.1 Информационные системы: принцип организации
- •1.2 Виды информационных систем
- •Выводы к главе 1
- •Глава 2 Организация поиска в информационных системах
- •2.1 Принцип организации поиска в информационных системах
- •2.2 Сравнительный анализ различных поисковых систем
- •Выводы к главе 2
- •Заключение
- •Список источников
- •Приложения
- •Наиболее популярные поисковые системы
- •Индексные (словарные) поисковые системы
- •Классификационные (каталоговые) поисковые системы
Выводы к главе 2
Информационно-поисковые системы были созданы специально для поиска необходимой информации. Основываясь на информации из различных источников, можно сказать, что эффективная работа любой ИПС основана на быстроте и возможностях многоаспектной выборки нужных данных из большого массива (поиск информации) для внутренней работы с данными. Эта задача накладывает на систему определенные требования в плане интерфейса, организации поиска и формы представления информации. Структура ИПС построена таким образом, чтобы соответствовать вышеперечисленным требованиям. Так же ИПС можно классифицировать по различным признакам на разные категории. Например, классификационные, словарные и предметные ИПС. Так же есть уникальный вид ИПС- метапоисковые системы, которые ищут информацию сразу по нескольким базам данных других ИПС.
Важнейшая составляющая любой ИПС- это поисковый аппарат. Он состоит из нескольких компонентов, таких как поисковая машине, поисковый индекс и информационно-поисковый язык. Поисковая машина- система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах. Она непосредственно влияет на механику поиска ИПС. Поисковый индекс- структура данных, которая содержит информацию о документах и используется в поисковых системах. Индексы в ИПС выстраиваются в процессе индексирования, который может отличаться в зависимости от конкретной ИПС. И последняя, главная часть поискового аппарата- информационно-поисковый язык (ИПЯ). Это язык, позволяющий сформулировать запрос к системе в простой и наглядной форме. Т.е. несмотря на то, что пользователь вводит запросы на естественном языке, в ИПС он переводится в ИПЯ. Существуют различные виды ИПЯ, опять же, применяющиеся в различных ИПС.
Так же очень важным понятием касательно ИПС является понятия ранжирование. Это алгоритм упорядоченного выстраивания полученных ссылок. Различные поисковые системы используют различные алгоритмы ранжирования, однако основные принципы определения релевантности у всех систем примерно одинаковые. Это количество слов запроса в текстовом содержимом документа (т.е. в html-коде) и тэги, в которых эти слова располагаются. Так же можно выделить такие принципы определения релевантности, как местоположение искомых слов в документе и удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа.
Все ИПС ищут информацию используя определенный «информационный поиск», который подразумевает использование определённых стратегий, методов, механизмов и средств поиска. Каждый из этих параметров так же имеет свои аспекты, которые варьируются в зависимости от конкретной ИПС.
Так же, почти все ИПС имеют такую особенность, как средства поиска и структурирования, иногда называемые поисковыми механизмами. Они используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет.
С развитием информационных технологий и сети Интернет появилось много различных ИПС в веб-пространстве. Их них можно выделить несколько основных- Rambler, Yandex, Google и Yahoo. Все они имеют совершенно различные механизмы поиска и предназначаются для различных целей. Каждая их них имеет свои плюсы и минусы в зависимости от потребностей пользователя.