Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсовая работа_Больдерман_431 группа.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
142.46 Кб
Скачать

Выводы к главе 2

Информационно-поисковые системы были созданы специально для поиска необходимой информации. Основываясь на информации из различных источников, можно сказать, что эффективная работа любой ИПС основана на быстроте и возможностях многоаспектной выборки нужных данных из большого массива (поиск информации) для внутренней работы с данными. Эта задача накладывает на систему определенные требования в плане интерфейса, организации поиска и формы представления информации. Структура ИПС построена таким образом, чтобы соответствовать вышеперечисленным требованиям. Так же ИПС можно классифицировать по различным признакам на разные категории. Например, классификационные, словарные и предметные ИПС. Так же есть уникальный вид ИПС- метапоисковые системы, которые ищут информацию сразу по нескольким базам данных других ИПС.

Важнейшая составляющая любой ИПС- это поисковый аппарат. Он состоит из нескольких компонентов, таких как поисковая машине, поисковый индекс и информационно-поисковый язык. Поисковая машина- система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах. Она непосредственно влияет на механику поиска ИПС. Поисковый индекс- структура данных, которая содержит информацию о документах и используется в поисковых системах. Индексы в ИПС выстраиваются в процессе индексирования, который может отличаться в зависимости от конкретной ИПС. И последняя, главная часть поискового аппарата- информационно-поисковый язык (ИПЯ). Это язык, позволяющий сформулировать запрос к системе в простой и наглядной форме. Т.е. несмотря на то, что пользователь вводит запросы на естественном языке, в ИПС он переводится в ИПЯ. Существуют различные виды ИПЯ, опять же, применяющиеся в различных ИПС.

Так же очень важным понятием касательно ИПС является понятия ранжирование. Это алгоритм упорядоченного выстраивания полученных ссылок. Различные поисковые системы используют различные алгоритмы ранжирования, однако основные принципы определения релевантности у всех систем примерно одинаковые. Это количество слов запроса в текстовом содержимом документа (т.е. в html-коде) и тэги, в которых эти слова располагаются. Так же можно выделить такие принципы определения релевантности, как местоположение искомых слов в документе и удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа.

Все ИПС ищут информацию используя определенный «информационный поиск», который подразумевает использование определённых стратегий, методов, механизмов и средств поиска. Каждый из этих параметров так же имеет свои аспекты, которые варьируются в зависимости от конкретной ИПС.

Так же, почти все ИПС имеют такую особенность, как средства поиска и структурирования, иногда называемые поисковыми механизмами. Они используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет.

С развитием информационных технологий и сети Интернет появилось много различных ИПС в веб-пространстве. Их них можно выделить несколько основных- Rambler, Yandex, Google и Yahoo. Все они имеют совершенно различные механизмы поиска и предназначаются для различных целей. Каждая их них имеет свои плюсы и минусы в зависимости от потребностей пользователя.