Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Петров все рефераты.docx
Скачиваний:
8
Добавлен:
19.09.2019
Размер:
656.55 Кб
Скачать
  1. Введение

В современном мире огромную роль в жизни людей играет информация. Постоянная, регулярная работа с информацией в наше время стала неотъемлемой частью жизни каждого цивилизованного современного человека.

С каждым днем пользователей всемирной сети становится все больше, современные пользователи все больше времени проводят тем или иным образом, получая и обмениваясь информацией используя информационные системы, как в рабочее, так и в свободное досуговое время.

На данном этапе развития информационных систем весьма актуальны проблемы оптимизации информационно-поисковых механизмов, поисковых аппаратов, систем индексирования и обработки данных для увеличения эффективности работы пользователей и получения максимально релевантных результатов при работе с поисковыми системами. Эти аспекты будут рассматриваться в данном докладе.

  1. Документальные системы.

Документальные системы служат для работы с документами, в которых информация хранится в виде текстовых документов (статьи, книги, рефераты, тексты законов) и графических объектов, снабженная тем или иным формализованным аппаратом поиска.

Цель системы, как правило, – выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям.

В зависимости от того, по каким хранимым документам или по их описаниям (вторичным документам) осуществляется поиск, документальные системы часто делят на:

  • системы с библиотечным поиском;

  • системы с библиографическим поиском.

В первом случае поиск ведется в информационном фонде, содержащем первичные документы, во втором — в информационном фонде вторичных документов. Заметим, что наибольшее практическое значение имеют документальные ИПС, поиск в которых организован по двум контурам:

  1. библиографическому, с определением основных характеристик первичного документа и предоставлением пользователю возможности оценить, может ли данный документ удовлетворить его информационные потребности;

  2. библиотечному, когда в информационном фонде осуществляется нахождение требуемого документа с последующей его (или копии) выдачей пользователю.

Под описанием документа или вторичным документом понимается некоторая совокупность данных, представленных в некоторой заданной форме, позволяющая охарактеризовать первичный (исходный) документ с точки зрения его содержания, местонахождения и т. п. Например, реферат статьи, опубликованный в реферативном сборнике, является вторичным документом, позволяющим найти эту статью.

  1. Поисковый аппарат

Технология функционирования АИПС состоит в переводе сообщений (документов, текстов) и информационных запросов на ИПЯ (формировании поисковых образов документов и запросов), сравнение ПОЗов и ПОДов и выдачи пользователям АИПС сообщений, отвечающих их информационным потребностям.

При переводе сообщений на ИПЯ возможны различные подходы:

  • полный перевод сообщения на ИПЯ;

  • частичный перевод сообщения на ИПЯ (перевод на ИПЯ только отдельного элемента сообщения, например, его названия или реферата);

  • полный отказ от перевода на ИПЯ и использование в процессе поиска оригинального сообщения или его составляющих (текста, аннотации, заглавия, реферата и т.д.).

Перевод запросов на ИПЯ тоже может быть выполнен в различных вариантах:

  • перевод всею информационного запроса на ИПЯ и формирование единого ПОЗа;

  • перевод отдельных составляющих на ИПЯ и формирование поисковых образов подзапросов.

Поисковое предписание (ПП), т. е. задание АИПС на поиск информации тоже может быть сформулировано по-разному:

  • формулировка единого ПП, соответствующего единому ПОЗу;

  • формулировка нескольких ПП, соответствующих подзапросам.

Причем в несколько ПП может быть развернуто и единое ПП. Процедура сравнения ПОЗов (или ПП) и ПОДов и принятия решений о выдаче или невыдаче пользователям АИПС тех или иных сообщений тоже характеризуются большим многообразием.

Такое многообразие определятся многими факторами и, прежде всего, возможностями использования при формировании ПП логических операций И, ИЛИ, НЕ и различных критериев выдачи.

Организация и используемые методы и средства реализации процессов индексирования документов и запросов и проведения собственно поиска оказывают основополагающее влияние на эффективность поиска и, соответственно, эффективность АИПС.Совокупность методов и средств реализации процесса поиска информации в автоматизированных ИПС назовем аппаратом поиска иди поисковым аппаратом.

Поисковый аппарат АИПС включает:

  • математический аппарат формализованного представления и поиска информации;

  • методы и средства структурирования информационных запросов;

  • критерии выдачи (смыслового соответствия) информации;

  • стратегии поиска и организации массивов.