Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
264_265.doc
Скачиваний:
14
Добавлен:
30.07.2019
Размер:
272.38 Кб
Скачать
  1. Функционирование систем текстового поиска. Методы работы в системах текстового поиска.

Разнообразие СТП связанно с довольно широким спектром подходов к конструированию представлений док-ов,польз.запросов,к оценке реливантности док-ов и использовании технологий индексаций док-ов.

Однако как в простых так и сложных СТП используется некоторые общие принципы,эти принципы заключаются в следующем.

При вводе док-та в систему осуществляется индекирование док-та и строится его представление которое далее будет выступать заминителем этого док-та в процессе функционирования системы при обработки польз.запросов.

Поскольку предст. Док-та в достаточной мере формализованно,исключается необходимость анализа его полного текста каждый раз при обработки запросов.

Представление док-та остается неизменным в течений всего периода,посколько содержание док-та не изменяется.

Далее на основе индексир. Свойств конкретных документов,полученных из вне системы или выявленных самой системой в результате анализа текста док-таюСистема формирует и поддерживает индекс,для каждой коллекций хранимых в ней док-ов.

Система также поддерживает актуализацию индекса при пополнений коллекций или при удалений док-та из коллекций.

При поступлений в систему польз.запроса,для него также строится соответст представление.Метод его построения аналогичен методу построения представлений док-ов.

Поиск заключается в том,что каким либо способом осуществляется сопоставления представ. Польз. Запроса с предст. хранимых в системе док-ов,по принятому в системе критерию близости,для этого в системе вводится спец. метрика.

Результатом обработки запроса представления в виде мн-ва реливантных док-ов.

  1. Средства лингвистической поддержки в системах текстового поиска. Словари и тезаурусы.

При обработки полнотекстовых док-ов и польз.запросов В полнотекстовых СТП обычно использ.средства обработки естественного языка.Эти средства являются важными и сложными

функциональными компонентами.

Такие средства в СТП позволяют выделять из анализ.текстовых док-ов и польз.запросов термы.

Терм-слова,словосочетания или фразы носители основного содержания.Также системы выделяют зависимости между термами.учитывают их концептулальные связи в контексте данной предмет.обл.

А также трансформируют поисковые запросы пользователя в удобном для реализаций поиска форму,осущест.расширение запросов для обеспечения полноты поиска.

Для реализ. Указанных функций обычно используют комплексы средств лингвистической поддержки.Такой комплекс включает различные словари и т.д.

В СТП обрабатыающих тексты на естественном языке поддерживаются словари обще языковой лексики и лекстки предметной областию

Данные словари используются для морфологического анализа текста,для обеспечения оттождествлений слов в различных грамотюформах в процессе поиска.

В системах апперирующих док-ами на нескольких языках также применяются переводные словари.

Важную роль в анализе и формирования формализованного представления тестовых док-ов и польз.запросов играют тезариусы.

В этом случае тезариусы представляют собой словари основных понятий языка ,обозначающих отдельными словами или словосочетаниями с опред симантическими связями между ними.

Тезариус может быть обще языковым(тезариус русского языка) или быть ориент на конретную область.Виды поддерж симантич. связей между ними могут быть зависимые и не зависимые от какой либо предметной области.

Обычно в тезариусах поддерживается связи определяющие синонимы ,антонимы,амонимы.

  1. Модели поиска. Простой и контекстный поиск.

  2. Защита информации в информационных системах.

Аутентификация - процедура проверки подлинности данных и субъектов информационного взаимодействия исключительно на основе внутренней структуры самих данных.

Идентификация (от позднелат. identifico — отождествляю), признание тождественности, отождествление объектов, опознание.

  1. Перспективы развития информационных систем.

29

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]