Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
inform.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
231.61 Кб
Скачать

1.Принципы построения документальных систем. Информационный поиск в документальных ис. Релевантность, пертинентность, критерий смыслового соответствия. Информационно-поисковые языки.

Ис по хар-ру хранимой инф-ии в БД м/б фактографические (картотека с краткой инфой) и документальные-архивы, хранящие всевозможные докум-ы. Инф-ные потребности удовлет-ся путем предоставления первичных докум-ов, нбх сведения из ктр потребители извлекают сами. ИС, работающие с текстовыми докум-ми наз-ют инф-но-поисковыми системами (ИПС). Докумен-ые БД хранят инф-ю со сложной смысловой структурой, представленной в формате текста. Осн. цель – снабжение инфой, а главная операция – проведение инф-го поиска. Инф-ый поиск в системе проводится на основе поступившего запроса. Вследствие разл. формулировки запроса на поиск одного и того же нет четкого правила составления запросов => Ис оч трудно нас понимать и интерпретировать. Мы формулируем запрос на естест-ом языке. Реакцию системы нбх рассм-ть и по отн-ию к инф-ой потребности и по отн-нию к инф-му запросу. Автоматизация процесса ИП потребовала формализации представления осн. смыслового содерж-ия инф-ого запроса в виде поискового предписания (ПП), а докум-ов в виде поисковых образов док-ов (ПОД). В процессе проведения поиска определяется степень соот-ия содержания докум-ов и запроса путем сопоставления ПОД и ПП. На основе этого принимается решение о выдаче исходного док-та (он признается реливантным) или его не выдачи (не реливантным). Релева́нтность—степень соот-ия запроса и найденного. Пертине́нтность — соот-ие найденных ИПС докум-ов инф-ным потреб-стям пользователя. Решение о выдаче/невыдаче принимается на основе нкт набора правил, по ктр данной ИПС определяется степень смысловой близости м/у ПОД и ПП, ктр наз-ют критерий смыслового соот-ия (КСО), он устанавливает смысловое соот-ие м/у сведениями в докум-те и запросе. Для записи ПП и ПОД применяются спец языки, ктр наз-ся инф-но-поисковыми. ИПЯ – семантич. сис-ма для выражения содержания док-та и поискового запроса. Задача ИПЯ: перевод содержания док-та в поисковое предписание/поисковый образ док-та (при вводе документа в ИПС) и перевод содержания запросов пользователя в поисковый образ запроса (ПП). Создается на базе естеств-го языка, но отлич-ся компактностью, наличием четких граммт-их правил и отсутствием семантич. неоднозначности. Осн. эл-ты ИПЯ: Алфавит – сис-ма знаков для записи слов и выражений ИПЯ. Словарный состав ИПЯ – сов-сть слов, с/с м выражений для построения текстов ИПЯ. Грамматика ИПЯ – совокуп-ть ср-в и способов построения, изменения и сочетания лексических единиц. 2 типа: классификационные. Разница м/у языками в процедуре построения предл-ий языка. Для записи смыслового содерж-я сообщений исп-ся отдельные эл-ты и готовые сложные понятия,т.е. построение предл-ия заменяется выбором сложного понятия из готового набора. С пом. таких яз-в производится класс-ия сообщений, т.е. отнесение их к классам обозначенным лексич-ми единицами. дескрипторные. Лексич-ие ед-цы заранее не связаны никакими отн-ми, сложные синтакс-ие конструкции, предл-ия создаются путём объединения лекс-х ед-ц во время процедуры представления смыслового содержания докум-ов системы. Готовых фраз нет.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]