Особенности разработки информационно-поисковой системы. Оценка эффективности информационно-поисковой системы. Критерии поиска в информационно-поисковой системе. Возможности количественной оценки

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Ухтинский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Печать_ТИПИС.doc

Скачиваний:

Добавлен:

08.08.2019

Размер:

323.07 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 166 7 8 9 10 11 12 13 14 15 16 > Следующая >>>

Особенности разработки информационно-поисковой системы. Оценка эффективности информационно-поисковой системы. Критерии поиска в информационно-поисковой системе. Возможности количественной оценки

Исходно в истории развития поиска существовало два направления:

Системы поиска для систем управления;
Системы поиска для систем научно-технической информации.

Системы управления должны были иметь цель управления, т.е. функциональную часть, и средство для достижения цели – обеспечивающая часть. Основные этапы: сбор, анализ и подготовка рекомендаций. Для получения упр. рекомендаций развивались математические методы.

Системы НТИ исходно были чисто информационными. Основные этапы: создание, хранение и поиск информации. Развивались семантический анализ, компьютерная лингвистика, теория информационного поиска, семиотика.

Следствие: необходимость разработки ИПЯ.

Для оценки эффективности информационных ресурсов необходимо оценивать не только затраты на их создание, но и их вклад в эффективность функционирования системы управления. Нужно оценивать их влияние на систему управления.

Были предложены меры удовлетворения информационной потребности в теории информации: методы релевантности (соответствие выданному запросу) и пертинентности (соответствие выдачи потребности). Косвенные характеристики в задаче оценки значимости ресурса:

Частота обращений;
Число обслуживаемых пользователей;
Объём хранимой информации.

Критерии выдачи (или критерии смыслового соответствия) – являются основой для алгоритма поиска. Различают следующие критерии:

На полное вхождение – полное совпадение поисков образа документации и образа запроса;
Частичное вхождение – поисковый образ запроса должен входить в образ документальной фразы. Поисковый образ должен быть больше, чем эта фраза;
Критерии смыслового соответствия с учётом базисных соотношений – фраза, разбитая на слова, поиск ведётся во всех документах;
Критерий смыслового соответствия с учётом синтаксического соотношения – смысловой образ (иерархическая структура).

Информационно-поисковые языки как основа информационно-поисковых систем. Сложность задачи индексирования

Исходно в истории развития поиска существовало два направления:

Системы поиска для систем управления;
Системы поиска для систем научно-технической информации.

Следствие: необходимость разработки ИПЯ.

ИПЯ обладают высокими смысловыразительными способностями. В настоящее время под ИПЯ понимают формализованные семантические системы, обеспечивающие передачу (запись) информации в объеме, необходимом для цели поиска, то есть для формирования запросов поиска должно употребляться такое количество информации для организации поиска наиболее эффективным образом. В качестве стандартных единиц используют ключевые слова или ключевые слова в некоторых стандартных отношениях (стандартизированные предложения запросов).

Система индексирования. Под индексированием понимается процесс перевода с естественного языка на ИПЯ (Пример: система шифров УДК библиотеки). Процесс должен быть автоматизирован, поскольку является весьма трудоемким. Автоматизация процесса – есть система индексирования.

Типы систем индексирования:

Свободное индексирование – использование ключевых слов;
Полусвободное индексирование (ключевые слова анализируются, если они совпадают со словами тезауруса, иначе они игнорируются). Первое и второе недостаточно используют ключевые слова;
Статистический подход. Ключевые слова сами вырабатываются системой на основе статистического анализа текста. Анализируемый текст и слова из тезауруса встречаются и относятся к ключевым словам;
Индексирование, контролируемое тезаурусом. Каждое слово текста с точностью до основы сравнивается со словарём и вырабатывается весовой коэффициент совпадения. Совпадения записываются в поисковый образ документа. Такая система индексирования применяется в глобальных сетях.

<<< < Предыдущая 1 2 3 4 56 / 166 7 8 9 10 11 12 13 14 15 16 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
02.03.20162.09 Mб82Павел Волков. Разнообразие человеческих миров.doc
#
02.03.20161.75 Mб1059ПБ в НиГ.doc
#
17.09.2019578.56 Кб8ПГС_ТГВ_ВВ_Гидравлика 10-11.doc
#
02.03.20161.03 Mб9Пенсионный фонд, его .docx
#
12.11.201995.74 Кб2петрофиз_связи.doc
#
08.08.2019323.07 Кб10Печать_ТИПИС.doc
#
02.03.201660.07 Кб30ПЗ Планирование доходов бюджета.docx
#
02.03.2016106.5 Кб11Питер Фуллер Искусство подачи информации.doc
#
06.11.20186.85 Mб79поверочный расчет парового котла.doc
#
17.11.201955.64 Кб3поиск в интернете.docx
#
21.09.201925.32 Кб4полит 34-38 вопросы.docx

Информационно-поисковые языки как основа информационно-поисковых систем. Сложность задачи индексирования