
- •Содержание
- •1 Информационные системы — определение, история развития Определение информационных систем
- •2 Информационные системы — состав, структура Структура информационной системы
- •3 Информационные процессы в информационных системах
- •4 Классификация информационных систем
- •5 Классификация информационных систем по функциональному признаку
- •6 Функциональные компоненты информационных систем
- •7 Классификация информационных систем по способу организации
- •8 Клиент-серверная архитектура информационных систем
- •9 Многоуровневая архитектура информационных систем
- •10 Internet/intranet архитектура информационных систем
- •11 Использование информационных систем в процессе управления организацией
- •13 Сферы использования и последствия внедрения информационных систем
- •14 Жизненный цикл информационных систем
- •15 Основные этапы проектирования информационной системы
- •27 Понятие предметной области и модели ее представления
- •28 Анализ предметной области.
- •29 Сущность структурного подхода к разработке информационных систем
- •30 Моделирование бизнес процессов
- •31 Методология функционального моделирования idef0
- •32 Моделирование потоков данных
- •33 Методология моделирование потоков данных dfd
- •34 Основные компоненты диаграмм потоков данных
- •35 Моделирование данных. Диаграммы "сущность-связь"
- •36 Методология моделирование данных erd
- •37 Классификация сущностей предметной области
- •38 Модели данных
- •39 Нормализация и нормальные формы схем "сущность-связь"
- •40 Основные понятия реляционной теории баз данных
- •41 Получение реляционной схемы из er-схемы
- •42 Документальные (текстовые) информационные системы (определение, особенности, классификация)
- •43 Документальные информационные системы. Схема документальной информационно-поисковой системы.
- •44 Индексирование
- •45 Синтаксический анализ в информационно-поисковых системах.
- •46 Поисковые функции ипс
- •48 Показатели эффективности поиска
43 Документальные информационные системы. Схема документальной информационно-поисковой системы.
Общий принцип функционирования.
44 Индексирование
Индексирование — это процесс перевода с естественного языка на информационно-поисковый язык либо на язык индексирования (ИПЯ).
Язык предметных рубрик.
Типы индексирования
В зависимости от используемых ИПЯ можно выразить с помощью предметизации, систематизации (классификационные ИПЯ)
Два вида индексирования (в зависимости от ИПЯ)
- Предкоординатное. ИПЯ классификационного типа. Чаще применяется к документам, которые индексируются до поступления запроса. Поиск в этом случае чаще всего реализуется по иерархической структуре, т.е. по каталогам.
- Посткоординатное. Координатные ИПЯ. языки дескрипторных или ключевых слов). Индексированию подвергаются документы а также запросы, индексирование выполняется после поступления запроса.
На сегодня чаще всего исп. два осн. варианта:
- Прямой индекс (прямой индексный файл)
- Обратный индекс (инвертированный файл)
45 Синтаксический анализ в информационно-поисковых системах.
- Пофразовый. Составление фраз.
- Пословный. При поиске воспринимается каждое слово по отдельности.
- Комбинированный.
46 Поисковые функции ипс
Можно выделить два основных режима работы ИПС.
1. Ретроспективный поиск. Осуществляется по разовым запросам по всей базе данных поисковых образов документов. Этот режим реализован во всех ИПС.
2. Режим избирательного распространения информации. Реализуется по постоянным запросам по части базы данных вновь поступивших документов. Чаще всего за определенный период. При реализации данного режима обязательно должна быть БД документов с информацией о дате их поступления, а также БД поисковых образов запросов.
48 Показатели эффективности поиска
Основные
— Полнота поиска
— Точность
Косвенные
— Информационные потери
— Информационный шум
|
Релевантные документы |
Нерелевантные документы |
Выданные |
a |
b |
Не выданные |
с |
в |
A + C = истинно релевантные документы
Полнота поиска — это отношение выданных релевантных документов к общему количеству релевантных документов в базе.
Диапазон изменение полноты — от 0 до 1
Точность — отношение выданных релевантных документов к общему количеству выданных документов.
Пределы изменения — от 0 до 1
Потеря - отношение не выданных релевантных документов к невыданным релевантным документам.
ИПт = 1 полнота
Информационный шум - b / (a + b)
1 - точность
Отношение выданных не релевантных документов к общему количеству выданных документов