- •На тему
- •Содержание
- •1.Введение 6
- •1.Информационно-поисковый язык 16
- •1.Введение 90
- •5.Заключение 95
- •Введение
- •Документальные системы.
- •Поисковый аппарат
- •Оценка эффективности поиска
- •Релевантность
- •Заключение.
- •Список использованных источников.
- •На тему
- •Оглавление
- •4.Заключение 67
- •1.Введение 73
- •1.Введение 90
- •5.Заключение 95 введение
- •Фактографические системы
- •Концептуальные модели данных
- •Список литературы:
- •На тему
- •На тему
- •Введение
- •Безопасность ис
- •Оценка безопасности ис
- •Методы и средства построения систем информационной безопасности.
- •Методы и средства обеспечения безопасности информации в аис
- •Защита информации в корпоративных сетях экономических ис
- •На тему Фактографические системы. Представление данных в памяти эвм.
- •Оглавление
- •3. Внутренняя схема баз данных фактографических аис 7
- •Введение
- •Система представления и обработки данных фактографических аис
- •Система управления базами данных фактографических аис
- •Внутренняя схема баз данных фактографических аис
- •Разновидности моделей данных
- •Графовые модели
- •Источники
- •На тему
- •4.Заключение 67
- •1.Введение 73
- •1.Введение 90
- •5.Заключение 95
- •2. Документальные информационные системы.
- •2.1. Общая характеристика
- •2.2. Виды дис
- •2.2.1. Семантически-навигационные системы
- •2.2.2. Системы индексирования
- •3. Основные показатели эффективности функционирования дис.
- •4. Источники.
- •На тему Документальные системы. Классификация информационно – поисковых языков
- •Оглавление
- •4.Заключение 67
- •1.Введение 73
- •1.Введение 90
- •5.Заключение 95
- •1.Введение
- •2.Информационно-поисковый язык
- •3.Структура ипя
- •3.1 Иерархическая классификация
- •3.2 Предметные заголовки
- •3.3 Ключевые слова
- •3.4 Помеченные дескрипторы
- •3.5 Фасетное индексирование
- •3.6 Перестановочное индексирование
- •Источники
- •На тему Документальные системы. Информационно – поисковый язык
- •Оглавление
- •4.Заключение 67
- •1.Введение 73
- •1.Введение 90
- •5.Заключение 95 Введение
- •1.Информационно-поисковый язык
- •2.Структурная составляющая ипя индексированных систем
- •2.1.Информационно-поисковые каталоги
- •2.2.Тезаурус
- •2.3.Генеральный указатель
- •3.Структурная составляющая ипя семантически-навигационных систем
- •4.Поисковая (манипуляционная) составляющая ипя
- •4.1.Дескрипторные языки
- •4.2.Семантические языки
- •4.2.1.Предикатный язык
- •4.2.2.Реляционный язык
- •5.Показатели эффективности функционирования
- •Источники
- •Реферат на тему: «Поисковые системы»
- •Содержание
- •4.Заключение 67
- •1.Введение 73
- •1.Введение 90
- •5.Заключение 95
- •Введение
- •Основные принципы построения Информационно-поисковых систем
- •Понятие информационно - поисковой системы
- •Процесс поиска
- •Информационный язык
- •Перевод
- •Дескриптор
- •Критерий соответствия
- •Индексирование
- •Заключение
- •4. Источники
- •На тему Фактографические системы. Этапы проектирования баз данных
- •Оглавление
- •4.Заключение 67
- •1.Введение 73
- •1.Введение 90
- •5.Заключение 95
- •1.Введение.
- •2.Основные задачи проектирования баз данных.
- •3.Основные этапы проектирования баз данных.
- •3.1.Концептуальное (инфологическое) проектирование
- •3.2.Логическое (даталогическое) проектирование
- •3.3.Физическое проектирование
- •3.4.Нормализация.
- •3.5.Модели «сущность-связь».
- •3.6.Семантические модели
- •Источники
- •На тему
- •Содержание
- •4.Заключение 67
- •1.Введение 73
- •1.Введение 90
- •5.Заключение 95
- •2.Государственное регулирование интелектульной собственности.
- •2.1 Статья 1225. Охраняемые результаты интеллектуальной деятельности и средства индивидуализации
- •2.2 Статья 1232. Государственная регистрация результатов интеллектуальной деятельности и средств индивидуализации
- •2.3 Статья 1333. Изготовитель базы данных
- •2.4 Статья 1334. Исключительное право изготовителя базы данных
- •3. Документы и оформление программ как интелектуальной собственности Документы и информация, необходимые для регистрации авторских прав на программы для эвм и баз данных при помощи юридических фирм:
- •Заявка на регистрацию должна содержать:
- •4. Заключение
- •Источники
- •1. "Гражданский кодекс рф - часть четвертая" принятый Государственной Думой 24 ноября 2006 г.
- •На тему
- •Содержание
- •4.Заключение 67
- •1.Введение 73
- •1.Введение 90
- •5.Заключение 95
- •2.Основные подходы к анализу рисков
- •2.2 Методология анализа рисков в ис с повышенными требованиями в области иб
- •2.2.1.Определение ценности ресурсов
- •2.2.2.Оценка характеристик факторов риска
- •3.Метод cramm
- •4.Заключение
- •Источники
- •На тему Фактографические системы. Типы моделей.
- •Оглавление
- •4.Заключение 67
- •1.Введение 73
- •1.Введение 90
- •5.Заключение 95
- •1.Введение
- •2.Разновидности моделей данных
- •2.1.Графовые модели
- •2.2.Реляционная модель
- •2.3.Семантические модели
- •2.4.Объектные модели
- •2.5.Многомерные модели
- •2.6.Модель сущностей-связей
- •Источники
- •На тему
- •Оглавление
- •Графическое представление модели «сущность – связь» ………………….7
- •Введение
- •Модель сущность-связь
- •Базовые понятия er-модели Сущность
- •Типы связи
- •Графическое представлениемодели «сущность – связь»
- •Заключение
- •Список использованной литературы
- •На тему
- •1.Введение
- •2.Информационные системы
- •3.Фактографические и документальные информационные системы
- •4.Програмные средства реализации документальных ис
- •5.Заключение
2.2.2. Системы индексирования
Система индексирования (СИ) совокупность методов и средств перевода текстов с естественного языка на ИПЯ в соответствии с заданным набором словарей лексических единиц и с правилами применения ПНЯ.
Рассмотрим классификацию систем индексирования.
1. Но степени автоматизации процесса индексирования выделяют системы:
• ручного индексирования;
• автоматического индексирования;
• автоматизированного индексирования.
2. По степени контролируемости различают системы:
• без словаря;
• с жестким словарем;
• со свободным словарем.
3. По характеру алгоритма отбора слов текста выделяют системы:
• с последовательным просмотром текста (отбираются все полнозначные слова);
• с эвристическими процедурами выбора слов текста (слова отбираются интуитивно или по заданной процедуре):
• со статистическими процедурами выбора слов (отбираются только информативные слова в соответствии с распределением частот их употребления).
4. По характеру лексикографического контроля различают системы:
• без лексикографического контроля;
• с полным контролем;
• с промежуточным контролем.
Лексикографический контроль предусматривает:
• устранение синонимии, полисемии и омонимии на основе нормативных словарей лексических единиц с парадигматическими отношениями между ними;
• нормализацию слов на основе морфологических нормативных словарей.
5. По характеру морфологического анализа слов различают системы:
• с использованием морфологических словарей;
• с использованием основных лексических словарей;
• с использованием морфологического анализа с усечением слов.
Возможны системы индексирования без морфологического анализа.
Процесс свободного индексирования состоит в следующем. Индексатор выписывает слова или словосочетания, которые, по его мнению, отражают содержание текста. Он может брать слова, отсутствующие в тексте, но важные, с его точки зрения, для выражения смысла текста. Отобранный список слов является поисковым образом документа. Это СИ с ручным индексированием.
Процесс полусвободного индексирования аналогичен вышеописанному, но слова для подберутся только из словаря.
При жестком индексировании слова берутся только из текста.
Поначалу индексирование осуществлялось специально подготовленными специалистами-экспертами в предметной области, которые могли осуществлять глубокий анализ смыслового содержания документа и относить его (индексировать) к тем или иным классам, рубрикам, ключевым терминам. В этом случае были высоки накладные расходы, поскольку требовалось наличие в штате высококвалифицированных специалистов-индексаторов. Кроме того, процесс индексирования в некоторой мере был субъективным. Поэтому возникла задача автоматизации индексирования документов.
Существуют два подхода к автоматическому индексированию. Первый основан на использовании словаря ключевых слов и применяется в системах на основе ИПТ. Индексирование в таких системах осуществляется путем последовательного автоматического поиска в тексте документа ключевых терминов. Строится индекс, представляющий поисковое пространство документов. Возможны два типа такого индекса - прямой и инвертированный.
Прямой тип индекса строится по схеме «документ-термины». Поисковое пространство в ЭТОМ случае представлено в виде матрицы размерностью nxm. Строки этой матрицы представляют поисковые образы документов.
Инвертированный тип индекса строится по обратной схеме — «термин-документы». Поисковое пространство соответственно представлено аналогичной матрицей, только в транспонированной форме. Поисковыми образами документов в ЭТОМ случае являются столбцы матрицы.
Второй подход к автоматическому индексированию применяется в полнотекстовых системах. В процессе индексирования в индекс заносится информация обо всех словах текста документа (отсюда и название «полнотекстовые»).
Схематично общий принцип устройства и функционирования документальных ИПС на основе индексирования иллюстрируется на рис. 1.
Рис. 1 Общий принцип устройства и функционирования документальных ИПС на основе индексирования
