- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
Глоссарий
Алфавитно-предметная классификация – информационно-
поисковый язык, основной словарный состав которого представлен упорядоченным по алфавиту множеством слов, словосочетаний и фраз естественного языка, обозначающих предметы какой-либо отрасли науки или практической деятельности.
Библиотечно-библиографическая классификация –
классификация, применяемая в библиотечно-библиографической практике и служащая для расстановки как самих документов, так и их описаний в систематических каталогах.
Вторичный документ - документ, являющийся результатом аналитико-синтетической переработки одного или нескольких первичных документов.
Грамматика – система способов и средств построения слов и предложений в рассматриваемом языке.
Данные - информация, обработанная и представленная в формализованном виде для дальнейшей обработки.
Дескриптор — предназначенное для координатного индексирования документов и информационных запросов нормативное ключевое слово, по определенным правилам отобранное из основного словарного состава того или иного естественного языка.
Дескрипторный язык – информационно-поисковый язык, словарный состав которого состоит из дескрипторов, а использование основано на принципе координатного индексирования.
Документная информация - информация, содержащаяся в документах.
Естественный язык - язык, словарь и грамматические правила которого обусловлены практикой применения и не всегда формально зафиксированы.
Знак - материальный предмет (явление, действие, событие),
который |
выступает |
в процессе коммуникации как представитель |
другого |
предмета, |
свойства или отношения и используется для |
передачи, переработки и хранения информации.
Значение - информация, присвоенная знаку в процессе коммуникации.
Идентификация - установление тождества объектов на основе совпадения их признаков.
Иерархическая классификация – классификация, в которой каждое подразделение высшего порядка состоит из непересекающихся между собой подразделений низшего порядка.
Индексирование - формирование описания документа как совокупности дескрипторов, выбираемых из заранее созданных словарей понятий, либо из текстов документов.
Информатизация - Комплекс мер, направленных на обеспечение оперативного доступа к информационным ресурсам.
Информации переработка аналитико-синтетическая -
преобразование документов в процессе их анализа и извлечения необходимой информации, а также оценка, сопоставление, обобщение и представление информации в виде, соответствующем запросу.
Информационная система - система, предназначенная для хранения, обработки, поиска, распространения, передачи и предоставления информации.
Информационная технология - совокупность методов,
производственных процессов и программно-технических средств, объединенных в технологический комплекс, обеспечивающий сбор, создание, ранение, накопление, обработку, поиск, вывод, копирование, передачу и распространение информации.
Информационно-поисковый тезаурус – словарь-справочник, в
котором перечислены все лексические единицы дескрипторного ИПЯ с синонимичными им словами, а также эксплицитно выражены важнейшие смысловые отношения между дескрипторами.
Информационно-поисковый язык (ИПЯ) – искусственный язык,
обеспечивающий компактную, строго алгоритмизированную запись содержания документов и запросов в ИПС. ИПЯ можно определить как специализированную семантическую систему, состоящую из алфавита, правил образования (грамматики) и правил интерпретации (семантики).
Информационные ресурсы - совокупность накопленной информации, зафиксированной на материальных носителях в любой форме, обеспечивающей ее передачу во времени и пространстве. В контексте автоматизированных информационных систем под информационными ресурсами обычно подразумевают информационные массивы и базы данных, рассматриваемые совместно с информационными технологиями, обеспечивающими их доступность.
Информационный анализ - выявление в документах и фиксация в виде данных информации, относящейся к определенной предметной области.
Информация - сведения, воспринимаемые человеком и (или) специальными устройствами как отражение фактов материального или духовного мира в процессе коммуникации.
Информация научная - логически организованная информация, получаемая в процессе научного познания и отображающая явления и законы природы, общества и мышления.
Информация научно-техническая - информация, получаемая и
(или) используемая в области науки и (или) техники. Информационный запрос – записанный на естественном языке
текст, выражающий некоторую информационную потребность. Искусственный язык - язык, специально созданный и
регулируемый на основе согласованных принципов.
Классификация - процесс соотнесения содержания документов с понятиями, зафиксированными в заранее составленных систематических схемах.
Ключевое слово – предметное слово, выбираемое из некоторого текста (документа) и используемое для координатного индексирования этого текста (документа).
Код - система представления информации в виде данных, состоящая из набора условных знаков и правил присвоения им значений.
Координатное индексирование – индексирование, при котором основное содержание документа представляется в виде сочетания ключевых слов или дескрипторов.
Лексика (или словарный состав) — вся совокупность слов,
входящих в состав языка.
Методы поиска - совокупность моделей и алгоритмов реализации отдельных технологических этапов, таких, как построение поискового образа запроса, отбор документов (сопоставление поисковых образов запросов и документов), расширение и реформулирование запроса, локализация и оценка выдачи.
Механизмы поиска - реализованные в системе модели и алгоритмы процесса формирования выдачи документов в ответ на поисковый запрос.
Морфология — совокупность действующих в языке способов и средств построения слов.
Навигация - целенаправленная, определяемая стратегией, последовательность использования методов, средств и технологий конкретной АИПС для получения и оценки результата поиска.
Наименование - слово или словосочетание, используемое для идентификации какого-либо существа, предмета или класса.
Носитель информации (данных) - средства регистрации,
хранения, передачи информации (данных).
Парадигматические отношения (аналитические отношения,
базисные отношения, ассоциативные отношения) – логические отношения, существующие между лексическими единицами ИПЯ, независимо от их контекста.
Перечислительные классификации - иерархические классификации, в которых имеются отдельные исчерпывающие классы для всех возможных объектов, т. е. перечислены в классификационных таблицах.
Поисковый образ документа (ПОД) – описание документа,
выраженное средствами ИПЯ и характеризующее основное смысловое содержание или какие-либо другин признаки этого документа, необходимые для его поиска по запросу.
Поисковый образ запроса (ПОЗ) – записанный на ИПЯ текст,
выражающий смысловое содержание информационного запроса и
содержащий указания, необходимые для наиболее эффективного осуществления информационного поиска.
Понятие - форма мышления, отражающая существенные свойства, связи и отношения предметов и явлений.
Посткоординируемый ИПЯ — ИПЯ, в котором лексические единицы (термины, слова) объединяются в «предложения» (поисковые образы) лишь во время индексирования документов или даже в процессе их поиска.
Предкоординированный ИПЯ – ИПЯ, в котором лексические единицы (термины, слова) поисковых образов связаны координатной (соподчинительной) или какой-либо иной связью до процесса индексирования.
Признак - свойство объекта, обусловливающее его различие или общность с другими объектами.
Символ - элемент согласованного набора материальных предметов, используемых для представления знаков.
Синтагматические отношения (текстуальные отношения,
синтетические отношения, синтаксические отношения) – отношения между лексическими единицами ИПЯ, выражающие действительные логические связи между соответствующими понятиями в тексте сообщения.
Синтаксис — совокупность действующих в языке способов и средств построения предложений.
Сообщение - информация, переданная и (или) полученная в процессе коммуникации.
Средства поиска –взаимозависимый комплекс ИПЯ и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов, словарей, совокупностей результатов поиска), а также объекты пользовательского интерфейса как технологические решения, обеспечивающие управление последовательностью выбора операционных объектов конкретной АИПС.
Стратегия поиска - общий план (концепция, предпочтение, предрасположенность, установка) поведения пользователя для выражения и удовлетворения информационной потребности, обусловленный характером цели и типом поиска, архитектурой БД, а также методами и средствами поиска конкретной АИПС.
Тезаурус - семантическая сеть, в которой понятия связаны регулярными и устойчивыми семантическими отношениями – иерархическими (например, род-вид, целое-часть), ассоциативными, а также отношениями эквивалентности.
Термин - слово или словосочетание, являющееся точным обозначением определенного понятия какой-либо области знания.
Терминосистема - организованная совокупность терминов в специальном языке определенной области знания.
Технологии поисковые – унифицированные (оптимизированные в рамках конкретной АИПС) последовательности эффективного использования в процессе взаимодействия пользователя с системой отдельных средств поиска для устойчивого получения конечного и, возможно, промежуточных результатов.
Фасет – совокупность подклассов, получаемая при делении основного класса по одному и тому же ряду характеристик.
Фасетная классификация – классификация, дающая возможность классифицировать объекты параллельно по нескольким различным признакам.
Фасетная формула – фиксированная схема последовательности расположения фасетов в индексах документов при их многоаспектном индексировании.
Формат - способ расположения и представления данных на носителе информации.
Язык - Система знаков, обеспечивающая коммуникацию и включающая набор знаков (словарь) и правила их употребления и интерпретации (грамматика).