- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
для данной проблемы областью и другими областями. Рассеяние собственно информации основывается не на ослаблении, а на усилении межотраслевых связей в условиях научно-технического прогресса. Поэтому при изучении характера рассеяния информации следует рассматривать не столько рассредоточение профильных для какой-либо отрасли науки или техники публикаций, сколько возможность появления потенциально полезной информации для решения той или иной задачи в других, даже весьма отдаленных отраслях. Причем, такая информация может существовать как в явной, так и в латентной форме.
1.4. Информационные единицы
Связывание понятий информация и знание в информатике означает, что при поиске единицы информации, следует идти по пути поиска единицы знания, представленной в виде информационного сообщения. То есть, единица научно-технической информации может быть определена следующим образом [Муранивский1982]: «… в качестве единицы информации может рассматриваться любое (сколь угодно широкое или узкое) информационное сообщение или знание, которое имеет самостоятельное значение и выражено в доступной для восприятия и практического использования форме». Например, единицами информации являются сообщения о научных фактах, описания экспериментов, их методов или результатов, определения, закономерности, суждения, умозаключения, гипотезы, теории, законы, а также чертежи или описания конструкций, узлов, приборов, машин, технологических процессов и т.п. Другими словами, единица информации
— это единица знания, выраженная в форме письменных или какихлибо других документов или их фрагментов.
В качестве единицы научной информации может выступать и краткое или пространное сообщение, и отдельный научный факт, и научная теория, и совокупность фактов, гипотез, концепций, теорий и законов, образующих основу какой—либо отрасли науки. Самостоятельными единицами технической информации в такой отрасли, как машиностроение, могут быть описания конструкции детали, узла, машины или устройства, системы машин и т.п. Какую единицу выбирать, зависит от конкретных условий: от отрасли знания, интересов потребителя информации и других факторов, В одних случаях достаточно сообщить об отдельных результатах экспериментального исследования, а в других потребуется обоснование тенденций развития целой отрасли или группы отраслей.
Предлагаемое толкование единицы информации основывается на методологическом принципе относительности элементарного.
Из истории развития науки можно привести немало примеров, когда на место дискретного элемента, выступающего в качестве объекта научного исследования, со временем приходит непрерывная единица.
Например, вплоть до XVII века математика ограничивалась изучением
постоянных величин и фиксированных зависимостей между ними. Когда запросы астрономии и механики выдвинули проблему математического отображения процессов и движения, она стала исследовать переменные величины. А когда их изменяемость была распространена до бесконечно малого и бесконечно большого, возникло дифференциальное и интегральное исчисление.
Всовременной науке сложная структура элементарных образований различных материальных уровней, своеобразие законов их функционирования и развития приводят к уточнению общего понятия элемента. Простоту элемента следует понимать не абсолютно, а относительно изучаемой целостной системы. Множественности форм и уровней организации в природе соответствует множественность элементарных образований, каждое из которых является элементарным лишь по отношению к системам более высокого уровня (например, в живой природе – это клетка и клеточный организм, организм и популяция, вид популяции и биоценоз и т.д.).
Всемиотике, как языковой системе, осуществляющей функции обмена информацией, рассматривается несколько структурновзаимосвязанных уровней информации: уровень букв и элементарных знаков; уровень слов, чисел, классификационных шифров; уровень высказываний (показателей и других единиц языка, которые имеют форму наименований некоторых величин и их значений); уровень документов. Каждый из этих уровней, соответственно, может иметь свою единицу информации.
Любой процесс (событие, действие) существует не сам по себе, а непременно во взаимосвязи с другими процессами, причем связи эти многолики: причина и следствие, прошлое - настоящее - будущее, укрупнение или дробление и т.п. Закономерности взаимосвязей и непрерывного изменения объектов и процессов полностью распространяются и на научно-техническую информацию: одни и те же единицы информации могут быть включены в различные процессы и способны выполнять различные функции, непрерывно адаптируясь к новым условиям существования.
Следовательно, в качестве единицы информации в информационной теории целесообразно рассматривать единицу знания, которая имеет относительный характер и может менять свои функции в зависимости от конкретных условий ее практического использования.
Из относительного характера единицы информации следует ее дискретно-непрерывный характер. Это свойство проявляется, например, в текстах: отдельные слова одновременно образуют предложения, из которых составляются отрывки текста и т.п., причем в каждом случае относительно элементарные единицы одновременно образуют более сложные.
Точно такие же трудности наблюдаются при изучении единиц информации, являющихся составной частью более широких систем
(например, фактические данные в теоретической концепции или гипотезе). Кроме того, одни и те же факты не привязаны жестко к одному и тому же материальному носителю могут входить во многие теоретические обобщения и играть в каждом из них различную роль, проявляя новые свойства (как, например, слова в различных контекстах).
Таким образом, дискретно-непрерывный характер информации заключается в том, что элементарные единицы информации одновременно могут быть составными частями более широких систем, которые в свою очередь могут также образовывать новые единицы, по отношению к которым они сами имеют условно-дискретную, элементарную форму, причем эти единицы информации в различных системах могут играть разную роль. Наконец, в ряде случаев бывает трудно (а иногда нецелесообразно или даже невозможно) четко вычленить элементарные единицы информации из сложных образований более высоких уровней.
Принятие в качестве единицы информации единицы знания является принципиальным, однако трудно измеримым. Во многих случаях единица информации совпадает с содержанием документа (например, описание объекта в авторском свидетельстве или патенте, учебник по какому-либо предмету и т.п.).
Например, в библиотековедении и документоведении в качестве единицы информации была предложена натуральная единица (НИТ) - число сообщений, документов, слов, букв, символов. В математической теории информации в качестве единицы измерения используется бит - информация, содержащаяся в одном двоичном разряде, определяемая как количество информации, получаемой при выборе одного из двух равновероятных состояний.
С другой стороны, содержание информации, как уже отмечалось, не зависит ни от языка, ни от вида носителя: оно может быть выражено на различных языках и представлено в виде самых разнообразных документов. Другими словами информация инварианта по отношению к ее носителю. Поэтому отношение документа, как физической единицы, и единицы информации, содержащейся в нем, — это отношение формы и содержания, явления и сущности. Соответственно, существуют и разрабатываются методы и средства извлечения информации из данных, например, средства аналитической обработки баз данных, методы автоматического реферирования и индексирования и т.д. Отметим, что работа этих автоматизированных методов аналогична тому, что делает человек: путем всестороннего изучения явления (текста документа) проникает в сущность, выявляя и извлекая из текста нужную информацию.
Контрольные вопросы
1.Охарактеризуйте соотношение понятий «информация», «данные», «знания».
2.Дайте определение понятия «информация».
3.Охарактеризуйте прагматические свойства информации.
4.Перечислите атрибутивные свойства информации.
5.Назовите и охарактеризуйте формы концентрации информации.
6.Приведите примеры проявления свойства старения информации.
7.Охарактеризуйте свойство рассеяния информации.
8.Дайте определение единицы информации.