- •Глава 1 Основные понятия экономических информационных систем
- •1.1 Основные понятия и определения экономических информационных систем
- •1.2 Принципы построения и функционирования эис
- •1.3 Критерии эффективности эис
- •1.4 Классификация эис
- •1.5 Теория организации. Использование концепции многоуровневых систем в теории организаций.
- •1) Участники.
- •2) Структура организации
- •3) Методология.
- •1.6 Формализация основных понятий теории opганизаций в рамках теории многоуровневых систем
- •1.7 Предметная область
- •1.8 Компоненты экономических информационных систем
- •1.9 Классификация и основные свойства единиц информации
- •Пример:
- •Основные операции над единицами информации:
- •1.10 Экономические показатели и документы
- •1.11 Детализация представлений эис
- •1.12. Жизненный цикл эис
- •1.13. Цели и методы модификации эис
- •Глава 2. Модели данных
- •2.1. Модели данных. Реляционная модель данных
- •2.2. Функциональные зависимости и ключи
- •2.3. Нормализация отношений
- •2.4. Вторая и третья нормальные формы отношений
- •2.5. Ациклические базы данных
- •2.6. Сетевая модель данных
- •2.7.Организация веерного отношения в памяти эвм
- •2.8. Иерархическая модель данных
- •2.9. Сравнение моделей данных
- •2.10. Модель инвертированных файлов и информационно-поисковые системы
- •Глава 3. Методы организации данных
- •3.1 Методы организации данных в памяти эвм
- •3.2. Последовательная организация данных.
- •3.3. Цепная (списковая) организация данных
- •3.4. Древовидная организация данных
- •3.5. Сравнение методов организации данных
- •3.6. Организация данных во внешней памяти эвм
- •Глава 4. Моделирование предметных областей в экономике.
- •4.1. Семантические модели данных
- •4.2. Модель сущностей и связей
- •4.4. Базы знаний
- •4.5. Продукционная модель знаний
- •4.6. Фреймы
- •4.7. Семантические сети для представления знаний
- •4.8. Сравнение моделей знаний
- •4.9. Тезаурусы экономической информации
- •Глава 1 Основные понятия экономических информационных систем .. 3
- •1.1 Основные понятия и определения экономических информационных систем ……………………………………………………………………………….3
- •Глава 2 Модели данных ……………………………… ……………... 31
- •Глава 3 Методы организации данных ………………………………. 49
- •Глава 4 Моделирование предметных областей в экономике.
4.7. Семантические сети для представления знаний
Особенность семантической сети как модели знаний состоит в единстве базы знаний и механизма вывода новых фактов. На основании вопроса к базе знаний строится семантическая сеть, отображающая структуру вопроса, и ответ получается в результате сопоставления общей сети для базы знаний в целом и сети для вопроса.
Рассмотрим пример семантической сети, отображающий подчиненность сотрудников в отделе учреждения, приведенный на рис. 35,а. Приводятся связи, показывающие подчиненность первого сотрудника. Остальные сотрудники отдела связываются через вершины сети связями типа "руководит 2", "руководит 3" и т. д.
Вопрос "Кто руководит Серовым?" представляется в виде подсети, показанной на рис. 4.5,б. Сопоставление общей сети с сетью запроса начинается с фиксации вершины "руководит", имеющей ветвь "объект", направленную к вершине "Серов". Затем производится переход по ветви "руководит", что и приводит к ответу "Петров"
Рисунок 4.5 Примеры: а - семантической сети;
б - сети логического вывода для запроса
Преимущества семантических сетей состоят в том, что это достаточно понятный способ представления знаний на основе отношений между вершинами и дугами сети. Однако с увеличением размеров сети ухудшается се обозримость и увеличивается время вывода новых фактов с помощью механизма сопоставления.
4.8. Сравнение моделей знаний
Модели знаний - продукционная, фреймовая и модель семантических сетей - обладают практически равными возможностями представления знаний, использующих отношения "есть-нек" и "есть-часть". Дополнительно каждая модель знаний содержит средства усиления этой "базовой" конфигурации:
- продукционная модель позволяет легко расширять и усложнять множество правил вывода;
- фреймовая модель позволяет усилить вычислительные аспекты обработки знаний за счет расширения множества присоединенных процедур;
- модель семантических сетей позволяет расширять список отношений между вершинами и дугами сети, приближая выразительные возможности сети к уровню естественного языка.
4.9. Тезаурусы экономической информации
Первоначально идея разработки тезаурусов возникла в словарной практике в связи с составлением толковых словарей, как средство описания семантической структуры естественного языка. Затем они были применены в практике автоматизированных информационно-поисковых систем для обеспечения избыточного индексирования документов и информационных запросов. Под избыточным индексированием понимается дополнение поискового образа документов дополнительными дескрипторами, которые связаны по смыслу с основными дескрипторами.
Тезаурус - это словарь-справочник, в котором перечислены все лексические единицы ИМЯ с синонимичными им словами, а также выражены все важнейшие смысловые (парадигматические) отношения между лексическими единицами.
Тезаурус, как элемент информационного языка, выполняет следующие функции:
- средство формализации лексики;
- средство терминологического контроля;
- средство избыточного индексирования информационных запросов;
- средство выражения парадигматических отношений языка.
Основные этапы разработки тезауруса следующие:
а) Выбор источников лексики и отбор терминов.
б) Составление терминологического словаря.
в) Группировка терминов в тематические классы.
г) Формирование классов условной эквивалентности.
д) Установление парадигматических отношений.
е) Определение структуры тезауруса.
а) Для отбора лексического материала необходимо использовать экономические документы, отражающие характеристики экономического объекта. Кроме того, надо пользоваться такими вспомогательными средствами, как толковые и терминологические словари, справочники по исследуемой тематике, общесоюзные классификаторы.
Отбор терминов определяется специальными правилами. Перечислим некоторые из них:
- узкие термины применять, если в словаре отсутствуют подходящие общие термины;
- многословный термин вводить в том случае, если встречается довольно часто;
- прилагательное следует употреблять в сочетании с существительным.
б) В терминологическом словаре каждому отобранному термину дается определение, соответствующее его экономическому смыслу. Терминологический словарь служит в качестве пособия при формировании запросов конечными пользователями.
в) Все термины классифицируются в зависимости от функционального назначения в тематические классы. Ниже приведен перечень тематических классов экономической лексики:
1) Экономические категории, действия, события
2) Субъекты действия
3) Объекты действия
4) Назначение действия
5) Место действия
6) Источник поступления (финансирования)
7) Время действия
8) Функция управления
9) Единица измерения
10)Атрибутивные характеристики действия (разряд работ и т. п.)
11) Обоснование действия
12) Причина отклонения.
г) Дальнейшая работа по составлению тезауруса заключается в устранении многозначности (омонимия, полисемия) и синонимии терминов.
Омонимия - это совпадение в звучании и написании разных слов. Например: лук (растение) и лук (оружие).
Полисемия - это перенос названия одного предмета на другие предметы. Например: звезда (геометрическая фигура) и звезда (небесное тело), матрица (математическая) и матрица (техническая).
Омонимия и полисемия устраняются лексикографически при редактировании терминологического словаря.
Синонимия заключается в том, что одному "означаемому" (предмету, явлению) соответствует одно и более "означающих" (слов, словосочетаний). Например: алфавит - азбука, студенты - студенчество.
При построении тезауруса устранение синонимии производится путем группировки терминов в классы условной эквивалентности (КУЭ).
В КУЭ объединяются термины, между объемами понятий которых существуют отношения:
- равнозначности (геомагнетизм - земной магнетизм);
- перекрещивания, когда часть объема одного понятия входит в объем другого(книга - монография);
- подчинения, когда объем одного понятия составляет часть объема другого понятия (стол - мебель);
- внеположенности, когда объемы понятий полностью исключают друг друга и при этом не исчерпывают области предметов, о которых ведется рассуждение (стол - стул: общий класс - мебель).
В результате формирования классов условной эквивалентности термины тезауруса группируются в синонимические ряды. В каждом синонимическом ряду выделяется доминанта, то есть такой термин, который может заменить любое слово класса. Доминанту принято называть дескриптором. Однако фактически дескриптором является не имя КУЭ, а сам этот класс.
д) Парадигматические отношения в тезаурусах могут выражаться четырьмя способами:
- лексикографически;
- при помощи таблиц;
- аналитически;
- графически.
Лексикографический способ предполагает наличие специальных помет, которые указывают, в каких парадигматических отношениях находится данный дескриптор с заглавным. При этом используются условные обозначения, рекомендуемые ГОСТом, а именно:
н - нижестоящий видовой дескриптор по отношению к заглавному дескриптору;
в - вышестоящий родовой дескриптор по отношению к заглавному дескриптору;
ц - дескриптор находится в отношении - целое к заглавному дескриптору;
ч - дескриптор находится в отношении - часть к заглавному дескриптору;
с - ключевое слово находится в отношении синонимии к заглавному дескриптору;
см - отсылка от ключевого слова к дескриптору.
Табличный способ заключается в том, что под заглавным дескриптором записываются со сдвигом на несколько знаков вправо дескрипторы, находящиеся с ним в определенном отношении. Такой способ применяется в библиотечно-библиографических классификациях.
При аналитическом способе парадигматические отношения выражаются при помощи структуры кодов дескрипторов. Примером применения аналитического способа может служить универсальная десятичная классификация.
Графический способ предполагает применение различных графических схем.
Терминам экономических документов присущи отношения "вид-род", обозначающие смысловую соподчиненность терминов, и "целое-часть", дающие математическую взаимосвязь экономических категорий. Поэтому наиболее удобным будет сочетание лексикографического и табличного способов выражения парадигматических отношений.
е) Структура тезауруса влияет на результаты поиска и соответственно на эффективность работы всей системы.
Как правило, тезаурус представляется в виде совокупности расположенных в алфавитном порядке дескрипторных статей (семантических сегментов). Они представляет собой совокупность заглавного дескриптора и всех дескрипторов, связанных с ним какими-либо парадигматическими отношениями, а также ключевых слов-синонимов. Например:
Выпуск
с выпущено
с выработано
с произведено
с производство
Кольца уплотнительные круглого сечения
в Кольца уплотнительные
н Кольца резиновые уплотнительные круглого сечения, резина группы О
н Кольца резиновые уплотнительные круглого сечения, резина группы 1
Вопросы для самоконтроля к главе 3
1.Для чего служат семантические модели данных?
2.Какие уровни интерпретации имеют семантические модели?
3.Как отображается структура предметной области в модели сущностей и связей?
4.В чем недостатки модели «сущность-связь»?
5.Как отображается структура предметной области в модели семантической сети?
6.Что означают вершины графов в семантической сети?
7.Как отображаются связи между понятиями семантической сети? Что означает одинарная или двойная линия?
8.Что такое падежи семантической сети?
9.В чем преимущества семантической сети?
10.Как понимаете понятие искусственный интеллект?
11.В чем принципиальное отличие реализации запросов в базах знаний и базах данных?
12.Какие существуют принципиально различные модели знаний?
13.Что представляет собой продукционная модель знаний?
14.Как получаются новые знания в продукционной модели знаний?
15.Как ускорить процесс получения вывода в продукционной модели знаний?
16.В чем преимущества и недостатки продукционной модели знаний?
17. Что представляет собой фреймовая модель знаний?
18.Что представляет собой фрейм?
19.Что входит в структуру фрейма?
20.Как получаются новые знания в фреймовой модели знаний?
21.В чем преимущества и недостатки фреймовой модели?
22.Какие преимущества имеет та или иная модель знаний?
23.Что такое тезаурус?
24.Какие функции выполняет тезаурус?
25.Какие основные этапы разработки тезауруса?
26.В какие тематические классы объединяются все экономические понятия?
27.Для чего нужны классы условной эквивалентности?
28.Что такое дискриптор?
29.Какими способами отображаются парадигматические отношения в тезаурусах?
30.Что представляет собой структура тезауруса?
Терминологический словарь
Адрес связи- атрибут, в котором хранится начальный адрес или номер записи, обрабатываемой после этой записи. Обычная последовательность обработки записей в списке определяется возрастанием значений ключа в записях.
Атрибут – единица информации, информационное отображение отдельного свойства некоторого объекта, процесса или явления.
Атрибут-основание - отображение количественного свойства некоторого объекта, предмета, процесса.
Атрибут-признак - информационное отображение качественного свойства некоторого объекта, предмета, процесса.
Ацикличность – процедура позволяющая улучшить характеристики БД, чтобы при корректировке или перестройке отношений не было двусмысленности или потери информации.
База данных (БД) - это набор форматированных сообщений,
Бинарное дерево – древовидная организация данных, когда значение ключевого атрибута каждой записи больше, чем значение ключа у любой записи на ее левой ветви, и не меньше, чем ключ любой записи на ее правой ветви.
Веерное отношение - называется пара отношений, состоящая из одного основного, одного зависимого отношения и связи между ними при условии, что каждое значение зависимого отношения связано с единственным значением основного отношения.
Вероятный ключ отношения - такое множество атрибутов, что каждое сочетание их значений встречается только в одной строке отношения, и никакое подмножество атрибутов этим свойством не обладает. Вероятных ключей в отношении может быть несколько.
Взаимодействие объектов - факт участия нескольких объектов в каком-либо процессе, который протекает и во времени, и в пространстве
Внутреннее описание - определяет организацию данных в памяти ЭВМ и методы доступа к данным..
Время поиска данных - нахождение значения ключевого атрибута равного заранее известной величине;
Время корректировки данных - т.е. включение или исключение одной записи;
Выборка - операция выделения подмножества значений СЕИ (строк), которые удовлетворяют заранее поставленным условиям выборки.
Дескриптор – доминанта в классе условной эквивалентности, то есть такой термин, который может заменить любое слово класса.
Документ - материальный носитель информации, содержащий оформленное в установленном порядке сообщение и имеющий юридическую силу.
Домен – множество всех допустимых значений атрибута
Древовидная организация данных (дерево) – метод организации данных, множество записей расположены определенным образом по уровням:
- на 1-м уровне расположена только одна запись (корень дерева),
- к любой записи i-го уровня ведет адрес связи только от одной записи уровня i-1.
Единицы информации - набор символов, которому придается определенный смысл (атрибуты и составные единицы информации).
Идентифицирующие свойства - свойства, по значению которых можно однозначно отличить данный экземпляр объекта от любого другого (в том числе и в пределах класса объектов, содержащего этот экземпляр).
Иерархическая база данных - множество отношений и веерных отношений, для которых соблюдаются два ограничения:
1) существует единственное отношение, называемое корневым, которое не является зависимым ни в одном веерном отношении.
2) все остальные отношения (за исключением корневого) являются зависимыми отношениями только в одном веерном отношении.
Иерархическая модель данных – модель данных, допустимыми информационными конструкциями которой являются отношение, веерное отношение и иерархическая база данных.
Индексирование - выражение тем на языке, принятом в информационно-поисковой системе, и записи в виде поисковых образов, которые связываются с документом.
Информация – ресурсы; новые сведения, позволяющие улучшить процессы, связанные с преобразованием вещества, энергии и самой информации, принятые, понятые и оцененные конечным потребителем как полезные
Концептуальная схема - описание структуры всех единиц информации, хранящихся в БД.
Концептуальное представление - информационное содержание базы данных в абстрактной форме. Цель концептуального уровня - создать такое формальное представление о базе данных, чтобы любое внешнее представление являлось его подмножеством.
Корректировка - включение и исключение записей
КУЭ - классы условной эквивалентности.
Неполная функциальная зависимость - это две зависимости:
- вероятный ключ отношения функционально определяет некоторый неключевой атрибут,
- часть вероятного ключа функционально определяет этот же неключевой атрибут.
Нормализация - это операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой, позволяющая улучшить характеристики БД по минимальность избыточности представления информации.
Объект - любой элемент некоторой системы. В экономических приложениях это любой предмет, занимающий место в пространстве.
Омонимия -совпадение в звучании и написании разных слов. Например: лук (растение) и лук (оружие).
Организация значений данных - относительно устойчивый порядок расположения записей данных в памяти ЭВМ и способ обеспечения взаимосвязи между данными.
Отношение – таблица, с двухуровневой структурой
Отношение в первой нормальной форме (1 НФ) - это обычное отношение с двухуровневой структурой. Недопустимость в структуре отношения третьего и последующих уровней является ограничением, определяющим 1НФ отношения.
Отношение во второй нормальной форме (2НФ) - если оно соответствует 1НФ и не содержит неполных функциональных зависимостей.
Отношение в третьей нормальной форме (3НФ) - если оно соответствует 2НФ и среди его атрибутов отсутствуют транзитивные функциональные зависимости (ФЗ).
Пакетный режим обработки - данные в системе накапливаются до тех пор, пока не наступит заданный момент времени, или объем данных не превысит некоторый предел. Затем имеющаяся информация обрабатывается несколькими последовательно запускаемыми программами.
Первичный ключ отношения- такой вероятный ключ, по значениям которого производится контроль достоверности информации в отношении.
Поиск - процедура выделения из некоторого множества записей определенного подмножества, записи которого удовлетворяют некоторому заранее поставленному условию.
Показатель - представляет собой полное описание количественного параметра, характеризующего некоторый объект или процесс.
Полисемия - перенос названия одного предмета на другие предметы. Например: звезда (геометрическая фигура) и звезда (небесное тело).
Порядковая система кодирования – нумерация, применяемая, если классификация объектов вообще не требуется.
Последовательная организация данных – метод организации данных, когда записи располагаются в памяти строго одна за другой, без промежутков.
Предметная область - элементы материальной системы (объект, свойства объектов, взаимодействие объектов, свойства взаимодействия объектов), информация о которых хранится и обрабатывается в ЭИС.
Проекция – операция переноса в результирующее отношение тех столбцов исходного отношения, которые указаны в условии операции.
Простейшие СЕИ - таблицы, позволяющие создавать произвольные комбинации из атрибутов.
Разработка (проектирование) ЭИС - процесс составления описания еще не существующей системы на разных языках и с различной степенью детализации, в ходе которого осуществляется оптимизация проектных решений.
Реляционная база данных - модель данных, характеризующаяся следующими компонентами:
- информационной конструкцией - отношением с двухуровневой структурой,
- допустимыми операциями - проекцией, выборкой, соединением и другими
- ограничениями - функциональными зависимостями между атрибутами отношения.
Разрядная система кодирования – классификация объектов по нескольким признакам и их взаимная подчиненность соответствует выделению классов объектов, подклассов внутри каждого класса и т.д.
Свертка - операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой
Свойство объекта - некоторая величина, которая характеризует состояние объекта в любой момент времени. Отдельный экземпляр объекта можно точно описать, если указать достаточное количество значений его свойств.
Свойство взаимодействия - характеризует совместное поведение объектов, но не относится ни к одному объекту в отдельности..
Семантические модели - средство представления структуры предметной области.
Семантические сети - модель знаний, состоящая в единстве базы знаний и механизма вывода новых фактов. На основании вопроса к базе знаний строится семантическая сеть, отображающая структуру вопроса, и ответ получается в результате сопоставления общей сети для базы знаний в целом и сети для вопроса.
Серийная система кодирования – классификация объектов по одному признаку. Коды объектов разделяются на несколько частей (серий) по количеству значений этого признака и в пределах каждой серии использовать последовательные номера.
Сетевая база данных – модель данных, состоящая из множества отношений и веерных отношений. Отношения разделяются на основные и зависимые
Синонимия - одному "означаемому" (предмету, явлению) соответствует одно и более "означающих" (слов, словосочетаний).
Система – любой объект, который, с одной стороны, рассматривается как единое целое, а с другой - как множество связанных между собой или взаимодействующих составных частей
Слот фрейма - элемент данных, предназначенный для фиксации знаний об объекте, которому отведен данный фрейм.
Составная единица информации(СЕИ) - набор из атрибутов и, возможно, других СЕИ.
Система управления базой данных (СУБД) - комплекс программ, обеспечивающий централизованное хранение, накопление, модификацию и выдачу данных, входящих в БД.
Структура СЕИ - вхождение одних единиц информации в состав других единиц информации
Тезаурус - словарь-справочник, в котором перечислены все лексические единицы ИМЯ с синонимичными им словами, а также выражены все важнейшие смысловые (парадигматические) отношения между лексическими единицами.
Транзитивная ФЗ - это две ФЗ:
- вероятный ключ отношения функционально определяет не ключевой атрибут,
- этот атрибут функционально определяет другой не ключевой атрибут.
ФЗ – функциональная зависимость
Формирование данных - процедура упорядочения записей по ключевому атрибуту.
Продукционная модель – модель знаний, состоящая из набора правил и механизма логического вывода. Все правила содержат условную и заключительную части. В условной части правила находится одиночный факт либо несколько фактов. В заключительной части правила находятся факты, которые необходимо дополнительно сформировать в рабочей памяти, если условная часть правила является истинной.
Фреймы – модель знаний, структура знаний в памяти ЭВМ сопоставимая с рамками, определенными для каждого объекта в сознании человека. С помощью фреймов мы пытаемся представить процесс систематизации знаний в форме, максимально близкой к принципам систематизации знаний человеком.
Экономическая информация - информация о процессах производства, распределения, обмена и потребления материальных благ.
Экономическая информационная система - система, функционирование которой во времени заключается в сборе, хранении, обработке и выдачи информации о деятельности какого-то экономического объекта реального мира.
Эмерджентность - свойство системы обладать большими свойствами, чем составляющие ее элементы
Литература
1.Базилевич Л.А., Соколов Д.В., Франева Л.К. Модели и методы рационализации и проектирования организационных структур управления. –Л.: Изд. ЛФЭМ, 1991.
2.Герчикова И.Н. Менеджмент. 3 изд. – М.: Банки и биржи, ЮНИТИ, 1997.
3.Григоренко Г.П., ДаниленкоТ.Я.. Системы автоматизированной обработки информации (САОЭИ). Учебное пособие. –М.: МЭСИ, 1996.
4.Димов Э.М. Теория экономических информационных систем: Учебное пособие кафедры ЭИС ПГАТИ.
5.Долинская М.Г., Соловьев И.А.. Маркетинг и конкурентоспособность промышленной продукции. –М.: Издательство стандартов, 1991. –128 с.
6.Иватилов Ю.П., Лотов А.В. Математические модели в экономике. Под ред. Академика Моисеева Н.Н. Учебное пособие. –М.: Наука, 1979.
7.Информационные системы в экономике: Учебник под ред. В.В.Дика. – М.: Финансы и статистика, 1996. –272 с.
8.Кордонская И.Б., Диязитдинова А.Р. Детализированное описание организационной структуры компании. Методическая разработка для выполнения контрольной работы по ТЭИС. Изд. ПГАТИ, 15 с.
9.Криницкий Н.А., Миронов Г.А,, ФроловГ.Д. Автоматизированные информационные системы. Под ред. Академика Дородницина А.А. –М.: Наука, 1982.
10.Мисарович М., Марко Д., ТакахараИ. Теория иерархических информационных систем. Пер. с англ. –М.: Мир, 1973.
11.Мишенин А.И. Теория экономических информационных систем: Учебник. –4 изд. – М.: Финансы и статистика, 1999. – 240 с.
12.Ойхман Е.Г., Попов Э.В. Реинжиниринг бизнеса: Реинжиниринг организаций и информационные технологии. –М.: Финансы и статистика, 1997. –336 с.
13.Основы менеджмента. Учебное пособие для вузов / Научный ред. А.А.Радугин –М.: Центр, 1998.
14.Попов Э.В., Фоминых И.Б., Е.Б. Кисель, М.Д. Шапот. Статические и динамические экспертные системы: Учебное пособие, -М.: Финансы и статистика, 1996.
15.Романов А.Н., Одинцов Б.Е. Советующие информационные системы в экономике. Учебное пособие для вузов. –М.: ЮНИТИ-ДАНА, 2000.-487 с.
16.Якубайтис Э.Я. Информационные сети и системы: Справочная книга. М.: Финансы и статистика, 1996.
Содержание