
- •Оглавление
- •Введение
- •1 Особенности экономической информации
- •1.1 Экономическая информация. Информационное обеспечение экономики
- •1.2 Свойства экономической информации
- •1.3 Классификация экономической информации
- •1) По функциям управления
- •2) По месту возникновения
- •3) По стадиям образования
- •4) По способу отображения
- •5) По стабильности
- •1.4 Основные компоненты экономической информации
- •1.5 Экономическая информация и данные
- •1.6 Требования к данным и информации
- •1.7 Внешние входящие информационные потоки
- •1.8 Внутренние информационные потоки
- •1.9 Мониторинг внешней деловой среды
- •2 Основные понятия экономических информационных систем
- •2.1 Информационная система в общем виде
- •2.2 Принципы построения и функционирования эис
- •2.3 Критерии оценки эффективности эис
- •Повышение эффективности управления объектом:
- •Эффективное использование ресурсов эис:
- •2.4 Классификация эис
- •2.5 Компоненты экономических информационных систем
- •2.5.1 Предметная область информационной системы
- •2.5.2 Детализация представлений эис
- •2.6 Свойства экономических информационных систем
- •3 Экономическая информационная система как особая модель объекта экономики
- •3.1 Модель объекта экономики как отражение его специфики
- •3.2 Моделирование экономических информационных систем. Средства реализации моделей
- •3.3 Уровни отображения предметной области. Типы описания моделей эис
- •4 Роль и место информационных систем в управлении экономическими объектами
- •4.1 Основные направления использования информационных систем в экономике
- •4.2 Роль информационных систем в экономике
- •4.3 Единое информационное пространство
- •4.4 Место эис в системе управления экономическим объектом
- •4.5 Жизненный цикл эис
- •5 Классификация и основные свойства единиц информации
- •5.1 Информационное пространство
- •5.2 Основные единицы информации — атрибуты
- •5.3 Составные единицы информации. Операции над единицами информации
- •5.4 Экономические показатели
- •6 Методы организации данных
- •6.1 Анализ алгоритмов и структур данных в эис
- •6.2 Линейная организация данных
- •6.2.1 Последовательная организация данных
- •6.2.2 Линейная списковая организация данных
- •6.3 Нелинейная организация данных
- •6.3.1 Древовидная организация данных
- •6.3.2 Нелинейные списковые структуры данных
- •6.4 Методы ускоренного доступа к данным
- •6.4.1 Интерполяционный поиск записи в массиве
- •6.4.2 Адресные функции
- •6.4.3 Способы организации индексируемого массива
- •6.5 Обработка информации по нескольким ключевым признакам
- •7 Модели данных
- •7.1 Описательная модель предметной области
- •7.1.1 Этап инфологического проектирования
- •7.1.2 Этап датологического проектирования
- •7.2 Назначение и основные компоненты системы баз данных, их уровни представления
- •7.3 Концептуальные модели данных
- •7.3.1 Типы структур данных
- •7.3.2 Операции над данными
- •7.3.3 Ограничения целостности
- •7.4 Иерархическая модель данных
- •7.5 Сетевая модель данных
- •7.6 Реляционная модель данных
- •7.6.1 Основные понятия реляционной модели данных
- •7.6.2 Реляционная структура данных
- •7.6.3 Целостность реляционных данных
- •7.6.4 Основные операции над данными
- •7.6.5 Нормализация отношений в рмд
- •8 Моделирование предметных областей в экономике
- •8.1 Семантические модели данных
- •8.1.1 Модель сущностей и связей
- •8.1.2 Модель семантических сетей
- •8.2 Базы знаний
- •8.2.1 Понятие знания. Пять основных свойств знаний
- •8.2.2 Модели представления знаний
- •8.3 Параметризация эис
- •Заключение
- •Список рекомендованной литературы
6.5 Обработка информации по нескольким ключевым признакам
Важной разновидностью доступа к данным, которая требует специальных методов ускорения доступа, является обработка информации по нескольким ключевым признакам. В структуре записи массива определяется несколько ключевых атрибутов, причем в различных прикладных программах требуется доступ к записям по различным сочетаниям этих атрибутов и, возможно, требуется последовательная обработка всего массива.
Среди ключевых атрибутов записи устанавливается порядок старшинства. Извлекаемые на обработку записи должны быть упорядочены в пределах всего массива по самому старшему ключу. В пределах группы записей с одинаковым значением старшего ключа должна соблюдаться упорядоченность по значениям следующего по старшинству ключа и т.д. Представим упорядоченность по нескольким ключам с помощью следующей схемы. Рассмотрим, например, записи с четырьмя атрибутами в порядке старшинства слева направо А1, А2, A3, А4. Значения этих атрибутов из i-й записи обозначим через ali, a2i, a3i, a3i. Преобразуем указанные величины в текстовый формат и образуем величину:
p(i) = ali + a2i + a3i + a4i.
Примечание. Через + обозначена операция сцепления.
После этого упорядоченность по нескольким ключевым атрибутам определяется условием:
p(i) p(i + 1) — упорядоченность по возрастанию;
p(i) p(i + l) — упорядоченность по убыванию.
Последовательный массив с такой упорядоченностью может обеспечивать быстрый доступ к данным по следующим сочетаниям ключевых атрибутов: а1 + а2 + а3 + а4, а1 + а2 + а3, а1 + а2 и а1. Количество сочетаний атрибутов, необходимых для реализации максимально широкого круга запросов, в данном примере составляет 15. Хранение нескольких по-разному рассортированных дублей массива или систематическая сортировка единственного массива в соответствии с поступающими запросами не является лучшим решением проблемы.
Рассмотрим возможности создания нескольких массивов индексов в этой ситуации. Индекс удобно формировать не для одного ключевого атрибута, а для набора атрибутов. Естественно, что индекс ключевых атрибутов а1 + а2 + а3 + а4 может также использоваться для быстрого доступа по атрибутам а1 + а2 + а3, а1 + а2 и а1. Поэтому в данном примере максимально необходимо создание четырех индексов с упорядоченностью атрибутов
а1 + а2 + а3 + а4, а1 + а2 + а4, а1 + а3 + а4 и а2 + а3 + а4.
Для доступа к данным по нескольким ключевым атрибутам используется также мультисписковая организация данных. Мультисписком называется множество списков, организованных на общем множестве записей. Если требуется доступ к записям по t ключам, то формируется t списков для каждого ключевого атрибута в отдельности.
Рассмотрим особенности организации мультисписков, которые предназначены для обработки записей по нескольким ключевым атрибутам. В качестве примера в табл. 6.4 показаны 14 записей с ключевыми атрибутами ФАМИЛИЯ и ПРОФЕССИЯ (остальные атрибуты в данном случае несущественны). На пересечении строки с некоторой фамилией и столбца с некоторой профессией указан номер записи, которая содержит именно эти значения в качестве ключей.
Таблица 6.4
Фамилия |
Профессия
|
|||
слесарь |
токарь |
фрезеровщик |
электрик |
|
Бардюшин |
|
А1 |
А2 |
|
Басовский |
А3 |
|
А4 |
А5 |
Батолев |
А6 |
А7 |
|
|
Белов |
|
|
А8 |
А9 |
Иванов |
|
А10 |
|
А11 |
Ираев |
А12 |
А13 |
А14 |
|
В простейшем случае мультисписок будет содержать два списка — с указателем ФАМИЛИЯ — (А1, А2, А3, ..., А13, А14) и с указателем ПРОФЕССИЯ— (А3, А6, А12; А1, А7, А10, А13; А2, А4, А8, А14; А5, А9, А11).
При размещении мультисписка во внешней памяти необходимо размещать каждый список в небольшом числе рядом расположенных участков, что позволит уменьшить время доступа. Эффективная организация мультисписка предполагает выполнение следующих условий: число записей в каждом списке должно быть небольшим, адреса хранения записей должны монотонно возрастать.
Для сокращения длины списков в мультисписке необходимо детализировать содержимое указателей. Например, указатель ФАМИЛИЯ = «Ба» определяет список (А1, А2, А3, А4, А5, А6, А7), указатель ФАМИЛИЯ = «Бе» — список (А8, А9), указатель ФАМИЛИЯ=«И» — список (А10, А11, А12, А13, А14). Поскольку атрибут ПРОФЕССИЯ содержит четыре значения, возможно существование следующих четырех списков: (А3, А6, А12); (А1, А7, А10, А13); (А2, А4, А8, А14); (А5, А9, А11).
При поиске в сокращенных списках необходимо сначала проанализировать все указатели, чтобы выбрать одну строку, заведомо содержащую требуемую информацию.
Рассмотрим, например, запрос с условием
ФАМИЛИЯ = «Иванов» и ПРОФЕССИЯ = «электрик».
Потребуются три обращения к памяти для выбора списка (А10, А11, А12, А13, А14) и четыре обращения — для выбора списка (А5, А9, А11). В указателях хранится длина каждого списка. Вторая строка короче, поэтому она просматривается полностью до извлечения необходимой записи А11.
Контрольные вопросы к 6 главе
Чем различаются линейные методы организации данных?
Как располагаются записи в памяти ПК при последовательной организации данных?
Какие бывают записи с точки зрения способа указания длины массива?
Что подразумевается под формированием данных?
Чем обеспечивается линейная списковая организация данных?
Что такое адрес связи?
Почему замедляется поиск в списковой организации данных по сравнению с массивом?
Требует ли перезаписи поступающих данных списковая организация данных?
Что такое цепной каталог?
Дайте определение указателю списка и указателю свободной памяти.
Что такое группа, порядок и ранг дерева?
В чем заключается особенность бинарных деревьев?
Какие записи называются полными, неполными и концевыми в дереве?
Что такое нелинейный список?
По каким правилам строится аналитическая запись списковой структуры?
Дайте определение адресной функции.
В чем заключаются достоинства и недостатки адресной функции?
Что такое К-индексы и А-индексы?
Как осуществляется поиск в К-индексном массиве?
Для чего используется мультисписковая организация данных?