- •1. Введение
- •1.1. Меняющийся мир управления базами данных
- •1.2. Что дают исследования в области баз данных
- •2. Достижения последних лет
- •2.1. Объектно-ориентированные и объектно-реляционные субд
- •2.2. Поддержка новых типов данных
- •2.3. Обработка транзакций
- •3. Новые приложения баз данных
- •3.1. Eosdis
- •3.2. Электронная коммерция
- •3.3. Информационные системы здравоохранения
- •3.4. Электронные публикации
- •3.5. Коллективное проектирование
- •4. Тенденции, влияющие на исследования в области баз данных
- •4.1. Технологические тенденции
- •4.2. Архитектурные тенденции баз данных
- •4.3. Исследования и деловой климат
- •4.4. Информационная супермагистраль проходит через вашу квартиру
- •5. Новые направления исследований
- •5.1. Поддержка мультимедийных объектов
- •5.1.1. Третичная память
- •5.1.2. Новые типы данных
- •5.1.3. Качество обслуживания
- •5.1.4. Запросы с нечеткими критериями
- •5.1.5. Поддержка пользовательских интерфейсов
- •5.2. Распределение информации
- •5.2.1. Степень автономности
- •5.2.2. Учет и расчеты
- •5.2.3. Безопасность и конфиденциальность
- •5.2.4. Репликация и согласование данных
- •5.2.5. Интеграция и преобразование данных
- •5.2.6. Выборка и обнаружение данных
- •5.2.7. Качество данных
- •5.3. Новые применения баз данных
- •5.3.1. Интеллектуальный анализ данных
- •5.3.2. Хранилища данных
- •5.3.3. Репозитарии
- •5.4. Управление потоками работ и транзакциями
- •5.4.1. Управление потоками работ
- •5.4.2. Альтернативные модели транзакций
- •5.5. Простота использования
- •6. Выводы
5.3.3. Репозитарии
Приложения, относящиеся к категории репозитариев, характеризуются тем, что они предназначаются для хранения и управления как данными, так и метаданными, т. е. информацией о структуре данных. Примеры репозитариев – базы данных для поддержки компьютерного проектирования, включая CASE (системы проектирования программного обеспечения), а также системы управления документами. Отличительная черта этих систем – частые изменения метаданных, характерные для любой среды проектирования.
В репозитарии необходимо поддерживать множество представлений одной и той же или схожей информации. Например, программный модуль имеет представление в виде исходного кода, объектного кода, промежуточного кода, готовой программы, таблиц использований/определений, документации. Связи между всеми этими представлениями должны отслеживаться репозитарием так, чтобы изменения в одном из них автоматически распространялись на остальные представления того же объекта.
Репозитарии должны поддерживать понятие версий (моментальных снимков элементов данных, меняюшихся во времени) и конфигураций (версионных коллекций версий). Например, разные релизы программной системы будут обычно формироваться как конфигурации из определенных версий файлов исходного кода.
Репозитарий должен поддерживать эволюцию структуры информации и ее метаданных таким образом, чтобы при добавлении новых свойств данных или новых связей не требовалась полная перекомпиляция.
Цель исследований в этой области – создание "систем управления репозитариями", подобных сегодняшим СУБД.
5.4. Управление потоками работ и транзакциями
По мере того как базы данных получают все более широкое распространение, и сферы их применения выходят за рамки, предусмотренные бизнес-сообществом, традиционная модель транзакций перестает быть удовлетворительной. Транзакции сейчас могут охватывать множество "независимых" баз данных и не ограничиваться кратким промежутком времени.
5.4.1. Управление потоками работ
Часто бизнес-процессы включают и компьютеризованные шаги, где используются базы данных и другие информационные ресурсы, и шаги, где требуется вмешательство персонала. Например, отчет о командировке сначала заполняется сотрудником вручную, затем секретарь вводит его в компьютерную систему, где он автоматически преобразуется в формат бланка для возмещения затрат, после чего направляется клерку, который принимает его или отвергает, используя электронные средства. Если отчет принят, то он направляется в бухгалтерскую подсистему, которая запоминает сумму расходов и генерирует чек. Еще более необходимы средства управления потоками работ, интегрированные в СУБД, если процесс включает обработку мультимедийных документов. Оцифровка бумажного документа включает последовательность шагов, требующих человеческого вмешательства: сканирование, оптическое распознавание текста, проверка и исправление ошибок, регистрация обработанного документа.
Как показывают эти примеры, подобные процессы требуют специальных способов управления данными с поддержкой последовательности взаимозависимых событий. Причем, с некоторыми из этих событий могут быть связаны длительные задержки, например, если клерк находится в отпуске, а заменяющий его сотрудник ушел обедать. Алгоритмы обработки могут включать ветвления и даже откаты, если, скажем, отчет отвергнут, и его необходимо исправить для последующего принятия. Так же, как и для репозитариев (разд. 5.3.3), требуются соответствующие системы управления потоками работ, поддерживающие специфические для этих приложений требования. Требуются также специальные инструменты для проектирования и создания потоков работ, а также для управления ими. С технологиями потоков работ связаны и новые модели транзакций, которые обсуждаются в 5.4.2.