- •1. Введение
- •1.1. Меняющийся мир управления базами данных
- •1.2. Что дают исследования в области баз данных
- •2. Достижения последних лет
- •2.1. Объектно-ориентированные и объектно-реляционные субд
- •2.2. Поддержка новых типов данных
- •2.3. Обработка транзакций
- •3. Новые приложения баз данных
- •3.1. Eosdis
- •3.2. Электронная коммерция
- •3.3. Информационные системы здравоохранения
- •3.4. Электронные публикации
- •3.5. Коллективное проектирование
- •4. Тенденции, влияющие на исследования в области баз данных
- •4.1. Технологические тенденции
- •4.2. Архитектурные тенденции баз данных
- •4.3. Исследования и деловой климат
- •4.4. Информационная супермагистраль проходит через вашу квартиру
- •5. Новые направления исследований
- •5.1. Поддержка мультимедийных объектов
- •5.1.1. Третичная память
- •5.1.2. Новые типы данных
- •5.1.3. Качество обслуживания
- •5.1.4. Запросы с нечеткими критериями
- •5.1.5. Поддержка пользовательских интерфейсов
- •5.2. Распределение информации
- •5.2.1. Степень автономности
- •5.2.2. Учет и расчеты
- •5.2.3. Безопасность и конфиденциальность
- •5.2.4. Репликация и согласование данных
- •5.2.5. Интеграция и преобразование данных
- •5.2.6. Выборка и обнаружение данных
- •5.2.7. Качество данных
- •5.3. Новые применения баз данных
- •5.3.1. Интеллектуальный анализ данных
- •5.3.2. Хранилища данных
- •5.3.3. Репозитарии
- •5.4. Управление потоками работ и транзакциями
- •5.4.1. Управление потоками работ
- •5.4.2. Альтернативные модели транзакций
- •5.5. Простота использования
- •6. Выводы
5.2.3. Безопасность и конфиденциальность
В распределенных системах, включающих автономных партнеров, требуется поддержка безопасности информации. Во многих случаях это нужно для обеспечения конфиденциальности персональных данных. Например, информационная система здравоохранения должна беспрепятственно предоставлять информацию о пациенте его лечащему врачу, но обязана защитить ее от несанкционированного доступа. В других случаях необходимость защиты связана с коммерческой ценностью данных. Примеры – распределенное проектирование (разд. 3.5) и электронные публикации (разд. 3.4). Можно выделить следующие важные направления исследований.
Разработка исключительно гибких систем аутентификации и авторизации, поддерживающих доступ на основе разнообразных "ролей", исполняемых пользователями. Так, один и тот же индивид может выступать в роли лечащего врача некоторого пациента, в роли "врача вообще" или в роли частного лица.
Выработка механизмов для продажи информации большому числу пользователей, личности которых неизвестны продавцу.
5.2.4. Репликация и согласование данных
Фундаментальная проблема управления распределенной базой данных – нахождение способов функционирования в ситуации, когда сеть распадается на две или более несвязанные группы узлов. Когда врач садится в самолет, имея при себе историю болезни своего пациента, он должен иметь возможность вносить в нее записи, т.е. изменять содержимое базы данных, несмотря на то, что он отключен от сети, пока находится в самолете.
Разумеется, компоненты базы данных, связь между которыми сохраняется, должны продолжать функционировать независимо наилучшим возможным способом. Запросы на выборку и модификацию данных, затрагивающие доступные узлы, должны выполняться, а остальные – отвергаться.
Из соображений эффективности данные часто реплицируются на нескольких узлах. Когда все эти узлы связаны сетью, можно поддерживать идентичность копий. Однако в ситуациях, когда связь нарушается, в копиях могут появиться различия. После восстановления связи должен включаться механизм согласования (reconciliation), который должен согласовать все копии и сформировать одну новую копию, отражающую все сделанные изменения.
С точки зрения традиционных распределенных баз данных, утрата связности сети – это случай исключительный, аномальный, и поэтому процесс восстановления и согласования данных мог быть сложным и занимать относительно много времени. В новой информационной среде, как показывает приведенный выше пример, подобные ситуации становятся уже не исключением, а нормой. Отсюда необходимость создания быстрых протоколов и алгоритмов согласования.
Отметим также, что, в связи с растущей зависимостью производственных процессов от информационных систем, для многих приложений необходимым требованием становится стопроцентная доступность, или, как это иногда обозначают, "доступность 7х24" (7 дней в неделю х 24 часа в сутки). Некоторые проблемы повышения надежности решаются за счет совершенствования аппаратных средств. Однако в среде баз данных для повышения доступности необходимо исследование новых репликационных схем, обеспечивающих идентичность копий данных и корректное функционирование системы в условиях отказа отдельных компонентов.