- •8. Распределенные базы данных
- •8.1.Предпосылки возникновения рбд
- •8.2. Классификация систем по способам обработки данных
- •8.3. Однородные и неоднородные системы бд
- •8.4. Стратегия размещения данных в рбд по узлам сети
- •Функции сурбд
- •9. Удаленный доступ взаимодействия с базой данных
- •9.1. Режим работы с бд при удаленном доступе
- •9.2. Архитектура моделей удалённого доступа.
- •2.2.3. Двухуровневые модели. Модель файлового сервера (File Server, fs)
- •9.2.4. Модели удалённого доступа к данным (Remote Data Access, rda) в архитектуре «клиент-сервер»
- •9.2.5. Модель «сервера бд»
- •9.2.6. Хранимые процедуры (хп) и триггеры
- •9.3. Многоуровневые модели 9.3.1. Модель сервера приложений
- •9.3.2. Модель серверов баз данных.
- •9.4. Архитектура распределённых субд
- •10 .Параллельные процессы (или процесс транзакций)
- •10.1. Транзакции
- •10.2. Модели транзакций
- •3.3. Свойства транзакций
- •10.4. Восстановление системы.
- •10.5. Параллельные операции над бд
- •10.6. Проблемы параллелизма
- •10.7. Конфликт транзакций
- •10.8. Элементы блокировки.
- •10.8.1. Бесконечное ожидание и тупики
- •10.8.2. Способы предотвращения тупиков
- •10.9.1. Протоколы и расписания
- •10.9.2. Модель транзакции
- •10.9.3. Протокол, гарантирующий сериализуемость
- •10.10. Модели с блокировками для чтения и записи
- •10.11. Блокировки в Visual FoxPro
- •11. Безопасность бд
- •11.2. Система привилегий.
- •Факультативные возможности grant
- •11.3. Целостность данных
- •11.4. Шифрование данных
- •12. Хранилище данных
- •12.1. Концепция хранилища данных
- •12.2. Многомерная модель данных
- •12.3. Olap – системы
- •12.4. Интеллектуальный анализ данных
12.1. Концепция хранилища данных
Первые сведения по ХД появились в 1988г. Г.Инмон подробно описал концепцию в своей монографии “Построение хранилищ данных”.
В основе концепции ХД лежит идея разделения данных, используемых для оперативной обработки и для решения задач анализа.
Хранилище данных – предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений.
В СППР разделение данных происходит в двух направлениях:
1) ОИД – оперативные источники данных (это оперативные БД, файлы, электронные таблицы и т.п.)
2) структуры данных, предназначенных для анализа – это ХД.
Дальнейшее развитие – это использование витрин данных (ВД). ВД – это упрощенный вариант ХД, содержащий только тематические объединенные данные. ВД существенно меньше по объему ХД, является подмножеством данных.

Рис.12.1. Схема системы поддержки принятия решений (СППР)
Все данные в ХД делятся на три категории:
- детальные данные (переносимые непосредственно из ОИД);
- агрегированные (получают путем суммирования числовых фактических данных по определенным измерениям);
- метаданные (данные о данных).
Большинство СППР работают не с детальными данными, а с агрегированными данными. Перенос данных в ХД называют ETL – процессом (E –extraction, T – transformation, L – loading) – извлечение, преобразование и загрузка.
12.2. Многомерная модель данных
Реляционные модели не позволяют просматривать и анализировать данные с точки зрения множественности измерений. Множественность измерений предполагает представление данных в виде многомерной модели (гиперкуба).

Рис.12.2. Многомерная модель хранилища данных
Ребрами такого куба являются измерения, а ячейками – меры.
Измерения:
Исполнитель (предприятие – подразделение – отдел – служащий).
Время (Год – квартал – месяц – день).
Мера (measures) – представляет ячейку, которая хранит факты (объемы продаж, остатки на складе, издержки и т.п.).
Над гиперкубом могут быть произведены такие операции, как срез, вращение, консолидация и детализация.
Срез (Slice) – формирует подмножество многомерного массива данных.
Вращение (Rotate) – изменение расположения измерений.
Консолидация (Drill Up) – агрегирование.
Детализация (Drill Down)
12.3. Olap – системы
OLAP (On-Line Analytical Processing) – технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процесса принятия решений.
18 правил, предъявляемых к OLAP:
- многомерное концептуальное представление данных,
- доступность,
- архитектура “клиент - сервер”
- прозрачность,
- обработка ненормализованных данных,
- универсальность измерений и т.д.
OLAP система должна обеспечивать выдачу большинства ответов в пределах не более 5 сек.
Архитектура OLAP – систем
Выделяют три основных способа реализации многомерных моделей:
- MOLAP – используют многомерные БД,
- ROLAP – используют реляционные БД,
- HOLAP – используют и многомерные и реляционные БД.
MOLAP – используют для хранения и управления данными - многомерные БД. Данные хранятся в виде многомерных массивов. Такие массивы подразделяются на гиперкубы и поликубы. Физически, данные, представлены в многомерном виде, хранятся в плоских файлах. Куб представляется в виде одной плоской таблицы, в которую построчно вписываются все комбинации членов всех измерений с соответствующими им значениям мер.
Достоинство – быстрый поиск, так как база данных денормализована и содержит агрегированные данные. Недостаток – чувствительность к изменениям. Так при добавлении нового измерения приходится изменять структуру всей БД. Рекомендуется для небольших БД (не более нескольких гигабайт).
ROLAP
Реляционные БД дополняются средствами анализа. Распространены две основные схемы реализации многомерного представления данных с помощью реляционных таблиц: схема “Звезда” и схема “Снежинка”.
Основными составляющими таких схем являются денормализованные таблицы фактов (Fact Table) и массивы таблиц измерений (Dimension Table).
Фактами являются:
- события (телефонный звонок, снятие денег со счета и т.д.),
- “моментальные снимки” – рассматривается состояние объекта (например, банковского счета, объем продаж за день или дневная выручка).
Таблицы измерений содержат неизменяемые, либо редко изменяемые данные.

Рис.12.3. Модель хранилища данных по схеме «звезда»
В снежинке используются иерархические измерения, правда это ведет к усложнению структуры БД. Недостаток ROLAP по сравнению с многомерными СУБД – меньшая производительность.
HOLAP
Используют гибридную архитектуру, объединяющую технологии ROLAP и MOLAP. MOLAP лучше работает с более плотными данными, а ROLAP лучше, когда данные являются довольно разделимыми.
