- •12.1. Специальные аспекты работы с бд. Процедура индексирования.
- •12.2. Триггеры
- •12.2.1. Ключевые слова и параметры
- •12.2.2. Компоненты триггера
- •12.2.3.Типы триггеров.
- •12.2.4.Включение и выключение триггеров.
- •C.12.2.5. Удаление триггера
- •C.12.2.6. Корреляционные имена
- •12.3. Процедуры и функции
- •12.4. Функция
- •12.5.Курсоры.
- •14.1. Системы обработки транзакций oltp и olap - технологий
- •14.2. Хранилища данных. Многомерные хранилища данных
- •14.3. Методы аналитической обработки (olap)
- •14.3.1. Хранилища данных
- •14.3.2. Причины внедрения информационных систем на основе хранилищ данных
- •Литература
- •14.5. Olap в России
- •Тема 15. Основы фракталов. Фрактальная математика. Фрактальные методы в архивации. Управления складами данных
- •15.1. Понятие "фрактал"
- •15.2. Классификация фракталов
- •15.2.1. Геометрические фракталы
- •15.2.2. Алгебраические фракталы
- •C.15.2.3. Стохастические фракталы
- •C.15.3. Системы итерируемых функций
- •15.4. Фрактальное сжатие
- •15.5. История фрактального сжатия
- •15.6. Идея фрактальной архивации
- •15.7. Сравнение с jpeg
14.2. Хранилища данных. Многомерные хранилища данных
Комбинация многомерного и реляционного подхода: киоск данных
Каждая из описанных моделей имеет как достоинства, так и недостатки.
Многомерная модель позволяет производить быстрый анализ данных, не позволяет хранить большие массивы информации.
Реляционная модель практически не имеет ограничений по объему накапливаемых данных, однако имеет низкую скорость выполнения аналитических запросов.
Можно ли совместить эти два подхода?
Во-первых редко возникает операция когда для анализа необходима вся информация, хранящая в хранилище. Обычно каждый аналитик обслуживает одно из направлений деятельности организации.
Реальный объем этих данных позволяет вместить их в многомерные хранилища. Источником данных для них должен быть центральное хранилище организации. Многомерные хранилища данных выполняют роль мелких складов.
Киоск данных - это специализированное многомерное хранилище, обслуживающее одно из направлений деятельности предприятия.
Комбинация будет выглядеть следующим образом.
Системы, использующие хранилища данных строятся на основе архитектуры клиент-сервер. Хранилище размещается на специализированном сервере для него используют мощные многопроцессорные вычислительные системы. В качестве СУБД используют СУБД, поддерживающие параллельную обработку запросов:
1. TERADATA,NCD
2. DB\2, IBM
3. Oracle
4. INFORMIK
Киоски данных реализуются с использованием серверов многомерных баз данных:
1. Essbase (Arbor Soft ware)
2. Oracle Express (Oracle)
3. Centium (Planning Sciences)
Хранилища данных принято делить:
ип хранилища |
объем данных |
число строк в фактологической таблице |
маленькие |
до 3 Гбайт |
несколько миллионов строк |
средние |
до 25 Гбайт |
до 100 млн. строк |
большие |
до 200 Гбайт
|
несколько сотен млн.строк |
сверхбольшие |
свыше 200 Гбайт |
миллиард и более |
В таблице приведен полезный объем, использованый для анализа. Дисковое пространство обычно в несколько раз больше за счет того, что необходимо поддерживать систему индексов, обычно в 5-10 раз.
14.3. Методы аналитической обработки (olap)
1. используется статистический метод: регрессивного, факторного, дисперсионного анализа, анализа временных рядов
2. метод искусственного интеллекта - нейронные сети, нечетная логика, генетические алгоритмы, методы извлечений знаний. Эти методы называют методы интеллектуального анализа данных (ИАД)
Средство анализа данных в системах принятия решений (СППР) на основе хранимых данных, используется для решения следующих задач:
1. выделение в данных групп, сходных по некоторым признакам
2. нахождение и аппроксимация зависимостей, а также поиск наиболее значимых параметров
3. анализ аномалий, т.е. поиск данных, отклоняющихся от среднего
4. прогнозирование развития событий на основе хранящейся ретроспективной информации об их состоянии в прошлом