14.2. Хранилища данных. Многомерные хранилища данных

Комбинация многомерного и реляционного подхода: киоск данных

Каждая из описанных моделей имеет как достоинства, так и недостатки.

Многомерная модель позволяет производить быстрый анализ данных, не позволяет хранить большие массивы информации.

Реляционная модель практически не имеет ограничений по объему накапливаемых данных, однако имеет низкую скорость выполнения аналитических запросов.

Можно ли совместить эти два подхода?

Во-первых редко возникает операция когда для анализа необходима вся информация, хранящая в хранилище. Обычно каждый аналитик обслуживает одно из направлений деятельности организации.

Реальный объем этих данных позволяет вместить их в многомерные хранилища. Источником данных для них должен быть центральное хранилище организации. Многомерные хранилища данных выполняют роль мелких складов.

Киоск данных - это специализированное многомерное хранилище, обслуживающее одно из направлений деятельности предприятия.

Комбинация будет выглядеть следующим образом.

Системы, использующие хранилища данных строятся на основе архитектуры клиент-сервер. Хранилище размещается на специализированном сервере для него используют мощные многопроцессорные вычислительные системы. В качестве СУБД используют СУБД, поддерживающие параллельную обработку запросов:

1. TERADATA,NCD

2. DB\2, IBM

3. Oracle

4. INFORMIK

Киоски данных реализуются с использованием серверов многомерных баз данных:

1. Essbase (Arbor Soft ware)

2. Oracle Express (Oracle)

3. Centium (Planning Sciences)

Хранилища данных принято делить:

ип хранилища	объем данных	число строк в фактологической таблице
маленькие	до 3 Гбайт	несколько миллионов строк
средние	до 25 Гбайт	до 100 млн. строк
большие	до 200 Гбайт	несколько сотен млн.строк
сверхбольшие	свыше 200 Гбайт	миллиард и более

В таблице приведен полезный объем, использованый для анализа. Дисковое пространство обычно в несколько раз больше за счет того, что необходимо поддерживать систему индексов, обычно в 5-10 раз.

14.3. Методы аналитической обработки (olap)

1. используется статистический метод: регрессивного, факторного, дисперсионного анализа, анализа временных рядов

2. метод искусственного интеллекта - нейронные сети, нечетная логика, генетические алгоритмы, методы извлечений знаний. Эти методы называют методы интеллектуального анализа данных (ИАД)

Средство анализа данных в системах принятия решений (СППР) на основе хранимых данных, используется для решения следующих задач:

1. выделение в данных групп, сходных по некоторым признакам

2. нахождение и аппроксимация зависимостей, а также поиск наиболее значимых параметров

3. анализ аномалий, т.е. поиск данных, отклоняющихся от среднего

4. прогнозирование развития событий на основе хранящейся ретроспективной информации об их состоянии в прошлом

<<< < Предыдущая 1 2 3 4 5 67 / 157 8 9 10 11 12 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.11.201951.18 Кб5Организационно-правовые формы,полный.docx
#
09.08.2019150.53 Кб4Основы логистики.doc
#
05.03.201627.1 Кб37основы теории надежности. контрольная работа.docx
#
01.07.202527.39 Кб1Основы экономики.docx
#
01.05.202579.36 Кб1Основы_информационной_безопасности.doc
#
19.08.2019538.11 Кб6Остальные темы.doc
#
17.09.2019142.33 Кб239Ответы История России.docx
#
15.04.2019612.86 Кб30Ответы на билеты по ПТЭ ПМ-8.doc
#
05.03.201617.48 Кб214Отмена крепостного права (кратко).docx
#
17.11.2019210.94 Кб13отчет (2).doc
#
31.08.2019382.46 Кб8Отчет 2012.doc