Модели данных, которые используются для хранения данных (Эдгар Кодд)

FASMI (БАРМИ) — 5 требований :

Fast. Анализ должен быть быстрым. Время отклика не более 5 с.
Analysis. Предполагает возможность основных типов статистического и числового анализа, который задается в приложении или пользователем.
Shared. Контроль доступа пользователей к информации.
Multidimensional. Многомерная.
Information. Возможность обращаться к любой информации независимо от места хранения.

Средства OLAP делятся на два класса:

Серверный OLAP;
OLAP-приложения.

В настоящее время существуют три подхода к построению хранилищ данных:

Многомерная модель хранилища (MOLAP).
Реляционная (ROLAP).
Гибридная (HOLAP).

Правила Кодда

Многомерность представления данных. М-СУБД должна поддерживать многомерность, по крайней мере, на концептуальном уровне.
Прозрачность. Пользователь не должен знать, какие средства применяются для хранилища.
Доступность. М-СУБД должно автоматически отображать ответ на запрос наилучшим образом.
Производительность не должна зависеть от количества измерений.
Поддержка архитектуры клиент-сервер.
Равноправность всех измерений — не должно быть базовых измерений.
Динамическая обработка разряженных матриц.
Поддержка многопользовательского режима работы.
Поддержка операций должна быть для любых измерений.
Максимально удобный интерфейс.
Различные способы визуализации данных.
Неограниченное число измерений.

MOLAP

— структура хранения данных. При добавлении измерения гиперкуб перестраивается. Такая структура позволяет реализовать быстрое чтение и поиск данных (от 10 до 100).

Измерение — это множество, образующее одну из граней гиперкуба.

Значение — данные, которые подвергаются анализу в ячейках куба. Основные операции над гиперкубом:

Сечение — одно или больше значений фиксируется.

Вращение — изменение порядка представления измерения (применяется к двухмерным таблицам).
Свертка и детализация.

При свертке устанавливается иерархия измерений.

При свертке одно или более измерений замыкается значением более высокого уровня иерархии с агрегацией данных.

Недостатки MOLAP: Нерациональное использование памяти — все измерения и все аргументы функции хранятся в многомерном виде, много пустых ячеек.

MOLAP используют при небольшой базе данных и стабильном наборе измерений.

ROLAP

— гиперкуб эмулируется на логическом уровне.

Преимущество — база данных может быть большой. Недостаток — медленное выполнение аналитических запросов.

Базу данных представляют обычно в ненормализованном виде специальным образом. Используется два вида таблиц (структура — звезда):

Фактологическая таблица;
Таблица измерений или справочников.

В справочниках перечисляется множество значений одного измерения гиперкуба.

При большом числе измерений применяют схему, которая называется «снежинка» (атрибуты помещаются в отдельные таблицы).

HOLAP

В этом случае, при реализации запросов к хранилищу большое значение играют оптимизаторы СУБД. Основные данные хранятся в реляционной базе, а агрегированные — в многомерной структуре (кубе), так как ситуация, когда для анализа нужны все данные, возникает достаточно редко. Обычно каждый аналитик использует свое направление. В этом случае многомерные данные представляются в виде киосков данных.

Хранилища данных делятся на 4 группы в зависимости от размера:

Малые (до 10⁶ ячеек данных)
Средние (до 10⁸)
Крупные (~ 10⁸)
Сверхбольшие (~ 10⁹)

Большинство СУБД имеют специальные средства для создания хранилища данных.

<<< < Предыдущая 12 / 132 3 4 5 6 7 8 9 10 11 12 13 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.202585.65 Кб0pravo_9_-_17.docx
#
01.07.202562.8 Кб0PRIBORY_3_semestr.docx
#
01.04.20258.53 Mб0PRICE2.DOC
#
13.07.2019104.45 Кб5problems 8-11.doc
#
01.04.2025376.83 Кб0Problemy_i_metodika_formirovania_profiley_otkry...doc
#
01.04.2025308.22 Кб0Proektirovanie_informatsionnykh_i_expertnykh_si...doc
#
16.07.201950.8 Кб3Proektirovanie_Vosstanovlen.docx
#
01.05.20255.62 Mб0Programma_IGA_po_GOS_VPO_FGN 1.doc
#
01.07.20251.29 Mб0PROIZVODSTVENNYJ_MENEDZhMENT_docx1306521612.docx
#
23.12.2018248.19 Кб3PZ_6_222_050_000.docx
#
05.11.2018266.24 Кб11Raschet_EMP-DZ1_2_3-5s.doc