Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоры по СТОЭИ.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
222.72 Кб
Скачать

30. Модели хранилищ данных и основные компоненты хранилищ данных.

Существуют два архитектурных направления – нормализованные

хранилища данных и хранилища с измерениями.

Нормализованные хранилища х-ся как простые в создании и управлении, недостатки нормализованных хранилищ – большое количество таблиц, из-за чего для получения какой-либо инфы нужно делать выборку из многих таблиц одновременно, что приводит к ухудшению производительности системы.

Хранилища с измерениями используют схему «звезда» или схему «снежинка». При этом в центре «звезды» находятся данные (Таблица фактов), а измерения образуют лучи звезды.Различные таблицы фактов совместно используют таблицы измерений, что

значительно облегчает операции объединения данных из нескольких предметных

таблиц фактов (Например, факты продаж и поставок товара). Особенностью схемы «снежинка» является то, что таблицы измерений могут быть соединены с таблицами измерений других иерархических уровней непосредственно, минуя таблицу фактов. Поэтому данную схему рекомендуется использовать при наличии иерархии измерений.

Недостатками схемы «снежинка» по сравнению со схемой «звезда» являются

-более трудная для понимания и реализации структура данных, а также более

-сложная процедура добавления значений в измерения, а ее преимущества –

-большее соответствие представлению данных в многомерной модели, намного

-более низкая вероятность появления ошибок несоответствия данных и большая

-(по сравнению со схемой «звезда») компактность представления иерархических данных, поскольку все значения измерений представляются только один раз.

Основные компоненты хранилищ данных:

1 Оперативные источники данных

2 Средства переноса и трансформации данных

3 Метаданные

4 Реляционное хранилище

5 OLAP-хранилище и OLAP-клиенты

6 Средства доступа и анализа данных

31. Технология olap, olap-куб – основные понятия.

OLAP - технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процессов принятия решений. Можно считать, что работа идет с многомерными структурами данных (многомерными кубами), в которых числовые значения расположены на пересечении нескольких измерений.

Основное назначение OLAP-систем - поддержка аналитической деятельности, произвольных запросов пользователей - аналитиков. Цель OLAP-анализа - проверка возникающих гипотез.

Основные понятия:

Факт - это числовая величина которая располагается в ячейках гиперкуба.

Измерение - это множество объектов одного или нескольких типов, организованных в виде иерархической структуры и обеспечивающих информационный контекст числового показателя. Объекты, совокупность которых и образует измерение, называются членами измерений.

Ячейка - атомарная структура куба, соответствующая полному набору конкретный значений измерений.

Иерархия - группировка объектов одного измерения в объекты более

высокого уровня. Например - день-месяц-год. Иерархии в измерениях

необходимы для возможности агрегации и детализации значений показателей

согласно их иерархической структуре.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]