Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lectures ХД.docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
67.22 Кб
Скачать

Лекция 7.

Роли заказчика и исполнителя при построении хранилищ данных. Их дофига всяких, можно посмотреть на «www.prj-exp.ru», там есть Матрица ответственности по ролям.

Для любых внедрений ИС, в том числе ХД главный чувак от заказчика – это куратор проекта.

Иерархия людей от исполнителя:

  1. Куратор проекта

  2. Руководитель проекта

  3. Системный архитектор – отвечает за систему в целом. Эта роль может быть разделена на несколько людей, но всегда должен быть один чувак, который отвечает за всю систему.

  4. Бизнес-аналитик – перевод бизнес-требований в функциональные требования

  5. Архитектор по ETL и разработчики

  6. Администратор БД

  7. Администратор приложений

  8. Архитектор ETL и разработчики

  9. Архитектор BI и разработчики

Модель RACI

R – responsible (исполнитель, отвечающий за действие)

A – accountant – ответственный за качество выполненной работы

C – consultant

I – наблюдатель

При внедрении на этапе перед требованиями хорошо проводить обучение чуваков из команды заказчика дабы обеспечить единый язык и понимание между заказчиком и исполниетелем.

Проблемы (риски), возникающие при внедрении:

  1. Качественные. Трудности во время анализа данных, проблемы с определением качества

  2. Организационные. Тут часто бывает проблема с закрытостью систем, откуда мы берем информацию для ХД.

  3. Технические. Необходимо выбрать адекватные задачам и размерам технологии.

Физическое моделирование ХД.

Тут имеется ввиду в основном оптимизация работы конкретных систем.

Техники оптимизации:

Денормализация бывает 2-х видов:

  1. Нисходящая – внесение полей из более общей таблицы в более детализированную, зависимую таблицу. Это делается с целью минимизации использования связей. В общем виде это объединение таблиц.

  2. Восходдящая – внесение полей из зависимой таблицы в родительскую. Это обычно вынесение агрегированных показателей. Делается для того же самого.

Разделение таблиц (изменение логики структуры БД):

  1. Горизонтальное. Таблицы бьются по записям, чтобы в одной таблице было меньше записей. Часто бьется на текущие и архивные записи, то есть разбиение по времени.

  2. Вертикальное. Разделение таблиц на несколько по атрибутам. Атрибуты, выделяемые в другие таблицы определяются по принципу частоты запрашивания их.

Партиции – это физическое разбиение таблицы на несколько файлов.

Индексы.

Расширения SQL. Group by и проч.

Тенденции.

  1. БД в памяти.

  2. Повышение прозрачности данных.

  3. Интеграция BI с ERP

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]