3.0 Заключение
Таким
образом, эта статья является вводным
обзором процессов загрузки для всех
основных типов таблиц. Эта архитектура
загрузки основана на строгом подходе
к проектированию Data Vault. При создании,
конечно, будут отклонения. Однако 80 %
или больше проектов, как созданных с
помощью ETL-инструментов, типа Informatica,
Ab-Initio илиr Ascential, так и написанный на SQL
в базе данных, будут следовать тем же
самым стандартным парадигмам. Не трогайте
и не изменяйте данные по пути в хранилище
Data Vault, манипулируйте ими в соответствии
с бизнес-правилами вне хранилища – в
витринах данных.
Кроме
того, если должна быть некоторая
интерпретация, некоторый слой свернутых
(roll-up) или агрегированных данных, то
создайте иерархическую таблицу Связи
и проставьте значения в поле «источник
данных» равное «SYSGEN» или некоторому
подобному значению. Это позволит держать
порожденные / сгенерированные данные
отдельно от данных исходных систем, и
сохранит отслеживаемость. В настоящее
время есть несколько проектов Data Vault в
стадии создания, и одна крупная законченная
реализация. Следующая серия статей
будет исследовать некоторые методы
запросов, необходимых для получения
данных из структуры Data Vault.