
Тема 2015_13 Управление качеством данных
.pdf

План презентации
1.Основные понятия
2.Бизнес-архитектура
3.Архитектура данных
4.Технологическая архитектура
5.План изменения архитектуры
6.Возможности и решения

Информационная модель
Показатель качества |
Способ проверки качества |
Отчет |
Отчет №5 за сентябрь 2009
Данные непротиворечивы |
Автоматический |
|
||
анализ |
Подписи сторон |
|||
|
|
|||
|
|
|
Строка отчёта |
|
Изменение данных |
|
Адрес поставщика |
||
|
|
|||
Операция |
|
Данные |
Тип ошибки |
|
|
|
|
||
|
Тип данных |
|
Обнаружен дубль |
|
|
|
|
||
|
Серверные данные |
Права доступа |
||
Место хранения |
|
Формат данных |
Только чтение |
|
|
|
|||
БД №2 |
|
|
Дата |
|
|
|
|

Всегда в движении!
Основные требования к качеству данных (DM BOK Guide)
Русский |
English |
Значение |
|
корректность |
accuracy |
допустимые значения диапазонов и характеристик; |
|
полнота |
completeness |
наличие необходимых справочников, записей и атрибутов; |
|
непротиворечивость |
consistency |
допустимость значений атрибутов разных наборов записей; |
|
|
|
в любой момент времени (возможно, с некоторой оговоренной |
|
актуальность |
currency |
задержкой) справочник содержит все требуемые записи с |
|
|
|
актуальным наполнением атрибутов |
|
точность |
precision |
данные хранятся с требуемой степенью точности |
|
обоснованность |
reasonableness |
соответствие контексту использования |
|
ссылочная |
referential |
использование допустимых ссылок на вспомогательные |
|
целостность |
integrity |
справочники |
|
временная |
timeleness |
историческое соответствие (timeleness) - для части данных |
|
зависимость |
поддерживаются версии на дату |
||
|
|||
уникальность |
uniqueness |
отсутствие дублей или указание корректного статуса |
|
блокирования |
|||
|
|
||
правильность |
validity |
формат представления данных согласован и един для всех |
|
однотипных данных |
|||
|
|
24

Всегда в движении!
Основные показатели качества НСИ
№ |
Направление (Goal) |
Цель (Objective) |
Показатель (Measure) |
1 |
Корректность (Accuracy) |
Корректность числовых значений |
Количество нарушений допустимых диапазонов и зависимостей |
|
|
|
|
2 |
Корректность (Accuracy) |
Корректность значений даты |
Количество нарушений допустимых диапазонов и зависимостей |
|
|
|
|
3 |
Корректность (Accuracy) |
Корректность символьных значений |
Количество нарушений правил шаблонов и регламентов |
|
|
|
|
4 |
Полнота данных (Completeness) |
Наличие необходимых справочников |
Количество поддерживаемых справочников |
|
|
|
|
5 |
Полнота данных (Completeness) |
Наличие необходимых атрибутов справочников |
Количество атрибутов справочников |
|
|
|
|
6 |
Полнота данных (Completeness) |
Наличие необходимых записей справочников |
Количество записей справочников |
|
|
|
|
7 |
Полнота данных (Completeness) |
Отсутствие пустых значений |
Количество значений NULL для обязательных полей |
|
|
|
|
8 |
Полнота данных (Completeness) |
Полнота внешних справочников |
Количество расхождений с внешними данными |
|
|
|
|
9 |
Полнота данных (Completeness) |
Полнота классификаторов |
Наличие значений «Прочие» на каждом уровне |
|
|
|
|
10 |
Непротиворечивость (Consistency) |
Корректная выгрузка/загрузка из/в КССС |
Количество интерфейсов обмена НСИ между системами |
|
|
|
|
11 |
Непротиворечивость (Consistency) |
Корректное преобразование на шине |
Количество расхождений при сверке |
|
|
|
|
12 |
Непротиворечивость (Consistency) |
Корректная работа интерфейсов |
Количество переходов при обмене данными |
|
|
|
|
13 |
Непротиворечивость (Consistency) |
Корректная загрузка/выгрузка в/из ИС |
Количество расхождений при сверке |
|
|
|
|
14 |
Непротиворечивость (Consistency) |
Своевременная ручная синхронизация |
Количество расхождений при сверке |
|
|
|
|
15 |
Непротиворечивость (Consistency) |
Унификация форматов обмена |
Количество разных форматов для тех же данных |
|
|
|
|
16 |
Непротиворечивость (Consistency) |
Допустимость значений атрибутов разных справочников; |
Количество ошибок значений разных справочников |
|
|
|
|
17 |
Актуальность данных (Currency) |
Обеспечение работы интерфейсов с внешними системами |
Количество интерфейсов, которые обеспечивают электронный обмен с |
|
|
|
|
|
|
|
внешними системами |
18 |
Актуальность данных (Currency) |
Своевременная ручная актуализация основных данных |
Количество своевременно обработанных заданий на актуализацию |
|
|
|
|
19 |
Актуальность данных (Currency) |
Своевременная ручная актуализация внешних данных |
Количество протоколов обновления данных на основании внешних данных |
|
|
|
|
20 |
Точность (Precision) |
Обеспечение требуемой точности |
Количество нарушений требуемой точности |
|
|
|
|
21 |
Обоснованность (Reasonableness) |
Соответствие контексту использования |
Количество записей, несоответствующих реальным сущностям |
|
|
|
|
22 |
Ссылочная целостность |
Использование допустимых ссылок на вспомогательные |
Количество записей без корректных ссылок |
|
|
|
|
|
(Referential integrity) |
справочники |
|
23 |
Временная зависимость |
Обеспечение согласованных исторических данных |
Количество атрибутов, относящиеся к другим историческим данным, |
|
|
|
|
|
(Timeliness) |
|
пробелов в истории, ошибок версий |
24 |
Временная зависимость |
Обеспечение соответствия жизненного цикла разных |
Количество действующих ссылок на заблокированные записи или имеющие |
|
|
|
|
|
(Timeliness) |
записей |
другой статус жизненного цикла |
25 |
Уникальность (Uniquiness) |
Обеспечение непротиворечивости данных |
Количество дублей или указания неверного статуса блокирования |
|
|
|

Всегда в движении!
Бизнес-правила по качеству данных справочника «Товарно-материальные ценности»
|
|
|
|
Способ контроля качества данных |
||
№ |
Показатель |
Требование к справочнику в целом |
Доку |
|
|
|
мент |
КССС |
Внешняя система |
||||
|
|
|
||||
|
|
|
ы |
|
|
|
|
|
Текстовые и числовые поля содержат определенный набор символов, установленного |
|
Проверка при вводе; |
Проверка перед |
|
1 |
корректность |
|
Формат поля; Отчет по |
|||
формата и размерности |
|
массовыми загрузками |
||||
|
|
|
валидации |
|||
|
|
|
|
|
||
|
|
|
|
|
Проверка количества |
|
2 |
полнота |
Все ТМЦ, используемые в бизнес-процессах должны присутствовать в справочнике, со |
|
Проверка при вводе; |
записей в |
|
всеми обязательными атрибутами |
|
Отчет по валидации |
синхронизированных |
|||
|
|
|
||||
|
|
|
|
|
ИСУ |
|
|
|
Логически зависимые атрибуты (наборы атрибутов) записи должны быть |
|
|
Сверка значений |
|
|
|
непротиворечивы. (Например: вес, объем, БЕИ). Похожие по определенным критериям |
|
|
||
|
непротиворечи |
Метод |
|
атрибутов записей с |
||
3 |
записи, должны иметь схожие значения атрибутов (Например, все Прямогонные |
|
||||
|
вость |
бензины относятся к классу "Бензины прямогонные" и не допустимо отнесение к |
ика |
|
синхронизированными |
|
|
|
|
|
ИСУ |
||
|
|
классам "Прочие продукты ГП", "Прочие продукты Нефтехимии") |
|
|
||
|
|
|
|
|
||
|
|
Новые ТМЦ должны быть заведены заблаговременно до начала их использования в |
|
|
|
|
4 |
актуальность |
бизнес-процессах, при обнаружении некорректных данных соответствующие атрибуты |
Регла |
|
|
|
должны быть скорректированы. Срок исполнения редактором задания на создание |
мент |
|
|
|||
|
|
|
|
|||
|
|
нового\изменение существующего ТМЦ - 1 рабочий день |
|
|
|
|
|
|
|
|
|
Проверка |
|
5 |
точность |
Наличие в наименовании всех характеристик, необходимых для однозначной |
Метод |
|
соответствия |
|
идентификации. Заполнение числовых характеристик ТМЦ с заданной точностью. |
ика |
|
наименований |
|||
|
|
|
||||
|
|
|
|
|
шаблонам |
|
6 |
обоснованност |
Создаются только ТМЦ, определенные организационными и техническими решениями |
Метод |
|
|
|
|
ь |
|
ика |
|
|
|
7 |
ссылочная |
Ссылки указаны в описании атрибутов, все ссылки являются ссылками на действующие |
|
Ссылки на действующие |
|
|
целостность |
записи справочников |
|
записи справочников |
|
||
|
|
|
||||
|
историческое |
Все неактуальные\некорректные данные должны иметь статус "Блокирована" или "На |
Регла |
Отчет по валидации, |
|
|
8 |
проверка о наличии |
|
||||
|
соответствие |
блокировании" и ссылку на действующую запись |
мент |
ссылки |
|
|
|
|
|
Регла |
Отчет по валидации, |
|
|
|
|
Краткое наименование уникально для ряда записей. Для части записей уникальность |
проверка уникальности |
|
||
9 |
уникальность |
определяется свзякой: "Наименование + ККП + фасовка + статус" |
мент |
для ГП "Наименование + |
Проверка дублей |
|
|
|
|
|
ККП + фасовка + статус" |
|
|
10 |
унификация |
Числовые и текстовые атрибуты хранятся в полях соответствующего типа |
|
Формат поля |
|

|
Всегда в движении! |
||
Работы в целях улучшения качества данных в части |
|
||
справочника ТМЦ и услуги |
|
||
|
Отчет по качеству ТМЦ (Автохимия) от SAP, IBM, Informatica |
|
|
Доработки |
Отчет КССС, проверяющий каждую запись на соответствие настроенным валидациям |
||
функционала |
Исправление валидации по полям Вес Нетто, Объем тары, Кол-во в упаковке |
|
|
систем |
Механизм сохранения истории изменения записей справочника |
|
|
|
Механизм сохранения истории изменения классов ключевых иерархий, используемых в |
||
|
справочнике |
|
|
|
Добавление обязательности поля "Группа акцизных пошлин" для готовой продукции |
||
|
Удаление записей материалов для ЗРСО, неиспользуемых в КССС.Россия |
|
|
Разовые |
Проставлен\исправлен классификатор МТР у всех записей справочника |
|
|
Исправлены некорректные значения в полях Вес Нетто, Объем тары, Кол-во в упаковке |
|||
работы по |
|||
Исправлен некорректно проставленный атрибут "товар для розничной реализации" |
|
||
чистке данных |
|
||
Заблокированы неактуальные\некорректные записи |
|
||
|
Сверка данных с НПО в части НДС |
|
|
|
Заполнение поля "Группа акцизных пошлин" для готовой продукции |
|
|
|
Ежедневная проверка всех заданий по изменению данных от пользователей |
10,22 |
|
Регулярные |
Еженедельная проверка целостности данных справочника (сравнивается кол-во |
|
|
работы по |
записей) |
0,05 |
|
контролю |
Ежемесячный анализ результатов процедуры проверки качества данных и |
|
|
качества |
исправление данных |
0,56 |
|
данных |
Синхронизация данных из внешних справочников |
0,05 |
|
|
Итого дополнительные регулярные работы по качеству данных, FTE |
0,66 |

Всегда в движении!
Результаты и планы проверок качества НСИ в части справочника «Товарно-материальные ценности»
Дата |
Записей Прирост Записей с |
Исправлено |
Разовые работы с момента предыдущей |
||||
записей с |
|||||||
проверки |
всего |
записей ошибками |
проверки |
||||
ошибками |
|||||||
08.07.2015 |
479031 |
- |
122578 |
- |
- |
|
|
|
|
|
|
|
1) |
Удалены из КССС.Россия записи ЗРСО |
|
|
|
|
|
|
2) Проставлен\исправлен классификатор |
||
|
|
|
|
|
МТР |
||
05.10.2105 |
502825 |
23794 |
93002 |
29576 |
3) |
Исправлены некорректные значения в |
|
полях Вес Нетто, Объем тары, Кол-во в |
|||||||
|
|
|
|
|
|||
|
|
|
|
|
упаковке |
||
|
|
|
|
|
4) |
Доработаны некорректные валидации, |
|
|
|
|
|
|
которые давали ошибки в отчете |
||
01.11.2015 |
506743 |
3918 |
85087 |
7915 |
1) |
Исправлен некорректно проставленный |
|
атрибут "Товар для розничной реализации" |
|||||||
|
|
|
|
|
|||
|
|
|
|
|
1) |
Доработка отчета по валидации |
|
|
|
|
|
|
2) |
Перевыгрузка данных в ОХД |
|
01.12.2015 |
|
|
|
|
|
Переработка и сбыт |
|
|
|
|
|
|
3) |
Исправление данных по группе |
|
|
|
|
|
|
|
Автохимия |
28

План презентации
1.Основные понятия
2.Бизнес-архитектура
3.Архитектура данных
4.Технологическая архитектура
5.План изменения архитектуры
6.Возможности и решения