Edi стандарт представления данных
Что такое EDI? Под аббревиатурой EDI понимают Electronic Data Interchange или Электронный Обмен Данными. Проще говоря, EDI– это отправка и получение информации с использованием компьютерных технологий. Благодаря тому, что применение технологий EDI в бизнесе удобно и практично, этот стандарт стал широко использоваться в различных отраслях экономики и социального обслуживания. Любые стандартные деловые документы, которыми, к примеру, одна FMCG компания обменивается с другой (такие как заказ на поставку, счёт-фактура, план отгрузок, запрос о наличии товара) могут быть переданы при помощи EDI, если обе стороны провели необходимую для этого подготовку. EDI значительно отличается от обычной электронной почты, при использовании которой информация передается в неструктурированном формате. В чем разница? К примеру, вам нужно доставить заказ на поставку в виде электронного письма, вы, вероятно, сначала напечатаете документ, а затем, внесете информацию в другую программу (бухгалтерского учёта или управления складским хозяйством). EDI же имеет структурированный формат. Использование EDI для обмена электронными документами гарантирует его понимание всеми участниками этого процесса. Например, Вам нужно получить через EDI данные о конкретной позиции заказа на поставку. Программное обеспечение EDI сначала обрабатывает информацию, затем переводит её в «читабельный формат», после чего импортирует данные непосредственно в вашу программу. Результат - Никакого ввода информации вручную! К тому же, процесс может быть запрограммирован так, что никакого участия человека не потребуется вообще! - В чём заключаются преимущества EDI?
Повышенная точность информации
Возможность избежать больших трудозатрат, таких как ввод информации вручную
Скорость. Благодаря быстрой и точной передаче данных, сокращается время на переговоры с поставщиками
Сокращённые затраты
Экономия почтовых расходов
ненужность бумажных документов
- Как работает EDI? Предположим, закупщик посылает поставщику заказ
Скорее всего, информация о заказе находится в компьютерном приложении (например, программном пакете бухучёта) в персональном компьютере закупщика. Пока возможен импорт и экспорт файлов из приложения, необходимая информация может быть извлечена, и преобразована в файл для программы перевода EDI
Транслятор EDI проводит согласование и проверяет, чтобы преобразованный файл удовлетворял стандартам EDI и руководству торговых партнёров по внедрению систем. После этого он переводит сообщение уже в формат EDI.
Устанавливается коммуникационное соединение для передачи EDI - заказа на поставку. Программное обеспечение EDI контролирует коммуникационное программное обеспечение.
Файл отправляется либо в почтовый ящик, либо на сайт FTP, либо напрямую получателю AS2 по протоколу HTTP
Компьютерная программа, которая получает EDI-заказ на поставку, форматирует поступающую информацию и готовит её к переводу в файлы существующего приложения. Например, заказ на поставку, полученный через EDI, может быть переведён и загружен в модуль регистрации заказа.
Когда заказ получен, программное обеспечение генерирует Функциональное Подтверждение обратно закупщику. Функциональное Подтверждение отображает получение сообщения и информацию о том, было или не было оно совмещено со стандартом EDI. Но сами данные в это сообщение не добавляются.
ETL - Extract, Transform, Load — извлечение, преобразование, загрузка RDF стандарт представления данных
ETL (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка») — один из основных процессов в управлении хранилищами данных, который включает в себя:
извлечение данных из внешних источников;
их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели;
и загрузка их в хранилище данных.
С точки зрения процесса ETL, архитектуру хранилища данных можно представить в виде трёх компонентов:
источник данных: содержит структурированные данные в виде таблиц, совокупности таблиц или просто файла (данные в котором разделены символами-разделителями);
промежуточная область: содержит вспомогательные таблицы, создаваемые временно, и, исключительно для организации процесса выгрузки.
получатель данных: хранилище данных или база данных, в которую должны быть помещены извлечённые данные.
Перемещение данных от источника к получателю называют потоком данных. Требования к организации потока данных описываются аналитиком. ETL следует рассматривать не только как процесс переноса данных из одного приложения в другое, но и как инструмент подготовки данных к анализу.
Извлечение данных в ETL
Начальным этапом процесса ETL является процедура извлечения записи из источников данных и подготовка их к процессу преобразования. При разработке процедуры извлечения данных, в первую очередь необходимо определить частоту выгрузки данных из OLTP-систем или отдельных источников. Выгрузка данных занимает определённое время, которое называется окном выгрузки.
Процедуру извлечения данных можно реализовать двумя способами:
извлечение данных с помощью специализированных программных средств;
извлечение данных средствами той системы, в которой они хранятся.
После извлечения данные помещаются в так называемую «промежуточную область», где для каждого источника данных создаётся своя таблица или отдельный файл, или и то и другое.
Преобразование данных
Цель этого этапа — подготовка данных к размещению в хранилище данных и приведение их к виду более удобному для последующего анализа. При этом должны учитываться некоторые, выдвигаемые аналитиком, требования, в частности, к уровню качества данных. Поэтому в процессе преобразования может быть задействован самый разнообразный инструментарий, начиная с простейших средств ручного редактирования данных и заканчивая системами, реализующими сложные методы обработки и очистки данных. В процессе преобразования данных в рамках ETL чаще всего выполняются следующие операции:
преобразование структуры данных;
агрегирование[en] данных;
перевод значений;
создание новых данных;
очистка данных.
Загрузка данных
Процесс загрузки заключается в переносе данных из промежуточных таблиц в структуру хранилища данных. При очередной загрузке в хранилище данных переносится не вся информация из источников, а только та, которая была изменена в течение промежуточного времени, прошедшего с предыдущей загрузки. При этом выделяют два потока:
поток добавления — в хранилище данных передается новая, ранее не существовавшая информация;
поток обновления (дополнения) — в хранилище данных передается информация, которая существовала ранее, но была изменена или дополнена.
Для распределения загружаемых данных на потоке используются средства данных. Они фиксируют состояние данных в некоторые моменты времени и определяют, какие данные были изменены или дополнены.
