
- •Понятие транзакции.
- •Технология оперативной обработки транзакций (oltp- технология).
- •Соответственно этим уровням выделяются следующие типы информационных систем:
- •Системы обработки данных - сод
- •Информационные системы - ис - управления - ису
- •Системы поддержки принятия решений - сппр
- •Характеристики ис - информационных систем - класса oltp
- •Предпосылки появления хд
- •Хранилища данных
- •Категории данных в хд
- •Детализированные и агрегированные данные
- •Метаданные
- •Способы использования хд
- •Обзор архитектур хд
- •Витрины данных
- •Понятие и модель данных olap Понятие olap
- •Структура olap-куба
- •Иерархия измерений olap-кубов
- •Операции, выполняемые над гиперкубом
- •Таблицы измерений
- •Слой извлечения, преобразования и загрузки данных
- •Слой хранения данных
- •Слой анализа данных
- •Клиентские olap-средства
- •Серверные olap-средства
- •Oracle Business Intellegence
- •Microsoft sql Server Analysis Services
- •Технические аспекты многомерного хранения данных
Характеристики ис - информационных систем - класса oltp
относительной алгоритмической простотой,
повышенной динамикой в части номенклатуры и структуры обрабатываемых документов, что связано с непосредственной близостью этих систем к предметной области,
массовостью и территориальной распределенностью мест сбора исходных данных,
высокими требованиями к достоверности и актуальности вводимых данных,
массовостью, достаточно частой сменяемостью и относительно невысокой компьютерной квалификацией персонала (пользователей).
поддержкой большого числа пользователей;
малым временем отклика на запрос;
относительно короткими запросами;
участие в запросах небольшого числа таблиц.
Исторически такие системы возникли в первую очередь, поскольку реализовывали потребности в учете, скорости обслуживания, сборе данных и пр. Однако вскоре пришло понимание, что сбор данных - не самоцель и накопленные данные могут быть полезны: из данных можно извлечь информацию.
Типичным примером применения OLTP-систем является массовое обслуживание клиентов, например бронирование авиабилетов или оплата услуг телефонных компаний. Обе эти ситуации имеют два общих свойства: очень большое число клиентов и непрерывное поступление информации.
При бронировании авиабилетов из многочисленных пунктов продажи непрерывно стекается информация об уже проданных билетах, которую вводят со своих рабочих мест операторы-продавцы. В той же БД формируется информация о свободных местах. С точки зрения данной задачи транзакция включает в себя набор таких действий, как:
запрос оператора о наличии свободных мест на тот или иной рейс;
отклик БД с предоставлением соответствующей информации;
ввод оператором информации о клиенте, номере заказанного места и оплаченной сумме (возможно, будет присутствовать еще какая-либо служебная вспомогательная информация);
передача новой информации в базу данных и внесение в нее соответствующих изменений;
передача оператору подтверждения о том, что операция выполнена успешно.
Такие транзакции выполняются тысячи раз в день в сотнях пунктов продаж. Очевидно, что основным приоритетом в данном случае является обеспечение минимального времени отклика при максимальной загрузке системы.
Рассмотрим характерные черты данного процесса, свойственные в той или иной мере всем OLTP-системам.
Запросы и отчеты полностью регламентированы. Оператор не может сформировать собственный запрос, чтобы уточнить или проанализировать какую-либо информацию.
Как только перелет завершился, информация об обслуживании данного клиента теряет смысл, становится неактуальной и подлежит удалению по прошествии определенного времени (то есть исторические данные не поддерживаются).
Операции производятся над данными с максимальным уровнем детализации, то есть по каждому клиенту в отдельности.
Ситуация коренным образом меняется, когда руководство авиакомпании принимает решение об изучении пассажиропотоков с целью, например, их оптимизации. Такие исследования могут быть реакцией на информацию о том, что в последнее время во многих пунктах продаж участились случаи нехватки билетов на определенные маршруты, что позволяет сделать предположение о целесообразности организации дополнительных рейсов.
Однако для проведения таких исследований необходимы как минимум три вещи. Во-первых, нужны данные о продажах билетов за достаточно длительный период (несколько месяцев или лет). Во-вторых, данные не должны содержать противоречий, пропусков, аномальных значений и других факторов, которые не позволят выполнить корректный анализ. В-третьих, необходима дополнительная информация о бизнес-среде: о конкурентах, рыночных тенденциях, ценах на топливо и пр. Очевидно, что типичная OLTP-система не может обеспечить ничего из перечисленного. Именно с пониманием этих проблем приходит осознание необходимости использования более развитых систем хранения данных, ориентированных на анализ.