- •Информатизация
- •Новые информационные технологии, определение понятий
- •3. Информационные технологии как инструмент формирования управленческих решений
- •2010: Первый вариант программы
- •Вопрос 2.
- •Вопрос 3. Информационные технологии
- •1 Классификация автоматизированных информационных технологий
- •2. Классификация информационных технологий по способу реализации ит в ис
- •1. Классификация автоматизированных информационных технологий
- •2. Классификация информационных технологий по способу реализации ит в ис
- •4. Технологический процесс переработки информации
- •2. Информационная культура предприятия
- •3. Виды информационной культуры
- •2. Информационная культура предприятия
- •Роль информационных технологий в изменении предприятий
- •2. Системы управления базами данных
- •3. Хранилища данных
- •1.Этапы развития информационных технологий
- •2.Тенденции развития ит
- •3.Развитие ит и организационные изменения на предприятиях
- •Этапы развития информационных технологий
- •Проблемы, стоящие на пути информатизации общества
- •Инструментальные технологические средства
- •Тенденции развития ит
- •Развитие ит и организационные изменения на предприятиях
- •Контрольные вопросы и задания
- •Развитие Internet/Intranet технологий
- •Поисковые системы
- •Internet-технологии в бизнесе
- •3 Ликвидация промежуточных звеньев
- •4. Глобализация
- •5 Конвергенция
- •1 Процесс информатизации общества
- •2 Опыт информатизации и перспективные идеи
3. Хранилища данных
Индустрия создания баз данных и СУБД берет свое начало в 60-х годах прошлого века и к настоящему времени достаточно развита, однако понятие "хранилище данных" в современном понимании его появилось относительно недавно.
Рис. 2.4. Классификационная система координат
Идея хранилищ данных оказалось востребованной, так как во многих видах государственной, деловой, научной, социальной деятельности необходимы тематически объединенные и исторически очищенные совокупности данных, при этом постоянно возрастала потребность:
в более дешевых данных;
в точных и структурированных данных;
в большей оперативности получения и обработки данных;
в интегрированных данных.
К концу 1980-х годов, когда была в полной мере осознана необходимость интеграции корпоративной информации и надлежащего управления этой информацией, появились технические возможности для создания соответствующих систем, которые первоначально были названы "хранилищами информации" (Information Warehouse - IW). И лишь в 1990-е годы, с выходом книги Уильяма (Билла) Инмона, хранилища получили свое нынешнее наименование "хранилища данных" (Data Warehouse - DW) [Inmon W.H. Building the Data Warehouse, QED/Wiley, 1991, 312 р.].
Билл Инмон определил хранилища данных как "предметно-ориентированные, интегрированные, неизменные, поддерживающие хронологию наборы данных, организованные для целей поддержки управления, призванные выступать в роли единого и единственного источника истины, обеспечивающего менеджеров и аналитиков достоверной информацией, необходимой для оперативного анализа и принятия решений".
В основе концепции хранилищ данных лежат следующие основополагающие идеи:
интеграция ранее разъединенных детализированных данных (исторические архивы, данные из традиционных систем обработки документов, разрозненных баз данных, данные из внешних источников) в едином хранилище данных;
тематическое и временное структурирование, согласование и агрегирование;
разделение наборов данных, используемых для операционной (производственной) обработки, и наборов данных, используемых для решения задач анализа.
Данные, помещаемые в хранилище, должны отвечать определенным требованиям - предметной ориентированности, интегрированности, поддержки хронологии и неизменяемости (таблица 2.3).
Таблица 2.3. |
|
Предметная ориентированность |
Все данные о некоторой сущности (бизнес-объекте, бизнес-процессе и т. д.) из некоторой предметной области собираются из множества различных источников, очищаются, согласовываются, дополняются, агрегируются и представляются в единой, удобной для их использования в бизнес-анализе форме |
Интегрированность |
Все данные о различных бизнес-объектах взаимно согласованы и хранятся в едином общекорпоративном хранилище |
Поддержка хронологии |
Данные хронологически структурированы и отражают историю за период времени, достаточный для выполнения задач бизнес-анализа, прогнозирования и подготовки принятия решения |
Неизменяемость |
Исходные (исторические) данные, после того как они были согласованы, верифицированы и внесены в общекорпоративное хранилище, остаются неизменными и используются исключительно в режиме чтения |
Хранилище данных выполняет множество функций, но его основное предназначение - предоставление точных данных и информации в кратчайшие сроки и с минимумом затрат.
Понятие хранилище данных в первоначальном понимании было основано на понятии распределенной витрины данных (Distributed Data Mart - DDM). Поэтому в классическом исполнении хранилище данных было прежде всего репозиторием (сквозной базой данных) данных и информации предприятия.
Рис. 2.5. Схема организации данных в хранилище
Среда хранилища была предназначена только для чтения и состояла из детальных и агрегированных данных, которые полностью очищены и интегрированы; кроме того, в репозитории хранилась обширная и детальная история данных на уровне транзакций. С точки зрения архитектурного решения такое хранилище данных реализует свои функции через подмножество зависимых витрин данных (рис. 2.5).
Достоинствами архитектуры классического хранилища данных являются:
общая семантика;
централизованная, управляемая среда;
согласованный набор процессов извлечения и бизнес-логики использования;
непротиворечивость содержащейся информации;
легко создаваемые по шаблонам и наполняемые витрины данных;
единый репозиторий метаданных;
многообразие механизмов обработки и представления данных.
К недостаткам можно отнести большие затраты по реализации, высокую ресурсоемкость в масштабе всего предприятия, потребность в сложных сервисных системах, рискованный сценарий развития, когда все данные и метаданные находятся в одном репозитории и в неблагоприятном случае могут быть потеряны. Кроме того, при фильтрации, агрегировании и рафинировании "сырых" данных для такого хранилища обычно теряется очень много информации, которая может быть чрезвычайно полезной при бизнес-анализе. В связи с этим возникло понимание того, что хранилище, помимо механизмов размещения и извлечения данных (On Line Transactional Processing - OLTP), репозитория и витрин, должно иметь соответствующее пространство для организации "сырых" данных и их многомерного анализа в режиме реального времени (On Line Analytical Processing - OLAP).
\
Лекция 6. Развитие информационных технологий
