- •Раздел 6. Компьютерные технологии использования систем управления
- •1. История создания баз данных.
- •1.1. Нулевое поколение: менеджеры записей (4000 г. До н.Э. – 1900 г.)
- •1.2. Первое поколение: менеджеры записей (1900 г. – 1955 г.).
- •1.3. Второе поколение: программируемое оборудование обработки записей (1955 г. – 1970 г.)
- •1.3.1. Архитектура субд.
- •Отдельные
- •Администратор
- •Описание на языке конкретной субд
- •Описание хранимых данных
- •1.4. Третье поколение: оперативные сетевые базы данных (1965 г.–1980 г.)
- •1.4.1. Иерархические субд.
- •1.4.2. Сетевые базы данных.
- •1.5. Четвертое поколение: реляционные базы данных (1980 г. – 1995 г.).
- •1.5.1. Таблицы.
- •Office city region mgr target sales
- •1.5.2. Первичные ключи.
- •1.5.3. Отношения предок/потомок.
- •Office cyti region
- •Empl_num name age rep_office
- •1.5.4. Внешние ключи.
- •2. Язык aql как стандартный язык базы данных.
- •2.1. Язык sql.
- •2.2. Роль sql.
- •2.3. Достоинства sql.
- •2.3.1. Независимость от конкретных субд.
- •2.3.2. Переносимость с одной вычислительной системы на другие.
- •2.3.3. Стандарты языка sql.
- •2.3.4. Протокол odbc и компания Microsoft.
- •2.3.5. Реляционная основа.
- •2.3.6. Высокоуровневая структура, напоминающая английский язык.
- •2.3.7. Интерактивные запросы.
- •2.3.8. Программный доступ к базе данных.
- •2.3.9. Различные представления данных.
- •2.3.10. Полноценный язык для работы с базами данных.
- •2.3.11. Динамическое определение данных.
- •2.3.12. Архитектура клиент/сервер.
- •2.4. Пятое поколение: мультимедийные базы данных (1995 г. - …)
- •People Name Adress
- •People Name Adress Papers Picture Voice
- •2.5. Основные требования.
- •2.5.1. Расширяемость.
- •2.5.2. Производительность.
- •2.5.3. Сопровождение в оперативном режиме.
- •2.5.4. Устойчивость.
- •3. Технология хранения данных. Корпоративные базы данных.
- •3.1. Современные требования к корпоративным базам данных.
- •3.2. Потребность в анализе данных.
- •3.3. Хранилища данных.
- •3.4. Хранилища и киоски данных.
- •3.5. Анализ данных в корпоративных системах.
- •3.5.1. Olap - передовая технология анализа.
- •3.5.2. Многомерное представление.
- •3.5.3. Хранение данных olap.
- •3.5.4. Разновидности olap.
- •3.6. Размышления и предсказания.
3.4. Хранилища и киоски данных.
Хранилища данных могут быть разбиты на два типа: корпоративные хранилища данных (enterprise data warehouses) и киоски данных (data marts).
Корпоративные хранилища данных содержат информацию, относящуюся ко всей корпорации и собранную из множества оперативных источников для консолидированного анализа. Обычно такие хранилища охватывают целый ряд аспектов деятельности корпорации и используются для принятия как тактических, так и стратегических решений. Корпоративное хранилище содержит детальную и обобщающую информацию; его объем может достигать от 50 Гбайт до одного или нескольких терабайт. Стоимость создания и поддержки корпоративных хранилищ может быть очень высокой. Обычно их созданием занимаются централизованные отделы информационных технологий, причем создаются они сверху вниз, то есть сначала проектируется общая схема, и только затем начинается заполнение данными. Такой процесс может занимать несколько лет.
Киоски данных содержат подмножество корпоративных данных и строятся для отделов или подразделений внутри организации. Киоски данных часто строятся силами самого отдела и охватывают конкретный аспект, интересующий сотрудников данного отдела. Киоск данных может получать данные из корпоративного хранилища (зависимый киоск), или, что более распространено, данные могут поступать непосредственно из оперативных источников (независимый киоск).
Киоски и хранилища данных строятся по сходным принципам и используют практически одни и те же технологии.
Основные компоненты.
Основными компонентами хранилища данных являются следующие:
- оперативные источники данных;
- средства проектирования/разработки;
- средства переноса и трансформации данных;
- СУБД;
- средства доступа и анализа данных;
- средства администрирования.
3.5. Анализ данных в корпоративных системах.
3.5.1. Olap - передовая технология анализа.
Двенадцать определяющих принципов OLAP были сформулированы в 1993 году Е.Ф.Коддом, "изобретателем" реляционных баз данных. OLAP - это OnLine Analytical Processing, то есть оперативный анализ данных. Позже определение Кодда было переработано в так называемый тест FASMI (Fast Analysis of Shared Multidimensional Information - быстрый анализ разделяемой многомерной информации), который требует, чтобы OLAP-приложение предоставляло следующие возможности быстрого анализа разделяемой многомерной информации:
- высокая скорость. Анализ должен производиться одинаково быстро по всем аспектам информации. При этом допустимое время отклика составляет не более 5 секунд;
- анализ. Должна существовать возможность производить основные типы числового и статистического анализа - предопределенного разработчиком приложения или произвольно определяемого пользователем;
- разделение доступа. Доступ к данным должен быть многопользовательским, при этом должен контролироваться доступ к конфиденциальной информации;
- многомерность. Основная, наиболее существенная характеристика OLAP;
- работа с информацией. Приложение должно иметь возможность обращаться к любой нужной информации, независимо от ее объема и места хранения.