
ЛЕКЦИЯ 2 (продолжение)
Тема 2. Базы данных – определение, термины, преимущества, области применения. Эволюция баз данных.
2.1. Введение
У баз данных та же цель, что и у файловых систем - хранение и управление данными конечных пользователей. Но в отличие от файловых систем БД хранят не только данные, но также связи между ними и описание способов (процедур) доступа, обработки и обслуживания.
(Термин) – это (существительное), (характеристики)
Примеры неправильных определений: БД – где хранятся данные, Модель данных – как хранятся данные
Это не придирки – необходимо учится правильно излагать суть проблемы (бакалавры, дипломы)
Основные понятия
База данных (Database):
An organized collection of logically related data. Организованное собрание (коллекция) логически связанных данных и способов доступа к ним, их обработки и обслуживания. Диск с данными – это не БД.
Система для хранения и управления данными, включающая пять основных компонентов: аппаратные средства, программное обеспечение, правила, данные и специалистов.
Данные (data): (сравнить с определением из дисциплины «ИТ» - 1 курс)
Meaningful facts, text, graphics, images, sound, video segments. Имеющие смысловое значение (связи: таблицы, записи, поля) факты, тексты, графика, изображения, звук, видео.
Метаданные (Metadata) (значительный процент общего объема):
Структурированные и кодированные данные, которые описывают характеристики объектов-носителей информации, с целью идентификации, обнаружения, оценке и управления этими объектами (при размещении в БД – объем данных уменьшается, но появляются метаданные).
Data about the data. Данные о данных и способах доступа, обработки и обслуживания. Структуры данных, индексы, процедуры, триггеры, первичные и внешние ключи, представления и т.д.
Метаданные необходимы для описания значения и свойств данных с целью лучшего ее понимания, управления и использования.
Классическим примером являются библиотеки. Книги (данные) можно классифицировать, управлять ими и находить только с помощью соответствующих метаданных (т.е. заголовка, автора и ключевых слов содержания).
Информация (Information):
Data processed to be useful in decision-making. Информация – это результат взаимодействия данных и адекватных им методов.
Модель данных:
Набор правил и определений, которым подчиняются все объекты, находящиеся внутри базы данных.
Преимущества использования баз данных по сравнению
1) Data Independence/Reduced Program Maintenance. Независимость данных – сокращение размеров программной поддержки доступа к данным (внутри прикладных программ)
1-1. Increased Application Development Productivity. Увеличение эффективности разработки приложений
1-2. Enforcement of Standards. Возможность создания и использования стандартов (хранение данных и методы доступа)
2) Minimal Data Redundancy. Минимальная избыточность хранения данных.
2-1) Improved Data Consistency and Sharing. Увеличение плотности данных и возможностей совместного доступа к данным.
2-2) Better Data Accessibility/ Responsiveness. Улучшенный доступ к данным и их соответствие конкретным решаемым задачам.
2-3) Improved Data Quality (Constraints - стеснение). Рост качества данных.
3) Security. Безопасность (защита).
4) Backup/Recovery. Сохранение и восстановление.
Локальные БД
Унаследованные данные (архивы) ERP
MRP,
MRP
II
Internet
Внешние
данные
Оперативные данные
ХД
Витрины данных
Извлечение /
Трансформация / Загрузка (ETL)
Цели ХД:
Интеграция
Качество
Запросы
Отчеты
(MRP, MRP II, ERP)
Системы
показателей (BSC)
Моделирование
Визуализация
(OLAP)
Добыча
данных
(Data Mining)
Бизнес
аналитика
Кадры / Бухучет
Ресурсы
Финансы
Персонал
HRM
(персонал)
CRM
(клиенты)
Цепочки
поставок
Отдельные
сотрудники
Менеджеры
Высшее
руководство
Весь
персонал
Данные Контекст
ИнформацияЗнания Действия
Источники ХРАНИЛИЩА ДАННЫХ Методы
обработки иПредметные Пользователи
данных средства
анализа области
Рис. Обобщенная схема современной корпоративной информационной инфраструктуры