- •Кафедра «Информационные технологии»
- •Лекции 8, 9
- •1. Информационные системы и базы данных: концепция интеграции данных, назначение, основные понятия
- •В широком понимании под определение ИС подпадает любая система обработки информации.
- •Иногда используется более узкая трактовка понятия ИС как совокупности аппаратно-
- •Банк данных - разновидность ИС, в которой реализованы функции централизованного хранения и накопления
- •База данных (БД) - совокупность специальным образом организованных (структурированных) данных, хранимых в памяти
- •Система управления базами данных (СУБД) - комплекс языковых и программных средств,
- •Одни из первых СУБД:
- •Приложение - программа или комплекс
- •Для работы с БД часто достаточно средств СУБД и не нужно использовать приложения,
- •Словарь данных (СД) - подсистема БнД для централизованного хранения информации о структурах данных,
- •Функционально СД присутствует во всех БнД, но не всегда выполняющий эти функции компонент
- •Администратор базы данных (АБД) - лицо или группа лиц, отвечающих за выработку
- •Вычислительная система (ВС) - совокупность взаимосвязанных и согласованно действующих ЭВМ или процессоров и
- •Предпосылки появления БД и СУБД
- •Преимущества нового подхода:
- •Взаимодействие программ с данными при независимой работе (слева) и при использовании СУБД (справа)
- •Упрощенная схема системы баз данных
- •Основные компоненты СУБД
- •Основные функции СУБД
- •Основные функции СУБД
- •Основные функции СУБД
- •Основные функции СУБД
- •2. Виды архитектуры ИС на основе БД. Три уровня архитектуры БД: физическая,
- •Сервер определенного ресурса в компьютерной сети - компьютер (или программа), управляющий этим ресурсом,
- •Основное преимущество организации ИС
- •Структура ИС с файл-сервером
- •В ИС архитектуры файл-сервер по запросам пользователей файлы БД передаются на ПЭВМ, где
- •Структура ИС с сервером БД
- •При клиент-серверной архитектуре сервер БД выполняет основную обработку данных. Формируемые пользователем или приложением
- •Для создания и управления ПБД и приложений, работающих с ними, используются различные СУБД:
- •Другие преимущества клиент-серверной архитектуры
- •Три уровня архитектуры БД
- •Согласно требованиям стандартной архитектуры
- •Три уровня архитектуры ANSI/SPARC
- •Детальная схема архитектуры СУБД
- •3. Классификация СУБД, функции
- •Классификация СУБД по виду программы
- •«традиционные» СУБД, сначала - для больших машин, затем - для мини-ЭВМ и ПЭВМ.
- •Серверы БД предназначены для организации центров обработки данных в сетях ЭВМ. Эта группа
- •Клиентские программы для серверов БД -
- •Средства разработки программ работы с БД
- •Классификация СУБД (и БД) по модели данных
- •Представление связей между объектами в иерархической модели данных
- •Для описания структуры (схемы) иерархической БД на некотором языке программирования используется тип данных
- •Данные в иерархической БД
- •Представление связей между объектами в сетевой модели данных
- •Пример схемы сетевой БД
- •Основные компоненты реляционного отношения
- •Основные компоненты реляционного отношения
- •Элементы реляционной модели
- •Пример реляционной БД –
- •Пример реляционной БД – Часть БД о покупателях и договорах
- •Реляционные СУБД опираются на прочный теоретический фундамент. В их основе - простое представление
- •Для описания реляционного подхода используется простой и в то же время мощный математический
- •Несмотря на теоретическую проработанность, реляционные системы не сразу получили широкое распространение, их эффективная
- •3.2. Функции, выполняемые различными видами СУБД
- •Для работы с данными СУБД предоставляет программам / пользователям 2 типа языков:
- •ЯОД (DDL) и ЯМД (DML) в разных СУБД могут
- •Перечисленные выше функции СУБД, в свою
- •В разных системах может различаться:
- •Управление буферами оперативной памяти
- •Управление транзакциями
- •Управление транзакциями
- •Перевод денег с одного счета на другой в
- •Пример транзакции – более детальный
- •Контроль транзакций важен в
- •При параллельном выполнении смеси транзакций возможно возникновение
- •Ведение журнала изменений в БД
- •Обеспечение целостности и безопасности БД
- •4. Разработчики и пользователи ИС на основе СУБД
- •Принципы работы прикладных программ с БД
- •Вторая группа - конечные пользователи, работают с БД через рабочую станцию (терминал); получают
- •Третья группа - администратор данных (АД)
- •АБД – технические специалисты, реализующие
- •5. Принципы разработки и выполнения приложений при работе с БД
- •Существующие СУБД поддерживают следующие
- •Ручное кодирование - текст программ приложений набирается вручную, затем - отладка.
- •Средства визуального программирования приложений - развитие идеи использования генераторов приложений - приложение «строится»
- •Виды приложений
- •Интерпретируемые приложения - без среды СУБД не выполняются. Выполнение приложения: СУБД анализирует содержимое
- •Приложения с псевдокомпиляцией -
- •используют для запрета модификации
- •Преимущества независимых приложений
- •Преимущества интерпретируемых приложений
- •6. Основы OLAP-технологий
- •Термин OLAP - Кодд (E. F. Codd), 1993 г. Главная идея OLAP -
- •OLAP используется аналитиками для быстрой обработки сложных запросов к БД. Служит для подготовки
- •Действие OLAP. OLTP и OLAP
- •Термин OLTP применяют также к системам (приложениям). OLTP-системы предназначены для ввода, структурированного хранения
- •OLTP-системы проектируются, настраиваются и оптимизируются для выполнения максимального количества транзакций за
- •«Недостаток» OLTP – относительно медленное выполнение сложных многотабличных запросов
- •Реляционное и многомерное представление
- •Примеры трехмерных моделей
- •Примеры бизнес-приложений Data Mining
- •SSIS
- •SQL Server 2005: Analysis
- •SQL Server 2005: Data Mining
- •SQL Server 2005: Значение Data Mining
- •SQL Server 2005: Data Mining
Примеры бизнес-приложений Data Mining
|
|
Страхование |
|
||
|
|
|
|
|
выявление мошенничества |
|
|
разработка продуктов |
|
|
анализ риска |
|
|
|
115
SSIS
SQL Server 2005: SSIS
Сценарии использования
•Хранилища данных
•Fuzzy logic
•Источник данных по требованию (to .Net DataReader)
•Импорт данных в гетерогенных средах
•Поддержка Data Mining
•Звено BI
116
SQL Server 2005: Analysis
Services
Что это за сервис
•OLAP
•Data Mining
117
SQL Server 2005: Data Mining
Data Mining – процесс извлечения верной, аутентичной, пригодной для использования информации из больших баз данных
•Определение проблемы
•Подготовка данных
•Исследование данных
•Построение моделей
•Исследование и проверка моделей
• Развертывание и обновление118 моделей
SQL Server 2005: Значение Data Mining
Business Knowledge
|
значимость |
|
|
SQL Server 2005 |
|
|
|
|
|
Data Mining |
|
|
|
|
OLAP |
|
|
|
|
|
|
|
|
|
Бизнес |
|
Reports (Adhoc) |
|
|
|
Reports (Static) |
|
|||
|
|
|
|
|
|
|
|
Легко |
|
Простота |
Сложно |
|
|
|
|
|
|
|
5 новых алгоритмов |
|
Тесная интеграция с AS, SSIS, |
||
|
Графические |
|
|
Reporting |
|
|
утилиты/wizards |
|
Интеграция с Web/Office |
||
|
12 встроенных средств |
|
приложениями |
119 |
|
|
|
||||
|
просмотра |
|
|
|
|
SQL Server 2005: Data Mining
Сценарии использования
•Серьезные аналитические системы
Анализ финансовой информации
Анализ угроз безопасности
Анализ рыночной ситуации, стратегии продаж
Помощь в поиске оптимальных бизнес- решений
120