Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект ИСЭ.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
624.13 Кб
Скачать

Витрины (киоски) данных.

Витрина данных (Data Mart) – это тематическая БД, содержащая информацию, относящуюся к отдельным аспектам деятельности организации.

ВД это подмножество ХД.

Достоинства ВД: стоимость (дешевле ХД), сроки, размеры, безопасность (с ними работает меньшее число пользователей).

Недостатки ВД: дублирование данных, расширение (трудно нарастить до ХД), ограниченность.

По определению У. Инмона (Inmon W.), хранилище данных – это предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки управления.

Предметно-ориентированный означает, что хранилище предназначено, прежде всего, для обработки экономической информации. Должна учитываться специфика данных.

Интегрированный – информация собирается из разных источников. Это различные OLTP системы, устанавливаемые, например, в банке и его филиалах. Все данные в них необходимо свести в одно хранилище, согласовать форматы и в одну систему понятий.

Неизменчивый, поддерживающий хронологию. В ХД можно добавить информацию, но её нельзя удалить или изменить.

Например, изменились реквизиты клиента.

Самое сложное требование, т.к. данные, помещаемые в хранилище не всегда достоверны.

  1. Основы проектирования реляционных баз данных

4.1. Модели данных

Хранимые в базе данные имеют определенную логическую структуру - иными словами, описываются некоторой моделью представления данных (моделью данных), поддерживаемой СУБД. К числу классических относятся следующие модели данных:

  • иерархическая,

  • сетевая,

  • реляционная.

Кроме того, в последние годы появились и стали более активно внедряться на практике:

  • постреляционная,

  • многомерная,

  • объектно-ориентированная.

Наиболее распространенной в настоящее время является реляционная модель представления данных.

4.2. Реляционная модель данных

Реляционная модель данных предложена сотрудником фирмы IBM Эдгаром Коддом и основывается на понятии отношения (relation).

Отношение представляет собой множество элементов, называемых кортежами. Наглядной формой представления отношения является обычная таблица.

Таблица имеет строки (записи, кортежи) и столбцы (колонки, поля, атрибуты). Например, таблица СОТРУДНИКИ состоит из полей ФАМИЛИЯ, АДРЕС, СТАЖ_РАБОТЫ и т.д. Строками в этой таблице будут данные о конкретных сотрудниках.

С помощью одной таблицы удобно описывать простейший вид связей между данными, а именно деление одного объекта (сущности) на множество подобъектов - экземпляров сущности, информация о которых хранится в виде строк таблицы. При этом каждый из подобъектов имеет одинаковую структуру, описываемые соответствующими значениями полей таблицы.

Теоретически возможно построение одной единственной таблицы (универсальной), содержащей полную информацию об объектах моделируемой предметной области. Например, если формируется база данных магазина, то такая универсальная таблица содержала бы информацию о поставщиках, товарах, клиентах, продавцах, складах и т.д. К сожалению, универсальные таблицы практически не используются ввиду необходимости хранения большого количества избыточной информации, что существенно усложняет компьютерную обработку данных.

Поэтому вместо одной универсальной таблицы информацию хранят в серии взаимосвязанных таблиц. Это множество взаимосвязанных таблиц, в которых хранится вся, представляющая интерес для организации, информация и представляет собой реляционную базу данных.

Вопросы эффективного распределения полезной информации по взаимосвязанным таблицам изучает теория проектирования реляционных баз данных. Одним из методов построения реляционных баз данных приемлемого качества является метод "Сущность - связь".