Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ все ответы 13-53[1].doc
Скачиваний:
8
Добавлен:
25.09.2019
Размер:
332.8 Кб
Скачать
  1. Модели данных современных субд.

Ядром любой базы данных является модель данных. Модель данных – это совокупность структур данных и операций их обработки. СУБД основывается либо на использовании иерархической, сетевой или реляционной модели, либо на комбинации этих моделей, либо на некотором их подмножестве.

Иерархическая модель данных. К основным понятиям иерархической структуры относятся: узел, уровень, элемент и связь. Узел – это совокупность атрибутивов, описывающих некоторый объект. На схеме иерархического дерева узлы представлены вершинами графика.

Сетевая модель

Реляционная модель данных ориентирована на организацию данных в виде двухмерных таблиц. Каждая реляционная таблица (отношение) представляет собой двухмерный массив и обладает следующими свойствами: 1. каждый элемент таблицы – один элемент данных. 2. все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный) и длину. 3. каждый столбец имеет уникальное имя. 4. одинаковые строки в таблице отсутствуют. 5. порядок следования строк и столбцов может быть произвольным.

Дополнительно: БД – это поименованная совокупность структурированных данных, относящихся к определенной предметной области. Объекты реального мира, сведения о которых хранятся в БД, называются сущностями, а их актуальные признаки – атрибутами. В БД могут отражаться не только физические объекты, она способна вобрать в себя сведения об абстракциях, процессах, явлениях. Т.е. обо всем, с чем сталкивается человек в своей деятельности. В состав БД входит также метаинформация, т.е. информация об информации, включающая описание БД (схема БД), информацию о предметной области, необходимую для проектирования системы и т.д. Централизованное хранилище метаинформации называется словарем данных (словарь – справочник, энциклопедия, репозитарий).

СУБД – это комплекс программных и языковых средств, необходимых для создания БД, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.

СУБД, позволяющие разработчику добавлять новые типы данных и новые операции называют расширяемымиСБД. В дальнейшем развитие РСБД является объектно-ориентированные системы БД, позволяющие моделировать сложные объекты.

Классификация СУБД.

1. по языкам общения: открытые (для обращения к БД используются универсальные языки программирования)—используются редко; замкнутые (имеют собственные языки общения с пользователем).

2. по числу уровней в архитектуре: 1-3 (под архитектурным уровнем СУБД понимается функциональный компонент, механизмы которого служат для поддержки некоторого уровня абстракции данных.

3. по выполняемым функциям: информационные (позволяют организовать хранение информации и доступ к ней); операционные (выполняют достаточно сложную обработку).

4. по сфере возможного применения: универсальные и специализированные (обычно проблемно-ориентированные).

  1. Понятие и основные характеристики хранилищ данных.

Хранилище данных – это предметно-ориентированное привязанное ко времени и не изменяемое собрание данных для поддержки процесса принятия управленческих решений. Целью построения хранилища данных является интеграция, актуализация и согласование оперативных данных из разнородных источников для формирования единого непротиворечивого взгляда на объект управления в целом.

Принципы организации хранилища данных:

- проблемно-предметная ориентация: данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют.

- интегрированность: объединяет данные т.о., чтобы они удовлетворяли всем требованиям всего предприятия, а не единственной функции бизнеса.

- некорректируемость: данные в хранилище данных не создаются, т.е. поступают из внешних источников, не корректируются, не удаляются.

- зависимость от времени: данные в хранилище точны и корректны только в том случае, когда они привязаны к некоторому промежутку или моменту времени

Хранилище данных является идеальным местом хранения аналитических данных и обладает следующими основными характеристиками: централизованное хранилище, оптимизированный доступ, непротиворечивость данных, использование бизнес-понятий для доступа к информации, автоматическое обновление, содержит исторические данные; хранит подробные сведения, а также частично и полностью обобщенные данные; данные в основном являются статическими; нерегламентированный, неструктурированный и эвристический способ обработки данных; средняя и низкая интенсивность обработки транзакций; непредсказуемый способ использования данных; предназначено для проведения анализа; ориентировано на предметные области; поддержка принятия стратегических решений; обслуживает относительно малое количество работников руководящего звена.

  1. Операционный склад данных, витрина данных.

Операционный склад данных (Operational Data Store, сокр. ODS). "Хранилище данных", содержащее ограниченный объем исторических данных, которые используются для поддержки одного или нескольких операционных приложений, к которым предъявляются высокие требования по быстродействию (время ответа менее секунды). Операционные склады данных обновляются непосредственно из операционных приложений. Является источником информации, загружаемой в хранилище данных.

Витрина данных (Data Mart). Совместно используемая, аналитическая структура данных, которая поддерживает одну предметную область, приложение или отдел.

Витрина данных — срез хранилища данных, представляющий собой массив тематической, узконаправленной информации, ориентированный, например, на пользователей одной рабочей группы или департамента. витрины данных — множество тематических БД содержащих информацию, относящуюся к отдельным аспектам деятельности организации.

Концепция витрин данных имеет ряд несомненных достоинств:

  • Аналитики видят и работают только с теми данными, которые им реально нужны.

  • Целевая БД максимально приближена к конечному пользователю.

  • Витрины Данных обычно содержат тематические подмножества заранее агрегированных данных, их проще проектировать и настраивать.

  • Для реализации витрин данных не требуются высокомощная вычислительная техника.