Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Shpory_KIT (1).doc
Скачиваний:
30
Добавлен:
20.02.2016
Размер:
355.84 Кб
Скачать

12 Правил к. Дейта:

  1. Локальная автономность

  2. Отсутствие опоры на центральный узел

  3. Непрерывное функционирование

  4. Независимость от расположения

  5. Независимость от фрагментации

  6. Независимость от репликации

  7. Обработка распределённых запросов

  8. Обработка распределённых транзакций

  9. Независимость от типа оборудования

  10. Независимость от сетевой архитектуры

  11. Независимость от операционной системы

  12. Независимость от типа СУБД

  1. Типы интерфейса доступа к БД.

Каждая база данных, и даже каждая версия базы данных имеет свой уникальный формат, свои уникальные особенности, поэтому драйвер для каждой разновидности баз данных тоже уникальный и обычно создаётся производителем баз данных. Интерфейс на «выходе» тоже должен быть стандартизованным – тогда работа с разными базами данных будет значительно облегчена до истиной переносимости кода далеко (хотя для простейших програм можно легко перенести код для работы с другой базой данных) – сказываются очень большие различия в архитектуре баз данных, которые просто невозможно свести 100% к одинаковому интерфейсу, но в любом случае знакомство с одной базой данных позволяет с лёгкостью разобраться с другой... Как всегда существует несколько стандартов таких «выходных интерфейсов».

Наиболее широко распространены следующие «стандарты» или системы доступа к базам данных:

1)BDE – Borland Database Engin.

2)ODBC – продукт был создан Microsoft как конкурент BDE.

3)DAO – это очень старая система для доступа к MS Access и MS Excel

4)ADO (ActiveX Data Object) – новая система от MS ориентированная прежде всего на работу с серверными базами данных.

Кроме перечисленных есть ещё по крайней мере десяток других широко известных систем доступа к базам данных, и огромное количество "отдельно стоящих" драйверов для конкретной базы данных.

  1. OLAP-технология. Тест FASMI

OLAP (On-Line Analytical Processing)— технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процессов принятия решений. Основное назначение OLAP-систем — поддержка аналитической деятельности, произвольных (часто используется термин ad-hoc) запросов пользователей-аналитиков. Цель OLAP-анализа — проверка возникающих гипотез.

FASMI (Fast of Shared Multidimensional Information), созданный в 1995 г. Найджелом Пендсом (Nigel Pendse) и Ричардом Критом (Richard Creeth).. на основе анализа правил Кодда. В данном контексте акцент сделан на скорость обработки, многопользовательский доступ, релевантность информации, наличие средств статистического анализа и многомерность, т. е. представление анализируемых фактов как функций от большого числа их характеризующих параметров. Таким образом, они определили OLAP следующими пятью ключевыми словами: Fast (Быстрый), Analysis (Анализ), Shared (Разделяемой), Multidimensional (Многомерной), Information (Информации). Изложим эти пять ключевых представлений более подробно.

Fast (Быстрый) - означает что система должна обеспечивать выдачу большинства ответов пользователям в сжатые сроки. При этом самые простые запросы обрабатываются в течение одной секунды и очень немногие - более 20-ти секунд.

Analysis (Анализ) - означает что система может справляться с любым логическим и статистическим анализом, характерным для данного приложения и обеспечивает его сохранение в виде, доступном для конечного пользователя.

Shared (Разделяемой) - означает, что система осуществляет все требования защиты конфиденциальности (возможно до уравнения ячейки) и если, множественный доступ для записи необходим, обеспечивает блокировку модификаций на соответствующем уровне.

Multidimensional (Многомерной) - означает, что система должна обеспечить многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий. Многомерность являются ключевым критерием.

Information (Информации) - необходимая информация должна быть получена там, где она необходима.

  1. Понятие хранилища данных. Его отличие от БД

Хранилище данных (англ. Data Warehouse) — предметно-ориентированная информационная корпоративная база данных, специально разработанная и предназначенная для подготовки отчётов, анализа бизнес-процессов с целью поддержки принятия решений в организации. Строится на базе клиент-серверной архитектуры, реляционной СУБД и утилит поддержки принятия решений. Данные, поступающие в хранилище данных, становятся доступны только для чтения. Данные из промышленной OLTP-системы копируются в хранилище данных таким образом, чтобы построение отчётов и OLAP-анализ не использовал ресурсы промышленной системы и не нарушал её стабильность. Данные загружаются в хранилище с определённой периодичностью, поэтому актуальность данных несколько отстает от OLTP-системы.

Принципы организации хранилища

Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют. Интегрированность. Данные объединены так, чтобы они удовлетворяли всем требованиям предприятия в целом, а не единственной функции бизнеса. Некорректируемость. Данные в хранилище данных не создаются: т.е. поступают из внешних источников, не корректируются и не удаляются. Зависимость от времени. Данные в хранилище точны и корректны только в том случае, когда они привязаны к некоторому промежутку или моменту времени Существуют два архитектурных направления – нормализованные хранилища данных и размерностные хранилища.  В нормализованных хранилищах, данные находятся в предметно ориентированных таблицах третьей нормальной формы. Нормализованные хранилища характеризуются как простые в создании и управлении, недостатки нормализованных хранилищ – большое количество таблиц как следствие нормализации, из-за чего для получения какой-либо информации нужно делать выборку из многих таблиц одновременно, что приводит к ухудшению производительности системы.  Размерностные хранилища используют схему "звезда" или "снежинка". При этом в центре звезды находятся данные (Таблица фактов), а размерности образуют лучи звезды. Различные таблицы фактов совместно используют таблицы размерностей, что значительно облегчает операции объединения данных из нескольких предметных таблиц фактов (Пример – факты продаж и поставок товара). Таблицы данных и соответствующие размерности образуют архитектуру "ШИНА". Размерности часто создаются в третьей нормальной форме (медленно изменяющиеся размерности), для протоколирования изменения в размерностях. Основным достоинством размерностных хранилищ является простота и понятность для разработчиков и пользователей, также, благодаря более эффективному хранению данных и формализованным размерностям, облегчается и ускоряется доступ к данным, особенно при сложных анализах. Основным недостатком является более сложные процедуры подготовки и загрузки данных, а также управление и изменение размерностей данных.

  1. Классификация хранилища данных по Б. Инмону

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]