Скачиваний:
27
Добавлен:
11.04.2015
Размер:
21.64 Кб
Скачать

32 OLAP системы OLTP системы. Логические структуры, используемые при создании хранилища данных. Мера, измерение

OLTP-приложений (On-Line Transaction Processing (OLTP)- оперативная обработка транзакций). Типичными примерами OLTP-приложений являются системы складского учета, системы заказов билетов, банковские системы, выполняющие операции по переводу денег, и т.п. Основная функция подобных систем заключается в выполнении большого количества коротких транзакций. Сами транзакции выглядят относительно просто, например, "снять сумму денег со счета А, добавить эту сумму на счет В". Проблема заключается в том, что, во-первых, транзакций очень много, во-вторых, выполняются они одновременно (к системе может быть подключено несколько тысяч одновременно работающих пользователей), в-третьих, при возникновении ошибки, транзакция должна целиком откатиться и вернуть систему к состоянию, которое было до начала транзакции (не должно быть ситуации, когда деньги сняты со счета А, но не поступили на счет В). Практически все запросы к базе данных в OLTP-приложениях состоят из команд вставки, обновления, удаления. Таким образом, критическим для OLTP-приложений является скорость и надежность выполнения коротких операций обновления данных.

OLAP-приложения (On-Line Analitical Processing (OLAP) - оперативная аналитическая обработка данных). Это обобщенный термин, характеризующий принципы построения систем поддержки принятия решений (Decision Support System - DSS), хранилищ данных (Data Warehouse), систем интеллектуального анализа данных (Data Mining). Такие системы предназначены для нахождения зависимостей между данными (например, можно попытаться определить, как связан объем продаж товаров с характеристиками потенциальных покупателей), для проведения анализа "что если…". OLAP-приложения оперируют с большими массивами данных, уже накопленными в OLTP-приложениях, взятыми их электронных таблиц или из других источников данных. Такие системы характеризуются следующими признаками:

Добавление в систему новых данных происходит относительно редко крупными блоками (например, раз в квартал загружаются данные по итогам квартальных продаж из OLTP-приложения).

Данные, добавленные в систему, обычно никогда не удаляются.

Перед загрузкой данные проходят различные процедуры "очистки", связанные с тем, что в одну систему могут поступать данные из многих источников, имеющих различные форматы представления для одних и тех же понятий, данные могут быть некорректны, ошибочны.

Запросы к системе являются нерегламентированными и, как правило, достаточно сложными.

33 Структура распределенной информационной системы

Под распределенной (Distributed DataBase - DDB) обычно подразумевают базу данных, включающую фрагменты из нескольких баз данных, которые располагаются на различных узлах сети компьютеров, и, возможно управляются различными СУБД. Распределенная база данных выглядит с точки зрения пользователей и прикладных программ как обычная локальная база данных. В этом смысле слово "распределенная" отражает способ организации базы данных, но не внешнюю ее характеристику. ("распределенность" базы данных невидима извне). 

12 свойств или качеств идеальной DDB(Распределенной ИС):

Локальная автономия (localautonomy)

Независимость узлов (norelianceoncentralsite)

Непрерывные операции (continuousoperation)

Прозрачность расположения (locationindependence)

Прозрачная фрагментация (fragmentationindependence)

Прозрачное тиражирование (replicationindependence)

Обработка распределенных запросов (distributedqueryprocessing)

Обработка распределенных транзакций (distributedtransactionprocessing)

Независимость от оборудования (hardwareindependence)

Независимость от операционных систем (operationgsystemindependence)

Прозрачность сети (networkindependence)

Независимость от баз данных (databaseindependence)

34 архитектура оракл

база данных - собрание данных, между которыми существуют (смысловые) связи. Физическое расположение и реализация базы данных прозрачны для прикладных программ; физическую базу данных можно перемещать и реорганизовывать и это не окажет влияния на работоспособность программ. На одной физической машине может быть одновременно несколько баз данных. Поэтому конкретную базу данных называют экземпляр (instance).

Физически база данных Oracle - не более чем набор файлов где-то на диске. Расположение этих файлов несущественно для функционирования (хотя важно для производительности) базы данных.

Каждая база данных содержит несколько схем данных - это пользовательский раздел Oracle,  который идентифицируется именем пользователя (с паролем), уникальным в данной БД. На рисунке показана архитектура Oracle.

Существуют три основные группы файлов на диске, составляющие базу данных.

  1. Файлы базы данных  - *dbf 

  2. Управляющие файлы - control file 

  3. Журнальные файлы - redo & arch 

  4. Файл настроек oracle - init.ora 

Наиболее важные из них - файлы базы данных, где располагаются собственно данные. Управляющие и журнальные файлы поддерживают функционирование архитектуры. Для доступа к данным БД все три набора файлов должны присутствовать, быть открытыми и доступными Oracle. Если эти файлы отсутствуют, обратиться к базе данных нельзя, и администратор базы данных должен будет восстанавливать часть или всю БД, используя файлы резервных копий (если их сделали!). Все эти файлы двоичные.

После инсталляции СУБД  администратор имеет возможность войти в СУБД используя учетные записи SYS или SYSTEM, с паролем manager.

Для работы с файлами базы данных на машине должны существовать системные процессы Oracle и один (или больше) пользовательский процесс.

Системные процессы Oracle (их называют фоновыми) обеспечивают функционирование пользовательских процессов - выполняют функции, которые иначе пришлось бы выполнять пользовательским процессам непосредственно.

Дополнительно к фоновым процессам Oracle, в простейшем случае, на одно подключение к базе данных должен существовать один пользовательский процесс. Прежде чем обратиться к какому-либо объекту, пользователь он должен подключиться к базе данных.

35 Физическая структура хранения данных (блок, экстент, сегмент, табличное пространство).

ORACLE распределяет пространство базы данных для всех ее данных. Единицами логического распределения являются блоки данных, экстенты и сегменты.

Блоки данных

На самом низком уровне рассмотрения, данные базы данных ORACLE хранятся в БЛОКАХ ДАННЫХ (называемых также страницами). Один блок данных соответствует фиксированному числу байт физического пространства базы данных на диске. Размер блока данных специфически устанавливается для каждой базы данных ORACLE при ее создании. Этот размер кратен размеру блока операционной системы, но не превышает определенный максимум. Каждая операционная система имеет то, что называется РАЗМЕРОМ БЛОКА, который определяется как специфическое число байт на диске.

Блок данных - это наименьшая единица ввода-вывода, используемая базой данных. Блок данных соответствует физическому блоку на диске с размером, совпадающим с размером блока данных ORACLE. Этот размер блока может отличаться от стандартного размера блока ввода-вывода операционной системы, в которой выполняется ORACLE.

Формат блока данных ORACLE один и тот же, независимо от того, содержит ли блок данные таблицы, индекса или кластера.

Экстенты

Следующий уровень логического пространства базы данных называется ЭКСТЕНТОМ(EXTENTS). Экстент - это специфическое число смежных блоков данных, распределяемых для хранения специфического типа информации.

Экстент - это логическая единица распределения пространства базы данных, состоящая из определенного числа непрерывных блоков данных. Каждый тип сегмента состоит из одного или нескольких экстентов. Когда существующее пространство в сегменте полностью использовано, ORACLE распределяет для сегмента новый экстент.

Сегменты

Уровень логического пространства базы данных, следующий за экстентом, называется СЕГМЕНТОМ (SEGMENTS). Сегмент - это совокупность экстентов, распределенных для специфического типа структуры данных, и находящихся в одном и том же табличном пространстве. Например, данные каждой таблицы хранятся в ее собственном СЕГМЕНТЕ ДАННЫХ, а данные каждого индекса хранятся в его собственном СЕГМЕНТЕ ИНДЕКСА.

ORACLE распределяет пространство для сегментов экстентами. Поэтому, когда существующие экстенты сегмента заполнены, ORACLE распределяет очередной экстент для этого сегмента. Поскольку экстенты распределяются при необходимости, экстенты сегмента не обязательно смежные на диске, и могут быть распределены между различными файлами. Каждый экстент, однако, не может находиться в нескольких файлах.

База данных ORACLE может содержать четыре различных типа сегментов:

сегмент данных

сегмент индекса

сегмент отката

временный сегмент

Табличное пространство

Для создания табличного пространства можно использовать предложение CREATE DATABASE или CREATE TABLESPACE. При создании, табличного пространства, следует сделать выбор, какой тип файлов будет использоваться, большой или маленький, какой тип управления экстентами будет использоваться, локальный или словарем данных, и как будет проводиться управление пространством сегментов – автоматически или вручную. Дополнительно, решается, будет ли это табличное пространство специализированным – табличное пространство для временных сегментов или сегментов отката.

Новое в Oracle 10g, это табличные пространства с большими файлами (bigfile). Такие табличные пространства поострены на одном файле данных или временном файле.

Табличное пространство smallfile – это новое название старых табличных пространств. В таких табличных пространствах, может быть несколько файлов данных.

Соседние файлы в папке ответы