- •Курс лекцій з дисципліни «розподілені системи баз даних і знань» для студентів 5 курсу спеціальності 8.05010104 “системи штучного інтелекту” денної форми навчання
- •Оглавление
- •1. Лекция: Архитектура и принципы распределенного подхода. Требования и критерии построения информационных систем на базе распределенных баз данных (рбд)
- •2. Лекция: Многомерное представление данных. Общая схема организации хранилища данных. Характеристики, типы и основные отличия технологий olap и oltp. Схемы звезда и снежинка. Агрегирование
- •Olap и oltp. Характеристики и основные отличия
- •Правила Кодда для olap систем
- •Основные элементы и операции olap
- •Типы olap. Преимущества и недостатки
- •Моделирование многомерных кубов на реляционной модели данных
- •Основные понятия сетевой терминологии
- •Проектирование сетей рабочей группы (инженерный подход)
- •Тонкий коаксильный кабель (диаметр до 5 мм)
- •Толстый коаксиальный кабель (диаметр до 10 мм)
- •Кабель с витыми парами
- •Оптоволоконный кабель
- •Средства управления лвс
- •Способы и средства увеличения пропускной способности лвс
- •Защита информации и повышение безопасности работы в лвс
- •4. Лекция: Логическая модель рбд. Бизнес-логика файл-серверной, клиент-серверной и n-уровневой архитектуры Логическая модель рбд
- •Файл-сервер
- •Клиент-сервер с бизнес-логикой на клиенте
- •Клиент-сервер с бизнес-логикой на сервере
- •Базовые технологии. Сравнение на понятийном уровне
- •Понятие о технологии corba
- •Объектная архитектура распределенных систем. Понятие о технологии ejb
- •Объектная архитектура распределенных систем. Понятие о технологии .Net
- •Объектные модели corba и com. Основные различия
- •Идентификация объектов corba и com в сети. Основные различия
- •Языки описания интерфейсов corba и com. Основные свойства
- •Основные встроенные объектные службы corba и com
- •6. Лекция: Распределенные субд. Архитектура ms sql Server 2005 и oracle Server 10g
- •Процессы oracle. Отличия между shared и dedicated экземплярами
- •Табличные пространства. Структура табличных пространств. Типы табличных пространств Словарь данных (словарь данных Oracle)
- •Сегменты отката undo (rollback)
- •Временные (temporary)
- •7. Лекция: Понятие транзакции. Неявные и явные транзакции. Уровни изолированности транзакций в ms sql Server 2005 и oracle 10g. Понятие блокировок. Основные типы блокировок
- •Уровни изолированности транзакций, отличия реализации Oracle от других субд
- •Особенности реализации транзакций в Oracle и ms Sql Server Общие операторы управления транзакциями
- •Понятие блокировок. Основные типы блокировок
- •Взаимоблокировки
- •8. Лекция: Репликация данных. Виды и свойства репликации. Сравнение механизмов репликации в ms sql Server 2005 и oracle Server 10g
- •Протоколы на базе первичной копии, подразумевающие репликацию данных
- •Протокол первичного архивирования с удаленной записью
- •Протокол первичного архивирования с локальной записью
- •Пример решения задач поиска и смены владельца первичной копии
- •Алгоритм поиска первичной копии
- •Алгоритм смены владельца первичной копии
- •Протоколы реплицируемой записи
- •Активная репликация
- •Протоколы кворума
- •Замечания по поводу реализации свободной непротиворечивости
- •Задача получения новой непротиворечивой реплики
- •Алгоритм, иллюстрирующий 1-ый подход
- •Алгоритм получения глобального состояния системы
- •Алгоритм, иллюстрирующий 2-ой подход
- •Сравнение механизмов репликации в ms sql Server 2005 и oracle Server 10g
- •Методы разрешения конфликтов уникальности
- •Методы разрешения конфликтов удаления
- •Методы разрешения конфликтов обновления Приоритет узла (Site priority в Oracle и ms SqlServer)
- •Сложение(Additive в Oracle и ms SqlServer)
- •Усреднение(Average в Oracle и ms SqlServer)
- •Последняя временная метка(Latest Timestamp в Oracle, datetime (Earlier Wins) в ms SqlServer)
- •Первая временная метка(Earliest Timestamp в Oracle, datetime (LaterWins) в ms SqlServer)
- •9. Лекция: Внутренний язык субд. Сравнительные характеристики t-sql и pl/sql Введение
- •Основные характеристики pl/sql и t-sql
- •Именованные блоки
- •Управляющие конструкции
- •Неявное использование переменной цикла
- •Динамическое изменение границ
- •Использование меток
- •Основные объекты. Хранимые процедуры и функции
- •Основные объекты. Триггеры
- •10. Лекция: Хранимые процедуры и функции. Типы параметров, синтаксис описания формальных параметров
- •Параметры
- •Возврат результатов
- •Создание процедур
- •Создание функций
- •Вызов процедур и функций
- •Передача параметров. Атрибут nocopy
- •Модули pl/sql
- •Просмотр объектов и компиляция
- •Перекомпиляция процедур и функций
- •Скрипт для перекомпиляции процедур и функций
- •11. Лекция: Триггеры. Основные понятия. Типы триггеров. Общая схема активизации триггеров
- •Триггеры sql Server Создание триггеров
- •Синтаксис команды создания триггера creat trigger
- •Удаление триггеров
- •Триггеры Oracle Подготовка примера
- •Создание триггера
- •Типы триггеров и порядок их выполнения
- •Использование предикатов inserting, ... И new, old
- •Изменяющиеся таблицы
- •12. Лекция: Оптимизация выполнения запросов Выполнение запросов в Oracle. Общая схема и взаимодействие с клиентским приложением и машиной pl/sql
- •Оптимизатор. Его назначение. Этапы работы оптимизатора
- •Режимы работы оптимизатора по стоимости. Установка режимов. Параметры, влияющие на работу оптимизатора
- •Статистика. Назначение, способы формирования
- •Сбор статистики с помощью analyze
- •Сбор статистики с помощью пакета dbms_stats
- •Статистика по таблицам
- •Статистика по индексам
- •Статистика по столбцам
- •Пути доступа к данным Подготовка данных
- •Полное сканирование таблицы. Преимущества, недостатки
- •Классические индексы
- •Доступ к таблицам по индексам
- •Функциональные индексы
- •Битовые индексы
- •Индекс-организованные таблицы
- •Принципы построения запросов для эффективного использования индексов
- •Материализованные представления
- •Создание объектов
- •Информация по материализованным представлениям
- •Оценка требуемого размера
- •Способы построения
- •Частота обновления
- •Способ обновления
Пути доступа к данным Подготовка данных
-- создание объектов
drop table h;
-- create table h(p number constraint pk primary key,
s varchar2(100) null, n number null,
nu number null constraint un unique);
create table h(p number, s varchar2(100) null,
n number null, nu number null);
Полное сканирование таблицы. Преимущества, недостатки
Для выборки данных производится перебор всех строк таблицы, возвращаются строки подходящие под условия запроса. Может быть эффективнее использования индекса в случаях когда необходимо выбрать >25-30% записей в таблице. Возникает проблема High Water Mark.
-- полное сканирование таблицы. high water mark
insert into h select -rownum, object_name,
object_id, object_id from all_objects where rownum < 100;
insert into h select rownum, object_name,
object_id, object_id from all_objects;
select * from h where p < 0;
analyze table h compute statistics for table for
all columns for all indexes;
select num_rows, blocks, empty_blocks from
user_tables where table_name = 'H';
delete from h where p > 0;
Классические индексы
Индексы на основе В*-дерева наиболее широко используемый тип индексной структуры в базе данных. По реализации они подобны двоичному дереву поиска. Цель их создания — минимизировать время поиска данных сервером Oracle. При наличии индекса по числовому столбцу, структура индекса может выглядеть так:
Блоки самого нижнего уровня в индексе, которые называют листовыми вершинами, содержат все проиндексированные ключи и идентификаторы строк ( rid на схеме), ссылающиеся на соответствующие строки. Промежуточные блоки над листовыми вершинами называют блоками ветвления. Они используются для переходов по структуре. Например, если необходимо найти в индексе значение 42, надо начать с вершины дерева и двигаться вправо. При проверке этого блока оказывается, что необходимо перейти к блоку в диапазоне "от 40 до 50". Этот блок оказывается листовым и ссылается на строки, содержащие число 42. Интересно отметить, что листовые блоки фактически образуют двухсвязный список. Как только найдено "начало" среди листовых вершин, т.е. первое значение, очень легко просматривать значения по порядку (это называют также просмотром диапазона по индексу, index range scan). Проходить по структуре индекса больше не нужно; мы просто переходим по листовым вершинам. Это существенно упрощает поиск строк но усл овиям следующего вида:
where x between 20 and 30
-- индексы
-- структура индекса, rowid
truncate table h;
insert into h select rownum, object_name,
object_id, object_id from all_objects where rownum < 10;
commit;
select rowid, p from h;
select * from h where rowid =
'AAAN95AAEAAAAfHAAA';
declare
r_t number;
o_n number;
f_n number;
b_n number;
r_n number;
r rowid;
begin
select rowid into r from h where rownum < 2;
dbms_rowid.rowid_info(r, r_t, o_n, f_n, b_n, r_n);
dbms_output.put_line('rowid type = ' || r_t);
dbms_output.put_line('object number = ' || o_n);
dbms_output.put_line('file number = ' || f_n);
dbms_output.put_line('block number = ' || b_n);
dbms_output.put_line('row number = ' || r_n);
end;
select * from user_objects where object_name = 'H';
select * from user_tables where table_name = 'H';
select * from dba_data_files;
-- создание индексов
truncate table h;
insert into h select rownum, object_name, object_id, object_id from all_objects;
commit;
create index ind_s on h(s);
select * from user_indexes where table_name = 'H';
drop index ind_s;
select * from user_indexes where table_name = 'H';
create index ind_s_1 on h(s desc);
create unique index ind_n on h(n);
select index_name, index_type, table_name, status, funcidx_status from user_indexes where table_name = 'H';
-- информация по таблицам и индексам
select * from user_tables;
select * from user_tab_columns;
select * from user_constraints;
select * from user_cons_columns;
select * from user_indexes;
select * from user_ind_columns;
Листинг 12.2. (html, txt)