Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

МИРЭА - Российский технологический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

БД_Лекции.tar / Лекции по Базам данных (Управление данными) / Лекции по Базам данных - версия 9.01.10 / Тема 6.doc

Скачиваний:

Добавлен:

10.05.2015

Размер:

186.88 Кб

Скачать

☆

1 / 61 2 3 4 5 6 > Следующая >>>

Тема 6 Физическое представлене данных.

6.1 Общие положення

Современные СУБД обладают высоким быстродействием поиска информации. Базы данных, имеющие мощность (т.е. количество записей) до ≈ 10⁶ дают скорость только ≈ 2 сек. за счет чего, это быстродействие реализуется .В настоящее время существует 2 пути:

Использование языка SQL – для реализации запросов

SQL является реляционным языком, использующим элементы реляционной алгебры и реляционного исчисления кортежей.

В реляционных системах запросов существует возможность выбора эффективной стратегии для вычисления реляционного выражения с помощью которого сформирован запрос.

Этот процесс – выбор эффективной стратегии вычислений выполняет оптимизатор. Он позволяет в отдельных случаях, сократить количество операций, которые необходимо произвести для организации поиска на 4 порядка т.е. в 10 000 раз. То есть мы имеем редкое увеличения скорости 10⁴ раза., т.е. поиск старым оператором языка и SQL выиграл в 10⁴ раза. Изучая обработку данных с помощью ЭВМ мы постепенно обращаемся к трем выделенным областям:

реальному миру;
информации;
данным.

Между этими тремя областями существуют определенные взаимосвязи. Тема рассматриваемая сегодня имеет отношение к 3 – й области – к области данных.

А область данных, как вы помните состоит из 3-х компонент:

3.1. Общая логическая структура данных (или данные в представлении администратора данных);

3.2. Данные в представлении программиста;

3.3.Представление данных в памяти ЭВМ.

Т.е. логическая структура данных и представление этой структуры в памяти ЭВМ это два важных, но различных между собой понятия.

Логические структуры данных это:

реляционные;
древовидные;
сетевые структуры.

Что касается представления данных в памяти, то существует два метода :

Первый метод заключается в том, что каждому элементу данных указывается адрес памяти ЭВМ. Размещение данных (т.е. их запоминание) и их выборка осуществляется по известному адресу.

Второй метод заключается в том, что содержание ключа конкретной записи преобразуется определенным методом (существует несколько методов) в адрес памяти ЭВМ. В этом случае размещение данных и их выборка осуществляются по известному значению ключа, т.е. определяются по содержимым самих данных. Этот случай хорошо реализуется в ассоциативной памяти ЭВМ или с помощью специального программного обеспечения в обычной памяти ЭВМ.

Для первого и второго метода существует общая проблема – как эффективно отобразить логическую структуру данных на физическую структуру хранения.

Т.е. речь идет о нахождении адресной функции, которая позволяла бы быстро вычислять, где хранятся необходимые данные.

6.2. 1–й метод представления данных в памяти ЭВМ.

6.2.1. Последовательное распределение памяти.

Пусть у нас есть определенный тип записи с экземпляром записей У1, У2,…, Уп.

Будем считать, что запись, состоящая из элементов данных, хранится целиком и разделение на атрибуты или элементы данных происходит после выборки записи.

Такую структуру можно определить как линейное упорядочение записей, т.е. номера записей следуют один за другим или линейный список.

В такой структуре каждая запись идентифицирована своим порядковым номером. Обозначим через:

N – количество записей в списке

m- размер записей в байтах

β – адрес базы, указывающий на начало вектора данных в памяти

i – текущая запись в списке

α – адрес физической памяти.

В этом случае адрес каждой записи можно вычислить с помощью адресной функции, отображающий логический индекс, идентифицирующий адрес в структуре, в адрес физической памяти.

Адрес	Содержимое		Физическая память
		β
α (1) = β	Y1		Y1	Y2
α (2) = β + m	Y2		β + m
	* * *
α (i) = β + (i-1) m	Yi
	* * *
α (n) = β + (n-1) m	Yn

α (i) = β + (i-1) m

Последовательное распределение памяти можно реализовать как для реляционных структур, так и для древовидных структур.

Пусть мы имеем регулярное двоичное дерево.

Каждый узел представляет запись фиксированной длины – m.

Адрес		Содержимое

α (1) = β		Y1
α (2) = β + m		Y2
α (3) = β + 2m		Y3
		* * *
		* * *
α (n) = β + (n-1) m		Yn

α (i) = β + (i-1) m – Адресная функция

Движение вниз по дереву осуществляется путем удвоенного индекса и прибавлением единицы

Y2*2

Y2*2+1

Адрес узла вычисляется по адресной функции.

1 / 61 2 3 4 5 6 > Следующая >>>

Соседние файлы в папке Лекции по Базам данных - версия 9.01.10

#
10.05.2015634.37 Кб52Тема 2.doc
#
10.05.2015728.06 Кб53Тема 3.doc
#
10.05.2015327.68 Кб52Тема 4.doc
#
10.05.2015591.87 Кб52Тема 5 - полная.doc
#
10.05.2015445.44 Кб50Тема 5.doc
#
10.05.2015186.88 Кб51Тема 6.doc