17.5. Статистические показатели базы данных

На стадиях 3 и 4 общего процесса оптимизации (называемых стадиями выбора пути доступа) используются статистические показатели базы данных, сохраняемые в ее ка- талоге (ниже кратко описаны способы их применения). В демонстрационных целях ниже кратко рассматриваются (с небольшими дополнительными комментариями) некоторые из основных статистических показателей, используемых в двух коммерческих продук- тах — СУБД DB2 и INGRES. Приведем некоторые из основных статистических показа- телей, применяемых в СУБД DB2².

■ Для каждой базовой таблицы фиксируются следующие показатели:

кардинальность;
количество страниц внешней памяти, занятых таблицей; " доля табличного пространства, занимаемого таблицей.

■ Для каждого столбца каждой базовой таблицы фиксируются следующие показатели:

количество различных значений в столбце;
второе наибольшее значение в столбце;
второе наименьшее значение в столбце;

десять значений в столбце (только для индексированных столбцов), которые чаще всего встречаются, а также количество вхождений каждого из этих зна- чений.

■ Для каждого индекса фиксируются следующие показатели:

" индикатор, указывающий, является ли индекс кластеризованным (т.е. индексом, в котором логический порядок значений ключа совпадает с физическим поряд- ком их размещения в таблице);

² Так как обе названные СУБД поддерживают стандартный язык SQL, при их обсуждении вместо терминов "переменная-отношение" и "атрибут" будут использоваться термины "таблица" и "столбец" соответственно Также заметим, что в обеих СУБД предполагается, что каждая базовая таблица должна отображаться в одну хранимую таблицу.

■ для кластеризованных индексов — доля индексированной таблицы, находящей- ся в кластеризующей последовательности;

количество листовых страниц в индексе;
количество уровней в индексе.

Замечание. Перечисленные выше статистические показатели не обновляются при ка- ждом обновлении базы данных из-за больших накладных расходов, связанных с их вы- числением. Вместо этого статистические показатели обновляются выборочно, с помо- щью системной утилиты RUNSTATS, которая запускается по требованию администратора базы данных, например после реорганизации базы данных. Аналогичное утверждение применимо и к большинству других коммерческих продуктов, в том числе к системе INGRES, где соответствующая утилита называется OPTIMIZEDB.

Перечислим некоторые из основных статистических показателей базы данных, нака- пливаемых в СУБД INGRES.

Замечание. В системе INGRES индекс рассматривается как частный случай хранимой таблицы. Поэтому приведенные ниже статистические показатели для базовых таблиц и столбцов вычисляются также для индексов.

■ Для каждой базовой таблицы фиксируются следующие показатели:

кардинальность;
количество первичных страниц для таблицы;
количество страниц переполнения для таблицы.

■ Для каждого столбца в каждой базовой таблице фиксируются следующие показатели:

количество различных значений в столбце;
максимальное, минимальное и среднее значения для столбца;
реальные значения в столбце и частота их вхождений.

<<< < Предыдущая 17 18 19 20 21 22 23 24 25 26 27 2829 / 5729 30 31 32 33 34 35 36 37 38 39 40 41 > Следующая >>>

Соседние файлы в папке Дейт К. Дж. Введение в системы баз данных [7 издание]

#
02.05.20142.66 Mб1471-270.doc
#
02.05.20142.3 Mб102271-540.doc
#
02.05.20142.28 Mб82541-800.doc
#
02.05.20142.54 Mб77801-1073.doc