Скачиваний:
82
Добавлен:
02.05.2014
Размер:
2.28 Mб
Скачать

17.5. Статистические показатели базы данных

На стадиях 3 и 4 общего процесса оптимизации (называемых стадиями выбора пути доступа) используются статистические показатели базы данных, сохраняемые в ее ка- талоге (ниже кратко описаны способы их применения). В демонстрационных целях ниже кратко рассматриваются (с небольшими дополнительными комментариями) некоторые из основных статистических показателей, используемых в двух коммерческих продук- тах — СУБД DB2 и INGRES. Приведем некоторые из основных статистических показа- телей, применяемых в СУБД DB22.

■ Для каждой базовой таблицы фиксируются следующие показатели:

  • кардинальность;

  • количество страниц внешней памяти, занятых таблицей; " доля табличного пространства, занимаемого таблицей.

■ Для каждого столбца каждой базовой таблицы фиксируются следующие показатели:

  • количество различных значений в столбце;

  • второе наибольшее значение в столбце;

  • второе наименьшее значение в столбце;

  • десять значений в столбце (только для индексированных столбцов), которые чаще всего встречаются, а также количество вхождений каждого из этих зна- чений.

■ Для каждого индекса фиксируются следующие показатели:

" индикатор, указывающий, является ли индекс кластеризованным (т.е. индексом, в котором логический порядок значений ключа совпадает с физическим поряд- ком их размещения в таблице);

2 Так как обе названные СУБД поддерживают стандартный язык SQL, при их обсуждении вместо терминов "переменная-отношение" и "атрибут" будут использоваться термины "таблица" и "столбец" соответственно Также заметим, что в обеих СУБД предполагается, что каждая базовая таблица должна отображаться в одну хранимую таблицу.


■ для кластеризованных индексов — доля индексированной таблицы, находящей- ся в кластеризующей последовательности;

  • количество листовых страниц в индексе;

  • количество уровней в индексе.

Замечание. Перечисленные выше статистические показатели не обновляются при ка- ждом обновлении базы данных из-за больших накладных расходов, связанных с их вы- числением. Вместо этого статистические показатели обновляются выборочно, с помо- щью системной утилиты RUNSTATS, которая запускается по требованию администратора базы данных, например после реорганизации базы данных. Аналогичное утверждение применимо и к большинству других коммерческих продуктов, в том числе к системе INGRES, где соответствующая утилита называется OPTIMIZEDB.

Перечислим некоторые из основных статистических показателей базы данных, нака- пливаемых в СУБД INGRES.

Замечание. В системе INGRES индекс рассматривается как частный случай хранимой таблицы. Поэтому приведенные ниже статистические показатели для базовых таблиц и столбцов вычисляются также для индексов.

■ Для каждой базовой таблицы фиксируются следующие показатели:

  • кардинальность;

  • количество первичных страниц для таблицы;

  • количество страниц переполнения для таблицы.

■ Для каждого столбца в каждой базовой таблице фиксируются следующие показатели:

  • количество различных значений в столбце;

  • максимальное, минимальное и среднее значения для столбца;

  • реальные значения в столбце и частота их вхождений.

Соседние файлы в папке Дейт К. Дж. Введение в системы баз данных [7 издание]