1. Организация таблицы идентификаторов

1.1. Исходные данные

На входе имеется набор идентификаторов, которые организуются в таблицу идентификаторов по одному из двух методов:

Простое рехеширование.
Простой список.

Должна быть предусмотрена возможность осуществления многократного поиска идентификатора в этой таблице. Список идентификаторов задан в виде текстового файла. Длина идентификатора ограничена 32 символами.

Требуется, чтобы программа подсчитывала число коллизий и среднее количество сравнений, выполняемых при поиске идентификатора. На основе анализа необходимо выбрать лучший метод для использования в дальнейшем.

1.2. Назначение таблиц идентификаторов

Проверка правильности семантики и генерация кода требуют знания характеристик идентификаторов, используемых в программе на исходном языке. Эти характеристики выясняются из описаний и из того, как идентификаторы используются в программе и накапливаются в таблице символов, или таблице идентификаторов. Любая таблица идентификаторов состоит из набора полей, количество которых равно числу идентификаторов программы. Каждое поле содержит в себе полную информацию о данном элементе таблицы. Под идентификаторами подразумеваются константы, переменные, имена процедур и функций, формальные и фактические параметры.

В данной работе сравниваются два метода организации таблицы идентификаторов: метод простого рехеширования и метод простого списка.

Метод простого рехеширования основан на хеш-адресации, то есть на использовании значения, возвращаемого хеш-функцией, в качестве адреса ячейки из некоторого массива данных. Хеш-функция вычисляется путем выполнения над цепочкой символов некоторых простых арифметических и логических операций. Самой простой хеш-функцией для символа является ASCII-код символа.

В данной курсовой работе принята хэш-функция суммаASCII-кодов первого и пятого символов цепочки.

Сравниваемые в данной работе методы организации таблицы идентификаторов  простого рехеширования и простой список. Ниже каждый метод рассмотрен подробнее.

1.3. Метод простого рехеширования

Согласно данному методу, если для элемента А адрес п₍₎ = h|A|, указывает на уже занятую ячейку, то есть в случае возникновения коллизии, необходимо вычислить значение функции n₁ = h₁|A| и проверить занятость ячейки по адресу n₁. Если и она занята, то вычисляется значение h₂|A|. И так до тех пор, пока либо не будет найдена свободная ячейка, либо очередное значение h_i|A| не совпадет с h|A|. В последнем случае считается, что таблица идентификаторов заполнена и места в ней больше нет  выдается сообщение об ошибке размещения идентификатора в таблице.

Согласно методу простого рехеширования:

h_i(A) = (h(A)+i) mod N_m,

где N_m максимальное значение хэш-функции.

В данной курсовой работе принята хэш-функция суммаASCII-кодов первых двух символов цепочки, максимальное значение хэш-функции равно 512.

Поскольку при заполнении таблицы идентификаторов основными операциями являются добавление элемента в таблицу и поиск элемента в ней, на рис. 1 и рис. 2 представлены блок-схемы этих операций для рассматриваемого метода.

Рис. 1. Блок-схема добавления элемента в таблицу идентификаторов по методу простого рехеширования

Рис. 2. Блок-схема алгоритма поиска элемента в таблице идентификаторов, организованной по методу простого рехеширования

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

Соседние файлы в папке ПЗ_1

#
02.05.2014893.95 Кб24Графы.doc
#
02.05.2014209.92 Кб24Листинг.doc
#
02.05.2014121.86 Кб24Матрица.doc
#
02.05.2014868.35 Кб25ПЗ.doc
#
02.05.2014339.97 Кб26Презентация.ppt