Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Комплект Информатика / Курс лекций.doc
Скачиваний:
128
Добавлен:
22.05.2015
Размер:
4.8 Mб
Скачать

2 Вопросы программирования

Завершим очередной раздел обзором возможностей, которые предлагают языки высокого уровня для управления структурами хранения рассмотренного типа. Для реализации хеширования в различных языках можно найти множество функций. Начнем с обсуждения программной среды Java.

Популярность хеширования как способа организации больших структур хранения в оперативной памяти отражается тем фактом, что в среде программирования Java существует предопределенный класс (тип) с названием Hashtable, при помощи которого можно конструировать таблицы. Точнее, оператор

Table = new HashtableCCapacity, Factor);

создаст объект типа Hashtable и назначит этот объект переменной Table. Переменная Capacity указывает количество сегментов, а переменная Factor определяет предел фактора нагрузки. Каждый сегмент таблицы на самом деле является связным списком, в котором содержатся записи, определенные хеш-функцией в этот сегмент. В результате хеш-таблица, созданная таким образом, не будет испытывать переполнения — сегменты просто будут постоянно расти. Но фактор нагрузки — это отношение непустых сегментов к общему количеству сегментов. Когда определенный предел фактора будет достигнут, Java автоматически увеличит количество сегментов и переделает всю таблицу.

Новые записи можно записывать в таблицу при помощи метода put (аргументы которого содержат ключевое значение и данные), а получать записи из таблицы можно методом get (в качестве аргумента передается ключевое значение). Обратите внимание, что такая структура освобождает Java-программиста от реализации и поддержки таблицы, то есть хеш-таблицу можно использовать как абстрактный инструмент.

Предположим, однако, что мы хотим создать хеш-файл на запоминающем устройстве, а не хеш-таблицу в оперативной памяти. В зависимости от языка программирования доступны различные подходы. Один из них заключается в создании нескольких последовательных файлов, каждый из которых играет роль отдельного сегмента. В этом случае с точки зрения операционной системы хеш-файл будет состоять из набора отдельных файлов. Могут возникнуть проблемы, так как операционная система часто ограничивает количество файлов, которые приложению разрешается одновременно открыть. Обойти эту сложность можно, разработав программу таким образом, чтобы она открывала и закрывала файлы при необходимости обратиться к различным сегментам.

Более практичный подход — зарезервировать большую область на запоминающем устройстве, объявив ее одним большим пустым файлом. Затем части этого файла можно использовать как сегменты нашей системы. Этот подход поддерживается в нескольких языках программирования. Например, язык COBOL позволяет программистам создавать большие пустые файлы, к которым можно обращаться как к массивам, то есть местоположения данных в файле могут быть указаны индексами. Тогда программист сможет создать такой файл и разбить на сегменты хеш-файла (рис. 8.13). К примеру, места с 1 по 20 можно считать первым сегментом, с 21 по 40 — вторым и т. д. Таким образом, по необходимости к содержимому отдельных сегментов можно обращаться напрямую.

Рисунок 4 – Большой файл, разбитый на сегменты для реализации хеширования

Схожую систему можно реализовать на языке С, используя для доступа к разным частям файла функции fgetpos и fsetpos, с которыми мы познакомились в предыдущем разделе.

Еще один подход к созданию хеш-файла использует преимущества большого объема оперативной памяти, доступного в современных компьютерах. Он заключается в считывании всего файла в оперативную память при первом открытии и обращении к нему как к большой хеш-таблице. В таких случаях в действительности данные хранятся в последовательном файле, из которого во время выполнения программы создается хеш-таблица.

Этот подход реализован в языке Java. В среде программирования Java есть вариация класса Hashtable под названием Properties. Объект типа Properties является хеш-таблицей, которую можно инициализировать из файла на запоминающем устройстве при помощи метода 1 oad и записать на устройство методом store. Но не следует думать, что объект типа Properties хранится на запоминающем устройстве как хеш-файл. Это последовательный файл, состоящий из последовательности битов, из которой соответствующая хеш-таблица конструируется в оперативной памяти.