7.3. Методы поиска и индексирования данных

При рассмотрении последующего учебного материала используются модели, приведенные в разд.3.1, 3.2.

7.3.1. Последовательный поиск

Последовательный поиск заключается в последовательной проверке всех записей файла на их соответствие условию поиска Q [17]. Записи, значения полей которых удовлетворяют условию Q, выдаются в качестве результата поиска.

Рис. 3.7. Пример организации файла при начальной загрузке

Поиск по равенству К = а, где К – значение ключевого поля. Алгоритм поиска заключается в последовательном просмотре записей файла и проверке условия К = а. Если запись найдена, то алгоритм заканчивает свою работу (удачный поиск). В противном случае поиск заканчивается просмотром последней записи файла (неудачный поиск).

Если ключ К с равной вероятностью может принимать любое из заданных значений, то в среднем для выполнения поиска требуется время

Поиск по интервалу значений ключа а ≤ К ≤ b. Алгоритм поиска заключается в последовательном просмотре всех записей файла, так как зарание неизвестно, какие записи удовлетворяют условию Q, а какие не удовлетворяют.

Требуемое время на поиск

Поиск по множеству значений K = a_i, i = 1, 2, ..., п, где a_i принимает значения из множества {а₁, а₂, ..., а_i, ..., а_п}. Алгоритм поиска заключается в последовательном просмотре всех записей файла, при чем для каждой записи осуществляется п проверок по равенству: К = а_i, где i = 1, 2, ..., п.

Основным достоинством последовательного поиска данных при последовательной организации файла является простота его реализации.

7.3.2. Бинарный поиск

Записи в файле можно упорядочить, например, по возрастанию или убыванию значения первичного ключа соответственно:

В этом случае можно построить более эффективные алгоритмы поиска, поскольку после сравнения значения а (условие поиска Q: К = а) со значением ключа i-й записи файла ясно, в какой части файла продолжать поиск [17].

Методы поиска записей в упорядоченном файле различаются друг от друга стратегией выбора очередной записи из фала для выполнения операции сравнения ключа в соответствии с заданным условием Q. Метод бинарного поиска основан на делении интервала поиска пополам.

Поиск по равенству К = а. Алгоритм поиска заключается в следующем. Файл считают упорядоченным по возрастанию ключа. Сравнивают значения ключа средней записи K_i, где i = n_з.ф./2 со значением а. Если К = а то поиск удачный и алгоритм заканчивает свою работу. Если К_i < а, то для продолжения поиска выбирается средняя запись правой половины файла: з_i, ..., з_j, ..., з_пз., где

Если К_i > а, то для продолжения поиска выбирается средняя запись левой половины файла: з₁, з₂, ..., з_j, ..., з_i, где

Процесс деления интервала пополам продолжается до тех пор, пока не будет найдена искомая запись (К_i = а), либо пока в интервале не останется всего одна запись. Если значение ее ключа не удовлетворяет условию поиска, то поиск неудачный и искомой записи в файле нет.

Бинарный поиск можно выполнять, работая с блоками файла, а не с записями. При считывании блока в оперативную память поиск записи в блоке может быть последовательным. В этом случае в качестве характеристик блока используются граничные значения ключей записей, находящихся в блоке.

Поиск по интервалу значений а ≤ К ≤ b. Алгоритм поиска следующий. Вначале выполняется бинарный поиск записи, значение ключа которой удовлетворяет условию К_i = а, либо, если такой записи нет в файле, то значение ключа которой является наиболее близким к а по условию а ≤ К_i. Далее последовательно читаются записи в блоках файла до тех пор, пока не будет нарушено условие: К_i≤ b.

<<< < Предыдущая 16 17 18 19 20 21 22 23 24 25 26 2728 / 6528 29 30 31 32 33 34 35 36 37 38 39 40 > Следующая >>>