4.5. Контрольные вопросы по теме

В чем заключается метод хеш-поиска?
Для чего используется хеш-функция и какие к ней предъявляются требования?
Что такое хеш-таблица и как она используется?
Как по трудоемкости соотносятся между собой основные методы поиска (полный перебор, двоичный поиск, хеш-поиск)?
Как с помощью простейшей хеш-функции находится расположение в таблице строковых ключей?
Какие проблемы могут возникать при построении хеш-таблиц с произвольными наборами ключей?
В каких ситуациях можно построить бесконфликтную хеш-таблицу?
Где на практике и почему можно использовать бесконфликтные хеш-таблицы?
Что такое открытое хеширование и для чего оно применяется?
Какие структуры данных используются для реализации открытого хеширования?
Какие шаги выполняет алгоритм построения хеш-таблицы при открытом хешировании?
Какие шаги выполняет алгоритм поиска в хеш-таблице при открытом хешировании?
Какие проблемы могут возникать при использовании открытого хеширования?
Как влияет размер хеш-таблицы на эффективность открытого хеширования?
Что такое внутреннее хеширование и для чего оно применяется?
Какие правила можно использовать для поиска свободных ячеек при внутреннем хешировании?
Какие шаги выполняет алгоритм построения хеш-таблицы при внутреннем хешировании?
Какие шаги выполняет алгоритм поиска в хеш-таблице при внутреннем хешировании?
Как влияет размер хеш-таблицы на эффективность внутреннего хеширования?
В каких задачах НЕ следует применять метод хеш-поиска?

Тема 5. Внешний поиск и внешняя сортировка

5.1. Особенности обработки больших наборов данных

Задачи внешнего поиска и сортировки возникают в тех случаях, когда обрабатываемый набор данных является слишком большим и для его размещения в оперативной памяти (ОП) нет достаточного места. Подобные задачи всегда встречаются при использовании баз данных с большими объемами информации. В этом случае в ОП считывается только частьданных, а остальные данные хранятся в файлах на диске.

Решение подобных задач неизбежно связано с учетом особенностей взаимодействия ОП и внешней памяти. Главное их отличие – время доступа. Поскольку доступ к внешней памяти выполняетсязначительно медленнее, то главным критерием при разработке алгоритмов становится не количество элементарных операций с расположенными в ОП данными, ачисло обращенийк внешней памяти. Методы внешнего поиска и сортировки должны быть такими, чтобы время обращения к внешней памяти было как можно меньше.

В свою очередь, это требует четкого понимания особенностей хранения информации во внешней памяти. Как известно, для хранения данных на диске создаются элементарные физические единицы (секторы), которые на логическом уровне объединяются в более крупные кластеры. Размер кластера определяется типом операционной системы. За одно обращение к диску считывается содержимое сразу всего кластера. Это связано с тем, что при таком подходе минимизируется время поиска необходимых секторов на диске, включающее в себя время на подвод считывающей головки к нужной дорожке и время на поворот диска к нужному сектору. Считываемые с диска наборы байтов помещаются в буферную область памяти. Отсюда можно сделать вывод, что методы поиска и сортировки должны быть построены таким образом, чтобы можно было обрабатывать сразу целую группу элементов. Нельзя читать данные из внешней памяти в ОП по одному элементу – должна быть считана целая группа логически связанных элементов, которая потом обрабатывается алгоритмом и, возможно, приводит к необходимости чтения другой группы элементов.

На этих принципах построен ряд методов внешнего поиска и сортировки. Среди них одним из наиболее известных методов поиска является метод Б-деревьев (B-tree).

<<< < Предыдущая 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 4546 / 5346 47 48 49 50 51 52 53 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.2025442.37 Кб0Страхование лекции.doc
#
22.03.2016605.49 Кб24Стрежнева.pdf
#
01.05.202528.02 Кб1СТРЕЛОЧНЫЙ ПЕРЕВОД.docx
#
27.09.201993.25 Кб5Структура философии.docx
#
01.07.20251.75 Mб2Структурный анализ осанки.docx
#
12.03.20151.81 Mб367Структуры и алгоритмы обработки данных.doc
#
12.03.2015835.7 Кб28Сттатистические методы управления качеством.pdf
#
01.05.2025113.17 Mб3СТУДЕНТЛАР ӨЧЕН ТАТАР ТЕЛЕ ӘСБАБЫ переделанная...docx
#
19.12.20186.64 Mб23СУсЧПУ_1201_Ведерников.doc
#
22.07.2019377.85 Кб10СУХТП_Венера.docx
#
01.07.2025137.73 Кб1Схема описания пород.doc