- •Программирование
- •1. Архитектура машинной памяти
- •2. Внешние запоминающие устройства.
- •3. Адресация памяти.
- •4. Три уровня представления данных в автоматизированных информационных системах.
- •5. Внутренняя структура записи
- •6. Типы структур данных
- •9. Способы хранения, основанные на преобразовании кода записи в ее адрес
- •10. Массивы
- •11. Стеки
- •12. Очередь
- •13. Таблица
- •14. Основные понятия и принципы сортировки
- •15. Основные методы сортировки линейных структур данных
- •16. Внешняя сортировка
- •17. Основные принципы информационного поиска
- •18. Последовательный поиск
- •20. Двоичный поиск
- •21. Блочный поиск
16. Внешняя сортировка
Когда объем сортируемых данных велик и превышает свободный объем ОП, то для сортировки используются ВЗУ. Обычно применяют МЛ, как наиболее дешевые и емкие ВЗУ.
Наиболее общей формой внешней сортировки с применением МЛ является сбалансированное n-ленточное слияние. Для n-ленточного слияния требуется 2п МЛ и 2п лентопротяжных устройств.
Исходная неупорядоченная последовательность, размещенная на одной МЛ, разносится на п МЛ следующим образом. Первая запись.— на первую МЛ, вторая - на вторую, п-я запись — на п-ю МЛ. В дальнейшем (п + 1) -я запись снова записывается на первую МЛ, (п + 2) -я — на вторую и т.д. до тех пор, пока вся исходная последовательность не будет распределена на п Мл.
С
ортировка
методом слияния. Существует
еще один метод сортировки элементов
массива, эффективность которого
сравнительно велика, - метод слияний.
Этот
метод состоит в разбиении данного
массива на несколько частей, которые
сортируются по отдельности и впоследствии
“сливаются” в одну.
Пусть массив а [1...n ] разбивается на части длиной k, тогда первая часть - а [ 1 ], а [ 2 ], ...., а [ k ], вторая - а [ k +1 ], а [ k + 2 ], ...., а [ 2k ] и так далее. Если n не делится на k, то в последней части будет менее k элементов. После того как массивы - части упорядочены, можно объединить их в упорядоченные массивы - части, состоящие не более чем из 2 k элементов, которые далее объединить в упорядоченные массивы длиной не более 4 k, и так далее, пока не получится один упорядоченный массив.
17. Основные принципы информационного поиска
При выполнении любых вычислений на ЭВМ, в течение любого процесса обработки информации с помощью ЭВМ неоднократно решается задача поиска нужных данных в памяти машины. Причем обычно требуется, чтобы данные были найдены как можно быстрее. Поиск осуществляется в ответ на запрос, поступающий от пользователей АЙС или от приложений. Запрос на поиск, поступающий в АИС, определенным образом формализуется. При этом формируется аргумент поиска. В зависимости от вида запроса аргумент поиска может иметь различные форму и степень сложности. В простейшем случае, когда необходимо найти запись об объекте, обладающем определенным признаком, аргументом поиска будет являться этот признак. Такой поиск обычно называют одноаспектным, т.е. поиском по одному признаку. Аргумент поиска может представлять собой перечень определенных признаков объекта, в том числе' и неключевых. Такой поиск называют многоаспектным.
Существуют следующие виды информационного поиска. Поиск по совпадению. Аргумент поиска содержит наименования одного или нескольких признаков (имена полей записи) и их значения. В процессе поиска из информационного массива выделяются записи, имеющие указанные значения поименованных полей. Критерием выдачи в этом случае является прямое совпадение.
Поиск по интервалу. Аргумент поиска содержит имена одного или нескольких признаков и пределы изменения значений этих признаков. В процессе поиска из информационного массива выделяется подмножество записей, у которых значения соответствующих полей лежат в заданных пределах. Критерием выдачи здесь является принадлежность заданному интервалу.
Поиск по выражению. Аргумент поиска представляет собой арифметическое или теоретико-множественное выражение или формулу булевой алгебры. Операндами являются имена признаков. В процессе поиска над содержимым соответствующих полей всех записей массива выполняются необходимые операции: либо вычисляется значение выражения, заданного аргументом поиска, либо выполняются теоретико-множественные операции, либо определяется истинность высказывания. Используемые при таком поиске критерии выдачи называются логическими критериями.
Процедуру информационного поиска часто рассматривают с позиций логики поиска и стратегии поиска.
Логика поиска задает словесное, содержательное описание задачи поиска; определяет вид аргумента поиска; устанавливает критерии, с помощью которых оценивается соответствие найденной информации запросу. Именно логика поиска определяет оценки эффективности поиска — полноту и точность.
Стратегия поиска — это реализация логики поиска в условиях конкретной системы и конкретной ЭВМ. При разработке стратегии поиска оценивается характер хранимой информации, объем информационных массивов и тип ЗУ; выбирается один из известных или разрабатывается оригинальный метод поиска данных в памяти ЭВМ; определяются алгоритмы поиска с учетом формы запросов и ответов.
