Добавил:

korayakov Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Государственный университет управления

Предмет:

Базы данных и знаний

Файл:

Kolokvium / REV2_IZM.DOC

Скачиваний:

Добавлен:

19.04.2013

Размер:

345 Кб

Скачать

☆

1 / 31 2 3 > Следующая >>>

Представление структур данных в памяти эвм. Списковые структуры

В системах обработки данных в качестве данных выступают описания (представления) фактов и понятий рассматриваемой предметной области на точном и формализованном входном языке системы -языке описания данных. С помощью входного языка при описании фактов и понятий ПО между элементами данными конструируются логические структурные отношения. В качестве логических структур используют либо таблицы, представляющие собой двумерный или n-мерный массив данных, либо древовидные иерархические структуры, либо сетевые структуры, представляющие собой сложную многосвязную структуру с большим количеством взаимных соединений и т. п. Чтобы правильно использовать вычислительную машину, необходимо хорошо представлять себе структурные отношения между данными, знать способы представления таких структур в памяти машины л методы работы с ними. Структура данных и представление этой структуры в памяти ЭВМ -два важных, но различных между собой понятия. Так, например, некоторая логическая структура данных типа «дерево» может быть представлена в памяти ЭВМ несколькими различными способами.

Таким образом, любое представление структуры данных в памяти ЭВМ должно включать в себя как сами данные, так и задаваемые взаимосвязи, которые и определяют структурирование.

Форма представления структур данных в памяти ЭВМ зависит от предполагаемого использования данных, поскольку для различных типов структур эффективность выполнения тех или иных операций обработки данных различна. Основное различие форм представления структур данных в памяти ЭВМ определяется в первую очередь тем, как адресуются элементы структуры данных в памяти машины - по месту или по содержимому. В первом случае указываются логические или физические адреса данных, определяющие место расположения данных в памяти машины. Во втором случае размещение данных и их выборка осуществляются по известному значению ключа, т. е. определяются содержимым самих данных. Этот случай реализуется в специальной -ассоциативной памяти ЭВМ. Некоторый аналог ассоциативной памяти может быть реализован средствами специального программного обеспечения в обычной памяти ЭВМ.

Наиболее простой формой хранения данных в памяти ЭВМ является одномерный линейный список. Линейный список-это множество n>=0 объектов (узлов) Х(1), Х(2), Х(3)... Х(n) структурные свойства которого связаны только с линейным (одномерным) относительным расположением узлов. Если n>0, то X(1) является первым узлом; для 1<i<n узел X(i-1) предшествует узлу X(i), а узел X(i+1) следует за ним, X(n) является последним узлом, т. е. линейный список реализует структуру, которую можно определить как линейное упорядочение элементов данных.

Линейный список X рассматривают как последовательность Х(1), Х(2), Х(3)... Х(n) компоненты которой идентифицированы порядковым номером, указывающим их относительное расположение в X.

Одномерный линейный список, используемый для хранения данных в памяти машины, называют еще вектором данных или физической структурой хранения данных. Использование линейного списка в качестве физической структуры хранения данных определяется свойствами памяти вычислительной машины. Так, оперативная память ЕС ЭВМ представляет вектор, в котором байты упорядочены по возрастанию их адресов от О до наивысшего, т. е. проидентифицированы адресом.

Проблема представления логических структур данных в памяти ЭВМ заключается в нахождении эффективных методов отображения логической структуры данных на физическую структуру хранения. Такое отображение называют адресной функцией.

При реализации адресной функции используют два основных метода: последовательное распределение памяти; связанное распределение памяти.

Последовательное распределение памяти. Последовательное распределение-простой и естественный способ хранения линейного списка. В этом случае узлы списка размещаются в последовательных элементах памяти.

При последовательном распределении вектор данных логически отделен от описания структуры хранимых данных. Например, если структура данных представляет собой линейный список (например, файл записей фиксированной длины), то описание структуры хранится в отдельной записи и содержит:

а) N - размер вектора данных, т. е. количество элементов списка -записей;

б) m - размер элемента списка, т. е. размер записи, например, в байтах;

в) - адрес базы, указывающий на начало вектора данных в памяти.

В этом случае адрес каждой записи можно вычислить с помощью адресной функции, отображающей логической индекс, идентифицирующий запись в структуре, в адрес физической памяти:

В случае линейного списка адресная функция состоит из операций смещения и масштабирования. Любые отношения, которые можно выразить на языке целых чисел, можно истолковать как отношения между элементами памяти, получая при этом всевозможные варианты структур.

7.2

В качестве примера рассмотрим реализацию с помощью линейного списка при последовательном распределении памяти для логической структуры типа регулярного двоичного дерева. Идея способа заключается в том, что, начиная с элемента памяти а(1), делают его корнем дерева, размещают там данные, соответствующие узлу У1. В элементах памяти а(2) и а(3) размещают непосредственных потомков узла У1 - узлы У2 и У3 и т. д. В общем случае, непосредственные потомки узла У размещаются по адресам: а(2) и а(2+1). Адресная функция имеет вид, где-номер узла древовидной структуры;- базовый адрес;m- размер элемента памяти, который требуется для хранения данных узлов дерева (каждый узел представляет собой запись фиксированной длины). По дереву, которое при этом получается, можно двигаться в обоих направлениях, так как от узла Уможно перейти к его потомкам, удвоив. (или удвоив и прибавив единицу). Можно двигаться к узлу, являющемуся исходным для узла У, разделивпополам и отбросив дробную часть. Адрес соответствующего узлу элемента памяти определяется по адресной функции.

Рассмотри еще один способ реализации, который применим только для двоичных деревьев. Если для представления двоичного дерева используется вектор памяти от элемента i до элемента j включительно, то корен дерева размещается в элементе памяти с адресом , где-знак округления до ближайшего меньшего целого.

Корень дерева размещается в середину вектора. В элементах памяти от i-го до (m - 1)-го включительно размещается левое поддерево. В элементах памяти от (m+1)-го до j-го включительно размещается правое поддерево. Аналогично процесс повторяется для размещения каждого поддерева. Приведенный способ позволяет реализовать двоичное сбалансированное дерево.

Существует ряд других способов представления древовидных структур. С помощью приемов, основанных на свойствах целых чисел, можно с помощью последовательного распределения организовать в памяти некоторые сетевые структуры. Однако для представления сложных сетевых структур требуются более гибкие методы построения в памяти ЭВМ, которые невозможно получить с помощью последовательного распределения памяти. В этом случае используется связанное распределение памяти.

Связанное распределение памяти. Связанное представление линейного списка называется связанным списком. При связанном распределении памяти для построения структуры необходимо задать отношения следования и предшествования элементов с помощью указателей. Указателями служат адреса, хранимые в записях данных. В отличие от последовательного распределения памяти, при котором с помощью адресной функции вычисляется адрес следующего элемента, при связанном распределении памяти значение адресной функции можно получить только путем просмотра хранящихся указателей. Такой метод распределения памяти позволяет расширить либо сократить структуру без перемещения самих данных в памяти ЭВМ, однако при этом требуется больше памяти для хранения структуры по сравнению с последовательным распределением.

Связанное распределение - более сложный, но и более гибкий способ хранения линейного списка. Каждый узел содержит указатель на следующий узел списка, т. е. адрес следующего узла списка. При связанном распределении не требуется, чтобы список хранился в последовательных элементах памяти.

7.3

Наличие адресов связи в данном способе хранения позволяет размещать узлы списка произвольно в любом свободном участке памяти. При этом линейная структура списка обеспечивается указателями.

Структура линейного списка, представленная с помощью связанного распределения, называется также цепной структурой или цепью.

Для достижения большей гибкости при работе с линейными списками в каждый узел Х(i) вводятся два указателя. Один из указателей реализует связь рассматриваемого узла с узлом Х(i+1), а другой-с узлом Х(i-1).

Обозначим через SOC (Х(i)) указатель, хранящийся в записи X(i) связанного списка X, т. е. адрес следующего узла -X(i+1). Поскольку узел Х(n) не имеет следующего узла, введем символ Л, означающий конец списка X. В этом случае SOC (X(n))==.Л.

Базовый адрес зададим как указательную переменную ТОР (Х), значением которой является адрес первого узла. Тогда адресная функция для связанного однонаправленного линейного списка определяется в виде

Базовый адрес задается при обращении к списку.

Введя обозначение указателя на предыдущий узел -PRE (X(i)), запишем адресную функцию для связанного двунаправленного линейного списка в прямом и обратном направлениях соответственно:

Связанные списки - удобная форма представления динамически изменяющихся линейных структур. Любое произвольное изменение порядка записей, сокращение или расширение вектора данных в какой-либо записи не требуют перемещения записей в памяти ЭВМ. Для выполнения этих операций достаточно лишь изменить значения долей связи.

Однако доступ к конкретному узлу может оказаться намного длительнее, чем при последовательном распределении памяти. Чтобы получить доступ к данным, хранящимся в узле X(i), необходимо сделать i итераций, используя ТОР (Х) и поля связи в узлах Х(), где=1, 2, ..., i, т.е. последовательно просмотреть все предшествующие узлы списка. Этот недостаток можно устранить различными способами.

Одним из способов является организация связанного линейного списка с пропусками. Для этого линейный список делится на группы узлов, связанные между собой обратными указателями. Вначале осуществляется доступ по обратным указателям к группе, в которой находится требуемый узел, а затем по прямым указателям перебираются узлы группы, пока не будет найден требуемый узел. Вход в список при таком способе организации осуществляется с конца.

7.5

Другой способ заключается в построении специального дополнительного линейного списка - индекса, например, с последовательным распределением памяти. Элементы индекса - значения первых узлов каждой группы и указатели на них.

Оптимальный размер группы (количество узлов в группе) при равновероятном нахождении узла в любой из групп , гдеn- количество элементов списка. Число групп .

При равновероятном нахождении узла в любой из групп при доступе к узлу необходимо просмотреть в среднем l\2 групп, а в каждой группе узлов. Следовательно, общее количество просмотров

Число элементов в каждой группе, при котором количество просматриваемых элементов минимально, определяется следующим образом: Приравнявк нулю, получим:, откуда

Для связанных линейных однонаправленного либо двунаправленного списков в ряде случаев целесообразно создать специальный узел списка - голову списка - и хранить его в специальной фиксированной ячейке памяти машины по адресу . В этот узел помещается ТОР (Х) - указатель на первый узел списка. В голове списка можно хранить различную служебную информацию, необходимую при обработке списка (идентификатор списка, количество узлов в списке и т. п.).

Важной разновидностью представления в памяти линейного списка является циклический список. Циклически связанный линейный список обладает той особенностью, что связь от последнего узла идет к первому узлу списка, т. е. SOC(X(n))= . Циклический список позволяет получить доступ к любому узлу списка, отправляясь от любого заданного узла. Циклические списки называются также кольцевыми структурами или кольцами.

7.6

Наряду с однонаправленными используются .двунаправленные циклические списки. В ряде случаев удобно использовать циклический список с указателями на голову списка из каждого узла (рис. 7.8), за исключением последнего узла -поскольку используется прямой указатель на голову списка.

7.7,8

Базируясь на использовании способов представления связанных линейных списков (однонаправленный, двунаправленный и циклический), можно реализовать в памяти ЭВМ сложные нелинейные структуры, например древовидные или сетевые. Такие представления структур называются многосвязанными списками. Для построения многосвязанного списка требуется иметь в узлах достаточное количество указателей. Наличие большого числа указателей в многосвязанной структуре в ряде случаев повышает эффективность обработки.

Таким образом, основой построения связанных списковых структур являются указатели. При практической реализации на ЭВМ можно использовать три типа указателей (адресов записей): машинный (действительный); относительный; символический (идентификатор).

Первый тип указателей -действительный адрес- используется тогда, когда необходимо получить наибольшую скорость обработки данных, организованных в связанные списковые структуры. Этот тип указателей имеет серьезный недостаток- жесткую привязку записей к конкретному месту расположения в памяти. Если возникнет необходимость переместить список на новое место в памяти ЭВМ, то потребуется выполнить работу по изменению указателей во всех записях.

Второй тип указателей -относительный адрес -позволяет размещать записи в любом месте памяти и на различных внешних устройствах без изменения значений указателей, при этом относительное расположение в памяти узлов списка между собой должно оставаться постоянным. При перемещении списка указатели в записях не изменяются, а изменяется базовый адрес при вычислении действительных машинных адресов. Относительные адреса в качестве указателей применяются при страничной организации памяти. Скорость доступа к узлам при использовании относительных адресов несколько замедляется по сравнению со случаем машинных адресов, однако появляется возможность размещать список в любом свободном месте памяти подходящего размера.

Третий тип указателей -символический адрес (идентификатор) -позволяет перемещать отдельные записи относительно друг друга, включать или удалять записи в список без изменения указателей во всех остальных записях списка. Однако при работе с символическими указателями скорость доступа меньше, чем при работе с машинными или относительными адресами. Идентификаторы в качестве указателей удобно использовать для интенсивно изменяющихся файлов. Преобразование идентификатора в машинный адрес при выполнении операции обращения к узлам списка выполняется с помощью специального алгоритма в соответствии с выбранном методом адресации.

С точки зрения организации структуры данных различают два типа указателей: встроенные указатели и справочник указателей. Если указатели образуют часть записи, то они называются встроенными. Если указатели хранятся отдельно от записей, то они образуют справочник.

Указатели имеют следующие возможные пути использования: определяют направление доступа (можно двигаться только в тех направлениях, которые заданы указателями); соединяют вместе связанные по смыслу данные; отображают ориентированные ребра в древовидных или сетевых структурах; связывают память на дисках и организуют цепочки дисковых страниц и т. п.

Применение многосвязанных списков -это основной механизм, позволяющий разработчикам СУБД реализовать сложные нелинейные структуры. Однако следует избегать слишком большого количества указателей, поскольку на них тратится память и время на переходы по указателям. Кроме того, при большом количестве указателей основная структура, представляемая в памяти ЭВМ, теряет четкость и могут возникнуть связи, которые в отображаемой структуре отсутствуют.

1 / 31 2 3 > Следующая >>>

Соседние файлы в папке Kolokvium

#
19.04.201338 Кб46KOR_3.DOC
#
19.04.201391 Кб62MARTIN1.DOC
#
19.04.201327 Кб60MARTIN2.DOC
#
19.04.201393 Кб53MARTIN3.DOC
#
19.04.2013122 Кб69REV1_ИЗМ.DOC
#
19.04.2013345 Кб89REV2_IZM.DOC
#
19.04.2013126 Кб49БИЛЕТ1.DOC
#
19.04.2013157 Кб50БИЛЕТ2.DOC
#
19.04.201335 Кб47ХАНЕНКО1.DOC
#
19.04.201371 Кб48ХАНЕНКО2.DOC
#
19.04.201341 Кб53ЯСИН.DOC