4.3. Логическая структура и физическая организация информацинних массивов

Информационный массив как составная часть внутримашинного информационного обеспечения может быть охарактеризован на трех модельных уровнях. На концептуальном уровне массив определяется некоторым составом, который зависит от объекта управления, описываемого этим массивом, а также от характеристик, содержащихся в массиве в связи с необходимостью управления. Здесь возникает ряд задач по наиболее рациональному распределению информации между массивами, комплексами массивов, между локальными базами данных. На концептуальном уровне правильное решение о составе информационных массивов может быть найдено только при тщательном изучении объекта управления и понимании конечной цели функционирования АИС. На логическом уровне необходимо создать структуру информационного массива. Логическая структура информационного массива определяется тем признаком, по которому производится расположение записей. Для упорядочения записей могут быть выбраны различные признаки, однако наиболее целесообразно выбрать некоторый основной—ключевой признак, согласно значениям этого признака упорядочить записи в информационном массиве.

Так как ключевой признак представляет собой некоторую величину, характеризующуюся различными значениями, то порядок расположения записей может быть выбран либо по возрастанию, либо по убыванию этой величины. Поэтому наряду с информа-' ционным полем массива необходимо выделить некоторое поле записи, которое занимает ключевой признак—поле упорядочения.

Если в информационном массиве возникает ряд записей с одинаковым значением ключевого признака, то вводят второй ключевой признак по упорядочению записей с одинаковым значением основного ключевого признака. Число ключевых признаков может быть увеличено для формализации порядка расположения записей. Упорядоченный массив обозначим через М (x₁,x₂…,x_n), где х₁ — ключевой признак, по которому информационный массив упорядочен в зависимости от возрастания значений;х₂—ключевой признак, по которому информационный массив упорядочен в зависимости от убывания значений. Выбор ключевого признака сложен. Целесообразно в качестве ключевого выбирать признак, наиболее часто используемый при решении данной функциональной задачи. Учитывая то, что один и тот же информационный массив может быть использован при решении нескольких функциональных задач, могут быть выбраны и разные ключевые признаки в зависимости от функциональной задачи. Так как в качестве первого признака выбирается какой-то один, то для отдельных задает упорядочение информационного массива может быть не оптимальным и потребуется переупорядочение информационного массива при переходе к следующим функциональным задачам.

На логическом уровне может быть решена проблема уплотнения и приведения информационных массивов. При долгосрочном хранении информации целесообразно провести ее уплотнение. Сжатая форма информации позволяет сократить объем памяти, занятой внутримашинным информационным обеспечением. Тогда информация при записи уплотняется, а при считывании развертывается. В соответствии с этим может включаться еще один признак—признак уплотнения, позволяющий учесть необходимость уплотнения массивов, следующих за этим реквизитом.

Весьма важным является согласование длин массивов с машинными единицами информации. Элементарной единицей информации является бит, т. е. одна двоичная единица информации. Если использовать в качестве символа цифры и буквы, то алфавит насчитывает менее 62 символов и можно иметь в двоичном представлении 2⁶ символов для кодирования информации неизбыточным кодом. С учетом избыточности количество символов, кодирующих один элемент информации, увеличивается. В машине за слово принимается байт, который отображается восемью двоичными разрядами. В информационном массиве реквизит может иметь произвольную длину, т. е. не соответствовать машинному слову. При обработке отдельных элементов массива возникает необходимость преобразования, т. е. приведения записи переменной длины к записям постоянной длины, кратной длине машинного слова. Массивы, состоящие из записей переменной длины, называются исходными, а массивы, сформированные путем приведения,—приведенными.

Применяют следующие способы приведения информационных массивов.

Максимизация первой части записи. В этом случае реквизиты переменной части записи сводятся в один реквизит увеличенной, но фиксированной длины. В качестве исходной берется самая длинная запись. Любая запись меньшей длины дополняется необходимым числом незначащих символов, в соответствии с чем происходит увеличение длины массива, но упрощается процесс программирования. При этом может увеличиться быстродействие системы по обработке информации. На рис. 4.3 представлена процедура приведения массивов путем максимизации первой частя записи.

Повторение постоянной части записи при каждом реквизите переменно и части. Если переменная часть содержит ряд реквизитов (P₁,P₂,P₃,P₄,P₅) то постоянная часть (П) повторяется столько раз, сколько реквизитов содержит переменная часть. В итоге каждая приведенная запись оказывается короче исходной, то в целом их число и объем информации будут больше, избыточность информационного массива возрастает. Однако процедура восстановлевня исходных данвых значительно упрощается. Данная процедура приведения представлена на рис. 4.4.

Выравнивание длин постояннойчасти записи и реквизита переменной части. Идея способа в том, что из двух реквизитов менее длинный по числу символов дополняется фиксированными символами одного и того же значения.

Количество добавленных символов равно разности длин данных реквизитов. После выравнивания реквизит переменной исходной записи и постоянная часть считаются отдельными приведенными записями и имеют одинаковую фиксированную длину. Данная процедура приведения информационных массивов, представлена на рис. 4.5. В итоге приведения возникают различные структуры, каждой из которых может соответствовать наиболее рациональный метод обработки информации.

На физическом уровне рассматривается расположение записей информационного массива относительно друг друга в памяти ЭВМ. Логическая и физическая структуры массивов могут совпадать либо не совпадать. Если логическая структура определяется степенью использования информационного массива в различных функциональных задачах АИС, то физическая зависит от физических характеристик памяти, от способов организации записи в машине, от формы представления информации о размещении записей в массиве.

Приняты следующие структуры информационных массивов на уровне физической организации.

Последовательная структура информационного массива. Физическая организация информационного массива соответствует логической структуре, т. е. записи располагаются в соответствии с некоторым ключевым признаком. Порядок записи соответствует возрастанию или убыванию значения ключевого признака либо некоторой лекси ко- графической форме представления его значений, а поэтому сами записи хранятся компактно, отсутствует адрес записи, так как каждая предыдущая запись указывает на последующую. Включение или исключение записей означает смещение всех записей массива. Последовательная структура массива удобна при использовании магнитной ленты, магнитного барабана, диска. При таком способе при каждом изменении переписывается весь информационный массив.

Цепная структура. Записи в информационном массиве при цепной структуре располагаются произвольно. Чтобы можно было считать набор записей, каждая предыдущая запись в адресной части содержит адрес расположения последующей. В цепной структуре (в отличие от последовательной) затрачивается большой объем памяти, однако легко находятся записи, достаточно просто исключаются устаревшие и происходит реорганизация информационного массива.

Ветвящаяся структура. Может быть эффективно применена, если значения некоторого признака объекта непрерывно повторяются в записях информационного массива в различных сочетаниях. При обычной организации это приводит к повторяющимся полям основного массива. Если такие поля основного массива убрать, объединить их в небольшой дополнительный информационный массив и в этом массиве поля упорядочить по некоторому признаку, например в соответствии с последовательной либо цепной структурой, то каждая запись информационного массива адресов будет соответствовать записи основного массива. Тогда основной массив включает в себя записи фиксированной длины, возникает адресный массив, который может иметь переменную длину записи. Ветвящаяся структура обладает большой гибкостью, позволяет достаток во просто включать дополнительные записи как в основной, так и в адресный массивы. Наличие ссылок позволяет в отдельных случаях сравнивать ее по объему памяти с последовательной структурой массивов.

ширение любого элемента списка в легко уничтожаются старые элементы списка и вводятся новые. Однако время доступа к требуемым записям может быть достаточно большим. Списковая структура (по сравнению с последовательной) требует большего объема памяти.

Рассмотренные методы физической организации информационных массивов должны быть тесно увязаны с носителями информации в ЭВМ. В качестве технических средств хранения информации выступают запоминающие устройства (ЗУ), которые имеют иерархическое построение, обладают различными объемами памяти, разными возможностями ввода и вывода, различными скоростями обмена с запоминающими устройствами более высокого уровня.

Наиболее существенной характеристикой качества запоминающего устройства для автоматизированной системы является вре-мя доступа к записи» зависящее от носителя информации. В оперативной памяти это время составляет несколько микросекунд;

для памяти, организованной на магнитной ленте,—несколько минут.

Списковая структура. При ее использовании логическая структура информационных массивов не совпадает с их фи-зичдекой реализацией. При списковой структуре предполагается наличие некоторого списка как совокупности адресных ссылок, расположенных в некотором логическом порядке. Список содержит наименования, поля данных и адреса этих полей. Поле данных и адрес последующего поля образуют элемент списка. Таким образом, каждый элемент включает имя списка и адрес следующего элемента. В простейшем случае список может быть описан таблицей, в первом столбце которой указано поле данных, а во втором — адрес следующего элемента данных. Если элементы списка фиксированы, то может быть организовано несколько списков с применением механизма многократных адресных ссылок. Это приводит к экономии памяти, поскольку нет необходимости многократно хранить один и тот же элемент. На рис. 4.6 в виде графа, представлен механизм адресных ссылок. Каждый элемент списка состоит из трех частей: маркерного поля М, поля данных Д и адресного поля А. Списковая структура является оптимальной для реорганизации базы. Весьма просто происходит рас-самостоятельный список,

Для характеристики запоминающего устройства используют коэффициент доступа:— время считывания записи Коэффициент доступа меняется в зависимости от типа запоминающего устройства. Различают следующие типы запоминающих устройств. [

ЗУ с параллельным доступом. Такие ЗУ обеспечивают одновременное считывание большого числа записей. Коэффициент доступа k_д=0. Особенность данного типа ЗУ в том, что операции загрузки записей и сопоставление их с требуемым признаком совершаются параллельно, время этих операций соизмеримо с временем, затрачиваемым в обычном ЗУ на одну запись.

Ассоциативное ЗУ. Отличается от ЗУ с параллельным доступом тем, что процессы сопоставления записи с требуемым признаком выполняются последовательно. Оно обеспечивает одновременное считывание большого числа записей. Наибольшее время тратится на поиск первой записи, а поэтому коэффициент доступа первой записи является наибольшим, для всех последующих записей он намного меньше.

ЗУ прямого доступа. Обращение к информации в данном ЗУ осуществляется по адресу: каждый элемент информации имеет свой адрес. Считывание какой-либо промежуточной информации здесь не нужно» в качестве конкретных физических носителей могут использоваться дисководы, записывающие информацию на магнитных дисках.

ЗУ с последовательным доступом. В этих ЗУ информация в виде записей размещается последовательно, адреса информации отсутствуют, а поэтому для нахождения требуемой записи необходимо просмотреть все предшествующие записи. Время доступа здесь зависит от номера записи. Весьма важна начальная установка механизма считывания относительно требуемой записи.

ЗУ с равным временем доступа. Для таких ЗУ в данный момент времени разрешается доступ только к одному элементу информации. Примером такого ЗУ служит магнитное оперативное запоминающее устройство, коэффициент доступа которого близок к нулю.

Зная свойства запоминающих устройств, оцениваемые временем доступа либо коэффициентом доступа, можно определить наиболее эффективные методы физической организации информационных массивов с учетом носителя информации.

Современные ЭВМ позволяют использовать следующие мето-тоды организации.

Последовательный метод организации. Он соответствует последовательной логической структуре информационных массивов, когда последовательность адресов в записи совпадает с последовательностью значений их ключевого признака. Последовательный метод организации информационных массивов эффективен, если требуется последовательная обработка информационного массива. Поиск информации при последовательном методе достаточю длителен, потому последовательный просмотр всех записей от начала до момента нахождения требуемой записи может оказаться неэффективным. Поэтому часто используют метод последовательного деления информационного массива— дихотомический поиск, когда имеется информационный массив, упорядоченный по значениям ключевого признака. Требуемую запись находят путем определения промежуточного значения ключевого признака и сравнения его с требуемым значением. Для этого массив делится последовательно пополам, в итоге определяется область, которая просматривается последовательно. Такой областью в магнитном диске может быть предварительно определенная дорожка.

Индексно-последовательный метод. Здесь записи в массиве располагаются также последовательно. Каждая запись обладает некоторым индексом, который заносится в каталог. Информационный массив, снабженный индексом, называется индексированным массивом. Если используется несколько магнитных носителей, например несколько магнитных дорожек на магнитном барабане, то кроме индекса записи необходимо указывать и номер дорожки. Последовательности индексов записей фиксируются на индексной дорожке. При замене какой-либо записи другой необходимо сдвинуть последующие записи с требуемого номера. При этом меняется индекс на дорожке и обеспечивается прямой доступ к требуемой записи. Время доступа по сравнению с последовательным методом резко сокращается.

Прямой метод организации информационных массивов. Он базируется на некоторой функциональной связи между адресом записи и значением ее ключа. Адрес вычисляется дополнительным арифметическим устройством, благодаря чему реализуется функциональная адресация записей в массиве. Зная функцию вида A==f(K), где А—адрес записи, К—ключ записи, нетрудно установить место записи и обеспечить прямой доступ к ней. Например, при непосредственной адресации адрес записи будет таким: А=Ао+а(К-1), где Aо-адрес начала информационного массива; о—количество ячеек, занятых записью; К— значение ключа записи. Этот метод дает наибольшую эффективность, если в массиве существуют записи со всеми значениями ключей. При отсутствии отдельных записей в памяти необходимо оставлять место для всех возможных значений ключей, хотя они могут и не использоваться в дальнейшем.

Расчлененный метод. Информационный массив в этом методе расчленяется на ряд последовательных частей и должен включать дополнительный справочник, который определяет имена и адреса этих составных частей. Записи адресов в справочнике располагаются последовательно в соответствии с реальным расположением составных частей массива. Части массива могут выбираться фиксированной или переменной длины. Данный метод представляет собой определенное развитие последовательного метода организации информационных массивов и обеспечивает меньшее время доступа.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 / 2017 18 19 20 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
31.03.201554.34 Кб6Бытовые ЭП.docx
#
31.03.20151.45 Mб27В. А.МАТВЕЕВ.pdf
#
31.03.2015285.18 Кб140Варианты предметной области АС.doc
#
31.03.2015213.12 Кб42варианты-10-01.12.2010.pdf
#
28.09.2019364.03 Кб30Введ в специальность 2012.doc
#
20.09.20191.2 Mб3Введение в АИС.doc
#
31.03.2015484.86 Кб43Введение в культурологию.doc
#
31.03.2015522.75 Кб31Введение в культурологию.doc
#
31.03.2015471.68 Кб12Векторный анализ (для самост. изучения).pdf
#
31.03.2015185.02 Кб44Виды сопряжений.pdf
#
31.03.20153.47 Mб25ВМ1(3 семестр)шпоры1.doc