Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

AlgStr / Библиотека / ЛЕКЦИИ / PZ01 / №_3_Шевлюк (Информация и данные_Понятие о структуре

.doc
Скачиваний:
35
Добавлен:
23.03.2015
Размер:
37.89 Кб
Скачать

Шевлюк Ю.В. ПЗ-03-1

Информация и данные. Понятие о структурах данных.

Информационная модель объекта

При разработке программ для решения сложных задач всегда можно выделить некоторый объект, являющийся главным элементом исследо­вания. Таким объектом может быть номенклатура изделий некоторого завода, календарный план работы цеха, студенческая группа. Объект характеризуется свойствами, для исследования взаимосвязей которых и решается задача. Одним из возможных методов решения задачи яв­ляется моделирование объекта с помощью компьютера. Для этой цели строится информационная модель, в которую включается информация только о существенных для данной задачи свойствах (характеристиках, сторо­нах) объекта. Другая задача, касающаяся этого же объекта, потребует знания информации о других его свойствах - строится другая информа­ционная модель. Объединение различных информационных моделей объек­та составит его комплексную модель, предназначенную для решения выделенной совокупности задач. Модель строится для набора однородных (с одинаковым вектором свойств) объектов и является изображением, описанием объекта при решении задачи.

Элементами информационной модели являются атрибуты, описываю­щие соответствующие свойства объекта. Каждому атрибуту соответст­вует множество допустимых значений. Конкретному, выделенному экземпляру объекта соответствует экземпляр модели, где каждому ат­рибуту присвоено определенное значение.

Атрибутом является логически неделимый элемент информации об объекте, который может быть связан с другими элементами, связи между атрибутами задаются связями между свойствами объекта.

Большинство атрибутов изменяется с течением времени, т.е. как правило, необходимо учитывать динамический характер моделей. По отношению к внешней среде объекта атрибуты можно разделить на входные, внутренние и выходные. Вектор (X) входных атрибутов включает те атрибуты, через которые внешняя среда влияет на объект. Вектор (С) внутренних, собственных атрибутов определяет конфигура­цию объекта в текущей момент времени. Вектор (У) выходных атрибу­тов определяет те атрибуты, через которые объект воздействует на внешнюю среду. Алгоритмом решения задачи является некоторый опера­тор А, преобразующий входные и внутренние атрибуты в выходные.

Для таких систем, учитывающих предысторию системы и воздействий внешней среды, необходимо хранить информацию на определенных носителях.

Понятие о данных

Информация существует благодаря связи с носителем, который представляет среду, способную находиться в одном из фиксированных наборов состояний.

Данными называется изображение информации, т.е. описание сос­тояния носителя. Для превращения информации в данные и наоборот необходим язык преобразования сообщения в состояние носителя и наоборот. Алфавит такого языка состоит из набора знаков (литер), которые могут быть отображены на состояние носителя (при этом для различных носителей система, отображений может быть различной). Ин­формационное сообщение изображается в виде последовательности (стро­ки) символов на логическом уровне, а изображение информации с описа­нием состояний носителя осуществляется ни физической уровне данных. И на логическом и на физическом уровне мы оперируем абстрактными понятиями данных. На логическом уровне нас не интересует метод пре­образования символов на физическую память, а на физическом уровне нас не интересует реализация битов , управление устройством и многие другие вопросы. Знак обычно не связывается со смыслом, т.е. он представляет собой конструкцию данных, а не информации. Исключением являются знаки-цифры, несущие определенную информацию при своем появлении. Единице информации (атрибуту) соответствуем не­которое "слово" ( подстрока символов), называемое обычно элементом данных. Таким образом, информационная модель отображается на совокупность взаимосвязанных элементов данных, объединенных в ло­гическую запись. При этом каждой логической записи соответству­ет свой экземпляр объекта, набору объектов соответствует файл.

Рассмотрим случай дискретного носителя, т.е. когда носитель состоит из конечного множества элементов, способных находиться в одном из ( к ) устойчивых состояний. Будем считать, что каждое состояние обеспечивается стандартным физическим устройством. По­следовательность из ( n ) таких элементов представляет собой среду, способную находиться в устойчивых состояний. Хо­тя с ростом ( к ) растет диапазон представляемых кодов, но растет и сложность системы.

Количество стандартных устройств определяет­ся по формуле Q(k)=k[lnN/lnK].

Функция Q(k) воз­растает при к≥3 . Надежность системы P(k)=(1-q)Q где:

q- вероятность сбоя в одном устройстве, будет максимальной при минимальном Q .

Считая стоимость системы равной S=a*Q(k) мы находим, что надежная система будет при этих предположениях и системой с минимальной стоимостью. Легко проверить, что Q(k) будет наименьшим при к=3 , однако сложность реализации троич­ных элементов привела к использованию двоичных элементов. При этом основным элементом, среды является двоичный разряд (бит). Последовательность разрядов объединяется в группу изображения (ко­дирования) знака (символа). Последовательность групп разрядов объединяется в поле для записи элемента данных, т.е. поле является элементарной, основной конструкцией - понятием данных на физи­ческом уровне. Поля объединяются в физические записи, содержащие данные логических записей. При отображении логической единицы на физическую появляется понятие проекции или отображения символов языка данных на группу двоичных разрядов. Наиболее распространен­ным случаем является использование групп одинаковой длины незави­симо от изображенного символа. Длина такой группы зависит от ко­личества символов в алфавите. Примеры систем:

М2- в которой для каждого символа отводится 6 разрядов ;

ГОСТ 13052-67 - для каждого символа используется 7 бит;

ДКОИ - для каждого символа используется 8 бит.

Таким образом, при решении задачи приходится рассматривать три области - область реального мира, область информации и область данных. В первой области основным элементом является объект с вы­деленным множеством взаимосвязанных свойств. Объект является ло­гическим понятием, с которым связаны понятия «экземпляр объекта» и «набор экземпляров объектов».

При отображении первой области на вторую объект заменяется информационной моделью, содержащей множество атрибутов и описание связей между ними. Экземпляру объекта соответствует сечение моде­ли. При отображении второй области на третью атрибуты заменяются элементами данных, а взаимосвязи атрибутов реализуются специальными средствами, так что информационная модель преобразуется в струк­турированный (организованный специальным образом) набор данных.

Понятие о структурах данных

Данные, являясь отображением информации, описывают элементы реального мира и участвует в обработке информационных моделей. Алгоритм обработки атрибутов определяется информационной моделью и сводится к реализации некоторого вычислительного процесса, в ко­тором участвуют значения атрибутов, т.е. элементы данных. При обра­ботке различной информации можно выделить тождественные, или экви­валентные, алгоритмы обработки совокупности (наборов) данных. Такие алгоритмы составляет существенную долю при создании информационных систем, особенно возросла их роль в связи с использованием и разра­боткой систем управления, базами данных.

Каждый элемент данных имеет набор характеристик (тип данного, форма представления, значение, длина поля и т.д.), которые опреде­ляют процедуру обработки этого элемента. Особой характеристикой

записи данных является ключ, который позволяет идентифицировать выделить, (определить) единственный элемент множества. Обычно в качестве ключа выступает один или несколько элементов данных за­писи. В первом случае говорят о простом ключе, во втором случае ключ является составным. Для составного ключа важен не только набор элементарных данных, но и их порядок. Ключевые поля вводят определенные отношения между множеством записей.

Обработка множества проводится по определенному, задаваемому алгоритмом, логическому порядку элементов, который определяет целесообразный метод доступа к элементам множества. Наиболее распространенными является две организации доступа: прямой доступ и последовательный доступ. Прямой доступ предполагает выделение элемента множества по его ключу или по другой аналогичной информации, независимо от обработки предыдущего элемента. Последовательный доступ предполагает выполнение обработки данного элемента после предыдущего элемента.

Второй характеристикой множества является стратегия взаимного расположения элементов данных в области памяти - стратегия адресации.

Организованную совокупность данных обычно называют структу­рой. Структура содержит информации о связях между элементами, общие характеристики множества и позволяет выполнять операции адресации и поиска.