AlgStr / Библиотека / ЛЕКЦИИ / PZ01 / №_3_Шевлюк (Информация и данные_Понятие о структуре
.docШевлюк Ю.В. ПЗ-03-1
Информация и данные. Понятие о структурах данных.
Информационная модель объекта
При разработке программ для решения сложных задач всегда можно выделить некоторый объект, являющийся главным элементом исследования. Таким объектом может быть номенклатура изделий некоторого завода, календарный план работы цеха, студенческая группа. Объект характеризуется свойствами, для исследования взаимосвязей которых и решается задача. Одним из возможных методов решения задачи является моделирование объекта с помощью компьютера. Для этой цели строится информационная модель, в которую включается информация только о существенных для данной задачи свойствах (характеристиках, сторонах) объекта. Другая задача, касающаяся этого же объекта, потребует знания информации о других его свойствах - строится другая информационная модель. Объединение различных информационных моделей объекта составит его комплексную модель, предназначенную для решения выделенной совокупности задач. Модель строится для набора однородных (с одинаковым вектором свойств) объектов и является изображением, описанием объекта при решении задачи.
Элементами информационной модели являются атрибуты, описывающие соответствующие свойства объекта. Каждому атрибуту соответствует множество допустимых значений. Конкретному, выделенному экземпляру объекта соответствует экземпляр модели, где каждому атрибуту присвоено определенное значение.
Атрибутом является логически неделимый элемент информации об объекте, который может быть связан с другими элементами, связи между атрибутами задаются связями между свойствами объекта.
Большинство атрибутов изменяется с течением времени, т.е. как правило, необходимо учитывать динамический характер моделей. По отношению к внешней среде объекта атрибуты можно разделить на входные, внутренние и выходные. Вектор (X) входных атрибутов включает те атрибуты, через которые внешняя среда влияет на объект. Вектор (С) внутренних, собственных атрибутов определяет конфигурацию объекта в текущей момент времени. Вектор (У) выходных атрибутов определяет те атрибуты, через которые объект воздействует на внешнюю среду. Алгоритмом решения задачи является некоторый оператор А, преобразующий входные и внутренние атрибуты в выходные.
Для таких систем, учитывающих предысторию системы и воздействий внешней среды, необходимо хранить информацию на определенных носителях.
Понятие о данных
Информация существует благодаря связи с носителем, который представляет среду, способную находиться в одном из фиксированных наборов состояний.
Данными называется изображение информации, т.е. описание состояния носителя. Для превращения информации в данные и наоборот необходим язык преобразования сообщения в состояние носителя и наоборот. Алфавит такого языка состоит из набора знаков (литер), которые могут быть отображены на состояние носителя (при этом для различных носителей система, отображений может быть различной). Информационное сообщение изображается в виде последовательности (строки) символов на логическом уровне, а изображение информации с описанием состояний носителя осуществляется ни физической уровне данных. И на логическом и на физическом уровне мы оперируем абстрактными понятиями данных. На логическом уровне нас не интересует метод преобразования символов на физическую память, а на физическом уровне нас не интересует реализация битов , управление устройством и многие другие вопросы. Знак обычно не связывается со смыслом, т.е. он представляет собой конструкцию данных, а не информации. Исключением являются знаки-цифры, несущие определенную информацию при своем появлении. Единице информации (атрибуту) соответствуем некоторое "слово" ( подстрока символов), называемое обычно элементом данных. Таким образом, информационная модель отображается на совокупность взаимосвязанных элементов данных, объединенных в логическую запись. При этом каждой логической записи соответствует свой экземпляр объекта, набору объектов соответствует файл.
Рассмотрим случай дискретного носителя, т.е. когда носитель состоит из конечного множества элементов, способных находиться в одном из ( к ) устойчивых состояний. Будем считать, что каждое состояние обеспечивается стандартным физическим устройством. Последовательность из ( n ) таких элементов представляет собой среду, способную находиться в устойчивых состояний. Хотя с ростом ( к ) растет диапазон представляемых кодов, но растет и сложность системы.
Количество стандартных устройств определяется по формуле Q(k)=k[lnN/lnK].
Функция Q(k) возрастает при к≥3 . Надежность системы P(k)=(1-q)Q где:
q- вероятность сбоя в одном устройстве, будет максимальной при минимальном Q .
Считая стоимость системы равной S=a*Q(k) мы находим, что надежная система будет при этих предположениях и системой с минимальной стоимостью. Легко проверить, что Q(k) будет наименьшим при к=3 , однако сложность реализации троичных элементов привела к использованию двоичных элементов. При этом основным элементом, среды является двоичный разряд (бит). Последовательность разрядов объединяется в группу изображения (кодирования) знака (символа). Последовательность групп разрядов объединяется в поле для записи элемента данных, т.е. поле является элементарной, основной конструкцией - понятием данных на физическом уровне. Поля объединяются в физические записи, содержащие данные логических записей. При отображении логической единицы на физическую появляется понятие проекции или отображения символов языка данных на группу двоичных разрядов. Наиболее распространенным случаем является использование групп одинаковой длины независимо от изображенного символа. Длина такой группы зависит от количества символов в алфавите. Примеры систем:
М2- в которой для каждого символа отводится 6 разрядов ;
ГОСТ 13052-67 - для каждого символа используется 7 бит;
ДКОИ - для каждого символа используется 8 бит.
Таким образом, при решении задачи приходится рассматривать три области - область реального мира, область информации и область данных. В первой области основным элементом является объект с выделенным множеством взаимосвязанных свойств. Объект является логическим понятием, с которым связаны понятия «экземпляр объекта» и «набор экземпляров объектов».
При отображении первой области на вторую объект заменяется информационной моделью, содержащей множество атрибутов и описание связей между ними. Экземпляру объекта соответствует сечение модели. При отображении второй области на третью атрибуты заменяются элементами данных, а взаимосвязи атрибутов реализуются специальными средствами, так что информационная модель преобразуется в структурированный (организованный специальным образом) набор данных.
Понятие о структурах данных
Данные, являясь отображением информации, описывают элементы реального мира и участвует в обработке информационных моделей. Алгоритм обработки атрибутов определяется информационной моделью и сводится к реализации некоторого вычислительного процесса, в котором участвуют значения атрибутов, т.е. элементы данных. При обработке различной информации можно выделить тождественные, или эквивалентные, алгоритмы обработки совокупности (наборов) данных. Такие алгоритмы составляет существенную долю при создании информационных систем, особенно возросла их роль в связи с использованием и разработкой систем управления, базами данных.
Каждый элемент данных имеет набор характеристик (тип данного, форма представления, значение, длина поля и т.д.), которые определяют процедуру обработки этого элемента. Особой характеристикой
записи данных является ключ, который позволяет идентифицировать выделить, (определить) единственный элемент множества. Обычно в качестве ключа выступает один или несколько элементов данных записи. В первом случае говорят о простом ключе, во втором случае ключ является составным. Для составного ключа важен не только набор элементарных данных, но и их порядок. Ключевые поля вводят определенные отношения между множеством записей.
Обработка множества проводится по определенному, задаваемому алгоритмом, логическому порядку элементов, который определяет целесообразный метод доступа к элементам множества. Наиболее распространенными является две организации доступа: прямой доступ и последовательный доступ. Прямой доступ предполагает выделение элемента множества по его ключу или по другой аналогичной информации, независимо от обработки предыдущего элемента. Последовательный доступ предполагает выполнение обработки данного элемента после предыдущего элемента.
Второй характеристикой множества является стратегия взаимного расположения элементов данных в области памяти - стратегия адресации.
Организованную совокупность данных обычно называют структурой. Структура содержит информации о связях между элементами, общие характеристики множества и позволяет выполнять операции адресации и поиска.