1.3. Составные единицы информации
Каждый из наблюдаемых объектов, процессов характеризуется рядом присущих ему свойств. Но точно так же, как взятое в отдельности любое свойство еще не представляет сущность (объект, процесс) в целом, так и изолированно взятый тот или иной реквизит, характеризующий своим значением одно из свойств сущности, не может представлять законченного сообщения о наблюдаемом объекте (процессе). Требуется некоторая взаимосвязанная совокупность реквизитов для того, чтобы воспроизвести некоторое сообщение о сущности, определенную информацию о явлении.
Каждое j-е свойство в сообщении Сi представлено значением определенного приписанного этому свойству реквизита Rj :
Сi = (R1, R2, . . . ,R3, . . . ,Rm),
где реквизиты Rj могут быть и признаками, и числовыми переменными-основаниями .
Реквизитом-признаком называется такой реквизит, значение которого определяет некоторое обстоятельство действия (место действия, действующих лиц, предметы и продукты труда, время и др.).
Реквизит-основание - это такой реквизит, значение которого определяет некоторую меру действия (количество или стоимость предметов и продуктов труда, норму выработки или времени и др.).
Чаще реквизит-основание является реквизитом числового типа (иногда его называют количественным).
Каждый реквизит в сообщении имеет лишь одно значение (строку или число). Однако поскольку одна и та же сущность (допустим, факт отпуска изделий покупателям) фиксируется многократно с возникновением каждый раз нового сообщения, значения любого реквизита Rj меняются в зависимости от обстоятельств.
Каждое из сообщений, отображающих какой-либо один хозяйственный факт, глубоко индивидуально, поскольку варьируются значения по составным свойствам сущностей. Так, при отпуске готовых изделий покупателям сообщения могут фиксироваться по каждому из складов, по каждому из наименований продукции, для каждого из покупателей, каждый день и т. д. В связи с меняющимися значениями свойств этой сущности все сообщения будут отличаться друг от друга.
Так как каждый из т реквизитов сообщения Сi может принимать одно из Kj значений, где Kj -длина номенклатуры для реквизита-признака и диапазон значений для реквизита числового типа, то потенциально множество значений сообщения данного вида равно произведению . В действительности, однако, из-за наличия определенной логической взаимосвязи реквизитов, различной вероятности появления отдельных значений реквизита и сочетаний значений разных реквизитов множество значений меньше теоретически возможного, но тем не менее, как правило, велико.
Каждое сообщение в множестве сообщений данного вида отличается от другого значением хотя бы одного из входящих в сообщение реквизитов. Все множество этих сообщений объединяется в один вид благодаря одинаковому составу свойств, отображаемых реквизитами, или структурой сообщения.
Структурой сообщения объединяется некоторая совокупность разных реквизитов, т. е. в данном случае некоторое более сложное по структуре информационное образование, состоящее из элементарных единиц информации - реквизитов.
Единицу информации, состоящую из совокупности других единиц информации, ассоциативно связанных между собой некоторыми отношениями, назовем составной единицей информации (СЕИ), или просто составной. Единицу информации, входящую в СЕИ, назовем составляющей единицей информации, или просто составляющей. В рассмотренном выше примере в качестве составляющих использовались реквизиты R1,R2, . . . ,Rm.
Составляющая единица информации может быть по положению в структуре, в свою очередь, составной единицей информации, но более низкого уровня, чем СЕИ, в состав которой входит эта составляющая. Наоборот, СЕИ может быть составляющей, если она находится в структуре не на первом (для СЕИ) уровне, а в составе другой, более укрупненной СЕИ.
Для каждой СЕИ будем различать ее наименование, структуру, значение н некоторые специальные свойства.
Наименование СЕИ (или имя) служит для обращения к ней и обычно представляется словом или группой слов, например «движение материалов за месяц». Чаще используются сокращенные названия СЕИ - идентификаторы. Для однозначной трактовки возможных употреблений синонимов СЕИ применяется тезаурус СЕИ.
Структурой СЕИ называется ее реквизитный состав с учетом иерархического вхождения СЕИ более низкого уровня в состав рассматриваемой СЕИ. Рекурсивность определения структуры СЕИ обеспечивает возможность построения весьма сложных информационных конструкций, вплоть до интегрированных баз данных.
Под значением СЕИ понимается некоторая конструкция, в которой каждому реквизиту, входящему в структуру СЕИ, присвоено значение или некоторое множество значений.
Для СЕИ могут быть определены арифметические, логические и текстовые операции, а также операции отношения. При арифметических операциях каждый реквизит, входящий в структуру СЕИ, участвует в арифметических операциях над реквизитами, ему может быть присвоено некоторое значение или множество значений. При логических операциях СЕИ рассматривается как некоторая переменная булевского типа, которой может быть присвоено значение этого же типа. При операциях отношения СЕИ рассматривается как множество значений, над которыми определены операции реляционной алгебры. Естественно, что при выполнении операций СЕИ выступают в качестве операндов соответствующих выражений.
Примером составной единицы информации может быть некоторое множество документированной информации (также относимой к структурированной). Такая информация может быть представлена на любом носителе данных, таком, как магнитная лента, магнитный диск, перфокарты, перфолента, табуляграмма, первичный документ и т. д. Именно анализ такой информации позволяет в определенной мере изучить состав, внутреннее строение и свойства обрабатываемой информации и информации, получаемой в результате обработки.
Поскольку в экономике документ служит основным средством регистрации отдельных фактов хозяйственной деятельности, основным способом определения характера экономической информации является анализ содержания и структуры документов.
В частности, содержание всех документов предприятия в совокупности фактически отображает всю его деятельность в том виде, в каком она была зафиксирована и зарегистрирована управленческим аппаратом, в каком весь трудовой процесс был представлен в результате определенных экономических обобщений и оперирования первоначальными данными. К. Маркс указывал, в частности, что бухгалтерский учет является средством контроля и мысленного обобщения процесса производства.
Многочисленные факты и операции хозяйственной жизни предприятия отражаются документами. Варианты регистрации могут быть самыми разнообразными в зависимости от объема и характера производства, количества рабочих, производственной структуры предприятия, формы бухгалтерского учета и методики планирования, технической оснащенности управленческого аппарата, методов исчисления готовой продукции и т. д.
Характер документирования каждой отдельной хозяйственной операции зависит от конкретных особенностей и условий ее осуществления и в связи с этим оформление одной и той же операции не одинаково для разных предприятий и организаций. Поэтому и количество форм документов, в которых регистрируется на предприятиях даже однотипное явление (например, расход материалов на производство), имеет много разновидностей. Так, существующие на предприятиях формы лимитной карты отличаются наличием или отсутствием некоторых реквизитов, их расположением и пр. Форма одного и того же наименования и назначения может быть в одном случае чрезвычайно сложной, в другом - простой.
Таблица 1.1
Рассмотрим в качестве примера информационную совокупность, отражающую информацию, которая содержится в таком распространенном документе, как приказ-накладная на отпуск готовых изделий (табл. 1.1). Форму этого документа можно условно разбить на три части: общую, предметную и оформительную (подписи). Следовательно, представленную этим документом СЕИ S соответственно можно разбить на три информационные совокупности - составные единицы информации: С11 (общая часть), С12 (предметная часть) и С13 (оформительная часть), что можно представить записью: S. (С11, С12, С13), где S - идентификатор СЕИ S, точка - знак иерархического отношения (подчинения), а (С11, С12, С1З) - составляющие по отношению к составной S, запятые между ними - знаки отношения следования в рамках одного уровня. Запись можно прочитать так: «Составная S состоит из составляющих С11, C12 и С13».
Составляющая С11, представляющая общую часть документа, в свою очередь является СЕИ и включает три составляющих: С11. (С21, С22, С23).
СЕИ С21 также является составной и включает четыре составляющие следующего уровня (Р1 - номер накладной на отпуск готовых изделий, Р2 - дата, РЗ - вид операции, Р4 - код склада), причем все они являются реквизитами - признаками: С21. (P1, P2, PЗ, Р4).
СЕИ С22 (данные о получателе) содержит три элемента (Р5, Р6 и Р7 - наименование, код и адрес получателя), являющихся реквизитами-признаками: С22. (Р5, Р6, Р7).
Несколько сложнее структура информационной совокупности С23 из общей части документа: СЗ1 - данные о платежном требовании, Р10 - вид упаковки, Р11 - станция назначения и Р12 - основание для сделки. Однако ее составляющий элемент СЗ1 в свою очередь является СЕИ, содержащей два элемента: номер платежного требования - Р8 и дату выписки платежного требования - Р9. Структура С23 может быть записана так: С23.(СЗ1.(Р8, Р9), Р10, Р11, Р12).
Рассмотрим теперь предметную часть документа - СЕИ С12. Это составная единица информации, поскольку содержит пять элементов: Р13 - наименование, сорт, размер; Р14 - номенклатурный номер; (Q1 - цена; СЗ2 - количество; (Q4 - сумма. СЗ2 состоит из двух элементов: Q2 - количество по наряду и QЗ - количество отпущенное. СЕИ С12 можно записать следующим образом: С12. (Р13, Р14, Q1, СЗ2. (Q2, QЗ), Q4).
Такая формулировка была бы справедливой, если бы составная С12 представляла лишь одно сообщение. Однако, как видно из табл. 1.1, приводятся три сообщения (значения СЕИ), а может быть дано до шести сообщений (если заполнить все строки). Для указания такой особенности СЕИ используются специальные средства.
Единица информации одной формы, представляющая только одно значение в некоторой конструкции, называется простой, а представляющая несколько значений в некоторой конструкции, - массивом. Составная единица информации только с одним значением в некоторой конструкции называется простой составной, а СЕИ, имеющая несколько значений в некоторой конструкции, - составной- массивом.
В рассматриваемом случае к простым СЕИ относятся, например, составные С11, С21, С22, С23, С31. Составная С12 является СЕИ - массивом, и в ее описании необходимо объявить длину массива - максимально допустимое число позиций, предназначенных для значений. Как правило, указываются номер позиции (индекса) массива, с которой начинается нумерация (индексация) позиций (в большинстве случаев это 1), и номер его последней позиции, например для нашего случая 1:6, где двоеточие означает последовательную нумерацию (1, 2, . . . ,6). Индекс, с помощью которого осуществляется адресация к той или иной позиции массива, может изменяться только в диапазоне этих двух чисел. Эту пару целых чисел обычно называют граничной парой, а сами числа - соответственно нижней .и верхней границами массива (по данному его измерению; для матрицы, естественно, требуются две граничные пары). В качестве нижней и верхней границ допускаются и переменные, а во многих алгоритмических языках - и арифметические выражения, вычисляемые к моменту точного определения длины массива. Для массивов с переменной длиной используются также специальные указатели (отметки) конца массива.
Примерами описаний массивов разной размерности могут служить записи : А. (1:N), B. (1 : К, 1: N), С. (1 : 5, 1 : 8, 1 : 4), D. (М К), Е.(К + 1 : К +N).
Для составной - массива С12 соответственно следует записать С12.(1:6), и с учетом этого формулировкой СЕИ - массива С12 будет С12.(1:6). (Р13, Р14, Q1, СЗ2.(Q2, QЗ), Q4).
Рис. 1.1. Графическая интерпретация структуры СЕИ - массива S из М позиций
Оформительная часть документа С1З состоит из четырех реквизитов: Р15 - отпуск разрешил. Р16 - виза главного бухгалтера, Р17 - отпустил, Р18-получил: С13.(Р15, Р16, Р17, Р18).
В конкретных условиях, например промышленного предприятия, приказ-накладная на отпуск готовых изделий представляется некоторым множеством документов, отражающим совокупность хозяйственных операций по отпуску готовых изделий. Следовательно, этот документ является массивом. Структура СЕИ - массива S из М позиций может быть представлена следующей записью: S.(1:M). (С1 1 . (С21. (Р1, Р2, РЗ, Р4),
С22. (Р5, Р6, Р7),
С23. (СЗ1.(P8,P9), Р10, Р11, Р12),
C12. (1:6).(P13, Р14, Q1, СЗ2. (Q2, Q3), Q4),
С13. (P15, Р16, Р17, Р18).
Рис. 1.2. Графическая интерпретация структуры СЕИ с преобразованной структурой
Графическая интерпретация структуры этой СЕИ дана на рис. 1.1, где висячие вершины дерева представляют собой реквизиты, из них реквизиты-признаки имеют идентификаторы, начинающиеся буквой Р, а реквизиты-основания - идентификаторы, начинающиеся буквой Q. Остальные вершины - это СЕИ, являющиеся промежуточными и составляющими по отношению к основной составной S. Вспомогательная роль таких промежуточных составных особенно выявляется при перестроении структуры СЕИ, когда каждая позиция составного массива будет иметь свой самостоятельный набор значений всех реквизитов, что позволяет обрабатывать этот массив отдельно. В полученной СЕИ будут отсутствовать промежуточные СЕИ - составляющие. Пример составного массива S приказов-накладных на отпуск готовых изделий с такой преобразованной структурой иллюстрирует граф этой структуры (рис.1.2), на котором число уровней СЕИ сократилось до трех, а длина массива N равна 6М. Такой структуре соответствуют матричная интерпретация и формулировка S.(1 : N).(Р1, Р2, РЗ, Р4, Р5, Р6, Р7, Р8, Р9, P10, Р11, P12, P13, P14, Q1, Q2, Q3, Q4, P15, P16, P17, P18).
Сравнение двух структур одной и той же составной, особенно в их табличной интерпретации, показывает, что вторая более проста, но имеет увеличенный объем данных.
Рис. 1.3.Ненормализованная структура СЕИ S
Рис. 1.4. Нормализованная структура СЕИ S
Структуру первого типа (рис. 1.3) называют ненормализованной, структуру второго типа (рис. 1.4) -нормализованной .
Введение промежуточных составных позволяет устранить дублирование данных и создать определенные удобства для групповой адресации. Промежуточные составные называют группами, причем состоящие только из реквизитов (напрС12, С22, СЗ1, СЗ2 и С1З в первой структуре) - простыми, а имеющие в своем составе другие составные (группы) - сложными (например, С11, С12, С23). Примерами простых групп могут также служить:
адрес. (область, город, улица, дом, квартира)
дата. (день, месяц, год)
товар. (наименование, номер, сорт, размер)
лицо. (фамилия, имя, отчество)
книга. (автор, название, том, издательство, год).
В качестве примеров сложных групп можно назвать:
работа. (цех, дата, лицо, изделие, операция)
водитель. (лицо, автомобиль)
адресат. (адрес, лицо)
товарополучатель. (товар, адресат).
В первой группе примеров все составляющие являются реквизитами, во второй большая часть из них - группы.
Синонимами термина «группа» также являются термины «сегмент», «агрегат», «набор» и иногда - «запись». Более часто под записью понимают значение одной позиции составной - массива (см. рис. 1.3), или, другими словами, сообщение об одном из состояний наблюдаемого объекта или явления. Сама составная - массив при этом определении - совокупность записей о множестве состояний объекта или множестве объектов наблюдаемого процесса (явления).
Запись представляет собой совокупность значений реквизитов, входящих в состав этой СЕИ. Это же справедливо в отношении групп, совокупность значений каждой из которых иногда называют статьей. В конечном итоге значение любой составной единицы информации, какой бы сложной она ни была и на каком бы уровне иерархии ни находилась, есть совокупность строк и чисел - значений составляющих реквизитов.