Раздел 2. Элементы теории информации
Лекция 5. Фазы информационного цикла и их модели
1. Фазы информационного цикла.
2. Модели основных фаз преобразования информации.
Литература: 1. Советов Б.Я. Информационная технология: Учеб. для
вузов по спец. «Автоматизир. системы обработки информ.
и упр.». – М.: Высш. шк., 1994.
1 Фазы информационного цикла
Как было отмечено на предыдущих лекциях, информационные технологии направлены на формирование и рациональное использование информационного ресурса общества. Перед человечеством стоит громадная по своей важности и сложности задача: извлечь максимум информации из накопленных за всю историю своего существования сообщений и превратить ее в активно функционирующий ресурс. Речь идет, в первую очередь, о превращении книжных описаний и других "рассеянных" знаний в алгоритмы и программы. Это лишь часть работ по формированию информационного ресурса.
Сам по себе информационный ресурс не может двигать системы и механизмы. Движителями систем выступают материальные силы: энергетические и трудовые факторы. Но информационный ресурс, словно фермент, переводит эти материальные факторы из латентного в активное состояние и вводит их в заданное русло. Тем самым информационный ресурс обеспечивает прирост свободной энергии в целенаправленных системах социальной природы за счет снижения их энтропии (неопределенности состояния системы).
Особую роль информация, информационный ресурс играют в АСУ. Рассмотрим последовательно основные фазы преобразования информации в автоматизированных системах как составляющие единого информационного процесса.
Сбор информации.
Фаза сбора информации является начальным этапом формирования осведомляющей информации. Сбор осуществляется либо с датчиков информации, встроенных в технологические или производственные процессы, с контрольно-измерительных приборов либо путем съема данных графиков, чертежей, схем, номенклатур, прейскурантов, спецификаций и т. д.
В общем случае сигналы, поступающие от объекта, можно разделить на статические, отображающие устойчивые состояния объектов, и динамические, для которых характерно быстрое изменение во времени, отображающее, например, изменение электрических параметров системы. Статические сигналы обычно фиксируются в документальной форме, динамические — появляются на выходе датчиков, контрольно-измерительных приборов и т. д. По характеру изменения сигналы делятся на непрерывные и дискретные.
На рис. 1 представлена структурная схема реализации фазы сбора информации. С технологического оборудования (ТО) с помощью датчиков Д1 ... Дn снимается непрерывная информация, которая подвергается операциям преобразования и кодирования. Эти операции выполняются преобразователями Пр1, ... Прn.
Рисунок 1 – Структурная схема процесса сбора информации
При преобразовании осуществляется дискретизация непрерывной величины. Эту операцию могут выполнять и датчики. При кодировании дискретное значение непрерывной величины превращается в код. Под кодом понимают определенный набор символов и знаков, однозначно отображающих любое сообщение, в том числе дискретизированное или мгновенно снятое с датчика значение непрерывной величины. Физически код представляет собой некоторую последовательность импульсов, распределенных во времени либо в пространстве. Он включает в себя ряд элементов, каждый из которых содержит определенное количество информации (в соответствии со статистической мерой). Представленные в кодированном виде значения исходной информации хранятся в накопительных устройствах Н1 ... Нn и через коммутатор (К) по определенному закону выводятся на следующую фазу преобразования информации. Режим опроса, т. е. функционирования коммутатора, задается устройством программного управления (УПУ). При этом могут реализовываться режимы циклического опроса, случайного поиска, опроса по загрузке накопителей, а также по заданным приоритетам.
Рассмотрим отдельные, наиболее характерные для фазы сбора информации процедуры кодирования с использованием неизбыточных кодов.
Процедуры считывания информации с датчика и последующего кодирования зачастую удается совместить. Для уменьшения ошибки считывания при наличии аналого-кодовых преобразователей используют специальные виды кодов. Примером является код Грея. Он относится к числу двоичных кодов и обеспечивает высокую точность преобразования непрерывной величины в код. Применяется для отображения десятичных чисел, поэтому используется число комбинаций М = 10 < 24, т. е. код содержит четыре элемента. Так как код двоичный, то каждый элемент четырехэлементного кода может принимать значения «0», «1». Последовательность выбора кодовых комбинаций определяется тем, что при изменении непрерывной величины каждый последующий отсчет непрерывной функции должен отображаться кодовой комбинацией, отличающейся от предыдущей лишь в одном разряде. Это позволяет свести ошибку считывания к единице в младшем разряде. Десятичные числа и отображающие их коды представлены в табл. 1.
Таблица 1
Десятичное число |
Двоичный код |
Код Грея |
Десятичное число |
Двоичный код |
Код Грея |
0 |
0000 |
0000 |
6 |
0110 |
0101 |
1 |
0001 |
0001 |
7 |
0111 |
0100 |
2 |
0010 |
0011 |
8 |
1000 |
1100 |
3 |
0011 |
0010 |
9 |
1001 |
1101 |
4 |
0100 |
0110 |
10 |
1010 |
1111 |
5 |
0101 |
0111 |
|
|
|
При сборе информации используются известные неизбыточные коды. В зависимости от закона распределения снимаемых мгновенных значений непрерывной величины эти коды имеют постоянную либо переменную длину. Если мгновенные значения равновероятны, то наилучшим отображением их в кодированном виде будет представление равномерным кодом. В этом коде все комбинации имеют одинаковую длину и любое сообщение отображается одним и тем же числом символов.
Если отсчеты функции неравновероятны, то для получения наибольшей информативности каждого элемента кода используют неравномерные коды, получившие название статистических кодов. В этих кодах длина комбинации тем больше, чем меньше вероятность возникновения отсчета функции.
Таким образом, при сборе информации существенными оказываются процедуры опроса датчиков и преобразования неэлектрической величины в электрическую, представляемую в виде равномерного или неравномерного кода в зависимости от статистики отсчетов непрерывной функции. При территориально разнесенных датчиках фаза сбора информации может совмещаться с фазой передачи. Тогда возникают проблемы кодирования сигналов с помощью избыточного кода, используемого в фазе передачи информации.
Подготовка информации.
Фаза подготовки информации заключается в записи информации, снятой автоматически с объекта управления либо полученной оператором, на носитель с целью включения этой информации в процесс управления. Вид представления информации на выходе фазы подготовки зависит от того, с какой следующей фазой сопрягается подготовка информации. Если эта информация после ее подготовки должна быть передана в канал связи, то необходимо представить ее в виде электрического сигнала, способного передаваться по физической линии либо специально организованному каналу связи. Если за фазой подготовки следует обработка либо хранение информации, то необходимо информацию перенести на машинный носитель либо документ в соответствии с теми правилами, которые определяются последующими фазами информационного процесса. Одним из важнейших условий фазы подготовки информации является максимальная автоматизация выполнения процедур подготовки.
При подготовке задач к решению на современных ЭВМ (компьютерах) команды могут записываться в двоичных ходах. В этом же виде они хранятся в памяти ЭВМ. При этом составляется программа, которая записывается в так называемом машинном языке. Процесс кодирования команд на машинном языке получил название программирования. Символическое обозначение всех команд называют языком Ассемблер, а машинную программу, по которой выполняется перевод с языка Ассемблер на машинный язык, называют Ассемблером. Надо отметить, что программировать в машинном языке, т. е. в двоичных кодах, трудоемко. Подготавливать информацию в таком виде сложно также из-за возможности наличия ошибок. Поэтому при подготовке информации в персональных ЭВМ пользуются более общими языками, когда информация записывается в символическом виде. При вводе информация преобразуется в двоичный код автоматически с помощью специальной программы, существующей в ЭВМ. Это ускоряет процесс программирования.
Следует отметить, что вычислительный процесс внутри ЭВМ, например арифметическая обработка, выполняется в машинных двоичных кодах. При вводе информации функцию кодирующего устройства, в частности, исполняет клавиатура.
Таким образом, в современных условиях подготовка информации, если она не связана непосредственно с последующей ее передачей, означает подготовку программ и ввод информации через клавиатуру. Характерно, что и в этом случае автоматизация фазы подготовки информации осуществляется за счет процедуры кодирования, которая реализуется аппаратным или программным путем.
Передача информации.
Фаза передачи информации в информационном процессе автоматизированной системы возникает тогда, когда существует взаимодействие между территориально удаленными объектами. В этом случае между источником и потребителем информации существует канал связи, и возникает задача передачи заданного объема информации через канал связи с требуемой помехоустойчивостью. Сообщение, формируемое источником информации, подвергается на передающей стороне трем процедурам: преобразованию, что выполняется преобразователем; кодированию, осуществляемому кодирующим устройством; модуляции, что реализуется модулятором.
На приемной стороне над сигналом, который прошел через линейные согласующие устройства в канал связи, выполняются следующие процедуры: демодуляция с помощью демодулятора; декодирование, что реализует декодирующее устройство; преобразование полученной информации в соответствующую форму, что выполняет потребитель информации.
Особенностью процесса передачи является то, что сигнал, отображающий код, в канале связи подвергается действию помех. Для обеспечения требуемой помехоустойчивости передачи информации предусматривают введение избыточности как в передаваемый сигнал, так и в код. Введение избыточности в передаваемый сигнал осуществляется за счет модуляции. Помехоустойчивость кода обеспечивается избыточным кодированием, которое является основным средством автоматизации фазы передачи информации.
Качество передачи информации оценивается вероятностно-временными характеристиками с учетом действующих помех в каналах связи, надежности элементов аппаратуры и условий обслуживания пересекающихся информационных потоков в концентраторах и узлах коммутации.
Таким образом, фаза передачи информации в информационном процессе АСУ является исключительно ответственной и требует серьезной проработки как на логическом, так и на физическом уровнях реализации системы. Фаза передачи информации обычно предшествует фазе обработки.
Обработка информации.
Термин «обработка информации» является широким. Полезно выделить как подэтап предварительную обработку информации. При автоматизированном управлении целью обработки является решение с помощью ЭВМ вычислительных задач оптимизационного либо расчетного характера, отображающих функциональные задачи управления в системе. В этих условиях должны существовать модели обработки информации, соответствующие принятым алгоритмам управления. Можно считать, что в памяти ЭВМ хранится некоторая концептуальная модель — информационный образ объекта управления и модели процесса управления. Для обработки необходимо создать набор вычислительных алгоритмов с программным обеспечением, проблемно-ориентированным на задачи управления.
На этапе предварительной обработки основной задачей является выявление смысла принятого сообщения. Семантическое содержание сообщения и его прагматическое значение зависят от пользователя, т. е. потребителя информации. Поэтому должно существовать правило интерпретации сообщения, которое принято по согласованию между источником информации и потребителем. Конкретное содержание процесса предварительной обработки зависит от конечной цели и может быть различным, например, для обнаружения сигнала, обработки текстовой информации, сжатия измерительной информации и т. д.
В АСУ обработка информации автоматизирована. Эта операция является обязательной составляющей АСУ. Прежде всего, необходимо обработать информацию, входящую во внешнее информационное обеспечение, т. е. ту, которая представлена в формализованном (документальном) виде. Показатели, содержащиеся в документах, обрабатываются в различных подразделениях предприятия. Одной из задач создания системы обработки является рациональное распределение вычислительных ресурсов между подразделениями с целью минимизации информационных потоков между службами предприятий и минимизация времени решения вычислительных задач. Вычислительные задачи, поставленные на основе данных, представленных в документах, имеют обычно рутинный (информационный) характер. Их решают на ЭВМ на базе типовых вычислительных алгоритмов. Ряд задач в АСУ, связанных с прогнозированием, стратегическим планированием и управлением, решаются путем моделирования с использованием математических и имитационных моделей. В этих случаях возможна оптимизационная постановка задачи и получение значительного экономического эффекта от реализации автоматизированного управления. Несмотря на внешнюю разнотипность задач обработки информации, физическая реализация процесса обработки означает представление данных в ЭВМ с помощью машинных кодов и выполнение ряда типовых операций над данными.
Рассмотрим внутримашинные процедуры обработки информации в ЭВМ.
Характерным процессом обработки в ЭВМ является арифметическая обработка. Она базируется на использовании двоичных кодов и выполнении в них операций сложения и вычитания. Процесс арифметической обработки информации в ЭВМ наряду с представлением данных включает в себя представление арифметических команд, соответствующие программы арифметических операций, организацию пересылки информации из одной области памяти в другую и т. д.
К обработке информации следует отнести обработку сигналов в некоторых областях науки и техники, переработку текстовой информации, обработку сообщений, обработку изображений и т. д.
Обработка информации в частных ее проявлениях может входить в отдельные стадии других фаз информационного процесса. Фаза обработки информации тесно связана с фазой хранения.
Хранение информации.
Хранение информации можно рассматривать как передачу информации во времени. Различают оперативное и долговременное хранение информации. Носители информации можно разделить на оперативные и долговременные запоминающие устройства. Необходимость хранения информации в ЭВМ связана не только с процессом арифметической обработки. При управлении создают информационные массивы, которые хранятся в информационной базе. Вопросы хранения информации, принципы организации информационных массивов, поиска, обновления, представления информации приобретают самостоятельный характер. Хранение информации осуществляется на специальных носителях.
Фаза хранения информации может быть представлена на концептуальном, логическом и физическом уровнях. Концептуальный уровень отражает содержательно информацию и способы реализации ее хранения. Логический уровень определяет порядок представления информации, организацию информационных массивов. Физический уровень означает реализацию хранения информации на конкретных физических носителях. Автоматизация фазы хранения информации осуществляется за счет процессов кодирования, процедур организации информационных массивов, алгоритмизации процессов ввода, поиска, вывода и обновления информации.
При хранении в автоматизированных системах, прежде всего, нужно различать информацию, хранимую вне ЭВМ, т. е. в форме документов, и информацию, хранимую внутри ЭВМ, с помощью специальных запоминающих устройств. На концептуальном уровне сведения о технико-экономическом объекте задают некоторый информационный образ. Этот образ отражается в виде технико-экономической информации, куда входят сведения наблюдателя об управляемом объекте, а также информация, которой обменивается этот объект с внешней средой. Ввиду большого объема технико-экономической информации необходимо компактное ее представление. Для этого используют процедуру классификации и кодирования.
Наряду с классификацией и кодированием существенным этапом автоматизации хранения информации является организация информационных массивов. Объекты и явления реального мира в ЭВМ представляются на стадии хранения информации в виде данных, при этом нам важны не только данные, но и связи между ними, т. е. принцип их организации. Желательно, чтобы концептуальная структура данных отображала реальные явления окружающего нас мира. Однако на физическом уровне структура данных во многом определяется требованиями, накладываемыми возможностями технических средств хранения информации.
Наиболее простой является линейная структура хранения. Организация данных может быть выполнена в виде строки, одномерного массива, стека, очереди и т. д. При организации данных в виде строки элементы данных располагаются по признаку непосредственного следования, т. е. по мере поступления данных в ЭВМ. В случае одномерного массива отдельные его элементы имеют индексы, т. е. поставленные им в соответствие целые числа. Эти числа можно рассматривать как номер элемента массива. Наличие индекса позволяет получить доступ к заданному элементу, и это оказывается намного проще, чем осуществлять поиск требуемого элемента в строке. С учетом динамики процесса ввода и вывода информации различают также структуры данных, в которых используется линейный принцип организации, реализующий дисциплину обслуживания «последним пришел — первым ушел». Такая структура получила название стека. В стеке первым удаляется последний поступивший элемент. Возможна реализация и другой дисциплины обслуживания, при которой для обработки информации выбирается элемент, поступивший ранее всех других. Такая структура получила название очереди. Рассмотренные структуры относятся к линейным и отображают достаточно простые одномерные структуры данных.
В случае многомерных сложных структур возникают и нелинейные структуры хранения данных. К ним можно отнести многомерные массивы, отображаемые деревьями, графами, сетями. Элемент многомерного массива также определяется индексом, однако индекс состоит из набора чисел. В основе формального представления многомерного прямоугольного массива лежит матрица, а в матрице каждое ее значение определяется совокупностью чисел, что и составляет индекс требуемого элемента массива.
Организация расположения данных может быть представлена на логическом уровне, при этом возникают логические структуры информационных массивов. Данные компонуются в виде записей, которые в информационном массиве могут располагаться различным образом. Выделяют четыре основные структуры информационных массивов на логическом уровне: последовательную, цепную, ветвящуюся, списковую.
В последовательной структуре записи информационного массива располагаются последовательно, нахождение требуемой записи осуществляется путем просмотра всех предшествующих. Включение новой записи в информационный массив требует смещения всех записей, начиная с той, которая включается. Обновление информационных массивов при последовательной структуре требует перезаписи всего массива.
В цепной структуре информационные массивы располагаются произвольно. Для логической связи отдельных записей необходима их адресация, т. е. каждая предыдущая запись логически связанного информационного массива должна содержать адрес расположения последующей записи. В случае, если с определенного уровня, т. е. признака, значения в записях повторяются в различных сочетаниях, то возможен переход в целях экономии памяти от цепной структуры к ветвящейся.
В ветвящейся структуре сначала в информационном массиве размещается запись, отображающая признак объекта с небольшим числом значений, далее эти значения повторяются в записях в различных сочетаниях, т. е. возможно от некоторой основной записи переходить к другим в зависимости от запроса, не повторяя основную запись. Чтобы устранить повторяющиеся записи и соответствующие им поля в памяти, их удаляют из основного массива и объединяют в дополнительный небольшой информационный массив. Здесь эти записи упорядочиваются также по какому-то признаку без повторений. Тогда в основном массиве вместо удаленного информационного поля указываются адреса записей, которые размещены в дополнительном массиве. Данная структура является удобной при реорганизации информационной базы, поскольку повторяющиеся записи легко могут быть заменены, так как они хранятся в дополнительном массиве, основной же массив подвергается при этом малому изменению. Однако эта структура требует дополнительного объема памяти.
Списковая структура информационных массивов характеризуется наличием списка, который содержит набор данных, определяющий логический порядок организации информационного массива. Список включает имя, поля данных и адреса полей. В памяти ЭВМ элементы списка физически разнесены, но связаны друг с другом логически за счет адресных ссылок. Поле данных в зависимости от характера хранимой информации может представляться двоичным разрядом, словом фиксированной либо переменной длины, а также набором отдельных слов. Формализовано список может быть представлен в виде таблицы, в которой именам списка и полям данных сопоставлены адреса. Адреса выбираются произвольно по мере наличия свободных мест в запоминающем устройстве.
Списковая структура с механизмом адресных ссылок может быть представлена в виде графа древовидной структуры. Каждый элемент списка тогда включает в себя маркерное поле, поле данных и адресное поле. Маркерное поле предупреждает, имеется ли ссылка на другой список либо такая ссылка отсутствует. В зависимости от этого в маркерном поле ставится знак минус или плюс. Списки могут отображать и более сложные структуры, чем древовидные. Они могут быть показаны ориентированными графами с петлями, в которых возможна ссылка вперед и назад. Возникает так называемый симметричный список, и появляется возможность движения в структуре данных в разных направлениях. Видно, что списковая структура отличается высокой логической простотой, но в связи с адресным обращением к данным время доступа здесь велико, так как каждому элементу списка необходимо иметь ссылку. Соответственно значительно возрастает и объем памяти запоминающего устройства (ЗУ), которую требуется иметь в списковой структуре по сравнению с последовательной структурой организации информационных массивов.
На физическом уровне любые записи информационного поля представляются в виде двоичных символов. Обращение к памяти большого объема требует и большой длины адреса.
Обработанная информация по требованию пользователя выводится из ЭВМ. Устройства вывода позволяют представить информацию в наглядном для пользователя виде либо выдать на носитель для длительного хранения. К типовым устройствам вывода обычно относят световые индикаторы, табло, дисплеи, печатающие устройства, графопостроители и др. На этих устройствах любой вид информации (буквенный, цифровой, графический) может быть представлен в наглядном и удобном для пользователя виде. Это позволяет значительно повысить эффективность работы оператора либо лица, принимающего решения.
Для автоматизации процесса вывода информации используют ее преобразование, кодирование и декодирование. Декодирование осуществляется автоматически за счет превращения двоичной информации в десятичную и в буквенный текст. Существующее типовое периферийное оборудование, а также специализированные устройства вывода позволяют в значительной степени автоматизировать процесс вывода и представления информации лицу, принимающему решение.
В целом информационный процесс при управлении производством является структурно сложным, включает ряд фаз, автоматизация которых реализуется за счет процедур преобразования и кодирования информации.