Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

7802

.pdf
Скачиваний:
0
Добавлен:
23.11.2023
Размер:
1.23 Mб
Скачать

21

доступ (актуализация) для сжатия (остальное запрещено);

доступ запрещен (запрещена актуализация без санкции). Информация не существует без других типов ресурсов энергии,

вещества, организации, как и они не могут существовать без информации. Любые взаимодействия систем (подсистем) – взаимодействия всегда материально- энергетически- информационные. Выявление (систематизация, структурирование), описание (формализация), изучение, применение инвариантов этих взаимодействий и составляет основную задачу информатики

как науки, как человеческой деятельности.

3.2. Методы получения, использования информации

Методы получения и использования информации можно разделить на три группы, иногда условно разграничиваемые.

1.Эмпирические методы или методы получения эмпирической информации (эмпирических данных).

2.Теоретические методы или методы получения теоретической информации (построения теорий).

3.Эмпирико - теоретические методы (смешанные,

полуэмпирические) или методы получения эмпирико-теоретической информации.

Охарактеризуем кратко эмпирические методы.

1.Наблюдение сбор первичной информации или эмпирических утверждений о системе (в системе).

2.Сравнение установление общего и различного в исследуемой системе или системах.

3.Измерение нахождение, формулирование эмпирических законов,

фактов.

4.Эксперимент целенаправленное преобразование исследуемой системы (систем) для выявления ее (их) свойств.

Кроме классических форм их реализации в последнее время используются и такие формы как опрос, интервью, тестирование и другие формы.

Охарактеризуем кратко эмпирико-теоретические методы.

1.Абстрагирование установление общих свойств и сторон объекта

(или объектов), замещение объекта или системы ее моделью. Абстракция в информатике и в математике играет важнейшую роль, понимается в двух следующих смыслах:

a.абстракция, абстрагирование метод исследования (изучения)

некоторых явлений, объектов, в результате которого можно выделить основные, наиболее важные для исследования свойства, стороны исследуемого объекта или явления и игнорировать несущественные и второстепенные;

b.абстракция как описание или представление объекта (явления), полученного с помощью метода абстрагирования. Особо важно и используемо

винформатике такое понятие, как абстракция потенциальной

22

осуществимости, которое позволяет нам исследовать конструктивно объекты, системы с потенциальной осуществимостью, т.е. они могли бы быть осуществимы, если бы не было ограничений по ресурсам (время, пространство, вещество, энергия, информация, организация, человек). Используются и

абстракция актуальной бесконечности - существования бесконечных,

неконструктивных множеств и систем, процессов, а также абстракция отождествления - возможности отождествления любых двух одинаковых букв, символов любого алфавита, объектов - независимо от места их появления

всловах, конструкциях, хотя их информационная ценность при этом может быть различна.

2.Анализ разъединение системы на подсистемы с целью выявления их взаимосвязей.

3.Синтез соединение подсистем в систему с целью выявления их взаимосвязей.

4.Индукция получение знания о системе по знаниям о подсистемах; индуктивное мышление распознавание эффективных решений, ситуаций и, затем, проблем, которые оно может разрешать.

5.Дедукция получение знания о подсистемах по знаниям о системе; дедуктивное мышление определение проблемы и поиск затем ситуации ее разрешающей.

6.Эвристика, использование эвристических процедур получение знания о системе по знаниям о подсистемах и наблюдениям, опыту.

7.Моделирование и/или использование приборов получение знания об объекте с помощью модели и/или приборов; моделирование основано на возможности выделять, описывать и изучать наиболее важные факторы и игнорировать при формальном рассмотрении второстепенные.

8.Исторический метод нахождение знаний о системе путем использования его предыстории - реально существовавшей или же мыслимой, возможной (виртуальной).

9.Логический метод метод нахождения знаний о системе путем воспроизведения его некоторых подсистем, связей или элементов в мышлении,

всознании.

10.Макетирование получение информации по макету объекта или системы, т.е. с помощью представления структурных, функциональных, организационных и технологических подсистем в упрощенном виде, сохраняющем информацию, необходимую для понимания взаимодействия и связей этих подсистем.

11.Актуализация получение информации с помощью активизации, инициализации ее, т.е. переводом из статического (неактуального) состояния в динамическое (актуальное) состояние; при этом все необходимые связи и отношения (открытой) системы с внешней средой должны быть учтены (именно они актуализируют систему).

12.Визуализация получение информации с помощью наглядного или визуального представления состояний актуализированной системы; визуализация предполагает возможность выполнения в системе операции типа

«передвинуть», «повернуть», «укрупнить», «уменьшить», «удалить»,

23

«добавить» и т.д. (как по отношению к отдельным элементам, так и к подсистемам системы), т.е. - это метод визуального восприятия информации.

Кроме указанных классических форм реализации теоретико- эмпирических методов в последнее время часто используются и такие формы как мониторинг (система наблюдений и анализа состояний системы), деловые игры и ситуации, экспертные оценки (экспертное оценивание), имитация

(подражание) и другие формы.

Охарактеризуем кратко теоретические методы.

1.Восхождение от абстрактного к конкретному получение знаний

осистеме на основе знаний о ее абстрактных проявлениях в сознании, в мышлении.

2.Идеализация получение знаний о системе или о ее подсистемах путем мысленного конструирования, представления в мышлении систем и/или подсистем, не существующих в действительности.

3.Формализация получение знаний о системе с помощью знаков или же формул, т.е. языков искусственного происхождения, например, языка математики (или математическое, формальное описание, представление).

4.Аксиоматизация получение знаний о системе или процессе с помощью некоторых, специально для этого сформулированных аксиом и правил вывода из этой системы аксиом, т.е. правил получения выводов, знаний из аксиом.

5.Виртуализация получение знаний о системе созданием особой среды, обстановки, ситуации (в которую помещается исследуемая система и/или ее исследующий субъект), которую реально без этой среды невозможно реализовать и получить соответствующие знания.

Все эти методы получения информации обычно применяются многоуровневым образом.

Пример. Для построения модели планирования и управления производством в рамках страны, региона, отрасли необходимо решить следующие проблемы:

1.определить структурные связи системы (как вертикальные, так и горизонтальные), уровни управления и принятия решений, ресурсы. При этом чаще используются методы наблюдения, сравнения, измерения, эксперимента, анализа и синтеза, дедукции и индукции, эвристический, исторический и логический, макетирование и др.;

2.определить гипотезы, цели, возможные проблемы планирования. Наиболее используемые при этом методы: наблюдение, сравнение, эксперимент, абстрагирование, анализ, синтез, дедукция, индукция, эвристический, исторический, логический и др.;

3.конструирование эмпирических моделей системы. Наиболее при этом используемые методы: абстрагирование, анализ, синтез, индукция, дедукция, формализация, идеализация и др.;

4.поиск решения проблемы планирования и просчет различных вариантов, директив планирования, поиск оптимального решения; используемые чаще методы: измерение, сравнение, эксперимент, анализ,

24

синтез, индукция, дедукция, актуализация, макетирование, визуализация, виртуализация и др.

3.3. Алфавит, слово, процесс, конструкция

Алфавитом называется любая совокупность символов (не обязательно букв некоторого языка общения), с помощью которых формируются сообщения, актуализируется информация.

Основные свойства любого алфавита:

компактность и конечность множества символов;

ясность (понятность слов в этом алфавите любому интерпретатору

с него);

информативность (символов, а особенно, слов над данным алфавитом);

уникальность (разные алфавиты имеют хотя бы один отличный

символ);

полнота (включает все символы для записи любого сообщения в данном алфавите).

Пример. Алфавит десятичных цифр, алфавит комбинаций точек и тире в азбуке Морзе, алфавит жестов у немых, алфавит китайских иероглифов, алфавит флажков у сигнальщиков на боевых кораблях.

Буквой или знаком называется любой элемент x конечного алфавита X, xX. Понятие знака неразрывно с тем, что им обозначается, они вместе могут рассматриваться как пара элементов (x,y), где x знак, y значение, обозначаемое этим знаком. Одни и те же знаки могут соответствовать различным понятиям.

Пример. Знак «+» может означать как операцию сложения чисел, так

иоперацию соединения текстов, знак «!» - соответствует понятиям: факториал, восклицание, опасность.

Из последнего примера видно, что не только элемент x определяет элемент y, но и элемент y может накладывать ограничения на x. Буквы алфавита существуют независимо от информации, которую можно актуализировать этим алфавитом, т.е. они символически самостоятельны, инвариантны.

Пример. Знак 5 как элемент алфавита арифметики несет смысловое значение - выражает количество, соответствующее пяти объектам, предметам. Знак Ы - как элемент алфавита русского языка уже не несет смысловой нагрузки - смысловое значение приобретает знак Ы в комбинации с другими символами, в соответствующей структуре, например, в слове СТУДЕНТЫ.

Информация это абстракция (математическая или семантическая) и внешне всегда проявляется в виде сообщения.

Пример. Десятичное число 9 выражает информацию о девяти объектах, а цифра 9 - выражение этого количества в виде символа алфавита десятичной системы. Отрезок АВ есть абстракция, соответствующая

25

множеству точек на числовой прямой, а отрезок [0,1] отождествляется с геометрическим отрезком (геометрическим местом точек) длины 1.

В алфавите должен быть определен порядок следования букв (типа

«предыдущий элемент последующий элемент») например, конечный алфавит

вида X={ x1, x1, ... , xn }.

Слово в алфавите X - любая конечная последовательность букв из x,

слово имеет вид: p=x1x2 ... xm, где xi X, i=1, 2, ..., m.

Длиной | p | слова p называется число составляющих его букв. Слово нулевой длины называется пустым словом: ||=0.

Разделителем слов называется один символ (несколько символов), отделяющий (отделяющих) последний символ предыдущего слова от первого символа последующего слова.

Множество различных слов над алфавитом X обозначим через S(X) и назовем словарным запасом (над алфавитом X).

Пример. Пусть X={a,1,2}, тогда словами над X будет а, аа, а112, 1111. Если считать разделителем слов знак пробела, то предложением над X будет

ааа а11 222аа. Длины слов: | a | = 1, | a112 | = | aa4a | = 4.

Один алфавит может быть информационно богаче другого. При этом не нужно иметь большой алфавит для того, чтобы получить большое множество слов над ним.

Пример. Алфавит китайских иероглифов богаче алфавита английского языка, но может быть беднее алфавита художественных образов (рисунков). Два различных знака (точка и тире) в алфавите Морзе и не более чем четырехсимвольная их комбинация позволяют передавать такую же информацию, что и алфавит русского языка.

Основная операция, которая определена в любом S(X) операция

конкатенации (присоединения) слов p, qS(X) в результате которого получаем слово s=p+q: к последнему символу слова p справа приписываются все символы q в том же порядке; иногда для удобства и четкости мы конкатенацию не будем обозначать никак, т.е. писать pq, а иногда обозначать как (pq).

Пример. Алфавит десятичной системы счисления: X={0, 1, 2, ..., 9}, p=10299, q=0001; алфавит десятичной арифметики: X={0, 1, 2, ..., 9, +, -, *,/, (,)}, p=12+131, q=2(133-9)/32; алфавит латинских букв: X={A, a, B, b, ... , Z , z}, p=Word; алфавит русского языка: X = {A, a, Б, б, ..., Я, я, -, . , ! , ? , , , : , ; , « , «,

...}, p=Республика Кабардино-Балкария, q=Лето. Жарко и светло.; алфавит азбуки Морзе: X ={. |. - |.--| --.|..- |.-.- |...}, p=|. -|.. -|- -..| - ..|.

Конкатенация может быть правая и левая, а также и двухсторонняя. Пример. Слова, а, следовательно, предложения русского языка

образуются правосторонней конкатенацией, а в арабском языке (письме) - левосторонней конкатенацией; в арифметике можно десятичные дроби образовывать двухсторонней конкатенацией (слева и справа от десятичной точки).

Действие (по отношению к некоторой системе) - изменение состояния системы.

Имеются два особых действия - начальное и финальное.

26

Процессом, определенным над некоторой операционной средой или алфавитом, назовем систему взаимосвязанных, структурированных, ресурсоориентированных действий от начального (стартового) до конечного (финального) событий.

Процесс всегда связан с выбором, актуализацией информации.

Реализация процесса это его выбор, актуализация действий для некоторого алфавита, операционной среды, ресурсов. Один и тот же процесс может быть реализован (актуализирован) различными способами - алфавитами, ресурсами. Реализация заключается в выполнении действий и в обмене ресурсами между ними и сопровождающихся построением правильной цепочки действий , приводящей к цели.

Конструктивизм, конструктивность процесса действий определим как приводимость (реализуемость) процесса от начального до конечного действия при любом допустимом входном наборе информации, т.е. возможность получения в результате выполнения этих действий результатов из заранее определенного выходного множества.

Конструктивный объект над множеством Х - объект, который можно построить с помощью некоторого конструктивного процесса над Х.

Пример. Построение решения квадратного уравнения для класса имен из одних четырех арифметических операций - не конструктивный процесс, а в классе имен, получаемом добавлением к ним операции (функции) извлечения корня до любой заданной степени точности (например, с помощью известного рекуррентного соотношения для вычисления квадратного корня) - конструктивный процесс.

При одинаковом наборе входной информации, все конструктивные процессы должны при реализации приводить к конструктивным объектам.

Процесс может быть последовательным, параллельным или смешанным - в зависимости от времени или пространства актуализация ресурса (вещества, энергии, информации).

Последовательный процесс (последовательно выполняемый процесс) - процесс, в котором каждое не особое действие является действием- предшественником или действием-преемником.

Конструктивным словообразующим процессом (процессом словообразования) называется процесс применения операции конкатенации к символам алфавита или к уже полученным в результате предыдущих конструктивных процессов словам над этим алфавитом.

Символы алфавита (их копии) могут участвовать в словообразовании сколь угодно раз. Любой процесс словообразования начинается с пустого символа (слова), к которому затем присоединяются другие символы (слова) алфавита.

Конструктивное описание конструктивного процесса словообразования будет выглядеть так:

1. Пустое слово - слово над любым алфавитом X.

2. Если s S(X), то словом над X будет слово y=sx (для правосторонней конкатенации) или y=xs (для левосторонней конкатенации).

27

Пример. Определим длину слова конструктивным процессом:

1.|| = 0 для любого алфавита X, S(X).

2.Если x X, а s S(X), то | (sx) | = | s | + 1.

Справедливо следующее очень важное утверждение.

Тезис Черча. Все разумные (непротиворечивые, понятные, реализуемые и т.д.) способы определения конструктивных объектов и процедур работы с ними эквивалентны.

Пример. Примеры в пользу этого утверждения: все корректные программы решения одних и тех же проблем эквивалентны по выходным результатам; все способы вычисления значений функции на одном и том же допустимом множестве эквивалентны по результатам; все разумные способы повышения производительности (или же эффективности) труда на предприятии эквивалентны, если мера производительности (или же эффективности) труда определена конструктивно, например, как отношение вида «добавленная стоимость на единицу продукции».

Если слова, образованные из символов (слов) x и y левой и правой конкатенацией, совпадают, то они коммутативны. Не для всяких алфавитов (или слов) верно правило коммутативности.

Пример. Если взять слова 102 и 201 над алфавитом N натуральных чисел, то они не коммутативны.

Конкатенация в каких-то алфавитах может удовлетворять правилам, аналогичным правилам действия в арифметике чисел, а в других алфавитах (или же в одном и том же алфавите) – не удовлетворять таким правилам.

3.4. Кодирование и декодирование

Кодом называется правило, описывающее соответствие данного набора знаков (входного алфавита Х или слов S(X)) другому набору знаков (Y или S(Y)). Слово «код» («code») произошло от слова «кодекс», «свод законов».

Кодирование - это представление символов одного алфавита сочетаниями символов другого алфавита. Преобразование сообщений (слов в алфавите), таким образом, сводится к процессу кодирования.

Пример. Пусть X=Z, Y ={0, 1, ... , 9, -}. Тогда запись любого целого числа из X представляет собой кодирование символов из X символами из Y.

Пример. Рассмотрим A={X,O}, B={(,)}. Тогда можно задать кодирование по принципу «визуальной аналогии», поставив в соответствие букве Х последовательность «)(« , а букве О - последовательность «()». Тогда слово ОХОХО над А закодируется как слово ())(())(() над В.

Пусть X={x1, x2, ... ,xn}, Y={y1, y2, ..., ym} - некоторые алфавиты. Кодирование произвольного сообщения x=x1x2 ... xp S(X) заключается в последовательном применении к Y преобразований R(x1 ): Y Y1 Y, R(x2 ): Y1 Y2 Y, ... , R(xp ): Yp-1 Yp Y.

Конечный результат Yp и будет являться кодом сообщения x.

Если это соответствие имеет однозначное обратное, то это обратное соответствие называется декодированием.

28

Пример. Рассмотрим так называемое арифметическое кодирование. Пусть заданы алфавиты X={x1, x2, ..., xn}, Y={y1, y2, ..., ym}. Например, Х - множество символов на клавиатуре ЭВМ, а Y - двоичный алфавит. Кодирование состоит в переводе произвольного слова, например, x=x1x2x5 над Х в элемент (слово, двоичное число y) над Y. Этот перевод осуществляется последовательными применениями к x преобразований R(x1), R(x2), R(x5). Каждое такое преобразование действует на подмножество Y и результат этого действия - новое подмножество Y. Конечный результат этой последовательности преобразований и является кодом х.

Расположение некоторого множества слов в соответствии с выбранным кодом называется упорядочиванием по коду. Упорядочение слов по символам некоторого данного алфавита называется лексикографическим упорядочиванием.

Пример. Слова «абрикос», «банан», «киви», «тыква» будут лексикографически упорядочены по входному алфавиту русского языка, а слова двоичного алфавита «101»,»011»,»010»,»100» - лексикографически неупорядочены.

Пример. Генетический код чрезвычайно сложная и упорядоченная система записи информации. Информация, заложенная в генетическом коде (по учению Дарвина), накапливалась многие тысячелетия. Хромосомные структуры своеобразный шифровальный код, и при клеточном делении создаются копии шифра, каждая хромосома удваивается, в каждой клетке имеется шифровальный код, при этом каждый человек получает, как правило, свой набор хромосом (код) от матери и от отца. Шифровальный код разворачивает процесс эволюции человека. Вся жизнь, как отмечал Э. Шредингер, «упорядоченное и закономерное поведение материи, основанное на существовании упорядоченности, которая поддерживается все время».

Правила кодирования (шифрования) не могут быть произвольными. Они должны быть такими, чтобы зашифрованное сообщение можно было бы прочесть (расшифровать). Однотипные правила (типа правила Цезаря) можно объединять в классы. Если внутри класса правил выбран некоторый параметр (числовой, табличный и т.д.), изменяя значения которого можно перебрать все правила, то он называется шифровальным ключом.

Имеются две группы шифров: шифры перестановки и шифры замены. Шифр перестановки изменяет только порядок следования символов

исходного сообщения.

Шифр замены заменяет каждый символ кодируемого сообщения на другие символы не изменяя порядка их следования.

Пример. Шифр Цезаря - шифр типа перестановки. Шифр состоящий в замене каждого символа алфавита русского языка его двухзначным порядковым номером - шифр типа замены.

Восстановление некоторого зашифрованного сообщения по ключу - расшифрование, а восстановление (прочтение) его без известного ключа -

вскрытие (взлом) шифра.

Кодирование и шифрование - разные вещи. При кодировании нет секретного ключа (достаточно знать соответствие символов), а при

29

шифровании необходимо наличие ключа (нужно знать как шифр, так и ключ к шифру). Кодирование не ставит основной целью недоступность для чтения, а ставит целью более сжатое, компактное и быстрое представление и преобразование текста. Шифрование ставит целью сделать сообщение недоступным для чтения без ключа к шифру.

Важной целью кодирования является сжатие сообщений. Пусть сообщение состоит из n символов и имеет вероятность р появления. Если это сообщение перекодировано в сообщение из m символов, то коэффициент сжатия сообщения равен k=m/n. Если рассматривать все l возможных кодировок n - символьных сообщений с вероятностями pi, i=1, 2,..., l, то среднестатистическое значение таких сообщений равно

Предел sn при n называется коэффициентом сжатия для данного метода (способа) кодирования.

Если при кодировании коды (кодовые слова) отличаются (по порядку кодирования) друг от друга (попарно) только одним символом кода, то такие коды называют одношаговыми кодами или кодами Грея.

Пример. АВС, АВВ, AАВ, САВ, ССВ - коды Грея некоторых слов.

Для того чтобы декодирование было возможно, необходимо выполнение условия Фано: никакое кодовое слово не является началом другого кодового слова.

Пример. Кодировку сообщения можно осуществить простой кодовой системой, называемой кодом Цезаря: каждый символ алфавита, на котором записано сообщение, заменяется другим, определенным символом этого же алфавита, например, отстоящим от него вторым символом алфавита. Этот несложный код можно расшифровать следующим образом: определяют относительные частоты символов закодированного текста, которые затем сравниваются с относительными частотами кодирующего текста; по совпадению этих частот устанавливаются соответствия символов (шифр).

Пример. Закодируем, например, текст «Ясная погода» кодом Цезаря, устанавливая соответствия вида: «а» - «б», «б» - «в», «в» - «г» и т.д. Закодированный текст будет иметь вид: «Атоба рпдпеб».

Если задан алфавит Х некоторых кодируемых сообщений, то

расстоянием (Хэмминга) между двумя словами y1, y2 Y=S(X) называется число d=d(y1,y2) несовпадений в соответствующих позициях этих слов. Если слова закодированы в двоичном алфавите, то расстояние Хэмминга - это количество двоичных символов, в которых кодовые слова поразрядно не совпадают.

Пример. Если дан алфавит Х={0, 1} и слова x1=11001, x2=0101, х3= , то расстояния d(x1,x2 )= d(x2,x1 )=3, d(x1, x3)=5.

Коды делятся на классы: коды с обнаружением и коды с исправлением ошибок.

30

Пример. Код, который проверяет передаваемое или принимаемое сообщение на четность (в конце кодового слова передается признак четности или нечетности числа символов закодированного сообщения, а при приеме этот избыточный признак четности проверяется) - код с обнаружением ошибок. Код с двух- или трехкратным повторением символов (групп символов) передаваемого сообщения - код с исправлением (исправление - по максимуму одинаковых символов на соответствующих позициях передаваемых одинаковых групп слов). Контроль четности не может служить надежным способом защиты от искажений (шумов) в кодируемых сообщениях, ибо они с одинаковым успехом могут воспроизводить также и помехи.

Пример. Искажения в четном числе разрядов не могут быть обнаружены при проверке кода на четность. Кратность обнаруживаемых искажений двоичных цифр в коде символа зависит от расстояния между словами. Этим, в частности, объясняется тот факт, что при увеличении скорости речи (примерно до 30 букв в сек. или до 40 бит в сек.) речь перестает быть воспринимаемой. Так называемое число Страуда (мысленных различий в сек.) лежит в пределах приблизительно 8-20 символов в сек.

Отметим две важные теоремы (без доказательства).

Теорема 1. Для того чтобы код позволял обнаруживать ошибки в не более m позициях кодового сообщения, необходимо и достаточно, чтобы наименьшее расстояние между кодовыми словами было не меньше m+1.

Теорема 2. Для того чтобы код позволял исправлять все ошибки в не более чем m позициях, необходимо и достаточно, чтобы наименьшее расстояние между кодовыми словами было не меньше 2m+1.

3.5. Основная проблема информатики

Основная проблема информатики отыскание, построение,

исследование или применение функции (закона, правила) f, переводящей некоторый входной алфавит Х или совокупность слов S(X) (в которых формируются конкатенацией вопросы, ставятся условия задач) в выходной алфавит Y или совокупность слов S(Y) (в которых формируются ответы и решения).

Сообщение и информация это некоторые слова (предложения) в

различных алфавитах. Отношение между ними представимо следующим образом: сообщение - конкретная форма передачи информации, которая может быть и абстрактной. Это соответствие между сообщением и информацией не всегда взаимооднозначное: одна и та же информация может быть передана различными сообщениями.

Информация - содержание сообщения, сообщение - форма проявления или актуализации информации. Информация всегда имеет носитель, передача (актуализация) информации связана с изменением носителя, ресурсов.

31

Информация абстрактный носитель, сообщение конкретный

носитель (или представитель) некоторых знаний, сведений. Сообщение это

внешнее проявление информации, ее внутренней сущности. Информация существует независимо от источника (приемника, преобразователя, интерпретатора информации), а сообщения всегда «привязаны» к тому или иному источнику (приемнику, преобразователю или интерпретатору). Изменение, например, приемника может искажать суть информации.

Пример. Сведения о сути товара могут быть изложены в рекламе, передаваемой различными сообщениями (по телевидению, по радио, в газете и т.д.). При этом соответствие этой рекламы действительности может быть независимо от типа сообщений, т.е. имеется третья сторона информации (кроме ее абстрактной сущности, ее представления сообщениями) - соответствие сведений заложенных в информации с проявлениями реальной системы.

3.6. Измерение сообщений. Бит, байт, слово

Если отвлечься от конкретного смыслового содержания информации и рассматривать сообщения информации как последовательности знаков, сигналов, то их можно представлять (кодировать) битами, а измерять в байтах, килобайтах, мегабайтах и гигабайтах.

Соотношения между ними таковы:

1 бит (от слова binary digit - двоичная единица) - это 0 или 1, 1 байт = 8 битов, например, байт вида 10001110, 1 килобайт (1К) = 1024 байтов, или 210 байтов, или 213 бит,

1 мегабайт (1М)= 1024 К, или 210 К, или 220 байт, или 223 бит,

1 гигабайт (1Г) = 1024 М = 210 М = 220 К = 230 байт = 233 бит.

Используют (редко) и более крупные единицы информации:

1 терабайт (1Т) = 1024 Г = 220 М = 230 К = 240 байт = 243 бит. 1 петабайт (1П) = 1024 Т = 230 М = 240 К = 250 байт = 253 бит.

В информатике «кило» принято считать равным 1024=210. Используются и такие единицы измерения (точнее, минимальные

объекты данных), как полуслово, слово или двойное слово, но в основном тогда, когда информация представлена в ЭВМ. Слово обычно равно байту. Два подряд идущих слова называется двойным словом. Адрес слова, полуслова, двойного слова, при их размещении в какой-нибудь структуре памяти, например, в памяти компьютера, определяется по адресу самого левого байта, первого в записи данного слова. Слово, полуслово и двойное слово вводятся для удобства хранения данных в ЭВМ, так как они, например, позволяют экономить память, используемую под адресацию этих данных.

Контрольные вопросы:

1.Понятие информации, виды информации.

2.Охарактеризуйте методы получения информации.

3.Дайте определение алфавита.

32

4.Принципы кодирования и декодирования.

5.Измерение сообщений. Бит, байт, слово.

4.Общая характеристика процессов сбора, передачи, обработки и

хранения информации

4.1. Восприятие информации

Восприятие информации процесс преобразования сведений, поступающих в техническую систему или живой организм из внешнего мира, в форму, пригодную для дальнейшего использования. Благодаря восприятию информации обеспечивается связь системы с внешней средой (в качестве которой могут выступать человек, наблюдаемый объект, явление или процесс и т.д.). Восприятие информации необходимо для любой информационной системы, коль скоро она претендует на какую-либо полезность.

Современные информационные системы, создаваемые на базе ЭВМ, в качестве своей составной части имеют более или менее (в зависимости от цели системы) развитую систему восприятия. Система восприятия информации может представлять собой довольно сложный комплекс программных и технических средств. Для развитых систем восприятия можно выделить несколько этапов переработки поступающей информации: предварительная обработка для приведения входных данных к стандартному для данной системы виду, выделение в поступающей информации семантически и прагматически значимых информационных единиц, распознавание объектов и ситуаций, коррекция внутренней модели мира. В зависимости от анализаторов (входящих в комплекс технических средств системы восприятия) организуется восприятие зрительной, акустической и других видов информации. Кроме того, различают статическое и динамическое восприятие. В последнем случае особо выделяют системы восприятия, функционирующие в том же темпе, в каком происходят изменения в окружающей среде. Важнейшей проблемой восприятия информации является проблема интеграции информации, поступающей из различных источников и от анализаторов разного типа в пределах одной ситуации. Кратко рассмотрим процесс восприятия наиболее важного вида информации зрительной.

Можно выделить несколько уровней зрительного восприятия:

1.Получение изображения, поступающего от рецепторов. Как правило, к ЭВМ подключают специальные устройства цифрового ввода изображения, в которых яркость каждой точки изображения кодируется одним или несколькими двоичными числами.

2.Построение образной модели. На этом уровне с помощью специально разработанных алгоритмов происходит обнаружение объектов в описании сцены и разбиение изображений на значимые сегменты. Эффективность алгоритмов анализа сцен определяет скорость работы системы восприятия.

33

Работа анализатора - цифровой ввод изображения

Далее возмож- но, например, обраще ние к словарю систе- мы для обнару- жения в нем счи- танного слова и определение его семантики

Распозна-

вание об-

(21,8) разов

Порядковые но- мера букв в рус- ском алфавите

Анализ

сцены

2-й зна- 1-й зна- чимый чимый сегмент сегмент изобра- изобра- жения жения

Рис. 4.1. Работа системы зрительного восприятия текстовой информации

3. Построение образно-семантической модели. На этом уровне за счет информации, имеющейся во внутренней модели внешнего мира, и за счет знаний, хранящихся в ней, опознаются выделенные на предшествующем уровне объекты и между ними устанавливаются пространственные, временные и другие виды отношений. В технических системах на этом уровне восприятия используются методы распознавания образов. Полученные знания о текущей ситуации могут использоваться в дальнейшей работе. Иллюстрацией к описанию уровней восприятия может служить рис. 4.1, поясняющий в общих чертах работу системы зрительного восприятия текстовой информации.

С точки зрения информационной системы в целом, система восприятия осуществляет первичную обработку собираемой извне информации.

В свою очередь, для системы восприятия первичную обработку информации производит система сбора информации. Нередко на практике встречаются информационные системы, не обладающие развитой системой восприятия информации (из-за отсутствия необходимости в таковой). В последнем случае система восприятия представляет собой просто систему сбора информации. Вопросам сбора информации и посвящен следующий параграф.

4.2. Сбор информации

Из изложенного выше легко сделать вывод, что система сбора информации может представлять собой сложный программно-аппаратный комплекс. Как правило, современные системы сбора информации не только обеспечивают кодирование информации и ее ввод в ЭВМ, но и выполняют

34

предварительную (первичную) обработку этой информации. Сбор информации

это процесс получения информации из внешнего мира и приведение ее к виду, стандартному для данной информационной системы. Обмен информацией между воспринимающей информацию системой и окружающей средой осуществляется посредством сигналов.

Сигнал можно определить как средство перенесения информации в пространстве и времени. В качестве носителя сигнала могут выступать звук, свет, электрический ток, магнитное поле и т.п. Подобно живым организмам, воспринимающим сигналы из внешней среды с помощью специальных органов (обоняния, осязания, слуха, зрения), технические системы для приема сигналов из окружающего мира оснащаются специальными устройствами.

Вне зависимости от носителя информации (сигнала) типичный процесс обработки сигнала может быть охарактеризован следующими шагами. На первом шаге исходный (первичный) сигнал с помощью специального устройства (датчика) преобразуется в эквивалентный ему электрический сигнал (электрический ток). На втором шаге вторичный (электрический) сигнал в некоторый выделенный момент времени оцифровывается специальным устройством аналого-цифровым преобразователем (АЦП). АЦП значению электрического сигнала ставит в соответствие некоторое число из конечного множества таких чисел. Таким образом, датчик и АЦП, связанные вместе, составляют цифровой измерительный прибор. Если этот прибор оснастить некоторым устройством для хранения измеренной величины

регистром, то на следующем шаге по команде от ЭВМ можно ввести это число в машину и подвергать затем любой необходимой обработке.

Конечно, не все технические средства сбора информации работают по описанной схеме. Так, клавиатура, предназначенная для ввода алфавитно- цифровой информации от человека, не имеет в своем составе АЦП. Здесь первичный сигнал нажатие клавиши непосредственно преобразуется в соответствующий нажатой клавише цифровой код. Но в любом случае будь то цифровой измерительный прибор, клавиатура или иное устройство ввода информации в ЭВМ, в конечном счете поступающая в ЭВМ информация представлена в виде цифрового кода двоичного числа. Современные системы сбора информации (например, в составе автоматизированных систем управления) могут включать в себя большое количество (тысячи) цифровых измерительных приборов и всевозможных устройств ввода информации (от человека в ЭВМ, от ЭВМ к ЭВМ и т.п.). Такое комплексирование средств приводит к необходимости управления процессом сбора информации и к разработке соответствующего программного (и аппаратного) обеспечения. Совокупность технических средств ввода информации в ЭВМ, программ,

управляющих всем комплексом технических средств, и программ, обеспечивающих ввод информации с отдельных устройств ввода (драйверов устройств), — вот что представляет собой современная развитая система сбора информации.

Так как информация очень разнообразна по содержанию и виду обслуживаемой ею человеческой деятельности (научная, производственная, управленческая, медицинская, экономическая, экологическая, правовая и др.),

35

то каждый вид информации имеет свои особенные технологии обработки, смысловую ценность, формы представления и отображения на физическом носителе, требования к точности, достоверности, оперативности отражения фактов, явлений, процессов. Технология обработки информации с применением комплекса технических средств вызывает необходимость манипулировать с отдельными информационными элементами, обеспечивать их изучение и формализованное описание, идентификацию для удобства обработки, хранения и передачи. Информация, представленная в формализованном виде, получила название данные.

Информация, являясь сложным по структуре образованием, размещается на физических носителях (бумажных или магнитных документах, в виде сигналов, передаваемых по каналам связи) и может находиться в статичном или динамичном состояниях. Статичное состояние информации связано с ее более или менее длительным организованным хранением, накоплением в информационных фондах и базах данных (БД). Под базой данных понимается вся необходимая для решения задач конкретной области совокупность данных, организованная по определенным правилам, позволяющим обеспечить независимость данных от прикладных программ, удобство хранения, поиска, манипулирования данными, которые записаны на машинных носителях. При этом каждый элемент строго идентифицируется для автоматизации процесса поиска, пополнения, обновления данных. Динамичное состояние постоянное движение в виде потоков присуще информации, реализующей в человеко-машинных, автоматизированных системах функцию обмена сведениями с помощью знаковых символов. Приведенные особенности информации тщательно изучаются при создании систем автоматизированной обработки в процессе ее синтаксического, семантического и прагматического анализа.

Синтаксический анализ устанавливает важнейшие параметры информационных потоков, включая необходимые количественные характеристики, для выбора комплекса технических средств сбора, регистрации, передачи, обработки, накопления и хранения информации.

Семантический анализ позволяет изучить информацию с точки зрения смыслового содержания ее отдельных элементов, находить способы языкового соответствия (язык человека, язык ЭВМ) при однозначном распознавании вводимых в систему сообщений.

Прагматический анализ проводится с целью определения полезности информации, используемой для управления, выявления практической значимости сообщений, применяемых для выработки управляющих воздействий. Учитывая, что полезность информации является функцией времени и что одна и та же информация в разное время может быть полезной либо бесполезной в зависимости от того, сколько новых сообщений об управляемом объекте она несет пользователю, принятые критерии оценки увязываются с достоверностью и своевременностью поступающих сообщений.

Информация, которая обслуживает процессы производства, распределения, обмена и потребления материальных благ и обеспечивает решение задач организационно-экономического управления народным

36

хозяйством и его звеньями, называется управленческой. Это разнообразные сведения экономического, технологического, социального, юридического, демографического и другого содержания. В информационном процессе, каким является управленческая деятельность, информация выступает как один из возможных ресурсов наряду с энергетическими, материальными, трудовыми, финансовыми. В технологии обработки первичные сведения о производственных и хозяйственных операциях, людях, выпуске продукции, фактах приобретения и продажи товаров выполняют роль предметов труда, а получаемая результатная информация продукта труда; она используется для анализа и принятия управленческих решений. Важнейшей составляющей управленческой информации является информация экономическая, которая отражает социально-экономические процессы как в сфере производства, так и в непроизводственной сфере, во всех органах и на всех уровнях отраслевого регионального управления. Рассмотрим особенности управленческой информации, в частности экономической, оказывающие влияние на организацию ее автоматизированной обработки.

Экономическая информация отражает акты производственно- хозяйственной деятельности с помощью системы натуральных и стоимостных показателей. Во всех случаях при этом используются количественные величины, цифровые значения. Эта особенность экономической информации предопределяет возможность широкого применения вычислительной техники в экономике. Следующей отличительной чертой экономической информации является ее цикличность. Для большинства производственных и хозяйственных процессов характерна повторяемость составляющих их стадий

иинформации, отражающей процессы. Цикличность экономической информации позволяет, однажды создав программу машинного счета, многократно использовать её. Это значительно упрощает проектирование автоматизированной обработки данных. Важное значение для обработки имеет форма представления информации. Экономическая информация непременно отражается в материальных носителях: в первичных и сводных документах, в машинных носителях (в магнитных лентах и дисках, в перфолентах), передается по каналам связи. Для повышения достоверности ведутся передача

иобработка лишь юридически оформленной информации (при наличии подписи на документе или на электронном сообщении, указанного кода, передающего сообщения и т.п.). Отличительной чертой экономической информации является ее объемность. Качественное управление экономическими процессами невозможно без детальной информации о них. Совершенствование управления и возрастание объемов производства сопровождаются увеличением сопутствующих ему информационных потоков. Экономические показатели описывают разные сущности как простые, так и сложные. Каждая сущность (объект, явление, процесс) имеет определенные свойства. Например, материал обладает весом, габаритами, имеет цену, относится к конкретному виду материальных ресурсов и т.п. Совокупность сведений, отражающих какую-либо сущность, называют информационной совокупностью. В зависимости от степени общности рассматриваемого объекта информационные совокупности могут быть разного уровня, иметь

37

иерархическую структуру. Данные о поставщике, например, включают его имя и адрес, номенклатуру поставляемой продукции, условия поставки, фактические сведения о произведенных поставках и т.д.

Степень детализации информационных совокупностей, однако, небеспредельна. Информационная совокупность, неделимая далее на более мелкие смысловые единицы, получила название реквизита по аналогии с реквизитом документа, как наиболее часто используемым в экономической работе носителем информации. Синонимами термина «реквизит» являются слово, элемент данных, атрибут, которыми пользуются при описании информационных систем и для определения объемов экономической информации в качестве единиц измерения.

Различают два вида реквизитов: реквизиты-признаки и реквизиты- основания. Первые характеризуют качественные свойства отражаемых сущностей. Вторые представляют собой количественные величины, характеризующие данную сущность.

Сочетание одного реквизита-основания с одним или несколькими соответствующими ему реквизитами-признаками образует показатель. Показатель качественно определенная величина, дающая количественную характеристику отображаемому объекту (явлению, предмету, процессу). Показатель является информационной совокупностью наименьшего состава, достаточной для образования самостоятельного сообщения или формирования документа. Например, информационная совокупность «500 т стали» состоит из реквизита-основания «500» и реквизитов-признаков — «т» и «сталь», что вполне отражает экономический смысл сообщения и потому является показателем.

Не следует думать, однако, что реквизиты-основания обязательно представляют в числовой форме, а реквизиты-признаки в текстовой. Важна не форма представления (цифровая или символьная), а то, какое свойство сущности (количественное или качественное) данный реквизит отражает. В любом документе каждый реквизит помимо его значения имеет определенное наименование.

Умение определить количество и состав реквизитов в документе позволяет оценить его уровень информативности, рассчитать при необходимости объемы информации. Зная максимальную разрядность каждого реквизита, легко определить объем информации в документе; зная число таких документов, можно рассчитать общий объем информации.

Информацию, циркулирующую в любом экономическом объекте, можно рассматривать с разных точек зрения в зависимости от целей анализа. Классификация экономической информации позволяет выделять определенные группы данных, применительно к которым производится изучение информационных потоков.

Наиболее общим направлением классификации экономической информации можно считать ее деление по таким признакам, как место возникновения, участие в процессах обработки и хранения, отношение к функциям управления, стабильность, способ отражения. Рассмотрим, как подразделяется экономическая информация по этим направлениям

38

классификации.

Для управления любым экономическим объектом необходимо располагать и манипулировать определенными сведениями о его фактическом и желаемом состояниях. Совокупность информации конкретного экономического объекта образует информационную систему, в которой различают входящую, исходящую, внутреннюю и внешнюю информацию.

Информацию, поступающую в информационную систему, называют входящей. Информационная система, обрабатывая входящие данные,

порождает новую результатную информацию (сводную). Передаваемая за пределы данной информационной системы информация называется исходящей. Если сведения поступают в информационную систему от объектов управления, то такая информация будет входящей внутренней, если из внешнего мира (например, для предприятий из министерства, от других организаций), информация называется входящей внешней.

Аналогичным образом подразделяются и выходящие сведения. Входящую внутреннюю информацию в условиях предприятия называют первичной. Она возникает в процессе первичного учета хозяйственных операций измерение и регистрация данных в ходе производственной деятельности объекта управления.

По критерию соответствия отражаемым явлениям экономическая информация может быть отнесена к достоверной и недостоверной. К этому классификационному признаку примыкает оценка своевременности и несвоевременности информационного отображения производственных и хозяйственных операций, получения исходной и результатной информации в установленные сроки.

По отношению к процессам обработки и хранения различают следующие виды экономической информации: исходную, производственную,

хранимую без обработки, результатную, промежуточную.

С точки зрения отражаемых функций управления экономическая формация подразделяется на: плановую, прогнозную, нормативную, конструкторско-технологическую, учетную, финансовую.

Важное значение, особенно при создании машинных информационных систем, имеет подразделение информации в зависимости от степени стабильности на постоянную (условно-постоянную) и переменную. Первая остается без изменений или же подвергается незначительным корректировкам в течение более или менее длительного периода времени. Это различные справочные сведения, нормативы и расценки и т.п. Переменная информация отражает результаты выполнения производственно- хозяйственных операций, соответствует их динамизму и, как правило, участвует в одном технологическом цикле машинной обработки.

Для оценки уровня стабильности информации используют коэффициент стабильности Кст, рассчитываемый по формуле

Кст

=

ИСобщ ИСизм

,

 

 

 

ИСобщ

39

где ИСобщ общее число информационных совокупностей; ИСизм число информационных совокупностей, изменивших свои значения за рассматриваемый период (год).

Обычно, если значение коэффициента стабильности не ниже 0,85 (Кст = 0,85), информационную совокупность принято считать условно-постоянной.

Большую часть условно-постоянной информации при использовании вычислительной техники рекомендуется хранить на машинных носителях. При этом отпадает необходимость включать эти реквизиты в состав показателей первичного документа, за счет чего можно значительно упростить их формы, сократить трудоемкость заполнения. Использование массивов условно- постоянной информации в технологии автоматизированной o6работки данных обеспечивает повышение достоверности результатной информации, позволяет дополнять ее необходимыми справочными сведениями и тем самым более углубленно и разносторонне охарактеризовать объект, процесс, явление.

Информационная технология решения задач включает следующие важнейшие процедуры, которые могут быть сгруппированы по функционально-временным стадиям: сбор и регистрация информации, передача ее к месту обработки, машинное кодирование данных, хранение и поиск, вычислительная обработка, тиражирование информации, использование информации, т.е. принятие решений и выработка управляющих воздействий.

Как правило, информация подвергается всем процедурам преобразования, но в ряде случаев некоторые процедуры могут отсутствовать. Последовательность их выполнения также бывает различной, но при этом некоторые процедуры могут повторяться. Состав процедур преобразования и особенности их выполнения во многом зависят от экономического объекта, ведущего автоматизированную обработку информации. Рассмотрим особенности выполнения основных процедур преобразования информации.

Сбор и регистрация информации происходят по-разному в различных экономических объектах. Наиболее сложна эта процедура в автоматизированных управленческих процессах промышленных предприятий, фирм и т.п., где производятся сбор и регистрация первичной учетной информации, отражающей производственно-хозяйственную деятельность объекта.

Особое значение при этом придается достоверности, полноте и своевременности первичной информации. На предприятии сбор и регистрация информации происходят при выполнении различных хозяйственных операций (прием готовой продукции, получение и отпуск материалов и т.п.). Сначала информацию собирают, затем ее фиксируют. Учетные данные могут возникать на рабочих местах в результате подсчета количества обработанных деталей, прошедших сборку узлов, изделий, выявление брака и т.д. Для сбора фактической информации производят измерение, подсчет, взвешивание материальных объектов, получение временных и количественных характеристик работы отдельных исполнителей. Сбор информации, как правило, сопровождается ее регистрацией, т.е. фиксацией информации на материальном носителе (документе или машинном носителе). Запись в

40

первичные документы в основном, осуществляется вручную, поэтому процедуры сбора и регистрации остаются пока наиболее трудоемкими. В условиях автоматизации управления предприятием особое внимание придается использованию технических средств сбора и регистрации информации, совмещающих операции количественного измерения, регистрации, накоплению и передач информации по каналам связи в ЭВМ с целью формирования первичного документа.

4.3. Передача информации

Необходимость передачи информации для различных объектов обосновывается по-разному. Так, в автоматизированной системе управления предприятием она вызвана тем, что сбор и регистрация информации редко территориально отделены от ее обработки. Процедуры сбора и регистрации информации, как правило, осуществляются на рабочих местах, а обработка в вычислительном центре. Передача информации осуществляется различными способами: с помощью курьера, пересылка по почте, доставка транспортными средствами, дистанционная передача по каналам связи. Дистанционная передача по каналам связи сокращает время передачи данных. Для ее осуществления необходимы специальные технические средства. Некоторые технические средства сбора и регистрации, собирая автоматически информацию с датчиков, установленных на рабочих местах, передают ее в ЭВМ.

Взаимодействие между территориально удаленными объектами осуществляется за счет обмена данными. Доставка данных по заданному адресу производится с использованием сетей передачи данных. В современных условиях большое распространение получила распределенная обработка информации, при этом сети передачи данных превращаются в информационно-

вычислительные сети. Информационно-вычислительные сети (ИВС)

представляют наиболее динамичную и эффективную отрасль автоматизированной технологии процессов ввода, передачи, обработки и выдачи информации. Важнейшим звеном ИВС является канал передачи данных, структурная схема которого представлена на рис. 4.2.

Рис. 4.2. Структурная схема канала передачи данных: УПД устройство подготовки данных; НКС непрерывный канал связи; ДКС дискретный канал связи; УПДс устройство повышения достоверности

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]