Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

8251

.pdf
Скачиваний:
0
Добавлен:
24.11.2023
Размер:
1.48 Mб
Скачать

21

доступ (актуализация) для сжатия (остальное запрещено);

доступ запрещен (запрещена актуализация без санкции). Информация не существует без других типов ресурсов – энергии,

вещества, организации, как и они не могут существовать без информации. Любые взаимодействия систем (подсистем) – взаимодействия всегда материальноэнергетическиинформационные. Выявление (систематизация, структурирование), описание (формализация), изучение, применение инвариантов этих взаимодействий и составляет основную задачу информатики

– как науки, как человеческой деятельности.

3.2. Методы получения, использования информации

Методы получения и использования информации можно разделить на три группы, иногда условно разграничиваемые.

1.Эмпирические методы или методы получения эмпирической информации (эмпирических данных).

2.Теоретические методы или методы получения теоретической информации (построения теорий).

3.Эмпирико - теоретические методы (смешанные,

полуэмпирические) или методы получения эмпирико-теоретической информации.

Охарактеризуем кратко эмпирические методы.

1.Наблюдение – сбор первичной информации или эмпирических утверждений о системе (в системе).

2.Сравнение – установление общего и различного в исследуемой системе или системах.

3.Измерение – нахождение, формулирование эмпирических законов,

фактов.

4.Эксперимент – целенаправленное преобразование исследуемой системы (систем) для выявления ее (их) свойств.

Кроме классических форм их реализации в последнее время используются и такие формы как опрос, интервью, тестирование и другие формы.

Охарактеризуем кратко эмпирико-теоретические методы.

1.Абстрагирование – установление общих свойств и сторон объекта (или объектов), замещение объекта или системы ее моделью. Абстракция в информатике и в математике играет важнейшую роль, понимается в двух следующих смыслах:

a. абстракция, абстрагирование – метод исследования (изучения)

некоторых явлений, объектов, в результате которого можно выделить основные, наиболее важные для исследования свойства, стороны исследуемого объекта или явления и игнорировать несущественные и второстепенные;

b. абстракция – как описание или представление объекта (явления), полученного с помощью метода абстрагирования. Особо важно и используемо

в информатике такое понятие, как абстракция потенциальной

22

осуществимости, которое позволяет нам исследовать конструктивно объекты, системы с потенциальной осуществимостью, т.е. они могли бы быть осуществимы, если бы не было ограничений по ресурсам (время, пространство, вещество, энергия, информация, организация, человек). Используются и

абстракция актуальной бесконечности - существования бесконечных,

неконструктивных множеств и систем, процессов, а также абстракция отождествления - возможности отождествления любых двух одинаковых букв, символов любого алфавита, объектов - независимо от места их появления

всловах, конструкциях, хотя их информационная ценность при этом может быть различна.

2.Анализ – разъединение системы на подсистемы с целью выявления их взаимосвязей.

3.Синтез – соединение подсистем в систему с целью выявления их взаимосвязей.

4.Индукция – получение знания о системе по знаниям о подсистемах; индуктивное мышление – распознавание эффективных решений, ситуаций и, затем, проблем, которые оно может разрешать.

5.Дедукция – получение знания о подсистемах по знаниям о системе; дедуктивное мышление – определение проблемы и поиск затем ситуации ее разрешающей.

6.Эвристика, использование эвристических процедур – получение знания о системе по знаниям о подсистемах и наблюдениям, опыту.

7.Моделирование и/или использование приборов – получение знания об объекте с помощью модели и/или приборов; моделирование основано на возможности выделять, описывать и изучать наиболее важные факторы и игнорировать при формальном рассмотрении второстепенные.

8.Исторический метод – нахождение знаний о системе путем использования его предыстории - реально существовавшей или же мыслимой, возможной (виртуальной).

9.Логический метод – метод нахождения знаний о системе путем воспроизведения его некоторых подсистем, связей или элементов в мышлении,

всознании.

10.Макетирование – получение информации по макету объекта или системы, т.е. с помощью представления структурных, функциональных, организационных и технологических подсистем в упрощенном виде, сохраняющем информацию, необходимую для понимания взаимодействия и связей этих подсистем.

11.Актуализация – получение информации с помощью активизации, инициализации ее, т.е. переводом из статического (неактуального) состояния в динамическое (актуальное) состояние; при этом все необходимые связи и отношения (открытой) системы с внешней средой должны быть учтены (именно они актуализируют систему).

12.Визуализация – получение информации с помощью наглядного или визуального представления состояний актуализированной системы; визуализация предполагает возможность выполнения в системе операции типа

«передвинуть», «повернуть», «укрупнить», «уменьшить», «удалить»,

23

«добавить» и т.д. (как по отношению к отдельным элементам, так и к подсистемам системы), т.е. - это метод визуального восприятия информации.

Кроме указанных классических форм реализации теоретикоэмпирических методов в последнее время часто используются и такие формы как мониторинг (система наблюдений и анализа состояний системы), деловые игры и ситуации, экспертные оценки (экспертное оценивание), имитация

(подражание) и другие формы.

Охарактеризуем кратко теоретические методы.

1.Восхождение от абстрактного к конкретному – получение знаний

осистеме на основе знаний о ее абстрактных проявлениях в сознании, в мышлении.

2.Идеализация – получение знаний о системе или о ее подсистемах путем мысленного конструирования, представления в мышлении систем и/или подсистем, не существующих в действительности.

3.Формализация – получение знаний о системе с помощью знаков или же формул, т.е. языков искусственного происхождения, например, языка математики (или математическое, формальное описание, представление).

4.Аксиоматизация – получение знаний о системе или процессе с помощью некоторых, специально для этого сформулированных аксиом и правил вывода из этой системы аксиом, т.е. правил получения выводов, знаний из аксиом.

5.Виртуализация – получение знаний о системе созданием особой среды, обстановки, ситуации (в которую помещается исследуемая система и/или ее исследующий субъект), которую реально без этой среды невозможно реализовать и получить соответствующие знания.

Все эти методы получения информации обычно применяются многоуровневым образом.

Пример. Для построения модели планирования и управления производством в рамках страны, региона, отрасли необходимо решить следующие проблемы:

1.определить структурные связи системы (как вертикальные, так и горизонтальные), уровни управления и принятия решений, ресурсы. При этом чаще используются методы наблюдения, сравнения, измерения, эксперимента, анализа и синтеза, дедукции и индукции, эвристический, исторический и логический, макетирование и др.;

2.определить гипотезы, цели, возможные проблемы планирования. Наиболее используемые при этом методы: наблюдение, сравнение, эксперимент, абстрагирование, анализ, синтез, дедукция, индукция, эвристический, исторический, логический и др.;

3.конструирование эмпирических моделей системы. Наиболее при этом используемые методы: абстрагирование, анализ, синтез, индукция, дедукция, формализация, идеализация и др.;

4.поиск решения проблемы планирования и просчет различных вариантов, директив планирования, поиск оптимального решения; используемые чаще методы: измерение, сравнение, эксперимент, анализ,

24

синтез, индукция, дедукция, актуализация, макетирование, визуализация, виртуализация и др.

3.3. Алфавит, слово, процесс, конструкция

Алфавитом называется любая совокупность символов (не обязательно букв некоторого языка общения), с помощью которых формируются сообщения, актуализируется информация.

Основные свойства любого алфавита:

компактность и конечность множества символов;

ясность (понятность слов в этом алфавите любому интерпретатору

с него);

информативность (символов, а особенно, слов над данным алфавитом);

уникальность (разные алфавиты имеют хотя бы один отличный

символ);

полнота (включает все символы для записи любого сообщения в данном алфавите).

Пример. Алфавит десятичных цифр, алфавит комбинаций точек и тире в азбуке Морзе, алфавит жестов у немых, алфавит китайских иероглифов, алфавит флажков у сигнальщиков на боевых кораблях.

Буквой или знаком называется любой элемент x конечного алфавита X, xX. Понятие знака неразрывно с тем, что им обозначается, они вместе могут рассматриваться как пара элементов (x,y), где x – знак, y – значение, обозначаемое этим знаком. Одни и те же знаки могут соответствовать различным понятиям.

Пример. Знак «+» может означать как операцию сложения чисел, так

иоперацию соединения текстов, знак «!» - соответствует понятиям: факториал, восклицание, опасность.

Из последнего примера видно, что не только элемент x определяет элемент y, но и элемент y может накладывать ограничения на x. Буквы алфавита существуют независимо от информации, которую можно актуализировать этим алфавитом, т.е. они символически самостоятельны, инвариантны.

Пример. Знак 5 как элемент алфавита арифметики несет смысловое значение - выражает количество, соответствующее пяти объектам, предметам. Знак Ы - как элемент алфавита русского языка уже не несет смысловой нагрузки - смысловое значение приобретает знак Ы в комбинации с другими символами, в соответствующей структуре, например, в слове СТУДЕНТЫ.

Информация это абстракция (математическая или семантическая) и

внешне всегда проявляется в виде сообщения.

Пример. Десятичное число 9 выражает информацию о девяти объектах, а цифра 9 - выражение этого количества в виде символа алфавита десятичной системы. Отрезок АВ есть абстракция, соответствующая

25

множеству точек на числовой прямой, а отрезок [0,1] отождествляется с геометрическим отрезком (геометрическим местом точек) длины 1.

В алфавите должен быть определен порядок следования букв (типа «предыдущий элемент последующий элемент») например, конечный алфавит

вида X={ x1, x1, ... , xn }.

Слово в алфавите X - любая конечная последовательность букв из x,

слово имеет вид: p=x1x2 ... xm, где xi X, i=1, 2, ..., m.

Длиной | p | слова p называется число составляющих его букв. Слово нулевой длины называется пустым словом: ||=0.

Разделителем слов называется один символ (несколько символов), отделяющий (отделяющих) последний символ предыдущего слова от первого символа последующего слова.

Множество различных слов над алфавитом X обозначим через S(X) и назовем словарным запасом (над алфавитом X).

Пример. Пусть X={a,1,2}, тогда словами над X будет а, аа, а112, 1111. Если считать разделителем слов знак пробела, то предложением над X будет

ааа а11 222аа. Длины слов: | a | = 1, | a112 | = | aa4a | = 4.

Один алфавит может быть информационно богаче другого. При этом не нужно иметь большой алфавит для того, чтобы получить большое множество слов над ним.

Пример. Алфавит китайских иероглифов богаче алфавита английского языка, но может быть беднее алфавита художественных образов (рисунков). Два различных знака (точка и тире) в алфавите Морзе и не более чем четырехсимвольная их комбинация позволяют передавать такую же информацию, что и алфавит русского языка.

Основная операция, которая определена в любом S(X) операция

конкатенации (присоединения) слов p, qS(X) в результате которого получаем слово s=p+q: к последнему символу слова p справа приписываются все символы q в том же порядке; иногда для удобства и четкости мы конкатенацию не будем обозначать никак, т.е. писать pq, а иногда обозначать как (pq).

Пример. Алфавит десятичной системы счисления: X={0, 1, 2, ..., 9}, p=10299, q=0001; алфавит десятичной арифметики: X={0, 1, 2, ..., 9, +, -, *,/, (,)}, p=12+131, q=2(133-9)/32; алфавит латинских букв: X={A, a, B, b, ... , Z , z}, p=Word; алфавит русского языка: X = {A, a, Б, б, ..., Я, я, -, . , ! , ? , , , : , ; , « , «,

...}, p=Республика Кабардино-Балкария, q=Лето. Жарко и светло.; алфавит азбуки Морзе: X ={. |. - |.--| --.|..- |.-.- |...}, p=|. -|.. -|- -..| - ..|.

Конкатенация может быть правая и левая, а также и двухсторонняя. Пример. Слова, а, следовательно, предложения русского языка

образуются правосторонней конкатенацией, а в арабском языке (письме) - левосторонней конкатенацией; в арифметике можно десятичные дроби образовывать двухсторонней конкатенацией (слева и справа от десятичной точки).

Действие (по отношению к некоторой системе) - изменение состояния системы.

Имеются два особых действия - начальное и финальное.

26

Процессом, определенным над некоторой операционной средой или алфавитом, назовем систему взаимосвязанных, структурированных, ресурсоориентированных действий от начального (стартового) до конечного (финального) событий.

Процесс всегда связан с выбором, актуализацией информации. Реализация процесса это его выбор, актуализация действий для

некоторого алфавита, операционной среды, ресурсов. Один и тот же процесс может быть реализован (актуализирован) различными способами - алфавитами, ресурсами. Реализация заключается в выполнении действий и в обмене ресурсами между ними и сопровождающихся построением правильной цепочки действий , приводящей к цели.

Конструктивизм, конструктивность процесса действий определим как приводимость (реализуемость) процесса от начального до конечного действия при любом допустимом входном наборе информации, т.е. возможность получения в результате выполнения этих действий результатов из заранее определенного выходного множества.

Конструктивный объект над множеством Х - объект, который можно построить с помощью некоторого конструктивного процесса над Х.

Пример. Построение решения квадратного уравнения для класса имен из одних четырех арифметических операций - не конструктивный процесс, а в классе имен, получаемом добавлением к ним операции (функции) извлечения корня до любой заданной степени точности (например, с помощью известного рекуррентного соотношения для вычисления квадратного корня) - конструктивный процесс.

При одинаковом наборе входной информации, все конструктивные процессы должны при реализации приводить к конструктивным объектам.

Процесс может быть последовательным, параллельным или смешанным - в зависимости от времени или пространства актуализация ресурса (вещества, энергии, информации).

Последовательный процесс (последовательно выполняемый процесс) - процесс, в котором каждое не особое действие является действиемпредшественником или действием-преемником.

Конструктивным словообразующим процессом (процессом словообразования) называется процесс применения операции конкатенации к символам алфавита или к уже полученным в результате предыдущих конструктивных процессов словам над этим алфавитом.

Символы алфавита (их копии) могут участвовать в словообразовании сколь угодно раз. Любой процесс словообразования начинается с пустого символа (слова), к которому затем присоединяются другие символы (слова) алфавита.

Конструктивное описание конструктивного процесса словообразования будет выглядеть так:

1.Пустое слово - слово над любым алфавитом X.

2.Если s S(X), то словом над X будет слово y=sx (для правосторонней конкатенации) или y=xs (для левосторонней конкатенации).

27

Пример. Определим длину слова конструктивным процессом:

1.|| = 0 для любого алфавита X, S(X).

2.Если x X, а s S(X), то | (sx) | = | s | + 1.

Справедливо следующее очень важное утверждение.

Тезис Черча. Все разумные (непротиворечивые, понятные,

реализуемые и т.д.) способы определения конструктивных объектов и процедур работы с ними эквивалентны.

Пример. Примеры в пользу этого утверждения: все корректные программы решения одних и тех же проблем эквивалентны по выходным результатам; все способы вычисления значений функции на одном и том же допустимом множестве эквивалентны по результатам; все разумные способы повышения производительности (или же эффективности) труда на предприятии эквивалентны, если мера производительности (или же эффективности) труда определена конструктивно, например, как отношение вида «добавленная стоимость на единицу продукции».

Если слова, образованные из символов (слов) x и y левой и правой конкатенацией, совпадают, то они коммутативны. Не для всяких алфавитов (или слов) верно правило коммутативности.

Пример. Если взять слова 102 и 201 над алфавитом N натуральных чисел, то они не коммутативны.

Конкатенация в каких-то алфавитах может удовлетворять правилам, аналогичным правилам действия в арифметике чисел, а в других алфавитах (или же в одном и том же алфавите) – не удовлетворять таким правилам.

3.4. Кодирование и декодирование

Кодом называется правило, описывающее соответствие данного набора знаков (входного алфавита Х или слов S(X)) другому набору знаков (Y или S(Y)). Слово «код» («code») произошло от слова «кодекс», «свод законов».

Кодирование - это представление символов одного алфавита сочетаниями символов другого алфавита. Преобразование сообщений (слов в алфавите), таким образом, сводится к процессу кодирования.

Пример. Пусть X=Z, Y ={0, 1, ... , 9, -}. Тогда запись любого целого числа из X представляет собой кодирование символов из X символами из Y.

Пример. Рассмотрим A={X,O}, B={(,)}. Тогда можно задать кодирование по принципу «визуальной аналогии», поставив в соответствие букве Х последовательность «)(« , а букве О - последовательность «()». Тогда слово ОХОХО над А закодируется как слово ())(())(() над В.

Пусть X={x1, x2, ... ,xn}, Y={y1, y2, ..., ym} - некоторые алфавиты. Кодирование произвольного сообщения x=x1x2 ... xp S(X) заключается в последовательном применении к Y преобразований R(x1 ): Y Y1 Y, R(x2 ): Y1 Y2 Y, ... , R(xp ): Yp-1 Yp Y.

Конечный результат Yp и будет являться кодом сообщения x.

Если это соответствие имеет однозначное обратное, то это обратное соответствие называется декодированием.

28

Пример. Рассмотрим так называемое арифметическое кодирование. Пусть заданы алфавиты X={x1, x2, ..., xn}, Y={y1, y2, ..., ym}. Например, Х - множество символов на клавиатуре ЭВМ, а Y - двоичный алфавит. Кодирование состоит в переводе произвольного слова, например, x=x1x2x5 над Х в элемент (слово, двоичное число y) над Y. Этот перевод осуществляется последовательными применениями к x преобразований R(x1), R(x2), R(x5). Каждое такое преобразование действует на подмножество Y и результат этого действия - новое подмножество Y. Конечный результат этой последовательности преобразований и является кодом х.

Расположение некоторого множества слов в соответствии с выбранным кодом называется упорядочиванием по коду. Упорядочение слов по символам некоторого данного алфавита называется лексикографическим упорядочиванием.

Пример. Слова «абрикос», «банан», «киви», «тыква» будут лексикографически упорядочены по входному алфавиту русского языка, а слова двоичного алфавита «101»,»011»,»010»,»100» - лексикографически неупорядочены.

Пример. Генетический код – чрезвычайно сложная и упорядоченная система записи информации. Информация, заложенная в генетическом коде (по учению Дарвина), накапливалась многие тысячелетия. Хромосомные структуры – своеобразный шифровальный код, и при клеточном делении создаются копии шифра, каждая хромосома удваивается, в каждой клетке имеется шифровальный код, при этом каждый человек получает, как правило, свой набор хромосом (код) от матери и от отца. Шифровальный код разворачивает процесс эволюции человека. Вся жизнь, как отмечал Э. Шредингер, «упорядоченное и закономерное поведение материи, основанное на существовании упорядоченности, которая поддерживается все время».

Правила кодирования (шифрования) не могут быть произвольными. Они должны быть такими, чтобы зашифрованное сообщение можно было бы прочесть (расшифровать). Однотипные правила (типа правила Цезаря) можно объединять в классы. Если внутри класса правил выбран некоторый параметр (числовой, табличный и т.д.), изменяя значения которого можно перебрать все правила, то он называется шифровальным ключом.

Имеются две группы шифров: шифры перестановки и шифры замены. Шифр перестановки изменяет только порядок следования символов

исходного сообщения.

Шифр замены заменяет каждый символ кодируемого сообщения на другие символы не изменяя порядка их следования.

Пример. Шифр Цезаря - шифр типа перестановки. Шифр состоящий в замене каждого символа алфавита русского языка его двухзначным порядковым номером - шифр типа замены.

Восстановление некоторого зашифрованного сообщения по ключу - расшифрование, а восстановление (прочтение) его без известного ключа -

вскрытие (взлом) шифра.

Кодирование и шифрование - разные вещи. При кодировании нет секретного ключа (достаточно знать соответствие символов), а при

29

шифровании необходимо наличие ключа (нужно знать как шифр, так и ключ к шифру). Кодирование не ставит основной целью недоступность для чтения, а ставит целью более сжатое, компактное и быстрое представление и преобразование текста. Шифрование ставит целью сделать сообщение недоступным для чтения без ключа к шифру.

Важной целью кодирования является сжатие сообщений. Пусть сообщение состоит из n символов и имеет вероятность р появления. Если это сообщение перекодировано в сообщение из m символов, то коэффициент сжатия сообщения равен k=m/n. Если рассматривать все l возможных кодировок n - символьных сообщений с вероятностями pi, i=1, 2,..., l, то среднестатистическое значение таких сообщений равно

Предел sn при n называется коэффициентом сжатия для данного метода (способа) кодирования.

Если при кодировании коды (кодовые слова) отличаются (по порядку кодирования) друг от друга (попарно) только одним символом кода, то такие коды называют одношаговыми кодами или кодами Грея.

Пример. АВС, АВВ, AАВ, САВ, ССВ - коды Грея некоторых слов.

Для того чтобы декодирование было возможно, необходимо выполнение условия Фано: никакое кодовое слово не является началом другого кодового слова.

Пример. Кодировку сообщения можно осуществить простой кодовой системой, называемой кодом Цезаря: каждый символ алфавита, на котором записано сообщение, заменяется другим, определенным символом этого же алфавита, например, отстоящим от него вторым символом алфавита. Этот несложный код можно расшифровать следующим образом: определяют относительные частоты символов закодированного текста, которые затем сравниваются с относительными частотами кодирующего текста; по совпадению этих частот устанавливаются соответствия символов (шифр).

Пример. Закодируем, например, текст «Ясная погода» кодом Цезаря, устанавливая соответствия вида: «а» - «б», «б» - «в», «в» - «г» и т.д. Закодированный текст будет иметь вид: «Атоба рпдпеб».

Если задан алфавит Х некоторых кодируемых сообщений, то

расстоянием (Хэмминга) между двумя словами y1, y2 Y=S(X) называется число d=d(y1,y2) несовпадений в соответствующих позициях этих слов. Если слова закодированы в двоичном алфавите, то расстояние Хэмминга - это количество двоичных символов, в которых кодовые слова поразрядно не совпадают.

Пример. Если дан алфавит Х={0, 1} и слова x1=11001, x2=0101, х3= ,

то расстояния d(x1,x2 )= d(x2,x1 )=3, d(x1, x3)=5.

Коды делятся на классы: коды с обнаружением и коды с исправлением ошибок.

30

Пример. Код, который проверяет передаваемое или принимаемое сообщение на четность (в конце кодового слова передается признак четности или нечетности числа символов закодированного сообщения, а при приеме этот избыточный признак четности проверяется) - код с обнаружением ошибок. Код с двухили трехкратным повторением символов (групп символов) передаваемого сообщения - код с исправлением (исправление - по максимуму одинаковых символов на соответствующих позициях передаваемых одинаковых групп слов). Контроль четности не может служить надежным способом защиты от искажений (шумов) в кодируемых сообщениях, ибо они с одинаковым успехом могут воспроизводить также и помехи.

Пример. Искажения в четном числе разрядов не могут быть обнаружены при проверке кода на четность. Кратность обнаруживаемых искажений двоичных цифр в коде символа зависит от расстояния между словами. Этим, в частности, объясняется тот факт, что при увеличении скорости речи (примерно до 30 букв в сек. или до 40 бит в сек.) речь перестает быть воспринимаемой. Так называемое число Страуда (мысленных различий в сек.) лежит в пределах приблизительно 8-20 символов в сек.

Отметим две важные теоремы (без доказательства).

Теорема 1. Для того чтобы код позволял обнаруживать ошибки в не более m позициях кодового сообщения, необходимо и достаточно, чтобы наименьшее расстояние между кодовыми словами было не меньше m+1.

Теорема 2. Для того чтобы код позволял исправлять все ошибки в не более чем m позициях, необходимо и достаточно, чтобы наименьшее расстояние между кодовыми словами было не меньше 2m+1.

3.5. Основная проблема информатики

Основная проблема информатики отыскание, построение,

исследование или применение функции (закона, правила) f, переводящей некоторый входной алфавит Х или совокупность слов S(X) (в которых формируются конкатенацией вопросы, ставятся условия задач) в выходной алфавит Y или совокупность слов S(Y) (в которых формируются ответы и решения).

Сообщение и информация это некоторые слова (предложения) в

различных алфавитах. Отношение между ними представимо следующим образом: сообщение - конкретная форма передачи информации, которая может быть и абстрактной. Это соответствие между сообщением и информацией не всегда взаимооднозначное: одна и та же информация может быть передана различными сообщениями.

Информация - содержание сообщения, сообщение - форма проявления или актуализации информации. Информация всегда имеет носитель, передача (актуализация) информации связана с изменением носителя, ресурсов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]