Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3345

.pdf
Скачиваний:
2
Добавлен:
15.11.2022
Размер:
4.34 Mб
Скачать

Ознакомление с подходами преобразования информации на носителях (бумажных и электронных) в признаково - смысловую с выходом на возможные пути определения ценности информации (с учетом ее многократного использования).

Методические рекомендации по изучению: слушать грамотных преподавателей, думать.

2.2.Основные понятия о содержании и строении информации

Информация имеет две стороны: это совокупность сведений и снятая неопределенность. Существующая практика и теория эти стороны рассматривает отдельно, не сводя в единство.

Так, информацией, как совокупностью сведений, в основном интересуются спецслужбы разведки, контрразведки, обеспечения безопасности и режима. При этом количество сведений определяется через количество признаков, составляющих иерархическую совокупность. Но это определение осуществляется не формализованно, а эвристически - экспертами - аналитиками. Величину снятой неопределенности, при этом, вычисляют косвенно путем определения доли известной информации относительно полного количества. Для этого определяют так называемый коэффициент вскрытия объекта (ситуации, обстановки).

Величину снятой неопределенности количественно измеряют

втеории информации К.Шеннона энтропией. Но вся беда состоит

втом, что за меру неопределенности эта теория использует очень частную оценку - факт выбора одного события из полной группы (кем-то определенной?) однородных событий (см. упоминание в п. 2.1 о мифическом объекте статистических исследований - Ю.Б.). Однако такая неопределенность у людей встречается очень редко, например, в азартных играх, лотереях, развлечениях и т.п. Главная же неопределенность состоит в неопределенности нового, грубо говоря - неопределенности того «пойди туда, не зная куда». Вся сложность положения при этом заключается в отсутствии однородности событий, формирующих неопределенную ситуацию, и в

51

неизвестности не только количества этих событий, но даже предметной границы их существования. Вот с такой неопределенностью и сталкиваются люди, проектируя новое (изделия, мероприятия, системы).

Необходимо отметить, что рассмотрение обеих сторон информации (совокупность сведений и снятая неопределенность) отдельно не позволяет обеспечить вскрытие всей картины использования информации разумным субъектом. Отсюда возникает дополнительная неопределенность в понимании роли и сущности информации в деятельности субъекта. Рассматривая обе стороны совместно и используя принцип дополнительности: сильные свойства одной стороны компенсируют слабость другой и наоборот, можно сформулировать замкнутую картину возникновения и использования информации субъектом, хотя бы и описательную. То есть построить информационную модель использования информации субъектом. Она следующая.

В разуме субъекта постепенно формируется представление об окружающей обстановке - картина мира как система базисных функций. На основе этого представления у субъекта формируется ШКАЛА ПРИОРИТЕТОВ его действий, то есть возможные действия расставляются по очередности в соответствии с их важностью. Субъект чувствует себя уверенно, если все элементы шкалы приоритетов имеют разные значения, то есть субъект ЗНАЕТ, ЧТО ДЕЛАТЬ.

Картина нарушается, когда два или более приоритета становятся примерно одинаковыми: субъект «тушуется», он не знает, как ему поступить, что выбрать. Для прояснения ситуации субъект начинает добывать новую информацию (новые сведения) путем проведения измерения реальности или «считыванием» записей информации. Поступаемые при этом признаки (кусочки, порции информации) по месту вплетаются в картину мира, пополняя ее и изменяя значения приоритетов. Картина вновь проясняется, ибо «слипшиеся» приоритеты расходятся, субъект снова знает, что делать, ему трудно, но хорошо.

Картина мира при этом обеспечивает выполнение двух функций: она дисциплинирует (направляет) процесс пополнения сведе-

52

ний; она минимизирует требуемый объем поступающих сведений, ибо любая закономерность сжимает размерность описания.

Правдоподобность изложенной гипотезы подтверждается содержанием определения информации, данное Н.Винером: «Информация - это обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему». То есть если под «приспособлением к миру» считать установку и корректировку приоритетов действий субъекта, то совпадение будет полным. А если вспомнить высказывание Г.Лейбница: «При помощи разума человек обязан получить представление о реальности и определенность в направлении к наилучшему», то гипотеза будет выглядеть совсем убедительно.

Однако, в изложенной гипотезе есть несколько принципиальных неясностей:

что из себя формально представляет картина мира и как она пополняется за счет поступления новых сведений (признаков);

каков набор действий субъекта, для которых он формирует приоритеты, исходя из картины мира и ее изменений.

Изложенные неясности предметно шире чисто теории информации, но часть из них касается нас «напрямую». Поэтому часть из них мы должны раскрыть. Это можно сделать, рассмотрев более подробно знаковую сущность информации и свойства используемых знаков. К этому вопросу мы будем обращаться неоднократно.

2.2.1. Знаковая сущность информации

Эпикур сказал: «Каждый предмет получает благодаря ему присвоенному названию свою ясность, очевидность, отчетливость». То есть предметы реального мира, получив нематериального заместителя, становятся удобными для абстрактного оперирования механизмом разума, ибо ясность, очевидность, отчетливость - это интеллектуальные категории. Таким образом, весь реальный (познанный) мир получает второй мир знаковых заместителей, содержащихся в информации.

Знак - это то, что стоит вместо чего-то, находящегося вне нашего разума, которое обобщенно можно назвать реальностью, обозначая эту реальность. Оторванный от осязаемых закономерностей

53

реальности, знак не существует сам по себе, он действует в определенной системе, включающей кроме знака правила оперирования с ним. Знаки и правила отработаны всем человечеством за всю историю его существования. Знак без правил оперирования, известных всем, мертв. Он не понимаем.

Удобство использования знака определяется двумя его свойствами: свойством, присущим знаку как представителю и выразителю реальности; свойством знака как представителя знаковой системы.

Чтобы быть представителем безграничного мира, знаков должно быть как можно больше. Однако это неудобно для использования - много нужно запоминать (вспомните ситуацию с китайскими иероглифами – их более 50 тысяч). Это противоречие человечество устранило путем увеличения выразительной «нагрузки» на знак, то есть путем увеличения неоднозначности и контекстуальной мощи знака. Понимание такого знака обеспечивается формированием картины мира - потенциальной сети многомерных понятийных и ситуационных (функциональных) связей.

Кроме этого, знаки образуют многоуровневую (по выразительности) совокупность знаков различной контекстуальной мощности (у признака – меньше, у символа – гораздо больше). Таких знаков сейчас используется пять: признак, образ, слово, буква, символ. Они перечислены в порядке возрастания выразительной мощности (общности) и абстрактности. При этом под мощностью (общностью) знака понимается величина предметного многообразия, прикрываемая (замещаемая) знаком, а под абстрактностью – степень связи знака с содержанием реальности. Эти характеристики знака связаны друг с другом.

На нижнем уровне этой совокупности располагается знак, называемый признаком. Так как этот знак является обобщением результатов измерения свойств замещаемой реальности, то он (и только он) имеет прямую связь с реальностью. То есть он является «частичкой» реальности и носителем семантического обобщения, как указатель группы объектов, сходных по данному признаку (свойству). При этом признак является результатом измерений как структурных, так и функциональных свойств объекта. Тем самым

54

обеспечивается мостик от полного предметного содержания реальности до знаковой выразительности, что является основой исчисления количества информации в зависимости от ее детализирующего (раскрывающего, углубляющего) содержания (но не предметного – о чем информация - Ю.Б.).

Однако выразительная гибкость признака недостаточна. Прямая связь с реальностью является путами, ибо чем теснее привязан знак к обозначаемому предмету (одному!), тем труднее знаковой системе управлять им внутри себя, представляя и другие (сходные) предметы, то есть у знака возникает ограничение предметного разнообразия замещаемой реальности. И обратно, чем абстрактнее знак, тем слабее его связь с конкретным объектом, тем легче оперировать внутри системы, ибо он подходит к любому замещаемому объекту, обозначая более крупные фрагменты реальности. Поэтому кроме признака нужны более абстрактные знаки, первым из них является ОБРАЗ.

Образ уже не является частью объекта. Он является результатом отображения структурных (только!) свойств объекта, полученным по законам подобия, а не путем измерения. То есть непосредственная физичность связи образа с отображаемым объектом исключается и она заменяется косвенной связью - похожестью структурных свойств объекта и образа (например, силуэт ножниц у входа в парикмахерскую).

Однако образ воздействует на субъект через зрительный канал, по которому человек получает около половины объема информации. У субъекта есть еще «языково-письменный» тракт (канал). Для его функционирования используется следующий знак - СЛОВО и его алфавитное обобщение - БУКВА.

Слово является очень мощным по выразительности знаком. Одно слово обеспечивает коэффициент сжатия, то есть содержит 107 - 1011 признаков. Человечество знает о происхождении слова очень мало. Каждое слово обозначает вещь, качество, действие или отношение. Однако, оно не только обозначает вещь, но и выделяет признаки вещи, обобщает вещи, относя их к определенной категории. Обобщая предметы, слово выступает орудием абстракции, являющейся важнейшей функцией сознания. Тем самым слово вы-

55

полняет и системную функцию, представляя собой потенциальную сеть многомерных ситуационных понятийных связей. Это проявляется в том, что обозначая предмет, слово выделяет в нем существенные свойства, ставит его в нужные отношения к другим предметам, относя его к известным категориям.

Особенно важно обратить внимание на потенциальность, то есть изменяющуюся нужность значения слова по отношению к другим предметам и их категориям, в чем заключается главная сила разума субъекта.

То есть слово как знак - не только компактный квант информации, обладающий большим зарядом обобщения, это еще знак с огромным потенциалом получения дополнительных значений при изменении его формы.

Слово имеет значение и смысл. Значение есть устойчивая система обобщений, стоящая за словом и являющаяся одинаковой для всех людей. Тут могут быть разными глубина, обобщенность и широта охвата обозначаемых предметов, но с сохранением неизменного ядра.

Под смыслом, в отличие от значения, понимают индивидуальное значение слова, то есть с учетом его «вплетения» в картину мира субъекта.

Кроме того, нам еще важно знать такую характеристику слова как валентность, т.е. возможное число потенциальных связей, составляющих основу понятия (предложения): «ЗАЩИТИТЬ» - ЧТО, - ОТ КОГО, - ЗАЧЕМ, «ЛЮБИТЬ» - КОГО, «КОПАТЬ» - ГДЕ, - ЧТО и - ЧЕМ. Это очень важно при рассмотрении тестового метода определения количества информации, содержащейся в слове.

Буква является знаком, позволяющим оперировать алфавитным системам. Самым же абстрактным знаком является символ, с помощью которого осуществляется кодирование (то есть замещение) любых объектов и их знаковых заместителей. То есть символ является «знаком знаков» и используется в подготовленной для абстрактного (не смыслового) представления информации. Там известны размер полной группы событий и вероятность их появления. Поэтому символ оправданно является основным знаком в теории информации К.Шеннона, осуществляющей освещение

56

коммуникативной (транспортной) стороны информации. Из-за предельной абстрактности символа теория информации К.Шеннона принципиально не имеет содержательной (семантической) составляющей информации, но блестяще справляется с коммуникативной стороной!

На основе изложенного можно составить представление о модели строения информации как многоуровневой совокупности знаков различной контекстуальной мощности. Контекстуальность, то есть предметная подразумеваемость по ситуации (по месту) значения знака в условиях их многослойной накладки обеспечивает непрерывное строение информации как многослойной системы отображения реальности (смотри табл. 1.1 в первой части курса).

2.2.2. Источники и носители информации

Источником информации является материальный объект реального мира, значения свойств которого определяют содержание информации. Носителем информации является также материальный объект, но с более бедными свойствами, которых достаточно только для размещения множества записей знаковых структур информации. В этом заключается принципиальная разница между источником и носителем информации как материальными объектами: источник информации как информативный объект реального мира включает все бесконечное многообразие свойств; носитель включает только тот минимум свойств, которых достаточно только для записи многообразия знаков; источник имеет ценность, соответствующую результату его применения по назначению (ценность абсолютная, глобальная); носитель имеет ценность только в плане возможности выполнения записи (ценность относительная, частная); чтобы уничтожить источник, необходимо уничтожить ценный материальный объект; чтобы уничтожить запись информации, необходимо уничтожить ее носитель, то есть порвать лист бумаги.

На основании изложенного можно сделать вывод, что информация от источника и информация от носителя с точки зрения ее сохранения и защиты отличаются принципиально.

Носители информации разделяются на бумажные и безбумажные (электронные). Последние, в свою очередь, разделяются

57

на долговременные или независимые от источника и мгновенные или зависимые от источника и называемые сигналами.

У бумажных и долговременных электронных носителей есть принципиальная общность - возможность только непосредственного физического доступа (их надо взять в руки). К мгновенным сигнальным носителям возможен дистанционный доступ с помощью приемников электромагнитной энергии. Более подробно это мы рассмотрим в следующих лекциях.

2.3. Измерение количества и ценности информации

Вопределении понятий СОДЕРЖАНИЯ и КОЛИЧЕСТВА информации имеется много путаницы. Под содержанием будем понимать то предметное наполнение, то есть ответ «о чем» информация. Так как это нельзя отобразить одной скалярной величиной,

аотображается сложной структурой знаков различной выразительной мощности, то эта структурность (множественность) представления содержания информации пересекается с понятием количества информации. Давайте разберемся со всем по порядку.

Втеории К.Шеннона за количество информации принята количественная мера снятой неопределенности, выражаемая энтропией. Но А.Н.Колмогоров считал, что такая глобальная категория как информация не может иметь только одну меру ее количества. Он предложил их три. Они следующие. Комбинаторная мера. Пусть переменная x способна принимать значения, принадлежа-

щие конечному множеству X, состоящему из N элементов, т.е. x X, X =N. Говорят, что энтропия переменой x равна

N(x)=log2 N.

Указывая определенное значение x=a переменной x, мы снимаем эту энтропию, то есть неопределенность, сообщая информацию I = log2 N. Единицей измерения такой информации является один бит, соответствующий выбору из 2-х исходов. Более подробно об этом поговорим в следующей лекции.

Вероятностная мера. Здесь имеем запись

H x p x log2 p x .

x

58

Такое выражение в теории вероятностей называется математическим ожиданием или средним значением (величины log2p(x)). Вероятностный подход, лежащий в основе теории К.Шеннона, очень естественен в теории передачи по каналам связи «массовой» информации, состоящей из большого числа не связанных или слабо связанных между собой сообщений, подчиняющихся вероятностным закономерностям.

Алгоритмическая мера. Применяется тогда, когда интересуются количеством информации, существующей в индивидуальном (а не вероятностном, как в предыдущем случае) объекте x относительно индивидуального объекта y. При этом за относительную сложность объекта y при заданном x предлагается принять минимальную длину l(p) программы P получения y из x. Длина программы определяется с использованием математического аппарата рекурсивных функций, то есть функций, разрешаемых алгоритмически по А.Тьюрингу, о чем подробнее сказано в ч.3 курса лекций.

На основании изложенных трех подходов к определению количества информации можно предложить четвертый (комплексный) подход к определению количества знаковой информации и назвать его тестовым, то есть вопросно-ответным, реализуемым вычислительным (компьютерным) методом. Суть его следующая.

Информация, как знаковое замещение реальности необходима разумному субъекту для общения с другими субъектами и для реализации управления вещественно-энергетическими процессами путем передачи команд управления. Так как эти потребности принципиально несхожи (ортогональны), ибо первая - интеллектуальная, а вторая - физико-техническая, то для измерения количества информации необходимо две единицы.

Первая единица должна быть содержательной и представлять собой квант (факт, признак) общения субъектов, реализуемого на основе сформированных им картин мира (системы понятий) каждого. Подтверждение предложенного автор нашел в работе польского экономиста В.Плюты: «…количество информации … измеряется числом признаков» [В.Плюта. Сравнительный многомерный анализ в эконометрическом моделировании. – М.: Финансы и статистика, 1989, с.88].

59

Вторая единица должна быть технической и представлять собой квант передачи сообщения при управлении и связи, реализуемой с помощью технических сигнальных систем. Эта единица хорошо известна и называется энтропийной единицей информации в один бит.

В связи с таким делением единиц информации возникает задача установления сущности вводимой содержательной единицы и об установлении формальной связи ее с технической единицей, ибо информация едина. Однако, в единстве связи указанных единиц имеется провал, именуемый неизвестным механизмом функционирования разума субъекта. Поэтому строгую связь установить принципиально нельзя, но приближенное представление о ней, достаточное для решения практических задач, составить можно.

Основу общения субъектов составляет обмен понятиями (словами), сформулированными заранее и представляемыми в знаковой форме, описанной выше. Поэтому сущность задачи установления содержательной единицы информации состоит в расщеплении понятий на более мелкие части (фрагменты) постепенно повышаемой детальности и понижаемой предметной общности (узости). Это можно реализовать компьютером с помощью фреймсценария М.Минского.

Фрейм-сценарий является формальным представлением тестовой процедуры получения недостающей информации путем выдвижения совокупности вопросов с нахождением ответов на них по привлекаемым источникам информации (базам данных). Процедура является итеративной, в силу чего детальность ответов постепенно повышается, а описываемая одним ответом предметная область постепенно сужается. При достижении определенной детальности (узости) ответа на вопрос его можно принять за один факт (признак), то есть за содержательную единицу информации. Л.Бриллюэн – корифей теории информации относительно тестового способа писал так: «Мы рассматриваем задачу с некоторым числом возможных ответов, если мы не имеем специальной информации о действительном положении. Если окажется, что мы располагаем некоторой информацией о задаче, то число возможных ответов уменьшается, а полная информация может даже оста-

60

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]