Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Основы информатики программирования и вычислительной математики. Ча

.pdf
Скачиваний:
26
Добавлен:
15.11.2022
Размер:
1.75 Mб
Скачать

Существует связь между количеством информации I и объемом данных Vд. Такую зависимость вывел американский ученый Ральф Винтон Лайон Хартли. Информация кодируется числовыми кодами в той или иной системе счисления. Естественно, что одно и то же количество разрядов в разных системах счисления может передать разное число состояний отображаемого объекта, что можно представить в виде соотношения N = mn, где N – число всевозможных отображаемых состояний; m – основание системы счисления (разнообразие символов, применяемых в алфавите системы); n – число разрядов (символов) в сообщении.

Например, по каналу связи передается n-разрядное сообщение, использующее m различных символов. Поскольку количество всевозможных кодовых комбинаций будет N = mn, то при равной вероятности появления любой из комбинаций количество информации, приобретенной абонентом в результате получения сообщения, будет I = log(N) = nlog(m) – это и есть формула Хартли.

Если в качестве основания логарифма принять m, то I = n, т.е. количество информации (при условии полного априорного незнания абонентом содержания сообщения) будет равно объему данных, полученных по каналу связи: I = Vд. Для неравновероятных состояний системы объем данных всегда оказывается больше количества полученной информации I < (Vд = n), так как в информации всегда присутствует избыточность.

Относительной мерой количества информации на синтаксическом уровне может служить коэффициент информативности (лаконичности) сообщения, который определяется отношением количества информации к объему данных, т.е.

Y I . Vд

В связи с избыточностью информации значения коэффициента информативности Y всегда находятся в предалх от 0 до 1, т.е. 0 < Y < 1. Чем выше значение Y, тем меньше объем работы по пре-

21

elib.pstu.ru

образованию информации (данных) в системе, поэтому стремятся к повышению информативности, для чего разрабатываются специальные методы оптимального кодирования информации.

Семантическая мера информации рассматривается на основе понятия тезауруса. Тезаурус – это совокупность сведений, которыми располагает пользователь, или система. Дословно тезаурус – это словарь терминов. Для измерения смыслового (семантического) содержания информации, т.е. ее количества на семантическом уровне, часто используется тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать и понимать поступившее сообщение.

Введем следующие обозначения:

S – смысловое содержание информации; Sp – тезаурус пользователя;

Ic – количество семантической информации, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус.

Характер зависимости количества семантической информации, воспринимаемой потребителем, от его тезауруса Ic = f(Sp) показан на рис. 7.

Рис. 7. Зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса Ic = f(Sp)

22

elib.pstu.ru

На графике есть две нулевые позиции. Левая нулевая позиция при Sp ≈ 0 означает, что тезаурус почти пуст, пользователь не воспринимает, не понимает поступающую информацию. Это то же самое, что беседовать на разных языках с каким-нибудь человеком; количество поступающей информации равно нулю, так как ни одна из сторон не обладает необходимым словарем. Правая нулевая точка при тезаурусе Sp → ∞ соответствует ситуации, когда пользователь все знает и поступающая информация ему не нужна. Оптимальная точка Sp опт соответствует ситуации, когда потребитель приобретает максимальное количество семантической информации Ic при согласовании ее смыслового содержания S со своим тезауру-

сом Sp или Sp = Sp опт, т.е. поступающая информация и тезаурус потребителя сопоставимы, и поступающая информация понятна поль-

зователю и несет ему ранее неизвестные (отсутствующие в его тезаурусе) сведения.

Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему:

С Ic .

Vд

С увеличением коэффициента содержательности растет семантическая пропускная способность системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.

Прагматическая мера информации определяет полезность или ценность информации для достижения пользователем поставленной цели. Эта мера обусловлена особенностями использования этой информации в той или иной системе.

Для сопоставления мер информации в табл. 1 представлены примеры единиц измерения информации применительно к компьютерной области.

23

elib.pstu.ru

Таблица 1

Единицы измерения информации и примеры

Мера

Единицы

Примеры измерения

информации

измерения

 

Синтаксическая

 

 

Подход

Степень умень-

 

шения неопре-

Вероятность события

Шеннона

деленности

 

 

 

Компьютерный

Единицы пред-

 

ставления ин-

Бит, байт, килобайт и т.д.

подход

формации

 

 

 

 

 

Пакет прикладных программ, персо-

 

Тезаурус

нальный компьютер, компьютерные

Семантическая

 

сети

Экономические

Рентабельность, производительность

 

 

компьютера, коэффициент амортиза-

 

показатели

ции и т.д.

 

 

 

 

Емкость памяти, производительность

 

 

компьютера, скорость передачи дан-

Прагматическая

Ценность

ных и т.д.

 

использования

Денежное выражение.

 

 

Время обработки информации и при-

 

 

нятия решений

1.3. Основные показатели качества информации

Как и любой объект или явление, информация обладает качественными характеристиками:

1.Репрезентативность информации связана с правильностью

ееотбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют правильность концепции, на базе которой сформулированы исходные понятия, обоснованность отбора существенных признаков и связей отображаемого

явления. Нарушение репрезентативности чаще всего приводит к существенным ее погрешностям.

24

elib.pstu.ru

2. Доступность информации восприятию пользователем обеспечивается наличием соответствующих процедур получения и преобразования. Например, в информационной системе информация преобразуется в доступную и удобную форму для восприятия ее пользователем согласно его тезаурусу.

3. Точность – степень близости информации к реальному состоянию объекта, процесса или явления.

4. Содержательность отражает смысловую нагрузку информации. Для оценки содержательности информации используются коэффициенты содержательности и информативности (лаконичности).

5. Достоверность – отражение реальных объектов с нужной точностью. Измеряется достоверность с доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

6. Актуальность определяет степень ценности информации в момент использования.

7. Достаточность (полнота) информации означает, что она содержит минимальные, но достаточные для принятия решения данные. Как неполная, так и избыточная информация снижает эффективность принимаемого решения.

8. Своевременность информации означает то, что она поступает не позже нужного момента времени, согласованного с временем решения поставленной задачи.

9. Устойчивость информации отражает ее способность к сохранению необходимой точности при изменении исходных данных. Устойчивость, как и репрезентативность, зависит от выбранной методики отбора и формирования информации.

1.4. Информационные процессы

Информация не существует сама по себе, она проявляется в информационных процессах: от одного объекта, обладающего информацией, происходит ее передача другому объекту.

25

elib.pstu.ru

Информационным процессом будем называть совокупность действий, производимых над информацией, представленной в определенной форме, с целью достижения определенного результата.

Рассмотримструктуруобщихинформационныхпроцессов(рис. 8).

Рис. 8. Схема взаимосвязи информационных процессов

В процессе регистрации, реализуемом объектом-регистратором (получателем информации), можно выделить три основных процесса:

1)прием (восприятие) сигнала от информационного объекта, заключающийся в изменении состояния объекта-регистратора и сохранении этого изменения до окончания воздействия сигнала;

2)запись данных (фиксация принятого сигнала) объектом-регис- тратором, заключающаяся в сохранении измененного состояния по окончании воздействия сигнала втечение некоторого времени;

26

elib.pstu.ru

3) хранение объектом-регистратором полученных данных в течение длительного времени вне зависимости от приема и записи им других сигналов.

Важность процесса хранения определяется тем, что приход еще одного сигнала от данного (а иногда и другого) информационного объекта может привести к уничтожению записанных данных. Выделяют следующие причины уничтожения информации: преднамеренное уничтожение и уничтожение информации по прошествии некоторого времени, когда она перестала быть актуальной. В более сложных объектах-регистраторах реализуется процесс хранения данных о нескольких зафиксированных в разное время сигналах. Про такие объекты говорят, что они обладают способностью накопления информации.

Впроцессе регистрации новая информация возникает безотносительно к ее использованию, поэтому в этом процессе проявляются лишь синтаксический и семантический аспекты информации.

Впроцессах распространения данных во времени и пространстве, после их приема, должно быть обеспечено сохранение их содержания и смысла, т.е. проявление прагматического аспекта.

Распространение информации во времени можно разделить на три основных информационных процесса:

1. Процесс записи данных на носитель данных (с одновременным распознанием информации).

2. Процесс хранения (как правило, в виде накопления) данных на носителе данных. Современные устройства хранения данных, реализующие эти процессы, могут работать автономно (магнитофон) или в составе вычислительных машин и систем (накопитель на магнитных дисках). Некоторые устройства могут выполнять лишь часть из вышеперечисленных информационных процессов. Например, плеер в отличие от магнитофона не имеет возможности записи информации. Хранение данных человеком осуществляется в его памяти или с помощью различных носителей данных, чаще всего бумаги.

27

elib.pstu.ru

3. Процесс выдачи хранимых данных по запросу.

При распространении информации в пространстве реализуются два основных информационных процесса: один из участвующих в этом общем процессе информационных элементов (его называют источником или передатчиком) реализует процесс передачи информации по каналу связи, а другой или другие (получатель или приемник) осуществляют процесс ее получения (приема) из канала связи.

Канал связи – это естественный или искусственный материальный объект, обеспечивающий передачу сигнала от передатчика к приемнику. Способы передачи данных и каналы связи весьма разнообразны. Исторически наиболее ранние способы заключались в пересылке носителя данных от источника к получателю информации. Такой способ, хотя и является самым медленным, часто применяется и сейчас; именно так осуществляется, например, распространение газет и журналов. Встречается этот способ и при использовании вычислительной техники: например, данные с одного компьютера на другой часто переносят с помощью дисков или «флешек», в качестве канала связи при этом выступает человек. Другие способы распространения информации, использующие

вкачестве каналов связи физическую среду, передающую сигналы

ввиде звуковых или электромагнитных волн, характеризуются высокой скоростью распространения информации, но не обеспечивают хранения переданных (принятых) данных ни в источнике, ни в приемнике. Современные компьютерные средства распространения информации, например электронная почта, соединяют в себе высокую скорость передачи информации с возможностью ее хранения на электронных носителях данных.

Ворганизации распространения информации выделяют четыре основные схемы:

1. «От одного к одному», когда имеется один источник и один получатель информации; такая схема характерна, например, для телефонного разговора.

2. «От одного ко многим», когда имеется один источник и несколько получателей информации; такая схема используется в теле-

28

elib.pstu.ru

видении и радио, а также при групповой рассылке обычных или электронных писем.

3. «От многих к одному», когда имеется много источников и один получатель информации; такая схема широко используется в различных системах управления, когда на одно управляющее устройство (программу) приходят данные от нескольких объектоврегистраторов (датчиков).

4. «От многих к многим»; эта схема характерна для коллективного обмена информацией в ходе дискуссий, обычных или электронных конференций, так называемых чатов, популярных в Интернете.

Вобщем процессе использования информации информационным субъектом можно выделить три основных процесса:

1) сбора информации;

2) обработки данных с целью получения необходимой информации;

3) представления информации в виде, удобном для ее восприятия, интерпретации и удовлетворения информационных потребностей информационного субъекта.

Процесс использования информации длится определенное время, информационный субъект может представлять собой коллектив людей, а применяемые ими для реализации этого процесса средства распределены в пространстве. В силу этих причин процесс использования информации включает в себя также основные информационные процессы распространения информации.

Процесс сбора включает в себя поиск и отбор информации,

атакже хранение отобранной информации.

Впроцессе поиска можно выделить две составляющие: поиск источника информации и поиск необходимых данных в этом источнике. Информация, позволяющая однозначно найти источник данных, называется его адресом. Поскольку часть источника информации зачастую также может рассматриваться как источник информации, то нередко источники информации (и их адреса) имеют иерархическую структуру. Например, в качестве источника информации можно ука-

29

elib.pstu.ru

зать автора книги, саму книгу или конкретную страницу определенного издания книги. В качестве источника информации можно рассматривать не только содержимое специально организованных хранилищ информации, но и специалистов, выступающих в роли экспертов, консультантов. Зачастую поиск ограничивается поиском одного или нескольких источников информации с последующей выдачей пользователю всей имеющейся в них информации. Примером такого поиска могут служить непосредственное наблюдение за найденным объектом, чтение книги, прослушивание лекций.

Поиск информации может осуществляться путем формирования запросов к источникам информации, отражающих информационные потребности субъекта (пользователя). Это отражение не всегда является идеальным по двум причинам. Первая из них заключается в неполной определенности, нечеткости представления пользователя о своих информационных потребностях. Примером следствия такого нечеткого представления может служить просьба библиотекарю дать «почитать что-нибудь интересное». Второй причиной является ограниченность языковых средств построения запросов, определяемая особенностями реализации механизма поиска в хранилище информации. Например, пользуясь таким механизмом поиска, как библиотечный каталог, нельзя формулировать запросы типа «потрепанная толстая книга с синей обложкой». Характеристика степени соответствия информационным потребностям информации, найденной по запросу, выражающему эти потребности, называется пертинентностью.

Любое хранилище информации выдает по запросу не всю содержащуюся в нем информацию, а только соответствующую этому запросу. Результаты поиска зависят от формулировки запроса и особенностей реализации механизма поиска по этому запросу. Характеристика выданной по запросу информации, определяющая степень ее соответствия запросу, называется релевантностъю. Специальные средства, имеющиеся в Интернете, называемые поисковыми серверами, позволяют по запросу пользователя находить информацию в многочисленных хранилищах информации, доступных с помощью этой глобальной сети.

30

elib.pstu.ru