Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Волгоградский филиал РАНХиГС (ВАГС)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекция_Информация и информ. системы.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

562.18 Кб

Скачать

☆

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

2. Свойства информации

Так как информация является динамическим объектом, то как всякий объект она обладает свойствами. Можно привести немало разнообразных свойств информации. С точким зрения информатики наиболее важными представляются следующие свойства:

Адекватность информации — это уровень соответствия образа, создаваемого с помощью информации, реальному объекту, процессу, явлению. От степени адекватности информации зависит правильность принятия решения.
Содержательность, определяет отношение количества семантической информации в сообщении к общему объему данных. Семантическая информация – это информация, которой придаётся определённый смысл.
Полнота требует, чтобы информация содержала минимально необходимый объем данных позволяющих принять правильное решение. Как неполная, так и избыточная информация сдерживает принятие решений или может повлечь ошибки.

Доступность требует, чтобы информационное сообщение было предоставлено пользователю в максимально понятной для него форме, что достигается выполнением соответствующих процедур его получения и преобразования.
Актуальность информации означает ее поступление не позже заранее оговоренного срока, который определяется исходя из условий решения поставленной задачи.
Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Недостоверная информация может привести к неправильному пониманию или принятию неправильных решений. Достоверная информация со временем может стать недостоверной, так как она обладает свойством устаревать.
Устойчивость информации отражает ее способность реагировать на изменение исходных данных без нарушения необходимой точности.

3. Измерение информации

Информация обладает замечательным свойством: будучи собранной и обработанной с определенных позиций, информация дает новые сведения, приводит к новым знаниям. Однако, человеку свойственно субъективное восприятие информации. Поэтому одно и то же информационное сообщение может содержать разное количество информации для разных людей — в зависимости от их предшествующих знаний, от уровня понимания этого сообщения и интереса к нему.

Так, сообщение, составленное на японском языке, не несёт никакой новой информации человеку, не знающему этого языка, но может быть высокоинформативным для человека, владеющего японским. Никакой новой информации не содержит и сообщение, изложенное на знакомом языке, если его содержание непонятно или уже известно. Следовательно, должна существовать возможность измерения информации.

В настоящее время получили распространение подходы к определению понятия "количество информации", основанные на том, что информацию, содержащуюся в сообщении, можно нестрого трактовать в смысле её новизны или, иначе, уменьшения неопределённости наших знаний об объекте.

Так, американский инженер Р. Хартли (1928 г.) процесс получения информации рассматривает как выбор одного сообщения из конечного наперёд заданного множества из N равновероятных сообщений, а количество информации I, содержащееся в выбранном сообщении, определяет как двоичный логарифм N.

Формула Хартли: I = log₂N.

Допустим, нужно угадать одно число из набора чисел от единицы до ста. По формуле Хартли можно вычислить, какое количество информации для этого требуется: I = log₂100 » 6,644. То есть сообщение о верно угаданном числе содержит количество информации, приблизительно равное 6,644 единиц информации.

Приведем другие примеры равновероятных сообщений:

при бросании монеты: "выпала решка", "выпал орел";
на странице книги: "количество букв чётное", "количество букв нечётное".

Определим теперь, являются ли равновероятными сообщения "первой выйдет из дверей здания женщина" и "первым выйдет из дверей здания мужчина". Однозначно ответить на этот вопрос нельзя. Все зависит от того, о каком именно здании идет речь. Если это, например, станция метро, то вероятность выйти из дверей первым одинакова для мужчины и женщины, а если это военная казарма, то для мужчины эта вероятность значительно выше, чем для женщины.

Для задач такого рода американский учёный Клод Шеннон предложил в 1948 г. другую формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе.

Ф ормула Шеннона:

Если p_i<=1, то p_i log₂p_i<=0

P_i =0, то p_i log₂p_i=0

где Pi — вероятность того, что система находится в i-м состоянии. В случае, когда все состояния системы равновероятны p₁, ..., p_N , то каждая из них равна 1/N и формула Шеннона превращается в формулу Хартли.

Т аким образом, если объект будет находиться в одном из двух равновероятных состояниях, то по формуле Хартли количество информации будет равно 1.

I=log ₂ 2=1

Это количество информации принято за единицу измерения информации, называемую битом или двоичной единицей (bit – binary digit). Таким образом, один бит – это минимальное количество информации, посредством которого выделяется одно из двух равновероятных состояний объекта.

В вычислительной технике битом называют ячейку памяти, которая может находиться в двух состояниях (“включено” и “выключено”) и в неё может быть записана одна двоичная цифра (0 или 1).

Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица — байт, равная восьми битам. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=2⁸).

Широко используются также ещё более крупные производные единицы информации:

1 Килобайт (Кбайт) = 1024 байт = 2¹⁰ байт,
1 Мегабайт (Мбайт) = 1024 Кбайт = 2²⁰ байт,
1 Гигабайт (Гбайт) = 1024 Мбайт = 2³⁰ байт.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

1 Терабайт (Тбайт) = 1024 Гбайт = 2⁴⁰ байт,
1 Петабайт (Пбайт) = 1024 Тбайт = 2⁵⁰ байт.

За единицу информации можно было бы выбрать количество информации, необходимое для различения, например, десяти равновероятных сообщений. Это будет не двоичная (бит), а десятичная (дит) единица информации.

Пример 1 Важно иметь представление, сколько информации может вместить килобайт, мегабайт или гигабайт. При двоичном кодировании текста каждый символ занимают 1 байт. На странице книги среднего формата примерно 50 строк, в каждой строке около 60 символов, таким образом, полностью заполненная страница имеет объём 50 x 60 = 3000 байт ≈3 Килобайта. Вся книга среднего формата занимает ≈ 0,5 Мегабайт. Один чёрно-белый кадр содержит примерно 300 Кб информации, цветной кадр содержит уже около 1 Мб информации. Телевизионный фильм продолжительностью 1,5 часа с частотой 25 кадров в секунду — 135 Гб

Для измерения смыслового содержания информации наибольшее распространение получила тезаурусная мера.

Тезаурус — это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S_p изменяется количество семантической информации I_c, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 2. Рассмотрим два предельных случая, когда количество семантической информации I_c равно 0:

• при S_p→0 пользователь не воспринимает, не понимает поступающую информацию;

• при S_p→ ∞ пользователь все знает, и поступающая информация ему не нужна.

I_С

0 Sp opt Sp тезаурус (ТЗ)

Рис. 2. Зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса.

Максимальное количество семантической информации I_c потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом S_p (S_p = S_{p opt}), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения. Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным для пользователя некомпетентного. Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к общему объему данных:

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.03.2025155.65 Кб0ЛЕКЦИЯ Ивановой Т,Б, РЦБ.doc
#
24.09.201949.53 Кб5Лекция Ляхова Д.,Борисова, Орлова.docx
#
01.07.202591.65 Кб1Лекция по теме Безработица 2014.doc
#
23.11.201951.32 Кб2Лекция Суды в судебной системе Российской Федер...docx
#
01.07.2025156.67 Кб1Лекция_Информ. технологии.doc
#
01.07.2025562.18 Кб1Лекция_Информация и информ. системы.doc
#
22.08.2019127.49 Кб4личность-инд-индть)-1.doc
#
01.04.202546.08 Кб1логика к семенару.doc
#
01.04.2025209.92 Кб3Магура.doc
#
21.05.2015645.56 Кб43Макроэкономика экзамен.docx
#
01.07.20251.12 Mб1маркет СУП.doc