Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский технологический университет "МИСиС"

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Информационные технологии Колтыгин.doc

Скачиваний:

Добавлен:

01.03.2025

Размер:

882.69 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 323 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

3.3Количество информации

Как стало понятно из вышеизложенного, практически невозможно точно вычислить или измерить количество информации, поскольку невозможно точно определить границы понятия информации. Тем не менее, существует несколько подходов к оценке количества информации. Среди них выделяют:

Статистический;
Семантический;
Прагматический;
Структурный подходы.

Исторически наибольшее развитие получил статистический подход.

3.3.1Статистический подход

Основоположником статистического подхода к определению количества информации считают «дедушку теории информации» Клода Шеннона. Им было введено понятие количества информации как меры неопределенности состояния системы, снижаемой при получении информации. Т.е. приращение или убыль информации о системе рассматривалась как функция энтропии системы [2]. Таким образом, чем больше информации о системе приходит к получателю информации, тем меньше степень неопределенности и энтропия системы уменьшается.

До получения информации о системы Х наблюдатель обладает некоторой предварительной информацией о ней. Оставшаяся неосведомленность о системе и есть для него мерой неопределенности (энтропией) системы. Тогда, после получения некой информации (сообщения) о системе энтропия системы должна уменьшится, и количество информации полученной наблюдателем, можно будет посчитать по формуле:

I(X)=H(X)-H’(X) (1)

где I(X) – количество преобретенной информации о системе Х,

H(X) и H’(X) – энтропия системы до и после получения сообщения.

Если система Х переходит из состояние в состояние скачкообразно, количество этих состояний равно N, а вероятность нахождения системы в каждом из этих состояний – Р₁, P₂, … , P_n(причем и P_i≤1), то энтропия системы определяется в соответствии с теоремой Шеннона:

(2)

где K₀ и a определяют систему единиц измерения количества информации.

Отсюда, если вероятности нахождения системы в одном из состояний равны между собой (P_i=1/N), энтропия системы равна:

(3)

Если система имеет только два состояния (N=2), то мы можем говорить что, если принять полную определенность в состоянии системы за 1, и учесть что при этом энтропия будет количественно равна информации о системе Н=I, что вытекает из формулы 1, то

1=K_olog_a2. (4)

Действительно, если полная определенность системы возникает при Н’(X)=0, то I(X)=H(X).

Формула 4 справедлива, если K₀=1, а a=2. Отсюда вытекает формула, предложенная американским инженером Р. Хартли (1928 г.) и носящая его имя.

Формула Хартли:

I = log₂N. (5)

Эта формула может считаться краеугольным камнем информационных технологий, поскольку все понятия о количестве информации, которой оперируют вычислительные машины и средства связи вытекают из нее.

Информация о состоянии системы передается получателю в виде сообщения, представляющего собой набор m символов, имеющих n разрядов, если код не избыточен, то каждое состояние системы будет отображаться одной кодовой комбинацией, их количество равно:

N=mⁿ (6)

Подставив N в формулу 5 получаем

I=nlog₂m (7)

Если код двоичен, то используется лишь два символа («0» или «1», «да» или «нет», «истина» или «ложь» и т.п.), т.е. m=2, отсюда I=n. В этом случае единица информации состоит из n двоичных единиц или битов (bit – binary digit двоичная единица).

Бит в теории информации — количество информации, необходимое для различения двух равновероятных сообщений.

В вычислительной технике битом называют наименьшее количество памяти, необходимое для хранения одного из двух знаков «0» и «1», используемых для внутримашинного представления данных и команд.

На практике чаще применяется более крупная единица — байт, равная восьми битам. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=2⁸).

Широко используются также ещё более крупные производные единицы информации:

1 Килобайт (Кбайт) = 1024 байт = 2¹⁰ байт,

1 Мегабайт (Мбайт) = 1024 Кбайт = 2²⁰ байт,

1 Гигабайт (Гбайт) = 1024 Мбайт = 2³⁰байт.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

Терабайт (Тбайт) = 1024 Гбайт = 2⁴⁰ байт,

Петабайт (Пбайт) = 1024 Тбайт = 2⁵⁰ байт.

Если в формуле Хартли изменить основание 2 на 10 то мы будем иметь дело с десятичными единицами информации, т.н. дитами, если на число е то с натами. Переход от основания a к основанию b требует лишь умножения на .

Например

, т.е. 1 дит примерно равен 3,32 битам.

<<< < Предыдущая 1 23 / 323 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.03.2025152.95 Кб2Информатика 1-69.docx
#
01.04.20259.66 Mб2Информатика 2 семoffice_pack.doc
#
27.09.2019772.61 Кб4информатика билеты.doc
#
14.04.2019238.85 Кб3информатика билеты.docx
#
01.05.202512.71 Mб1ИНФОРМАТИКА ОТВЕТЫ!.doc
#
01.03.2025882.69 Кб0Информационные технологии Колтыгин.doc
#
01.07.202533.08 Кб0ИОТ шкипер.docx
#
19.08.20191.08 Mб3ИС-Методичка.doc
#
20.04.201564 Кб11Ис.э.уч. тест 2.doc
#
01.07.202524.98 Кб0Использование проектного метода в разработке и проведении недели психологии в школе (1).docx
#
01.07.2025608.77 Кб0Исследование металлургических машин.doc