Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Оренбургский Государственный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

информатика ответ.docx

Скачиваний:

Добавлен:

05.08.2019

Размер:

118.82 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 84 5 6 7 8 > Следующая >>>

Более общим случаем вычисления количества информации в сообщении об одном из n, но уже неравновероятных событий. Этот подход был предложен к.Шенноном в 1948 году.

Пусть имеется строка текста, содержащая тысячу букв. Буква “о” в тексте встречается примерно 90 раз, буква ”р” ~ 40 раз, буква “ф” ~ 2 раза, буква “а” ~ 200 раз. Поделив 200 на 1000, мы получим величину 0.2, которая представляет собой среднюю частоту, с которой в рассматриваемом тексте встречается буква “а”. Вероятность появления буквы “а” в тексте (p_a)можем считать приблизительно равной 0.2. Аналогично, p_р = 0.04, p_ф = 0.002, р_о= 0.09.

Далее поступаем согласно К.Шеннону. Берем двоичный логарифм от величины 0.2 и называем то, что получилось количеством информации, которую переносит одна-единственная бква “а” в рассматриваемом тексте. Точно такую же операцию проделаем для каждой буквы. Тогда количество собственной информации, переносимой одной буквой равно

h_i = log₂1/p_i = - log₂ p_i,

где p_i- вероятность появления в сообщении i-го символа алфавита.

Удобнее в качестве меры количества информации пользоваться не значением h_i , а средним значением количества информации, приходящейся на один символ алфавита

H = ∑ p_ih_i = - ∑ p_i log₂p_i

Значение Н достигает максимума при равновероятных событиях, то есть при равенстве всех pi

pi = 1 / N.

В этом случае формула Шеннона превращается в формулу Хартли.

Количество информации при вероятностном подходе можно вычислить, пользуясь следующими формулами:

1). Формула Хартли.

I = log₂ N или 2^I = N,

где

N - количество равновероятных событий (число возможных выборов),

I - количество информации.

2). Модифицированная формула Хартли.

и формула имеет вид I = log₂ (1/p) = - log₂ p

где

p - вероятность наступления каждого из N возможных равновероятных событий.

3). Формула Шеннона.

H = ∑ p_ih_i= - ∑p_i log₂p_i

где

p_i- вероятность появления в сообщении i-го символа алфавита;

h_i= log₂ 1/p_i = - log₂ p_i- количество собственной информации, переносимой одним символом;

Н - среднее значением количества информации.

Первичные единицы

Объём информации можно представлять как логарифмколичества возможных состояний.

Наименьшее целое число, логарифм которого положителен — это 2. Соответствующая ему единица — бит — является основой исчисления информации в цифровой технике.

Единица, соответствующая числу 3 (трит) равна log₂3≈1,585 бита, числу 10 (хартли) — log₂10≈3.322 бита.

Такая единица как нат (nat), соответствующая натуральному логарифму применяется в инженерных и научных расчётах. В вычислительной технике она практически не применяется, так как основание натуральных логарифмов не является целым числом.

В проводной технике связи (телеграф и телефон) и радио исторически впервые единица информации получила обозначение бод.

Единицы, производные от бита

Целые количества бит отвечают количеству состояний, равному степеням двойки.

Особое название имеет 4 бита — ниббл (полубайт, тетрада, четыре двоичных разряда), которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.

Байт

Следующей по порядку популярной единицей информации является 8 бит, или байт (о терминологических тонкостях написано ниже). Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.

Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.

Килобайт

Для измерения больших количеств байтов служат единицы «килобайт» = [1024] байт и «Кбайт»[3] (кибибайт, kibibyte) = 1024 байт (о путанице десятичных и двоичных единиц и терминов см. ниже). Такой порядок величин имеют, например:

Сектор диска обычно равен 512 байтам то есть половине килобайта, хотя для некоторых устройств может быть равен одному или двум кибибайт.

Классический размер «блока» в файловых системах UNIX равен одному Кбайт (1024 байт).

«Страница памяти» в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 байт, то есть 4 Кбайт.

Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.

Мегабайт

Единицы «мегабайт» = 1000 килобайт = [1 000 000] байт и «мебибайт»[3] (mebibyte) = 1024 Кбайт = 1 048 576 байт применяются для измерения объёмов носителей информации.

Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт.

Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны.

Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.

Гигабайт

Единицы «гигабайт» = 1024 мегабайт = [1048576] килобайт = [1073741824] байт и «Гбайт»[3] (гибибайт, gibibyte) = 1024 Мбайт = 230 байт измеряют объём больших носителей информации, например жёстких дисков. Разница между двоичной и десятичной единицами уже превышает 7 %.

Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 Мбайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти. Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.

Для исчисления ещё больших объёмов информации имеются единицы терабайт и тебибайт (1012 и 240 байт соответственно), петабайт и пебибайт (1015 и 250 байт соответственно) и т. д.

<<< < Предыдущая 1 2 34 / 84 5 6 7 8 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
19.07.2019148.99 Кб7инф безоп 3 ПР.doc
#
24.04.2019162.47 Кб28ИНФ.ЭКЗ.docx
#
08.09.201992.67 Кб62ИНФА реферат.doc
#
25.04.201929.22 Кб5инфа, вопросы не вошедшие.docx
#
17.11.201948.31 Кб7инфоматика лекция 1.docx
#
05.08.2019118.82 Кб8информатика ответ.docx
#
18.09.2019630.27 Кб21Информатика ответы.doc
#
21.11.2019184.19 Кб15информационная безопасность в проф деят.rtf
#
16.11.201963.49 Кб3Исикава.doc
#
28.08.201971.45 Кб5исм 3.docx
#
27.08.201995.74 Кб3Использование техногенных отходов.doc