
- •Единицы измерения количества информации
- •Формула Хартли
- •Формула Шеннона
- •Алфавитный подход
- •Приближение равной вероятности символов в тексте
- •«Без труда не вытащишь рыбку из пруда.»
- •Приближение разной вероятности встречаемости символов в тексте
- •Частотный словарь русского языка – словарь вероятностей (частот) появления букв в произвольном тексте – приведен ниже. Определите, какое количество информации несет каждая буква этого словаря.
- •Содержательный подход
- •Неравновероятные события (вероятностный подход)
- •Пример 4. В корзине лежат 32 клубка шерсти, из них 4 красных. Сколько бит информации несет сообщение о том, что достали клубок красной шерсти?
- •Задачи для самостоятельного решения
«Без труда не вытащишь рыбку из пруда.»
1)37 бит 2) 592 бита 3) 37 байт 4) 592 байта
Решение:
Длина фразы составляет примерно 40 символов. Следовательно, ее объем можно приблизительно оценить в 40 2 =80 байт. Такого варианта ответа нет, попробуем перевести результат в биты: 80 байт 8 = 640 бит. Наиболее близкое значение из предложенных — 592 бита. Заметим, что разница между 640 и 592 составляет всего 48/16 = 3 символа в заданной кодировке и его можно считать несущественным по сравнению с длиной строки.
Ответ: 2.
Замечание: Подсчетом символов в строке можно убедиться, что их ровно 37 (включая точку и пробелы), поэтому оценка 592 бита = 74 байта, что соответствует ровно 37 символам в двухбайтовой кодировке, является точной.
Пример 6. Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100%, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.
1) 80 бит 2) 70 байт 3) 80 байт 4) 560 байт
Решение:
Способ 1
Воспользуемся формулой алфавитного подхода к измерению количества информации I = M log2N, где N — количество символов (мощность) алфавита, в котором записано сообщение, М — количество символов в записи сообщения (длина сообщения), I — количество бит информации, содержащееся в сообщении.
Алфавитом в данном случае является множество целочисленных значений влажности от 0 до 100. Таких значений 101. Поэтому информационный объем результатов одного измерения I=log2101. Это значение не будет целочисленным. Не вычисляя его, сразу найдем округленное в большую сторону целое значение. Заметим, что ближайшая к 101 целая степень двойки, большая 101, есть число 128 = 27. Поэтому принимаем 7=log2128 = 7 бит. Учитывая, что станция сделала 80 измерений, общий информационный объем равен 80 7=560 бит =70 байт.
Ответ: 2.
Способ 2
Воспользуемся следствием из формулы. Заметим, что 26< 101 < 27, поэтому минимально необходимое количество двоичных разрядов (бит) равно 7. Далее аналогично получаем, что общий информационный объем равен 80 7 = 560 бит = 70 байт.
Ответ: 2.
Пример 7. Для регистрации на сайте некоторой страны пользователю требуется придумать пароль. Длина пароля – ровно 11 символов. В качестве символов используются десятичные цифры и 12 различных букв местного алфавита, причём все буквы используются в двух начертаниях: как строчные, так и заглавные (регистр буквы имеет значение!).
Под хранение каждого такого пароля на компьютере отводится минимально возможное и одинаковое целое количество байтов, при этом используется посимвольное кодирование и все символы кодируются одинаковым и минимально возможным количеством битов.
Определите объём памяти, который занимает хранение 60 паролей.
1) 540 байт 2) 600 байт 3) 660 байт 4) 720 байт
Решение:
согласно условию, в пароле можно использовать 10 цифр (0..9) + 12 заглавных букв местного алфавита + 12 строчных букв, всего 10 + 12 + 12 = 34 символа
для кодирования 34 символов нужно выделить 6 бит памяти (5 бит не хватает, они позволяют закодировать только 25= 32 варианта)
для хранения всех 11 символов пароля нужно 11 6 = 66 бит
поскольку пароль должен занимать целое число байт, берем ближайшее большее (точнее, не меньшее) значение, которое кратно 8: это 72 = 9 8; то есть один пароль занимает 9 байт
тогда 60 паролей занимают 9 60 = 540 байт
Ответ: 1.
Задачи для самостоятельного решения
При составлении сообщения использовали 128-символьный алфавит. Каким будет информационный объем такого сообщения, если оно содержит 2048 символов?
Сколько символов содержит сообщение, записанное с помощью 256-символьного алфавита, если объем его составил 1/32 Мбайта?
Информационное сообщение объемом 2,5 Кбайта содержит 2560 символов. Чему равна мощность алфавита, при помощи которого было записано данное сообщение?
Для записи сообщения использовался 128-символьный алфавит. Каждая страница содержит 25 строк. Все сообщение содержит 8750 байт и занимает 5 страниц. Сколько символов в строке?
Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 4 символа, второй - 16 символов. Во сколько раз отличается количество информации в этих текстах?
Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения: «Царь Соломон - сын царя Давида».
Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения: «В 60-х годах транзисторы стали элементарной базой для ЭВМ второго поколения».
Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей пушкинской фразы в кодировке Unicode: «Привычка свыше нам дана: Замена счастию она.»
Каждый символ в Unicode закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке: «Без охоты не споро у работы.»
Автоматическое устройство осуществило перекодировку информационного сообщения из 16-битной кодировки Unicode в 8-битную кодировку КОИ – 8. При этом информационный объем сообщения уменьшился на 16 байтов. Сколько бит было в первоначальном сообщении?
1) 512 2) 374 3) 256 4)128
Автоматическое устройство осуществило перекодировку информационного сообщения из 16-битной кодировки Unicode в 8-битную кодировку КОИ-8 и потом удалило половину сообщения. После этог7о информационный объем сообщения стал равен 24 байт. Сколько бит было в первоначальном сообщении?
64 2) 128 3) 256 4) 1024
Автоматическое устройство осуществило перекодировку информационного сообщения из 8-битной кодировки ASCII в два равных по длине информационных сообщения в 16-битной кодировке Unicode. При этом информационный объем каждого нового сообщения увеличился на 8 байт. Какова длина первоначального сообщения в байтах?
8 2) 9 3) 16 4) 24
В марафоне участвуют 12 спортсменов. Специальное устройство регистрирует прохождение финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого бегуна. Каков информационный объем сообщения, записанного устройством, после того как финиш пересекли 2/3 спортсменов?
6 байт 2) 32 бита 3) 3 байта 4) 48 бит
Метеорологическая станция ведет наблюдения за скоростью ветра. Результатом одного измерения является целое число от 1 до 20, которое записывается при помощи минимально возможного количества бит. Определите информационный объем всех результатов наблюдения за март.
175 бит 2) 155 бит 3) 55 байт 4) 20 байт
В бассейне ведется наблюдение за температурой воды. Результатом одного измерения является целое число от +10 до +35 градусов, которое записывается при помощи минимально возможного количества бит. Было сделано 27 измерений. Определите информационный объем всех результатов наблюдения. (ЕГЭ 2011. Информатика: сборник заданий/Е. М. Зорина, М. В. Зорин. – М.: Эксмо, 2010. – 208 с.)
54 байта 2) 65 байт 3) 128 бит 4) 162 бита
Азбука Морзе позволяет кодировать символы для радиосвязи, задавая комбинацию точек и тире. Сколько различных символов (цифр, букв, знаков пунктуации и т.д.) можно закодировать, используя код Морзе длиной не менее пяти и не более шести сигналов (точек и тире)?