
Об одном из n равновероятных событий
N |
i |
N |
i |
N |
i |
N |
i |
1 |
0,00000 |
17 |
4,08746 |
33 |
5,04439 |
49 |
5,61471 |
2 |
1,00000 |
18 |
4,16993 |
34 |
5,08746 |
50 |
5,64386 |
3 |
1,58496 |
19 |
4,24793 |
35 |
5,12928 |
51 |
5,67243 |
4 |
2,00000 |
20 |
4,32193 |
36 |
5,16993 |
52 |
5,70044 |
5 |
2,32193 |
21 |
4,39232 |
37 |
5,20945 |
53 |
5,72792 |
6 |
2,58496 |
22 |
4,45943 |
38 |
5,24793 |
54 |
5,75489 |
7 |
2,80735 |
23 |
4,52356 |
39 |
5,28540 |
55 |
5,78136 |
8 |
3,00000 |
24 |
4,58496 |
40 |
5,32193 |
56 |
5,80735 |
9 |
3,16993 |
25 |
4,64386 |
41 |
5,35755 |
57 |
5,83289 |
10 |
3,32193 |
26 |
4,70044 |
42 |
5,39232 |
58 |
5,85798 |
11 |
3,45943 |
27 |
4,75489 |
43 |
5,42626 |
59 |
5,88264 |
12 |
3,58496 |
28 |
4,80735 |
44 |
5,45943 |
60 |
5,90689 |
13 |
3,70044 |
29 |
4,85798 |
45 |
5,49185 |
61 |
5,93074 |
14 |
3,80735 |
30 |
4,90689 |
46 |
5,52356 |
62 |
5,95420 |
15 |
3,90689 |
31 |
4,95420 |
47 |
5,55459 |
63 |
5,97728 |
16 |
4,00000 |
32 |
5,00000 |
48 |
5,58496 |
64 |
6,00000 |
Алфавитный подход к измерению информации.
А теперь познакомимся с другим способом измерения информации. Этот способ называется алфавитным подходом.
А
ЛФАВИТНЫЙ
ПОДХОД
Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык.
Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел (промежуток между словами).
М
ОЩНОСТЬ
АЛФАВИТА
Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и дополнительных символов равна 54.
Представьте себе, что текст к вам поступает последовательно, по одному знаку, словно бумажная ленточка, выползающая из телеграфного аппарата. Предположим, что каждый появляющийся на ленте символ с одинаковой вероятностью может быть любым символом алфавита. (В действительности это не совсем так, но для упрощения примем такое предположение.)
В каждой очередной позиции текста может появиться любой из N символов. Каждый символ несет i бит информации; число i можно определить из уравнения:
2i = N
Для N = 54, используя таблицу 1, получаем: i = 5,755 бит.
Столько информации несет один символ в русском тексте. А теперь для того, чтобы найти количество информации во всем тексте, нужно посчитать число символов в нем и умножить на i.
Возьмем с книжной полки какую-нибудь книгу и посчитаем количество информации на одной ее странице. Пусть страница содержит 50 строк. В каждой строке — 60 символов. Значит, на странице умещается 50 х 60 = 3000 знаков. Тогда объем информации будет равен: 5,755 х 3000 = 17265 бит.
Следовательно, при алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от объема текста (то есть от числа знаков в тексте) и от мощности алфавита.
Отсюда следует, например, что нельзя сравнивать информационные объемы текстов, написанных на разных языках, только по объему. У них отличаются информационные веса одного символа так как мощности алфавитов разных языков — различные.
Но если книги написаны на одном языке, то понятно, что в толстой книге информации больше, чем в тонкой. При этом содержательная сторона книги в расчет не берется.
С формулируем правило, как измерить информацию, используя для этого алфавитный подход.
Количество информации, содержащееся в символьном сообщении, равно
I = К х i,
где К— число символов в тексте сообщения,
i— информационный вес символа, который находится из уравнения
2i = N, где N— мощность используемого алфавита.
Применение алфавитного подхода удобно, прежде всего, при использовании технических средств работы с информацией. В этом случае теряют смысл понятия «новые — старые», «понятные — непонятные» сведения. Алфавитный подход является объективным способом измерения информации в отличие от субъективного, содержательного, подхода.
Удобнее всего измерять информацию, когда мощность алфавита N равна целой степени числа 2. Например, если N = 16, то каждый символ несет 4 бита информации потому, что 24 = 16. А если N = 32, то один символ «весит» 5 бит.
Ограничения на максимальную мощность алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. С ним мы скоро встретимся при работе с компьютером. Это алфавит мощностью 256 символов. В таком алфавите можно поместить практически все необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания. В такой алфавит помещают даже значки, с помощью которых можно чертить рамки, таблицы. Их называют знаками псевдографики.
Поскольку 256 = 28, то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ейприсвоили свое название — байт.
1 байт = 8 бит
В этом случае легко подсчитать объем информации в тексте. Если один символ алфавита несет 1 байт информации, то надо просто сосчитать число символов; полученное значение даст информационный объем текста в байтах.
Пусть небольшая книжка содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Значит, страница содержит 40 х 60 = 2400 байт информации. Объем всей информации в книге:
2400 х 150 = 360 000 байт.
Уже на таком примере видно, что байт — «мелкая» единица. А представьте, что нужно измерить информационный объем научной библиотеки. Какое это будет громадное число в байтах! В любой системе единиц измерения существуют основные единицы и производные от них. Последние нужны для измерения либо очень больших, либо очень маленьких величин.
Для измерения больших объемов информации используются производные от байта единицы.
1 килобайт = 1Кб = 210 байт = 1024 байта
1 мегабайт = 1Мб = 210 Кб = 1024 Кб
1 гигабайт = 1Гб = 210 Мб = 1024 Мб
Следовательно, объем вышеупомянутой книги равен приблизительно тремстам шестидесяти килобайтам. А если посчитать точнее, то получится:
360000/1024 = 351,5625 Кб
351,5625/1024 = 0,34332275 Мб
Прием-передача информации могут происходить с разной скоростью.
СКОРОСТЬ ИНФОРМАЦИОННОГО ПОТОКА
(
или
скорость передачи информации)
Эта скорость выражается в таких единицах: бит в секунду (бит/с), байт в секунду (байт/с), килобайт в секунду (Кбайт/с) и т.д.
Если передатчиком и приемником информации являются технические устройства (телетайпы, телефаксы, компьютеры), скорость информационного обмена много выше, чем между людьми. Технические средства, связывающие передатчик и приемник информации в таких системах, называются каналами связи. Это, например, телефонные линии, кабельные линии, радиоустройства.
ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА
И
нформационные
объекты различных видов
ИНФОРМАЦИОННЫЕ
ОБЪЕКТЫ
Информация может существовать в самом разнообразном виде:
Попробуем структурировать громадное количество видов информационных объектов.
Во-первых, информационные объекты различаются по способу восприятия информации.
Человек воспринимает информацию из окружающего мира с помощью своих органов чувств; их пять:
зрение: с помощью глаз люди различают цвета, воспринимают зрительную информацию, к которой относятся и текстовая, и числовая, и графическая;
слух: уши помогают воспринимать звуковую информацию – речь, музыку, звуковые сигналы, шум;
вкус: вкусовые рецепторы языка дают возможность получить информацию о том, каков предмет на вкус – горький, кислый, сладкий, соленый;
обоняние: с помощью носа люди получают информацию о запахах окружающего мира;
осязание: кончиками пальцев (или просто кожей), наощупь можно получить информацию о температуре предмета – горячий он или холодный, о качестве его поверхности – гладкий или шершавый.
Около 90% информации поступает к нам через зрение, 9% черезслух. Но и запахи, вкусовые и осязательные ощущения тоже несут 1% информации. Например, почувствовав запах гари, вы узнали, что на кухне сгорел обед, о котором забыли. На вкус вы легко узнаете знакомую пищу, на ощупь — знакомые предметы даже в темноте.
Во-вторых, по форме представления информации.
текстовая — способ кодирования речи человека специальными символами — буквами; особенно большое значение этот способ приобрел после изобретения бумаги и книгопечатания;
числовая — количественная мера объектов и их свойств в окружающем мире; особенно большое значение приобрела с развитием торговли, экономики и денежного обмена; аналогично текстовой информации для ее отображения используется метод кодирования специальными символами — цифрами, причем системы кодирования (счисления) могут быть разными;
графическая или изобразительная — первый вид, для которого был реализован способ хранения информации об окружающем мире в виде наскальных рисунков, а позднее в виде картин, фотографий, схем, чертежей на бумаге, холсте, мраморе и др. материалах, изображающих картины реального мира;
звуковая — мир вокруг нас полон звуков и задача их хранения и тиражирования была решена с изобретением звукозаписывающих устройств в 1877 г.; ее разновидностью является музыкальная информация — для этого вида был изобретен способ кодирования с использованием специальных символов, что делает возможным хранение ее аналогично графической информации;
видеоинформация — способ сохранения «живых» картин окружающего мира, появившийся с изобретением кино.
Существуют также виды информации, для которых до сих пор не изобретено способов их кодирования и хранения — это тактильная информация, передаваемая ощущениями, органолептическая, передаваемая запахами и вкусами и др.
В-третьих, по общественному значению информации.
личная – это знания, опыт, интуиция, умения, эмоции, наследственность конкретного человека;
общественная– общественно-политическая, научно-популярная, т. е. то, что мы получаем из средств массовой информации. Кроме того, это опыт всего человечества, исторические, культурные и национальные традиции и др.;
обыденная – та, которой мы обмениваемся в процессе общения;
эстетическая – изобразительное искусство, музыка, театр и др.;
специальная – научная, производственная, техническая, управленческая.
Информация нам нужна для того, чтобы принимать правильные решения. Рассмотрим свойства информации, т.е. ее качественные признаки.