- •Практическое занятие. Измерение количества информации
- •3.2 Измерение информации.
- •3.3 Представление текстовой информации
- •3.3 Представление графической информации
- •3.4 Представление звуковой информации
- •3.5 Единицы измерения информации
- •4 Содержание работы
- •4.1 Вычислить количество информации:
- •4.2 Решить задачи на представление текстовой информации
- •4.3 Решить задачи на представление графической информации
- •4.4 Решить задачи на представление звуковой информации
- •5 Контрольные вопросы
3.2 Измерение информации.
В информатике используются различные подходы к измерению информации:
Содержательный подход к измерению информации. Сообщение – информативный поток, который в процессе передачи информации поступает к приемнику. Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными Информация - знания человека, сообщение должно быть информативно, т.е. количество информации с точки зрения человека =1. Если сообщение не информативно, то количество информации = 0. (Пример: вузовский учебник по высшей математике содержит знания, но они не доступны 1-класснику) .
Вероятностный подход к измерения информации. Все события происходят с различной вероятностью, но зависимость между вероятностью событий и количеством информации, полученной при совершении того или иного события можно выразить формулой которую в 1948 году предложил Шеннон.
формула
Шеннона:
где:
I - количество информации
N – количество возможных событий
pi – вероятности отдельных событий
В случае равновероятностных событий
формула Шеннона переходит в формулу Хартли I=log2N.
Алфавитный подход к измерению информации не связывает кол-во информации с содержанием сообщения. Алфавитный подход - объективный подход к измерению информации. Он удобен при использовании технических средств работы с информацией, т.к. не зависит от содержания сообщения. Кол-во информации зависит от объема текста и мощности алфавита. Ограничений на max мощность алфавита нет, но есть достаточный алфавит мощностью 256 символов. Этот алфавит используется для представления текстов в компьютере. Поскольку 256=28, то 1символ несет в тексте 8 бит информации. 1 бит – такое кол-во информации, которое содержит сообщение, уменьшающее неопределенность знаний в два раза.
Бит (англ. bit - binary, digit - двоичная цифра).- это наименьшая единица измерения информации. 1байт = 8 бит
1Кб (килобайт) = 210 байт = 1024 байт
1Мб (мегабайт) = 210 Кб = 1024 Кб
1Гб (гигабайт) = 210 Мб = 1024 Мб
3.3 Представление текстовой информации
Каждому символу ставится в соответствие определенный уникальный числовой (двоичный) код. Таблица, устанавливающая такое соответствие, называется таблицей кодировки символов.
Количество различных символов (N), которые можно закодировать с помощью какой-либо таблицы кодировки,определяется числом двоичных разрядов (k), отводимых под кодирование одного символа:
N=2k
Наибольшее распространение получило 8-разрядное кодирование (на кодирование одного символа отводится 8 бит=1 байт), позволяющее закодировать N=28=256 различных символов.
Пусть K – количество символов в тексте, i – информационный «вес» одного символа. Тогда количество информации I, содержащейся в тексте, вычисляется по формуле: I=K•i.
Наиболее распространенные 8-разрядные таблицы кодировок: ASCII (принята в качестве стандарта в MS-DOS),Windows-1251 (CP1251), КОИ-8, ISO.
UNICODE – 16-разрядная кодировка символов, позволяющая закодировать 216=65536 различных символов.
