
- •Лекция 1. Основные понятия информатики. Измерение информации. [Семакин, глава 1, стр.9-24] План:
- •2. Информация и ее свойства
- •3. Данные и их свойства, кодирование данных
- •4. Измерения информации
- •4.1. Содержательный подход
- •Объемный подход (или алфавитный)
- •Лекция 2. Дискретное представление данных в компьютере
- •Правила представления данных в компьютере
- •Представление чисел Представление целых чисел
- •Прямой и дополнительный код
- •Вещественные числа в компьютере
- •3. Представление текста, графики и звука в компьютере Текстовая информация
- •Графическая и звуковая информация
- •Пространственная дискретизация изображения
- •Решение:
- •Решение:
- •Временная дискретизация звука
- •Кодирование фильмов
Объемный подход (или алфавитный)
Информация рассматривается как последовательность символов – знаков (цифр, букв, кодов цветов точек изображений и т.д.).
Алфавитный подход к измерению информации не связывает количество информации с содержательным сообщением. Алфавитный подход является объективным, т. е. он не зависит от человека, воспринимающего текст.
Рассмотрим этот подход на примере текста, написанного на каком-нибудь языке, например, на русском. Все множество используемых в языке символов будем называть алфавитом. Полное количество символов алфавита будем называть мощность алфавита. Информационная емкость знаков зависит от их количества в алфавите (мощности алфавита): чем больше их количество, тем больше количества информации несет один знак.
Например, в алфавит мощностью N=256 символов можно поместить все необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, знаки препинания и т.д. Представим себе, что текст, состоящий из 256 символов, поступает последовательно, и в каждый момент времени может появиться любой из них. Тогда по формуле (1):
2i = 256, → i=8 (бит)
Таким образом, один символ алфавита мощностью 256 символов имеет информационную емкость 8 бит.
При двоичном кодировании объем информации, выраженный в битах, равен длине двоичного кода, в котором информация представлена.
-
2i=N
где N –объем информации или мощность алфавита,
i – длина кода символа.
Как правило, компьютер работает не с отдельными битами, а с восемью битами сразу. Восемь последовательных битов образуют байт. В одном байте можно закодировать значение 1 символа из 256 возможных (256=28).
1Кб=1024Б=210 байт
1Мб=1024Кб=220 Байт
1Гб=1024Мб=230 Байт.
1Терабайт = 1024Гбайт = 240 Байт.
Условно часто считают, что 1Кбайт равен 1000 байтам.
Информационный объем текста в памяти компьютера измеряется в байтах. Он равен количеству знаков в записи текста, умноженную на длину кода.
I=K*i
где К – количество знаков в тексте,
i – длина кода 1 символа или количество информации, которое несет 1 символ.
Одна страница текста на листе А4, 12 шрифт, одинарный интервал – объем 40000 байтов, т.к. помещается 40000 знаков.
Задача. Система оптического распознавание символов позволяет преобразовывать отсканированные изображения страниц документа в текстовый формат со скоростью 4 страницы в минуту и использует алфавит мощностью 65536 символов. Какое количество информации будет нести текстовый документ, каждая страница которого содержит 40 строк по 50 символов, после 10 минут работы приложения?
Решение:
1. Определим информационную емкость алфавита:
-
2i=N
2i=65536
i = 16 битов
2. Определим количество информации на странице:
-
I=K*i
16*40*50=32000
I = 32000 битов=4000байтов
3. Определим количество информации, которое будет нести текстовый документ:
4000 байтов*4 листа*10 минут=160000 байтов = 156 Кбайт
Самостоятельно:
Задача. Пользователь компьютера может вводить в минуту 200 знаков. Мощность используемого алфавита равна 256. Какое количество информации может ввести пользователь за 5 минут? (Ответ – 8000 бит = 1000 байт)