- •Кодирование информации Методические указания к лабораторной работе по дисциплине «Информатика»
- •Оглавление
- •Теоретическая часть кодирование информации.
- •1. Представление чисел в компьютере
- •2. Кодирование текстовой информации. Кодировка ascii
- •2.1. Вычисление информационного объема сообщения
- •2.2. Кодирование и декодирование информации
- •3. Кодирование и обработка графической информации
- •Примеры типовых решений Задача №1
- •Задача №2
- •Задача №3
- •Задача №4
- •Задача №5
2. Кодирование текстовой информации. Кодировка ascii
Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью.
Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ.
Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код является порядковым номером символа в двоичной системе счисления.
Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является уже упоминавшаяся таблица кодировки ASCII.
Принцип последовательного кодирования алфавита заключается в том, что в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.
Стандартными в этой таблице являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.
2.1. Вычисление информационного объема сообщения
с помощью K бит можно закодировать Q = 2K различных вариантов (чисел);
таблица степеней двойки, она же показывает, сколько вариантов Q можно закодировать с помощью K бит:
K, бит |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Q, вариантов |
2 |
4 |
8 |
16 |
32 |
64 |
128 |
256 |
512 |
1024 |
при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 кбайт) – 1024 байта, в мегабайте (1Мбайт) – 1024 кбайта1;
чтобы найти информационный объем сообщения (текста) I, нужно умножить количество символов (отсчетов) N на число бит на символ (отсчет) K: I = N * K;
две строчки текста не могут занимать 100 кбайт в памяти;
мощность алфавита – это количество символов в этом алфавите.
2.2. Кодирование и декодирование информации
кодирование – это перевод информации с одного языка на другой (запись в другой системе символов, в другом алфавите);
обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код, а декодированием – обратный переход;
один символ исходного сообщения может заменяться одним символом нового кода или несколькими символами, а может быть и наоборот – несколько символов исходного сообщения заменяются одним символом в новом коде (китайские иероглифы обозначают целые слова и понятия);
кодирование может быть равномерное и неравномерное; при равномерном кодировании все символы кодируются кодами равной длины; при неравномерном кодировании разные символы могут кодироваться кодами разной длины, это затрудняет декодирование.
