 
        
        - •Кодирование информации Методические указания к лабораторной работе по дисциплине «Информатика»
- •Оглавление
- •Теоретическая часть кодирование информации.
- •1. Представление чисел в компьютере
- •2. Кодирование текстовой информации. Кодировка ascii
- •2.1. Вычисление информационного объема сообщения
- •2.2. Кодирование и декодирование информации
- •3. Кодирование и обработка графической информации
- •Примеры типовых решений Задача №1
- •Задача №2
- •Задача №3
- •Задача №4
- •Задача №5
2. Кодирование текстовой информации. Кодировка ascii
Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью.
Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ.
Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код является порядковым номером символа в двоичной системе счисления.
Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является уже упоминавшаяся таблица кодировки ASCII.
Принцип последовательного кодирования алфавита заключается в том, что в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.
Стандартными в этой таблице являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.
2.1. Вычисление информационного объема сообщения
- с помощью K бит можно закодировать Q = 2K различных вариантов (чисел); 
- таблица степеней двойки, она же показывает, сколько вариантов Q можно закодировать с помощью K бит: 
| K, бит | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 
| Q, вариантов | 2 | 4 | 8 | 16 | 32 | 64 | 128 | 256 | 512 | 1024 | 
- при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 кбайт) – 1024 байта, в мегабайте (1Мбайт) – 1024 кбайта1; 
- чтобы найти информационный объем сообщения (текста) I, нужно умножить количество символов (отсчетов) N на число бит на символ (отсчет) K: I = N * K; 
- две строчки текста не могут занимать 100 кбайт в памяти; 
- мощность алфавита – это количество символов в этом алфавите. 
2.2. Кодирование и декодирование информации
- кодирование – это перевод информации с одного языка на другой (запись в другой системе символов, в другом алфавите); 
- обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код, а декодированием – обратный переход; 
- один символ исходного сообщения может заменяться одним символом нового кода или несколькими символами, а может быть и наоборот – несколько символов исходного сообщения заменяются одним символом в новом коде (китайские иероглифы обозначают целые слова и понятия); 
- кодирование может быть равномерное и неравномерное; при равномерном кодировании все символы кодируются кодами равной длины; при неравномерном кодировании разные символы могут кодироваться кодами разной длины, это затрудняет декодирование. 
