
- •2. КОДИРОВАНИЕ ИНФОРМАЦИИ
- •Для определения количества информации был найден способ представить любой ее тип (символьный, текстовый,
- •2.1. Количественное измерение информации
- •Информационная емкость чисел
- •2.2.Кодирование различных типов информации
- •Кодирование целых и действительных чисел
- •Кодирование текстовой информации.
- •Рассмотрим первую половину кодовой таблицы.
- •Кодирование графической информации
- •Объем растрового изображения определяется умножением количества точек на рисунке на информационный объем одной
- •Кодирование звуковой информации
2. КОДИРОВАНИЕ ИНФОРМАЦИИ
2.1.Количественное измерение информации
2.2.Кодирование различных типов информации
Тема 2 Кодирование |
1 |
|
информации |
||
|
Для определения количества информации был найден способ представить любой ее тип (символьный, текстовый, графический) в едином виде, что позволило все типы информации преобразовать к единому стандартному виду. Таким видом стала так называемая двоичная форма представления информации. Она заключается в записи любой информации в виде последовательности только двух символов. Каждая такая последовательность называется двоичным кодом. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим числом простых однотипных элементов, чем с небольшим числом сложных.
Тема 2 Кодирование |
2 |
|
информации |
||
|
2.1. Количественное измерение информации
Двоичные символы могут кодироваться любым способом: буквами А, Б; словами ДА, НЕТ, двумя устойчивыми состояниями системы и т.д. Однако ради простоты записи были взяты цифры 1 и 0. Обработка информации в ЭВМ основана на обмене электрическими сигналами между различными устройствами машины. В компьютере, хранящем, либо обрабатывающем информацию, рассматриваемые символы 0 и 1 могут также обозначаться по-разному: один из них - наличием в рассматриваемом элементе электрического тока, либо магнитного поля, второй - отсутствием электрического тока, либо магнитного поля.
Таким образом, в ЭВМ реализуются два устойчивых состояния. Эти два устойчивых состояния информационной системы определяют единицу измерения информации, называемую БИТОМ. Количество информации, кодируемое двоичной цифрой - 0 или 1, называется битом. Благодаря введению понятия единицы информации появилась возможность определения размера любой информации числом битов.
Процесс получения двоичной информации об объектах исследования называют кодированием информации. Кодирование информации перечислением всех возможных событий очень трудоемко. Поэтому на практике кодирование осуществляется более простым способом. Он основан на том, что один разряд последовательности двоичных цифр имеет уже вдвое больше различных значений - 00, 01, 10, 11, чем одноразрядные 0 и 1. Трехразрядная последовательность имеет также вдвое больше значений - 000, 001, 010, 011, 100, 101, 110, 111, чем двухразрядная и т.д. Добавление одного разряда увеличивает число значений вдвое, это позволяет составить
следующую таблицу информационнойТема 2 емкостиКодированиечисел: 3
информации

Информационная емкость чисел
Кол-во двоичных |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
разрядов |
|
|
|
|
|
|
|
|
Объем |
2 |
4 |
8 |
16 |
32 |
64 |
128 |
256 |
информации |
|
|
|
|
|
|
|
|
Кол-во двоичных |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
разрядов |
|
|
|
|
|
|
|
|
Объем |
512 |
1024 |
2048 |
4096 |
8192 |
16384 |
32768 |
65536 |
информации |
|
|
|
|
|
|
|
|
Пользуясь вышеприведенной таблицей легко закодировать любое множество событий. Например, нам нужно закодировать 32 буквы русского алфавита, для этой цели достаточно взять пять разрядов, потому что пятиразрядная последовательность имеет 32 различных значения.
Для измерения больших объемов информации пользоваться битами неудобно. Поэтому применяются кратные биту единицы измерения информации:
Тема 2 Кодирование |
4 |
|
информации |
||
|
2.2.Кодирование различных типов информации
Спомощью набора битов, можно представить любое число и любой знак. В информационных документах широко используются не только русские, но и латинские буквы, цифры, математические знаки и другие специальные знаки, всего их количество составляет примерно 200-250 символов. Поэтому для кодировки всех указанных символов используется восьмиразрядная
последовательность цифр 0 и 1. Таким образом, текстовая информация кодируется с помощью кодовой таблицы.
Кодовая таблица – это внутреннее преставление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII – Американский стандартный код для обмена информацией. Для хранения двоичного кода одного символа выделен 1 байт = 8 бит.
Следует отметить, что указанный способ кодирования используется тогда, когда к нему не предъявляются дополнительные требования, такие как необходимость указать на возникшую ошибку, исправление ошибки, секретность информации. При специальном кодировании коды получаются длиннее, чем в указанной таблице.
Наиболее просто кодируется числовая информация – она просто переводится в двоичную систему исчисления.
Тема 2 Кодирование |
5 |
|
информации |
||
|
Кодирование целых и действительных чисел
Целые числа кодируются двоичным кодом достаточно просто - необходимо взять целое число и делить его пополам до тех пор, пока частное не будет равно единице. Совокупность остатков от каждого деления, записанная справа налево вместе с последним частным, и образует двоичный аналог десятичного числа.
Для кодирования целых чисел от 0 до 255 достаточно иметь 8 разрядов двоичного кода (8 бит). 16 бит позволяют закодировать целые числа от 0 до 65535, а 24 – уже более 16,5 миллионов различных значений.
Для кодирования действительных чисел предварительно их преобразовывают в нормализованную форму:
3,1414926 = 0,31415926*101 |
300 000 = 0,3*106 |
Первая часть числа называется мантиссой, вторая – порядком. Большую часть из разрядной сетки отводят для хранения мантиссы (вместе со знаком) и меньшее количество разрядов - отводят для хранения порядка (вместе со знаком).
Тема 2 Кодирование |
6 |
|
информации |
||
|
Кодирование текстовой информации.
С помощью одного байта можно закодировать 256 различных значений. Всему населению мира необходимо договориться о том, каким кодом (от 0 до 255) должен кодироваться каждый символ. Всеобщая договоренность об одинаковом использовании чего-либо называется стандартом.
Стандарт устанавливает таблицу кодов, в которой записано, каким кодом должен кодироваться каждый символ. Но символы, которые хороши для одной страны, не подходят для другой. Поэтому было принято решение таблицу кодов разделить пополам. Первые 128 кодов (с 0 до 127) должны быть стандартными и обязательными для всех стран и всех компьютеров, а во второй половине таблицы (с кода 128 до кода 255) каждая страна создает в этой половине свой стандарт - национальный.
Первую (международную) половину таблицы называют таблицей ASCII – ее ввел американский институт стандартизации ANSI. В этой таблице размещаются прописные и строчные буквы английского алфавита, символы чисел от 0 до 9 , все знаки препинания, символы арифметических операций и некоторые другие специальные коды.
Тема 2 Кодирование |
7 |
|
информации |
||
|
Рассмотрим первую половину кодовой таблицы.
Коды от 0 до 32 - управляющие коды, которые используются не для представления информации, а применяются для управления компьютером. Они отданы на усмотрение производителей компьютерных сетей.
Специальные символы и знаки препинания имеют коды с 33 по 47. Далее идут 10 цифр (коды с 48 - 57).
Коды 58-64 используют некоторые математические символы и знаки препинания.
Коды с 65 по 90 обозначают прописные английские буквы от А до Z. Коды 91-96 используются для специальных символов.
Коды 97-122 - строчные буквы латинского алфавита. Коды 123-127 - специальные символы
Тема 2 Кодирование |
8 |
|
информации |
||
|

Кодирование графической информации
Графическая информация представляется вычислительных устройствах двумя способами:
•растровым;
•векторным.
Растровое изображение – совокупность точек, используемых для его изображения на экране монитора. Для черно-белого изображения информации объем одной точки равен 1 биту, т.к. она может быть либо черной, либо белой, что закодируют 0 или 1.
Для отображения цветных точек из 8 цветов – 3 бита, 16 – 4 бита, 256– 8 бит (1 байт).
Разные цвета и их оттенки получаются за счет наличия или отсутствия 3-х основных цветов (красного, синего, зеленого) и их яркости. Каждая точка кодируется с помощью 4 бит. Например:
Тема 2 Кодирование |
9 |
|
информации |
||
|
Объем растрового изображения определяется умножением количества точек на рисунке на информационный объем одной точки, который зависит от количества возможных цветов отображения (для черно-белого изображения информационный объем одной точки равен 1 биту и кодируется двумя цифрами – 0 или 1). Разные цвета и их оттенки получаются за счет наличия или отсутствия трех основных цветов – красного, синего, зеленого и их яркости. Каждая точка на экране кодируется с помощью 4 битов.
Векторное изображение кодируется разбиением рисунка на элементарные отрезки, геометрические фигуры и дуги. Положение этих элементарных объектов определяется координатами точек. Для каждой линии указывается ее тип (сплошная, пунктирная, штрих- пунктирная ), толщина и цвет. Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами.
Тема 2 Кодирование |
10 |
|
информации |
||
|