
- •Измерение и кодирование информации
- •Задания на кодирование текстовой информации
- •Задания для самостоятельного выполнения на занятии Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Задания для самостоятельного выполнения дома
- •Кодировка изображений
- •Кодировка чисел
- •Перевод десятичных чисел в двоичные
Измерение и кодирование информации
Информация относится к фундаментальным, неопределяемым понятиям науки информатика. Тем не менее:
в быту информацией называют любые данные, сведения, знания, которые кого-либо интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и т.п.;
в технике под информацией понимают сообщения, передаваемые в форме знаков или сигналов (в этом случае есть источник сообщений, получатель (приемник) сообщений, канал связи);
в теории информации под информацией понимают сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают степень неопределенности, неполноты имеющихся о них знаний.
Применительно к компьютерной обработке данных под информацией понимают некоторую последовательность символических обозначений (букв, цифр, закодированных графических образов и звуков и т.п.), несущую смысловую нагрузку и представленную в понятном компьютеру виде. Каждый новый символ в такой последовательности символов увеличивает информационный объем сообщения.
1 бит — минимальная единица измерения информации. При вероятностном подходе к измерению информации это количество информации, уменьшающее неопределенность знаний в 2 раза.
Связь между единицами измерения информации: • 1 байт = 8 бит; • 1 Кб (килобайт) = 210 (1024) байт = 213 бит; • 1 Мб (мегабайт) = 210 (1024) Кб = 220 (1 048 576) байт = 223 бит; • 1 Гб (гигабайт) = 210Мб = 220 Кб = 230 байт = = 233 бит; • 1 Тб (терабайт) = 210 Гб = 220 Мб = 230 Кб = 240 байт = 243 бит.
Кодирование информации - это представление сообщений в конкретном виде при помощи некоторой последовательности знаков. Правило отображения одного набора знаков в другой называется кодом. Обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код, а декодированием – обратный переход.
При кодировании информации для представления ее в памяти ЭВМ используется двоичный способ, т.е. любая информация — будь то числа, текст, графическое изображение, звук или видео — представляется универсальным двоичным кодом. Алфавит этого кода составляют символы 0 и 1. Этот способ кодирования был выбран потому, что технически реализовать два существенно различных состояния, представляющих, соответственно, 0 или 1, значительно проще, чем, например, три или десять. Действительно, отсутствие напряжения может обозначать 0, наличие — 1; отсутствие намагниченности участка носителя информации — 0, присутствие намагниченности — 1 и т.д. Каждая цифра машинного кода несет 1 бит информации.
Для кодирования одного символа используют 8 бит - один байт.
Байт - это наименьшая единица обработки информации. С помощью одного байта можно закодировать 28=256 символов.
Существует таблица кодов символов. Первые коды с 0 по 127 являются стандартными и обязательными для всех стран и всех компьютеров.
Коды с 0 по 32 соответствуют операциям (перевод строки, ввод пробела и т.д.)
Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Коды с 128 по 225 являются национальными (в каждой стране разные), т.е. в национальных кодировках одному и тому же коду соответствуют различные символы.
Первую половину называют таблицей ASCII (Американский стандартный код для обмена информацией).
Для русских букв существует пять однобайтовых таблиц:
Windows, MS-DOS, КОИ-8, Mac, ISO.
Также разработан международный стандарт Unicode, в котором каждый символ кодируется двумя байтами.