Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИЗМЕРЕНИЕ И КОДИРОВАНИЕ ИНФОРМАЦИИ дополненное...doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
165.89 Кб
Скачать

Измерение и кодирование информации

Информация относится к фундаментальным, неопределяемым понятиям науки информатика. Тем не менее:

  • в быту информацией называют любые данные, сведения, знания, которые кого-либо интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и т.п.;

  • в технике под информацией понимают сообщения, передаваемые в форме знаков или сигналов (в этом случае есть источник сообщений, получатель (приемник) сообщений, канал связи);

  • в теории информации под информацией понимают сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают степень неопределенности, неполноты имеющихся о них знаний.

Применительно к компьютерной обработке данных под информацией понимают некоторую последовательность символических обозначений (букв, цифр, закодированных графических образов и звуков и т.п.), несущую смысловую нагрузку и представленную в понятном компьютеру виде. Каждый новый символ в такой последовательности символов увеличивает информационный объем сообщения.

1 бит — минимальная единица измерения информации. При вероятностном подходе к измерению информации это количество информации, уменьшающее неопределенность знаний в 2 раза.

Связь между единицами измерения информации: • 1 байт = 8 бит; • 1 Кб (килобайт) = 210 (1024) байт = 213 бит; • 1 Мб (мегабайт) = 210 (1024) Кб = 220 (1 048 576) байт = 223 бит; • 1 Гб (гигабайт) = 210Мб = 220 Кб = 230 байт = = 233 бит; • 1 Тб (терабайт) = 210 Гб = 220 Мб = 230 Кб = 240 байт = 243 бит.

Кодирование информации - это представление сообщений в конкретном виде при помощи некоторой последовательности знаков. Правило отображения одного набора знаков в другой называется кодом. Обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код, а декодированием – обратный переход.

При кодировании информации для представления ее в памяти ЭВМ используется двоичный способ, т.е. любая информация — будь то числа, текст, графическое изображение, звук или видео — представляется универсальным двоичным кодом. Алфавит этого кода составляют символы 0 и 1. Этот способ кодирования был выбран потому, что технически реализовать два существенно различных состояния, представляющих, соответственно, 0 или 1, значительно проще, чем, например, три или десять. Действительно, отсутствие напряжения может обозначать 0, наличие — 1; отсутствие намагниченности участка носителя информации — 0, присутствие намагниченности — 1 и т.д. Каждая цифра машинного кода несет 1 бит информации.

Для кодирования одного символа используют 8 бит - один байт.

 Байт - это наименьшая единица обработки информации. С помощью одного байта можно закодировать 28=256 символов.

  1. Существует таблица кодов символов. Первые коды с 0 по 127 являются стандартными и обязательными для всех стран и всех компьютеров.

  2. Коды с 0 по 32 соответствуют операциям (перевод строки, ввод пробела и т.д.)

  3. Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

  4. Коды с 128 по 225 являются национальными (в каждой стране разные), т.е. в национальных кодировках одному и тому же коду соответствуют различные символы.

Первую половину называют таблицей ASCII (Американский стандартный код для обмена информацией).

Для русских букв существует пять однобайтовых таблиц:

Windows, MS-DOS, КОИ-8, Mac, ISO.

Также разработан международный стандарт Unicode, в котором каждый символ кодируется двумя байтами.