Меры и единицы представления, измерения и хранения информации в компьютере

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет низкотемпературных и пищевых технологий

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекции по информатике для тестирования.doc

Скачиваний:

Добавлен:

01.03.2025

Размер:

576.51 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 233 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 > Следующая >>>

Меры и единицы представления, измерения и хранения информации в компьютере

Подход к информации как к мере уменьшения неопределённости наших знаний позволяет количественно измерять информацию, полученную через некоторое сообщение.

Клод Шеннон предложил в 1948 году формулу для определения количества информации, которую мы получаем после получения одного из N возможных сообщений ([3] стр.10):

I = –(p₁log₂p₁+ p₂log₂p₂+…+ p_Nlog₂p_N)

Здесь p_i – вероятность того, что будет получено именно i-е сообщение. Если все сообщения равновероятны, то все p_i=1/N и из этой формулы получается формула Хартли:

I = log₂N

Бит – количество информации, необходимое для различения двух равновероятных сообщений. В вычислительной технике битом называют наименьший элемент памяти, необходимый для хранения одного из двух знаков «0» или «1», используемых для внутримашинного представления данных и команд.

Наряду с единицей бит иногда используют в качестве единицы информации количество, взятое по логарифму с другим основанием: дит – по десятичному логарифму, нут (нат, нит?) – по натуральному основанию.

(Если за единицу информации выбрать количество информации, необходимой для различения десяти равновероятных сообщений, то это будет десятичная (дит) единица информации.)

Бит очень удобен для использования двоичной формы представления информации. Для каждого типа информации (символьный, текстовый, графический, числовой) был найден способ представить ее в едином виде как последовательности только двух символов. Каждая такая последовательность называется двоичным кодом. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим числом простых однотипных элементов, чем с небольшим числом сложных.

Двоичные символы могут кодироваться любым способом: буквами А, Б; словами ДА, НЕТ, двумя устойчивыми состояниями системы и т.д. Однако ради простоты записи были взяты цифры 1 и 0.

Способы двоичного кодирования информации разного типа: текстовой, числовой, графической, аудио- и видео-информации рассмотрены в [1] стр. 59–69, [4] стр. 59–69, 107–122.

Байт – элемент памяти компьютера, состоящий из 8 битов.

Более крупные единицы измерения информации:

1 Кб=2¹⁰байт=1024 байт

1 Мб=2¹⁰Кбайт=1024 Кбайт=2²⁰байт

1 Гб=2¹⁰Мбайт=1024 Мбайт=2³⁰байт

1 Терабайт=2¹⁰Гбайт=1024 Гбайт=2⁴⁰байт

1 Петабайт=2¹⁰Тбайт=1024 Тбайт=2⁵⁰байт

Кодирование числовой информации [1] – стр. 65; [4] – стр. 103–107.

Основные виды данных, с которыми работает ЭВМ.

1. Целые: – Byte- 0-256 (один байт памяти); – Integer – -32768– 32767 (два байта памяти); – Long – -2 147 483 648 – 2 147 483 647) (четыре байта памяти)

2. Вещественные: – Single – 7-8 значащих цифр от -1,4*10^-45 до 3,4*10³⁸ (четыре байта памяти); – Double – 15-16 значащих цифр от -5,0*10^-324 до 1,7*10³⁰⁸ (восемь байт памяти).

3. символьные (один байт памяти)

4. логические (Boolean)

Способы кодирования целых чисел. Различают прямой, обратный и дополнительный коды (способы кодировки).Для положительных целых чисел прямой, обратный и дополнительный коды одинаковы. В прямом коде первый бит памяти, отведённый под число, показывает знак числа: 0 – положительное, 1 – отрицательное. Остальные биты отводятся под двоичный код модуля числа.

Примеры.

127₁₀→ 0111 1111₂ ; –127₁₀→ 1111 1111; 1₁₀→ 0000 0001₂ –1₁₀ –→ 1000 0001₂

В обратном коде все двоичные цифры, кроме знака, инвертируют (заменяют 0→ 1, 1→ 0).

Примеры. –127₁₀→ 1111 1111₂ → 10000000₂; –1₁₀ → 1111 1110₂.

Дополнительный код получают из обратного кода целого отрицательного числа, добавляя к младшему разряду 1₂.

Примеры. –1₁₀ →1111 1111₂ ; –127₁₀→ 1000 0001₂

Кодирование текстовой информации [1] – стр. 62–65; [4] – стр. 107–111.

Кодирование графической, аудио- и видеоинформации [1] – стр. 65–69, 714–715; [4] – стр. 111–119.

Байт может находиться в 2⁸ = 256 различных состояний. Эти состояния перенумерованы, и каждому сопоставляется какой-либо буквенный символ или графический элемент, необходимый при оформлении текстовой информации. Такое соответствие называется кодовой таблицей. В настоящее время применяются разные варианты кодовых таблиц. Наиболее распространённые:

ASCII – American Standart Code for Information Interchange – американский стандартный код для обмена информацией;

КОИ8-Р – Код Обмена Информацией 8-битный с кириллицей;

CP1251 – (Code Page) – кодировка с кириллицей в Microsoft Windows;

CP866 – кодировка MSDOS;

ISO 8859-5 – International Standards Organization – Международная организация по стандартизации. Ещё один стандарт для кодов для кириллицы.

Множество кодовых таблиц вызвано тем, что с учетом разнообразия естественных языков и фирм, выпускающих программное обеспечение, 256 состояний одного байта недостаточно для того, чтобы закодировать все встречающиеся символы и способы форматирования текста. При разработке всех кодовых таблиц использовано следующее соглашение: первая половина таблицы – это коды с 0 по 127 – интернациональна, то есть, одинакова во всех вариантах кодировок. Первые 33 состояния (0–32) – это коды операций с текстом (перевод на новую строку, пробел, удаление последнего символа и т. п.). Затем состояния с 33 по 127 – это коды знаков препинания, арифметических действий, цифр, строчных и прописных букв латинского алфавита. Вторая половина кодовых таблиц отводится под знаки национальных и специальных алфавитов и ввода в текст графических элементов для оформления таблиц.

В конце 90-х годов появился новый международный стандарт Unicode, который отводит под символ 2 байта. Каждый блок из 2-х байт может находиться в 2¹⁶ =65536 состояниях. Этого достаточно, чтобы в одной таблице собрать символы большинства алфавитов мира. Правда, длина текста удваивается, и скорость его обработки замедляется. Но, в связи с существенным увеличение памяти и быстродействия современных компьютеров, этим можно пренебречь.

-------------------------------------------------------------------------------------------------------

<<< < Предыдущая 1 23 / 233 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.03.202556.52 Mб3Лаба.rtf
#
01.05.20151.38 Mб33лабор практикум.doc
#
01.05.2025772.61 Кб1Лабораторная работа № 2 Гипотермия.doc
#
01.05.2025927.74 Кб0Лабораторная работа №1 Коэффициент теплоотдачи.doc
#
01.05.20151.31 Mб39Лабораторный практикум - Основы работы в EXCEL.doc
#
01.03.2025576.51 Кб0Лекции по информатике для тестирования.doc
#
11.11.2018488.96 Кб33Лекции, кадровый менеджмент.doc
#
10.03.2016123.39 Кб15Лекция 1.doc
#
01.05.2025170.5 Кб0Лекция 14_Межд.формы расчетов.doc
#
29.07.2019105.47 Кб12Лекция 6_Транспортная.doc
#
11.09.201961.95 Кб21ЛЕкция No.11.doc