- •Информационные
- •Раздел 2
- •15. Код, кодирование, декодирование информации.
- •16. Примеры различных способов кодирования информации.
- •17. Двоичное кодирование информации в вычислительной технике.
- •18.1. Кодирование различных видов информации: текстовой информации.
- •18.2. Кодирование различных видов информации: графической информации.
- •18.3. Кодирование различных видов информации: звуковой информации.
- •19. Цифра, число, система счисления.
- •20.1. Непозиционные системы счисления. Примеры. Недостатки.
- •20.2. Непозиционные системы счисления. Древнеегипетская десятичная система.
- •20.3. Непозиционные системы счисления. Римская система.
- •21. Позиционные системы счисления. Примеры.
- •22. Развернутая форма записи числа в позиционной системе счисления.
- •23. Примеры чисел различных позиционных систем счисления. Основание системы счисления.
- •24. Перевод чисел из двоичной (восьмеричной, шестнадцатеричной) системы счисления в десятичную систему счисления.
- •25.1. Перевод чисел из десятичной системы счисления в двоичную (восьмеричную, шестнадцатеричную) систему счисления.
- •25.2. Перевод чисел из десятичной системы счисления в двоичную (восьмеричную, шестнадцатеричную) систему счисления.
- •25.3. Перевод чисел из десятичной системы счисления в двоичную (восьмеричную, шестнадцатеричную) систему счисления.
- •25.4. Перевод чисел из десятичной системы счисления в двоичную (восьмеричную, шестнадцатеричную) систему счисления.
- •26. Единицы измерения объема информации.
- •Задачи по разделу 2.
- •Задачи по разделу 2.
- •Задачи по разделу 2.
- •Задачи по разделу 2.
Информационные
технологии
Карпук Анатолий Алексеевич, доцент кафедры ДО
e-mail: А_Кarpuk@mail.ru
1
Раздел 2
Представление и кодирование информации в компьютере
2
15. Код, кодирование, декодирование информации.
Код – это система условных знаков (символов) для передачи, обработки и хранения информации (сообщения). Количество знаков в системе конечно и не менее двух. Все множество используемых знаков называют алфавитом. Двоичный код, применяемый в компьютерах, состоит из двух знаков: «0» и «1». Код Морзе состоит из трех знаков: «точка», «тире» и «пауза».
Кодирование – это процесс представления информации (сообщения) в виде знаков алфавита кода. Каждый элемент информации (сообщения)
представляется одним или несколькими знаками алфавита. При равномерном кодировании каждый элемент кодируется одинаковым количеством знаков алфавита кода, при неравномерном кодировании
– различным количеством знаков алфавита кода. Метод кодирования выбирается в зависимости от цели и возможностей обработки результата. Частный случай кодирования – шифрование.
Декодирование – это процесс обратного преобразования кодированной информации (сообщения) к форме исходной знаковой системы, т.е.
получения исходного сообщения. Например, сообщения азбуки Морзе на |
|
письменный язык. |
3 |
|
16. Примеры различных способов кодирования информации.
Применяется три основных способа кодирования информации:
графический, числовой, символьный.
Вграфическом способе в качестве кодовых знаков используются значки или рисунки. Примеры: стенографическое кодирование естественного языка; азбука Морзе; азбука Брайля для слепых; кодирование цифр штрих-кодами, кодирование звука нотами.
Вчисловом способе в качестве кодовых знаков используются числа. При двоичном кодировании используются числа 0 и 1. При восьмеричном кодировании – числа от 0 до 7. При шестнадцатеричном кодировании – числа от 0 до 15, причем число 10 изображается
символом «A», число 11 – символом «B», … , число 15 – символом «F». Примеры: кодирование символов естественных языков по кодовым таблицам ASCII, CP1251, CP866, KOI8, Unicode, по кодам Хаффмана, кодирование звука и изображений, классификационное кодирование.
Всимвольном способе в качестве кодовых знаков используются символы алфавита исходного текста. Примеры: кодирование понятий в
информационных языках для передачи информации, шифрование.
4
17. Двоичное кодирование информации в вычислительной технике.
В вычислительной технике для представления информации используется двоичное кодирование, что обусловлено техническими
устройствами, которые могут сохранять и распознавать не более двух различных состояний (электромагнитные реле, поверхности магнитных и оптических носителей, триггеры).
Информация в компьютере представлена в двоичном коде, алфавит которого состоит из двух цифр (0 и 1). Единица измерения количества информации бит (bit) получила свое название от английского словосочетания Binary digiT (двоичная цифра).
Наименьшая единица кодирования информации в вычислительной
технике после бита – байт, который состоит из 8 бит. Более крупной единицей кодирования информации служит килобайт (Кб), равный 1024
байт. Другими, более крупными, единицами кодирования информации
являются символы, полученные с помощью добавления префиксов мега (Мб), гига (Гб), тера (Тб): 1 Мб = 1024 Кб; 1 Гб = 1024 Мб; 1 Тб = 1024 Гб.
В 1 байте можно закодировать 256 различных чисел или знаков
(символов) языка, в 2 байтах – 65 535 различных чисел или символов
5
18.1. Кодирование различных видов информации: текстовой информации.
Текстовой информацией называется информация, выраженная с помощью естественных и формальных языков в письменной форме. Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. Для кодирования каждого знака собственным двоичным кодом требуется 8 бит или 1 байт.
Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам. При вводе в компьютер текстовой информации
происходит ее двоичное кодирование, при вывода знака из памяти на экран компьютера производится декодирование, т.е. преобразование двоичного кода знака в его изображение.
Присваивание знаку конкретного двоичного кода фиксируется в кодовой таблице. Десятичные коды с 0 по 32 соответствуют служебным символам (перевод строки, ввод пробела и т. д.). Коды с 33 по 127 соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды с 128 по 255
являются национальными и отличаются в различных кодировках.
6
Используются кодировки Windows, MS-DOS, КОИ-8, Mac, ISO, Unicode.
18.2. Кодирование различных видов информации: графической информации.
В компьютере графическая информация представлена в дискретном
(цифровом) виде. Преобразование графической информации из аналоговой формы в дискретную производится путем дискретизации –
разбиения непрерывного графического изображения на отдельные элементы (пиксели). Результатом дискретизации является растровое изображение, содержащее заданное количество строк с заданным
количеством пикселей в каждой строке.
Разрешающая способность растрового изображения определяется количеством пикселей по горизонтали и по вертикали на единицу длины изображения. Величина разрешающей способности обычно выражается в dpi (dot per inch - точек на дюйм, 1 дюйм = 2,54 см).
При дискретизации могут использоваться различные палитры цветов, т.е. наборы цветов, в которые окрашены пиксели изображения. Глубина
цвета – это количество бит, используемых для кодирования цвета пикселя. Применяются следующие форматы растровой графики: gif
(глубина цвета 8 бит); jpeg (24 бит); bmp (32 бит); png (48 бит); tiff (64
бит). Для кодирования оттенка и яркости цвета используется аддитивная |
|
цветовая модель RGB (красный, зеленый, синий). |
7 |
|
18.3. Кодирование различных видов информации: звуковой информации.
В компьютере звуковая информация представлена в дискретном
(цифровом) виде. Преобразование звуковой информации из аналоговой формы в дискретную производится путем дискретизации – разбиения
непрерывного звукового сигнала на отдельные временные участки. Результатом дискретизации является дискретная последовательность измерений уровня громкости звука.
Частота дискретизации звука – это количество измерений громкости звука за 1 секунду, лежит в диапазоне от 8 000 до 384 000.
Глубина кодирования звука – это количество бит, используемых для кодирования дискретных уровней громкости звука. Качеству телефонной связи соответствует частота дискретизации 8 000, глубина кодирования 8 бит и запись одной звуковой дорожки (режим «моно»). Качеству аудио- CD соответствует частоте дискретизации 48 000, глубина кодирования 16 бит и запись двух звуковых дорожек (режим «стерео»).
Применяются следующие форматы звуковых файлов: aiff (частота дискретизации от 11 до 192 кГц); wav (от 11 до 192 кГц); wma (от 8 до 96 кГц); m4a (от 44 до 384 кГц); ac3 (от 32 до 48 кГц); mp3 (от 8 до 48 кГц); mp4 (от 8 до 192 кГц). Глубина кодирования для всех от8 8 до 32 бит.
19. Цифра, число, система счисления.
Число – это изображение количества объектов, изображение значения количественного параметра объекта, либо изображение результата выполнения различных операций над другими числами.
Цифра – это знак некоторого алфавита, используемого для записи чисел.
Система счисления – это знаковая система для записи чисел, в которой числа записываются по определенным правилам с помощью символов некоторого алфавита, называемых цифрами.
Система счисления должна обеспечивать: возможность представления любого числа из заданного диапазона, однозначность представления числа, краткость и простоту записи чисел, легкость изучения системы и удобство использования.
Запись числа в некоторой системе счисления называется кодом числа.
Отдельная позиция в изображении числа называется разрядом, а номер позиции – номером разряда.
Системы счисления бывают позиционные и непозиционные. В позиционных системах счисления количественное значение цифры зависит от ее положения в числе, а в непозиционных –9 не зависит.
20.1. Непозиционные системы счисления. Примеры. Недостатки.
Непозиционная система – это система счисления, в которой количественное значение цифры не зависит от ее положения в числе. Примеры: единичная система, в которой любое число образуется
путем повторения одного знака, символизирующего единицу (зарубки, палочки, на пальцах); древнеегипетская десятичная, в которой для
обозначения чисел 1. 10, 100 и т.д. использовались иероглифы «черта», «пятка», «петля» и т.д., а другие числа составлялись из них с помощью сложения; римская система, используемая и сейчас, в которой используются знаки I (для числа 1), V (5), X (10), L (50), C (100), D (500), M (1000), числа составляются по правилам сложения стоящих рядом
одинаковых знаков, разности двух цифр, если слева от большей стоит меньшая, и сложения полученных результатов; алфавитные системы
(греческая, славянская, финикийская и др.), в которых первые 9 цифр, а также десятки и сотни кодируются буквами соответствующего алфавита.
Недостатки непозиционных систем счисления: необходимость добавления новых знаков для записи больших чисел; невозможность
представить дробные и отрицательные числа; сложность выполнения |
|
арифметических операций. |
10 |
|