
- •Бюджетное образовательное учреждение Омской области среднего профессионального образования Омский колледж управления и профессиональных технологий методические указания
- •230701 Прикладная информатика (в экономике)
- •Тема 1.1 Предмет и базовые понятия теории информации 5
- •Тема 1.2 Определение количества информации 5
- •Тема 1.3 Двоичное кодирование информации 18
- •Тема 1.4. Представление и кодирование информации 32
- •Тема 1.5. Основы передачи данных 50
- •1. Методические рекомендации по выполнению практических работ
- •Тема 1.1 Предмет и базовые понятия теории информации
- •Тема 1.2 Определение количества информации
- •Тема 1.3 Двоичное кодирование информации
- •Тема 1.4. Представление и кодирование информации
- •Тема 1.5. Основы передачи данных
- •2. Список литературы
- •I.Основная
- •II. Дополнительная
Тема 1.4. Представление и кодирование информации
Основное содержание темы: Кодирование, т. е. перевод информации из одной знаковой системы в другую, производится с помощью таблиц соответствия знаковых систем, которые устанавливают взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.
Вся информация, которую обрабатывает компьютер, должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято называть двоичными цифрами или битами. С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.
Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, то есть двоичный код.
Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.
Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.
Практическая работа 11. Изучение приемов кодирования текстовой информации
Цель работы: изучить способы представления текстовой информации, научиться записывать информацию в различных кодировках.
Краткое теоретическое обоснование: Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т.к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ.
Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код является порядковым номером символа в двоичной системе счисления.
Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является уже упоминавшаяся таблица кодировки ASCII. Принцип последовательного кодирования алфавита заключается в том, что в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.
Стандартными в этой таблице являются только первые 128 символов, т.е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.
Необходимо помнить, что для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы, не будут правильно отображаться в другой.
Для определения числового кода символа в кодировке Windows (CP1251) нужно зайти в текстовый редактор Word, открыть диалоговое окно Вставка – Символ, выбрать символ и нажать кнопку Клавиша.
Используя приложение Блокнот. С помощью дополнительной цифровой клавиатуры при нажатой клавише Alt введите код символа, отпустите Alt , в документе появится символ. в кодировке Windows (CP1251) для числовых кодов отводится 4 бита, в кодировке MS-DOS (СР866) – 3 бита.
Оборудование: дидактические материалы по теме «Представление и кодирование информации».
Последовательность выполнения:
Разберите решение примеров по кодированию текстовой информации и запишите их в тетрадь.
Пример 1. Буква «i» в таблице кодировки символов имеет десятичный код 105. Что зашифровано последовательностью десятичных кодов: 108 105 110 107?
Решение. При расшифровке данной последовательности кодов не нужно обращаться к таблице кодировки символов. Необходимо учесть принцип последовательного кодирования алфавитов и вспомнить порядок букв в латинском алфавите – …, I, j, k, l, m, n, o, … Буква «j» будет иметь код 106, «k» – код 107 и т.д. Следовательно, закодировано слово «link».
Пример 2. С помощью последовательности десятичных кодов: 99 111 109 112 117 101 114 зашифровано слово «computer». Какая последовательность десятичных кодов будет соответствовать этому же слову, записанному заглавными буквами?
Решение. При шифровке слова не обязательно пользоваться таблицей кодировки символов. Необходимо лишь учесть, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32. Если букве «с» соответствует код 99, то заглавная буква «С» имеет десятичный код 67 = 99 – 32. Следовательно, слову «COMPUTER» соответствует последовательность кодов 67 79 77 80 85 84 69 82.
Пример 3. Последовательность двоичных кодов: 01110011 01110100 01101111 01110000 соответствует слову «stop». Построить внутреннее преставление этого слова.
Решение. Необходимо учесть, что каждая шестнадцатеричная цифра представима четырехзначным двоичным числом, т.е. двоичному коду 01110011 будут соответствовать две шестнадцатеричные цифры – 7 (0111) и 3 (0011). Следовательно, шестнадцатеричный код будет иметь вид: 73 74 6F 70.
Решите следующие задачи по вариантам (1 вариант – 1,5,9,13,17,21; 2 вариант – 2,6,10,14,15,22; 3 вариант – 3,7,11,15,23; 4 – вариант 4,8,12,20,24, номер 25 дополнительно всем). Результат оформите в тетради.
Используя Таблицу символов, запишите последовательность десятичных числовых кодов в кодировке Windows (СР1251) для слова Компьютер.
Используя Таблицу символов, а затем Калькулятор запишите последовательность двоичных числовых кодов в кодировке Windows (СР1251) для слова бит.
Используя Блокнот, определите, какие слова в кодировке Windows (СР1251) заданы последовательностями числовых кодов:
225, 224, 233, 242
11011101, 11000010, 11001100
Используя Блокнот, определите, какие слова в кодировке MS-DOS (СР866) заданы последовательностями числовых кодов:
161, 160, 169, 226
10011101, 10000010, 10001100
Закодируйте с помощью ASCII-кода свою фамилию, имя, номер группы.
Какое сообщение закодировано в кодировке Windows-1251: 0011010100100000111000011110000011101011111010111110111011100010
Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия: «Певец-Давид был ростом мал, Но повалил же Голиафа!»
Какие последовательности букв будут в кодировках КОИ8 и ISO соответствовать слову «ЭВМ», записанному в кодировке СР1251?
С помощью последовательности десятичных кодов: 225 232 242 зашифровано слово бит. Найти последовательность десятичных кодов этого же слова, записанного заглавными буквами. При решении учтите, что разница между десятичным кодом строчной буквы кириллицы и десятичным кодом соответствующей заглавной буквы равна 32.
Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст?
Свободный объем оперативной памяти компьютера 841 Кбайт. Сколько страниц книги поместится в ней, если на странице:
1) 32 строки по 64 символа в строке;
2) 64 строки по 64 символа в строке;
3) 16 строк по 64 символа в строке?
Текст занимает полных 40 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 10 дорожек по 9 секторов. Сколько символов содержит текст?
Десятичный код (номер) буквы «е» в таблице кодировки символов ASCII равен 101. Какая последовательность десятичных кодов будет соответствовать слову 1) file; 2) help?
Десятичный код (номер) буквы «о» в таблице кодировки символов ASCII равен 111. Что зашифровано с помощью последовательности десятичных кодов:
1) 115 112 111 114 116; 2) 109 111 117 115 101?
Десятичный код (номер) буквы «i» таблице кодировки символов ASCII равен 105. Какая последовательность десятичных кодов будет соответствовать слову INFORMATION?
С помощью последовательности десятичных кодов: 66 65 83 73 67 зашифровано слово BASIC. Какая последовательность десятичных кодов будет соответствовать этому слову, записанному строчными буквами?
Пользуясь таблицей кодировки символов ASCII, закодируйте с помощью шестнадцатеричных кодов следующий текст:
1) Norton Commander; 2) Computer IBM PC.
Пользуясь таблицей кодировки символов ASCII, расшифруйте текст, представленный в виде шестнадцатеричных кодов символов:
1) 57 69 6Е 64 6F 77 73 2D 39 35;
2) 63 6F 6D 65 2D 4F 4E 2D 6C 69 6E 65.
Пользуясь таблицей кодировки символов ASCII, закодируйте с помощью двоичных кодов следующие слова:
1)EXCEL; 2) Word.
По шестнадцатеричному коду восстановите двоичный код и, пользуясь таблицей кодировки символов, расшифровать слово:
42 61 73 69 63; 2) 50 61 73 63 61 6С.
По шестнадцатеричному коду восстановите двоичный код и, пользуясь таблицей кодировки символов, расшифровать слово: 8A 8E 8C 8F 9C 9E 92 85 90.
Пользуясь таблицей кодировки символов, получить шестнадцатеричный код слова ИНФОРМАТИКА.
Сколько букв и какого алфавита содержит зашифрованный десятичными кодами текст: 128 32 139 32 18 32 128 32 130 32 136 32 146?
Что зашифровано последовательностью десятичных кодов: 108 105 110 107, если буква i в таблице кодировки символов имеет десятичный код 105?
Свободный объем оперативной памяти компьютера 640 Кбайт. Сколько страниц книги поместится в ней, если на странице 16 строк по 64 символа в строке?
Выполните из учебника И.К. Сафронов «Задачник-практикум по информатике». Стр. 27. Практикум 8. Номер варианта определяется по номеру рабочего места. Решение по кодированию и подсчету количества информации представить в тетради.
Контрольные вопросы:
Как происходит кодирование символьной информации?
Как происходит кодирование числовой информации?
Как происходит кодирование (текстовой) информации?
Сколько бит отводится на кодировку десятичного кода символа в ASCII?
Практическая работа 12. Изучение приемов кодирования графической информации
Цель работы: изучить способы представления графической информации, научиться рассчитывать объем видеопамяти компьютера.
Краткое теоретическое обоснование: Создавать и хранить графические объекты в компьютере можно двумя способами – как растровое или как векторное изображение. Для каждого типа изображений используется свой способ кодирования.
Растровое изображение представляет собой совокупность точек (пикселей) разных цветов. В процессе кодирования изображения производится его пространственная дискретизация. Для черно-белого изображения информационный объем одной точки равен одному биту (либо черная, либо белая – либо 1, либо 0). Для четырех цветного – 2 бита. Для 8 цветов необходимо – 3 бита. Для 16 цветов – 4 бита. Для 256 цветов – 8 бит (1 байт).
Для представления цвета в виде числового кода используются две обратных друг другу цветовые модели: RGB или CMYK. Цветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемых для кодирования цвета точки.
Для того чтобы на экране монитора формировалось изображение, информация о каждой точке (код цвета точки) должна храниться в видеопамяти компьютера.
Векторное изображение представляет собой совокупность графических примитивов, описанных уравнением линий. Каждый примитив описывается математическими формулами. Кодирование зависит от прикладной среды.
Достоинством векторной графики является то, что файлы, хранящие векторные графические изображения, имеют сравнительно небольшой объем.
Важно также, что векторные графические изображения могут быть увеличены или уменьшены без потери качества.
Оборудование: дидактические материалы по теме «Представление и кодирование информации».
Последовательность выполнения:
Разберите решение примеров по кодированию графической информации и запишите их в тетрадь.
Пример 1. Рассчитать необходимый объем видеопамяти для одного из графических режимов 1280х1024 точек.
Решение:
В современных компьютерах разрешение экрана обычно составляет 1280х1024 точек. Т.е. всего 1280 * 1024 = 1310720 точек. При глубине цвета 32 бита на точку необходимый объем видеопамяти:
32 * 1310720 = 41943040 бит = 5242880 байт = 5120 Кб = 5 Мб.
Ответ: Объем видеопамяти 5 Мб.
Пример 2. Определить глубину цвета в графическом режиме True Color, в котором палитра состоит из более чем 4 миллиардов (4 294 967 296) цветов.
Решение: I = log242 949 67 296 = 32 бит
Ответ: 32 бит
Пример 3. Определить максимально возможную разрешающую способность экрана для монитора с диагональю 15” и размером точки экрана 0,28 мм.
Решение:
Выразим размер диагонали в сантиметрах:
2,54 см ´ 15 = 38,1 см
Определим соотношение между высотой и шириной экрана для режима 1024´768 точек:
768 : 1024 = 0,75
Определим ширину экрана. Пусть ширина экрана равна L, тогда высота равна 0,75L. По теореме Пифагора имеем:
L2 + (0,75L)2 = 38,12
1,5625L2 = 1451,61
L2 » 929
L » 30,5 см
Количество точек по ширине экрана равно:
305 мм : 0,28 мм = 1089
Максимально возможным разрешением экрана монитора является 1024´768.
Ответ: Максимально возможным разрешением экрана монитора является 1024´768
Пример 4. Сканируется цветное изображение размером 10´10 см. Разрешающая способность сканера 600 dpi и глубина цвета 32 бита. Какой информационный объем будет иметь полученный графический файл.
Решение:
Разрешающая способность сканера 600 dpi (dot per inch – точек на дюйм) означает, что на отрезке длиной 1 дюйм сканер способен различить 600 точек.
Переведем разрешающую способность сканера из точек на дюйм (1 дюйм = 2,54 см) в точки на сантиметр: 600 dpi : 2,54 » 236 точек/см
Следовательно, размер изображения в точках составит 2360´2360 точек.
Общее количество точек изображения равно: 2360´2360 = 5 569 600
Информационный объем файла равен:
32 бит ´ 5569600 = 178 227 200 бит » 21 Мбайт
Ответ: 21 Мбайт
Решите задачи по кодированию графической информации. Результат оформите в тетради.
Известно, что видеопамять компьютера имеет объем 512 Кбайт. Разрешающая способность экрана 640 на 200. Сколько страниц экрана одновременно разместится в видеопамяти при палитре: а) из 8 цветов, б) 16 цветов; в) 256 цветов?
Сколько бит требуется, чтобы закодировать информацию о 130 оттенках?
Подумайте, как уплотнить информацию о рисунке при его записи в файл, если известно, что: а) в рисунке одновременно содержится только 16 цветовых оттенков из 138 возможных; б) в рисунке присутствуют все 130 оттенков одновременно, но количество точек, закрашенных разными оттенками, сильно различаются.
Определите количество цветов в палитре при глубине цвета 4, 8, 16, 24, 32 бита.
Черно-белое (без градаций серого) растровое графическое изображение имеет размер 10*10 точек. Какой объем памяти займет это изображение?
Цветное (с палитрой из 256 цветов) растровое графическое изображение имеет размер 10*10 точек. Какой объем памяти займет это изображение?
В процессе преобразования растрового графического изображения количество цветов уменьшилось с 65536 до 16. Во сколько раз уменьшится объем занимаемый им памяти?
В процессе преобразования растрового графического изображения количество цветов увеличилось с 16 до 42 949 67 296. Во сколько раз увеличился объем, занимаемый им в памяти?
256-цветный рисунок содержит 120 байт информации. Из скольких точек он состоит?
Для хранения изображения размером 64 ´ 32 точек выделено 64 Кбайт памяти. Определите, какое максимальное число цветов допустимо использовать в этом случае.
Определить соотношение между высотой и шириной экрана монитора для различных графических режимов. Различается ли это соотношение для различных режимов?
а) 640´480; б) 800´600; в) 1024´768; а) 1152´864; а) 1280´1024.
Определить максимально возможную разрешающую способность экрана для монитора с диагональю 17” и размером точки экрана 0,25 мм.
Определите требуемый объем видеопамяти для различных графических режимов экрана монитора. Заполните таблицу.
Разрешающая способность экрана
Глубина цвета (бит на точку)
4
8
16
24
32
640 на 480
800 на 600
1024 на 768
1280 на 1024
Достаточно ли видеопамяти объемом 256 Кбайт для работы монитора в режиме 640 ´ 480 и палитрой из 16 цветов?
Какие графические режимы работы монитора может обеспечить видеопамять объемом в 1 Мбайт?
Установить различные графические режимы экрана монитора вашего компьютера:
а) режим с максимально возможной глубиной цвета;
б) режим с максимально возможной разрешающей способностью;
в) оптимальный режим.
Заполните таблицу цветов при 24-битной глубине цвета в шестнадцатеричном представлении.
Название цвета
Интенсивность
Красный
Зеленый
Синий
Черный
Красный
Зеленый
Синий
Белый
Сканируется цветное изображение стандартного размера A4 (21´29,7 см). Разрешающая способность сканера 1200 dpi и глубина цвета 24 бита. Какой информационный объем будет иметь полученный графический файл.
Контрольные вопросы:
В виде чего представлена графическая информация на экране?
Что называется глубиной цвета?
Что называется разрешающей способностью?
Что такое дискретизация?
Как кодируется растровое изображение?
Как кодируется векторное изображение?
Как рассчитать объем видеопамяти компьютера для графической картинки экрана?
Практическая работа 13. Изучение приемов кодирования звуковой информации
Цель работы: изучить способы представления звуковой информации, научиться рассчитывать объем звукового файла.
Краткое теоретическое обоснование: Звуковая информация может быть представлена в аналоговой или дискретной форме. Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода. Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.
В процессе кодирования звукового сигнала производится его временная дискретизация – непрерывная волна разбивается на отдельные маленькие временные участки и для каждого такого участка устанавливается определенная величина амплитуды. Таким образом, непрерывная зависимость амплитуды сигнала от времени заменяется на дискретную последовательность уровней громкости.
Каждому уровню громкости присваивается его код. Чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.
Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.
Частота дискретизации – количество измерений уровня сигнала в единицу времени.
Количество уровней громкости определяет глубину кодирования. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. При этом количество уровней громкости равно N = 216 = 65536.
Оборудование: дидактические материалы по теме «Представление и кодирование информации».
Последовательность выполнения:
Разберите решение примеров по кодированию графической информации и запишите их в тетрадь.
Пример 1. Подсчитать, сколько места будет занимать одна минута цифрового звука на жестком диске или любом другом цифровом носителе, записанного с частотой 44.1 кГц и разрядностью 16 бит.
Решение.
Если записывают моносигнал с частотой 44.1 кГц, разрядностью 16 бит (2 байта), то каждую минуту аналого-цифровой преобразователь будет выдавать 441000 * 2 * 60 = 529000 байт (примерно 5 Мб) данных об амплитуде аналогового сигнала, который в компьютере записываются на жесткий диск.
Если записывают стерео сигнал, то 1058000 байт (около 10 Мб)
Пример 2. Какой информационный объем имеет моно аудиофайл, длительность звучания которого 1 секунда, при среднем качестве звука (16 бит, 24 кГц)?
Решение.
16 бит * 24000 = 384000 бит = 48000 байт = 47 кБайт
Пример 3. Рассчитайте объем стерео аудиофайла длительностью 20 секунд при 20-битном кодировании и частоте дискредитации 44.1 кГц.
Решение.
20 бит * 20 * 44100 * 2 = 35280000 бит = 4410000 байт = 4.41 Мб
Пример 4. Определить количество уровней звукового сигнала при использовании устаревших 8-битных звуковых карт.
Решение.
К = 28 = 256 уровней.
Решите задачи по кодированию графической информации. Результат оформите в тетради.
Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 11 кГц, 22 кГц; 32 кГц и расширении 16 бит.
Определить размер (в байтах) цифрового аудиофайла, время звучания которого составляет 10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит. Файл сжатию не подвержен.
Объем свободной памяти на диске - 0,01 Гб, разрядность звуковой платы - 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44100 Гц.
Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из 65 536 возможных уровней интенсивности сигнала?
16 битов; 2) 256 битов; 3) 1 бит; 4) 8 битов.
Оценить информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука:
а) моно, 8 битов, 8000 измерений в секунду;
б) стерео, 16 битов, 48 000 измерений в секунду.
Определить длительность звукового файла, который уместится на дискете 3,5" (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байтов каждый):
а) при низком качестве звука: моно, 8 битов, 8000 измерений в секунду;
б) при высоком качестве звука: стерео, 16 битов, 48 000 измерений в секунду.
В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретизации и разрядность?
Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц?
Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой платы — 8. С какой частотой дискретизации записан звук?
Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации — 22050 Гц. Какова разрядность аудиоадаптера?
Объем свободной памяти на диске — 0,01 Гб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44100 Гц?
Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?
Оцените информационный объем высокачественного стереоаудиофайла длительностью звучания 1 минута, если "глубина" кодирования 16 бит, а частота дискретизации 48 кГц.
Рассчитайте время звучания моноаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен:
а) 700 Кбайт; б) 6300 Кбайт
Вычислить, сколько байт информации занимает на компакт-диске одна секунда стереозаписи (частота 44032 Гц, 16 бит на значение). Сколько занимает одна минута? Какова максимальная емкость диска (считая максимальную длительность равной 80 минутам)?
Определите качество звука (качество радиотрансляции, среднее качество, качество аудио-CD) если известно, что объем моноаудиофайла длительностью звучания в 10 сек. равен:
а) 940 Кбайт; б) 157 Кбайт.
Контрольные вопросы:
Какие виды звуковой информация бывают? Приведите примеры на каждый вид информации.
Что называется дискретизацией звука?
Как происходит процесс преобразования одного вида звуковой информации в другой?
Чем отличается непрерывный сигнал от дискретного?
Что такое частота дискретизации и на что она влияет?
Как кодируется звуковая информация?
Как рассчитать объем звукового файла? От чего он зависит?
Практическая работа 14. Изучение приемов шифрования данных
Цель работы: исследование простейших методов криптографической зашиты информации.
Краткое теоретическое обоснование: Разработкой методов преобразования (шифрования) информации с целью ее защиты от незаконных пользователей занимается криптография. Такие методы и способы преобразования информации называются шифрами.
Шифрование – процесс применения шифра к защищаемой информации, т. е. преобразование защищаемой информации (открытого текста) в шифрованное сообщение (шифртекст, криптограмму) с помощью определенных правил, содержащихся в шифре.
Дешифрование – процесс, обратный шифрованию, т. е. преобразование шифрованного сообщения в защищаемую информацию с помощью определенных правил, содержащихся в шифре.
Криптография – прикладная наука, она использует самые последние достижения фундаментальных наук и, в первую очередь, математики. С другой стороны, все конкретные задачи криптографии существенно зависят от уровня развития техники и технологии, от применяемых средств связи и способов передачи информации.
Под шифром обычно понимается семейство обратимых преобразований, каждое из которых определяется некоторым параметром, называемым ключом, а также порядком применения данного преобразования, называемым режимом шифрования.
Ключ – это важнейший компонент шифра, отвечающий за выбор преобразования, применяемого для шифрования конкретного сообщения. Обычно ключ представляет собой некоторую буквенную или числовую последовательность. Эта последовательность как бы "настраивает" алгоритм шифрования.
Оборудование: дидактические материалы по теме «Представление и кодирование информации».
Последовательность выполнения:
Изучите шифры простой замены
Шифр Цезаря - частный случай шифра простой замены. Метод основан на замене каждой буквы сообщения на другую букву того же алфавита, путем смещения от исходной буквы на K букв.
Пример1. Известная фраза Юлия Цезаря: «VENI VIDI VICI» (пришел, увидел, победил), зашифрованная с помощью данного метода, преобразуется в фразу «SBKF SFAF SFZF», ключ – смещение на 4 символа влево.
,
Греческим писателем Полибием за 100 лет до н.э. был изобретен так называемый полибианский квадрат размером 5*5, заполненный алфавитом в случайном порядке. Греческий алфавит имеет 24 буквы, а 25-м символом является пробел. Для шифрования на квадрате находили букву текста и записывали в зашифрованное сообщение букву, расположенную ниже ее в том же столбце. Если буква оказывалась в нижней строке таблицы, то брали верхнюю букву из того же столбца.
Схема шифрования Виженера. Таблица Виженера представляет собой квадратную матрицу с n2 элементами, где n — число символов используемого алфавита. На рисунке показана верхняя часть таблицы Виженера для кириллицы. Каждая строка получена циклическим сдвигом алфавита на символ. Для шифрования выбирается буквенный ключ, в соответствии с которым формируется рабочая матрица шифрования.
Таблица Виженера
Осуществляется это следующим образом. Из полной таблицы выбирается первая строка и те строки, первые буквы которых соответствуют буквам ключа. Первой размещается первая строка, а под нею — строки, соответствующие буквам ключа в порядке следования этих букв в ключе шифрования. Пример такой рабочей матрицы для ключа «книга» приведен на рисунке 1.
Процесс шифрования осуществляется следующим образом:
Под каждой буквой шифруемого текста записываются буквы ключа. Ключ при этом повторяется необходимое число раз.
Каждая буква шифруемого текста заменяется по подматрице буквами находящимися на пересечении линий, соединяющих буквы шифруемого текста в первой строке подматрицы и находящимися под ними букв ключа.
Полученный текст может разбиваться на группы по несколько знаков.
Пусть, например, требуется зашифровать сообщение: максимально допустимой ценой является пятьсот руб. за штуку. В соответствии с первым правилом записываем под буквами шифруемого текста буквы ключа. Получаем:
максимально допустимой ценой является пятьсот руб. за штуку
книгакнигак нигакнигак нигак нигакниг акнигак ниг ак нигак
Дальше осуществляется непосредственное шифрование в соответствии со вторым правилом, а именно: берем первую букву шифруемого текста (М) и соответствующую ей букву ключа (К); по букве шифруемого текста (М) входим в рабочую матрицу шифрования и выбираем под ней букву, расположенную в строке, соответствующей букве ключа (К),— в нашем примере такой буквой является Ч; выбранную таким образом букву помещаем в зашифрованный текст. Эта процедура циклически повторяется до зашифрования всего текста.
Эксперименты показали, что при использовании такого метода статистические характеристики исходного текста практически не проявляются в зашифрованном сообщении. Нетрудно видеть, что замена по таблице Виженера эквивалентна простой замене с циклическим изменением алфавита, т.е. здесь мы имеем полиалфавитную подстановку, причем число используемых алфавитов определяется числом букв в слове ключа. Поэтому стойкость такой замены определяется произведением стойкости прямой замены на число используемых алфавитов, т.е. число букв в ключе.
Расшифровка текста производится в следующей последовательности:
Над буквами зашифрованного текста последовательно надписываются буквы ключа, причем ключ повторяется необходимое число раз.
В строке подматрицы Виженера, соответствующей букве ключа отыскивается буква, соответствующая знаку зашифрованного текста. Находящаяся под ней буква первой строки подматрицы и будет буквой исходного текста.
Полученный текст группируется в слова по смыслу.
Рисунок 1 Пример расшифровки текста «КНИГА»
Нетрудно видеть, что процедуры как прямого, так и обратного преобразования являются строго формальными, что позволяет реализовать их алгоритмически. Более того, обе процедуры легко реализуются по одному и тому же алгоритму.
Одним из недостатков шифрования по таблице Виженера является то, что при небольшой длине ключа надежность шифрования остается невысокой, а формирование длинных ключей сопряжено с трудностями.
Алгоритм перестановки
Этот метод заключается в том, что символы шифруемого текста переставляются по определенным правилам внутри шифруемого блока символов. Рассмотрим некоторые разновидности этого метода, которые могут быть использованы в автоматизированных системах.
Самая простая перестановка – написать исходный текст задом наперед и одновременно разбить шифрограмму на пятерки букв. Например, из фразы
ПУСТЬ БУДЕТ ТАК, КАК МЫ ХОТЕЛИ.
получится такой шифротекст:
ИЛЕТО ХЫМКА ККАТТ ЕДУБЪ ТСУП
В последней группе (пятерке) не хватает одной буквы. Значит, прежде чем шифровать исходное выражение, следует его дополнить незначащей буквой, например «О» до числа, кратного пяти:
ПУСТЬ-БУДЕТ-ТАККА-КМЫХО-ТЕЛИО.
Тогда шифрограмма, несмотря на столь незначительные изменения, будет выглядеть по-другому:
ОИЛЕТ ОХЫМК АККАТ ТЕДУБ ЬТСУП
Кажется, ничего сложного, но при расшифровке проявляются серьезные неудобства.
Во время Гражданской войны в США в ходу был такой шифр: исходную фразу писали в несколько строк. Например, по пятнадцать букв в каждой (с заполнением последней строки незначащими буквами).
П У С Т Ь Б У Д Е Т Т А К К А
К М Ы Х О Т Е Л И К Л М Н О П
После этого вертикальные столбцы по порядку писали в строку с разбивкой на пятерки букв:
ПКУМС ЫТХЬО БТУЕД ЛЕИТК ТЛАМК НКОАП
Если строки укоротить, а количество строк увеличить, то получится прямоугольник-решетка, в который можно записывать исходный текст. Но потребуется предварительная договоренность между адресатом и отправителем посланий, поскольку сама решетка может быть различной длины-высоты, а для шифрования можно брать различные направления.
Шифры сложной замены
Шифр Гронсфельда состоит в модификации шифра Цезаря числовым ключом. Для этого под буквами сообщения записывают цифры числового ключа. Если ключ короче сообщения, то его запись циклически повторяют. Зашифрованное сообщение получают примерно также, как в шифре Цезаря, но используют не одно жестко заданное смещение, а фрагменты ключа.
Пусть в качестве ключа используется группа из трех цифр – 314, тогда сообщение
С О В Е Р Ш Е Н Н О С Е К Р Е Т Н О
|
АБВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ_ |
А |
АБВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ_ |
Б |
_АБВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ |
В |
Я_АБВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮ |
Г |
ЮЯ_АБВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭ |
. |
………… |
Я |
ВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ_АБ |
_ |
БВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ_А |
3 1 4 3 1 4 3 1 4 3 1 4 3 1 4 3 1 4
Ф П Ё С Ь З О С С А Х З Л Ф З У С С
В шифрах многоалфавитной замены для шифрования каждого символа исходного сообщения применяется свой шифр простой замены (свой алфавит).
Каждая строка в этой таблице соответствует одному шифру замены аналогично шифру Цезаря для алфавита, дополненного пробелом. При шифровании сообщения его выписывают в строку, а под ним ключ. Если ключ оказался короче сообщения, то его циклически повторяют. Зашифрованное сообщение получают, находя символ в колонке таблицы по букве текста и строке, соответствующей букве ключа. Например, используя ключ АГАВА, из сообщения ПРИЕЗЖАЮ ШЕСТОГО получаем следующую шифровку:
ПРИЕЗЖАЮ_ШЕСТОГО
АГАВААГАВААГАВАА
ПОИГЗЖЮЮЮШЕПТНГО
Такая операция соответствует сложению кодов ASCII символов сообщения и ключа по модулю 256.
Выполните задание. Результаты запишите в тетрадь.
Зашифруйте фразу «ГРУЗИТЕ АПЕЛЬСИНЫ БОЧКАМИ ТЧК БРАТЬЯ КАРАМАЗОВЫ ТЧК» методом Виженера с помощью ключа ВЕНТИЛЬ.
Дан шифр-текст: СВПООЗЛУЙЬСТЬ_ЕДПСОКОКАЙЗО. Известно, что шифрование производилось по столбцам.
Найдите три высказывания великих людей, каждая минимум из 7 слов. Реализуйте шифрование этой фразы всеми перечисленными видами шифрования.
Контрольные вопросы:
В чем заключается система шифрования Цезаря?
Как используется схема Виженера?
Объясните сущность алгоритма перестановки.
В чем особенность шифра Гронсфельда?
Как производится расшифровка текста?
Практическая работа 15. Комплексная работа по кодированию информации
Цель работы: контроль навыков кодирования информации разного типа.
Краткое теоретическое обоснование: см.практические работы 11-15.
Оборудование: дидактические материалы – контрольно-оценочные средства по дисциплине «Основы теории информации»
Последовательность выполнения:
Выполните ТЗ№2. Тест № 4 "Кодирование и декодирование информации". В тесте необходимо выбрать только один ответ из предложенных вариантов. Выполнять тест лучше самостоятельно, без применения конспектов, учебников и прочей вспомогательной литературы.
Выполните ПЗ№2. Задачи 11-19.
Лабораторная работа 2. Изучение приемов сжатия информации с помощью программных средств
Цель работы: Изучение приемов сжатия информации с помощью программных средств.
Краткое теоретическое обоснование:
Сжатие информации – это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения. Сжатие информации в файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Применяются различные алгоритмы подобного сжатия информации.
Оборудование: персональный компьютер, ОС, программы-архиваторы, дидактические материалы – контрольно-оценочные средства по дисциплине «Основы теории информации».
Последовательность выполнения:
1. На диске D: в папке STUDENT создайте именной каталог. Скопируйте в этот каталог несколько файлов с расширениями .docx (документ MS Word 2007), .txt (Текстовый файл , содержащий текстовые данные, как правило, организованные в виде строк. Текстовым файлам противопоставляются двоичные файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текста (например, файлы, хранящие закодированные звук или изображение), .jpg (изображение JPEG), .bmp (изображение BMP). В папке может находиться несколько файлов одного типа. Суммарный объём файлов каждого типа не должен быть меньше одного мегабайта.
2. Поместите файлы в архивы (отдельный для файлов каждого вида) 7z и Zip с нормальным и наивысшим уровнями сжатия (всего получится 16 архивов). Имя архива должно содержать тип сжимаемого файла, степень сжатия и номер по списку студентов группы.
3. Оцените степени сжатия каждого из архивов — отношение объёмов сжатого и несжатого файлов (объём файла учитывать с точностью до бита). Оформите результаты сравнения в виде электронной таблицы. Проанализируйте степени сжатия, полученные для различных типов файлов и при использовании разных форматов и различных уровней сжатия.
4. Проведите проверку целостности одного из архивов.
5. Создайте защищённый паролем самораспаковывающийся 7z архив для файлов .txt с нормальным уровнем сжатия. Объясните разницу в объёмах файлов самораспаковывающегося и соответствующего не самораспаковывающегося архивов.
6. Создайте подпапку в именной папке и распакуйте туда содержимое самораспаковывающегося архива, а также любой из файлов, содержащийся в архиве с файлами *.bmp.
7. Создайте многотомный архив с размером тома, равным 300Кб, содержащий созданную в предыдущем задании подпапку именной папки.
8. Выполните отчет о проделанной работе.
Отчет должен включать:
титульный лист;
содержание (оглавление);
цель работы;
протокол выполнения задания — краткое описание последовательности команд (функций), позволяющих выполнить соответствующее задание;
результаты проведённого анализа и их интерпретацию;
выводы;
список использованной литературы.
В отчёте должна присутствовать таблица со сравнением степеней сжатия, интерпретация результатов, снимки экранов различных стадий выполнения заданий, выводы по заданиям.
Контрольные вопросы:
Какие факторы влияют на степень избыточности данных?
Какие программные средства называются архиваторами?
Понятие процесса архивации, разархивации файлов.
Дайте определение понятиям: сжатие информации, архивный файл, коэффициент сжатия.
Основные характеристики процессов сжатия.
Какая зависимость существует между коэффициентом сжатия и эффективностью метода сжатия?
Преимущества и недостатки обратимых и необратимых методов сжатия.
Форматы архивных файлов. Приведите примеры форматов обратимых и необратимых методов сжатия.
В чем состоит основная идея алгоритмов RLE, LZW, Хаффмана.