- •Содержание
- •Тема 1. Информация и информатика
- •Понятие информации
- •Свойства информации
- •Объективность информации
- •Полнота информации. Моделирование
- •Достоверность информации
- •Адекватность информации
- •Актуальность информации
- •Доступность информации
- •Информационные процессы и системы
- •Информационные ресурсы и технологии
- •Информатика и её предыстория
- •Структура информатики и её связь с другими науками
- •Тема 2. Количество и качество информации
- •Уровни проблем передачи информации
- •Меры информации
- •Меры информации синтаксического уровня
- •Меры информации семантического уровня
- •Меры информации прагматического уровня
- •Качество информации
- •Виды и формы представления информации в информационных системах
- •Тема 3. Представление числовой информации в ЭВМ
- •Системы счисления
- •Позиционные системы счисления
- •Перевод чисел из одной системы счисления в другую
- •Двоичная, восьмеричная и шестнадцатеричная системы счисления
- •Двоично-десятичная система счисления
- •Представление числовой информации в ЭВМ
- •Прямой, обратный и дополнительный коды
- •Выполнение арифметических операций над целыми числами
- •Смещённый код и код Грея
- •Представление вещественных чисел в ЭВМ
- •Выполнение арифметических действий над нормализованными числами
- •Погрешности представления числовой информации в ЭВМ
- •Тема 4. Кодирование символьной, графической и мультимедийной информации в ЭВМ
- •Кодирование и запись информации
- •Принципы кодирования информации
- •Аналоговое кодирование
- •Табличное кодирование
- •Цифровое кодирование
- •Аналого-цифровое преобразование
- •Основы цифрового кодирования
- •Двоичный разряд и его особенности
- •Байт
- •Правила записи чисел в различных системах счисления
- •Ранние системы кодирования текстов
- •Двоичное кодирование текста. Система Бэкона
- •Двоичный код переменной длины. Система Морзе
- •Система Бодо. Введение управляющих кодов
- •Система Мюррея. Введение кодов форматирования
- •Система FIELDDATA. Введение кодов-разделителей.
- •Схема кодирования ASCII
- •Отечественные схемы 8-разрядного кодирования текстов
- •Схема кодирования ISO-8859
- •Схема кодирования CP 866
- •Схема кодирования Windows-1251
- •Схема кодирования КОИ-8Р
- •Технология кодирования Unicode
- •Значение стандарта Unicode
- •Механизмы трансформации Unicode
- •Механизм UTF-8
- •Механизм UTF-16
- •Механизм UTF-7
- •Цифровое кодирование изображений
- •Растровая модель компьютерной графики
- •Векторная модель
- •Трёхмерная графическая модель
- •Характеристика графических моделей
- •Кодирование растровых изображений
- •Оптическое разрешение изображения
- •Глубина цвета
- •Кодирование цвета
- •Механизмы образования цвета
- •Теоретические модели RGB и CMY
- •Практические модели sRGB и CMYK
- •Разрядность кодирования цвета
- •Оценка объёма выборки данных
- •Кодирование звукозаписей
- •Цифровое кодирование сигнала
- •Дискретизация сигнала
- •Квантование импульсов сигнала
- •Оценка размера звуковой выборки данных
- •Поток данных
- •Кодирование видеозаписей
- •Оценка размера выборки видеоданных
- •Поток данных при видеозаписи
- •Сжатие данных при кодировании
- •Теоретические аспекты сжатия данных
- •Как измерить данные?
- •Минимальная выборка данных
- •Избыточность кодирования
- •Снижение избыточности данных
- •Обратимость методов сжатия данных
- •Обратимые методы сжатия данных
- •Групповое сжатие
- •Сжатие по словарю
- •Необратимые методы сжатия данных
- •Необратимое сжатие графики. Технология JPEG
- •Необратимое сжатие видео. Технология MPEG
- •Необратимое сжатие звука (технология МР3)
- •Тема 5. Логические функции
- •Основные законы и постулаты алгебры логики
- •Аксиомы (постулаты) алгебры логики
- •Законы алгебры логики
- •Представление функций алгебры логики
- •Тема 6. Помехоустойчивое кодирование
- •Основные определения теории помехоустойчивого кодирования
- •Общий подход к обнаружению ошибок
- •Общий подход к исправлению ошибок
- •Информационная избыточность помехоустойчивых кодов
- •Код Хэмминга
- •Линейные групповые коды
- •Циклические коды
- •Тема 7. Компьютерная обработка информации
- •Поколения электронных вычислительных машин
- •Классификация средств обработки информации
- •Классификация программного обеспечения
- •Системное программное обеспечение ЭВМ
- •Инструментарий технологии программирования
- •Пакеты прикладных программ
- •Тема 8. Автоматизация работы с документами
- •Оформление электронных документов
- •Размер листа
- •Ориентация листа
- •Печатные поля
- •Группировка страниц
- •Колонтитулы
- •Работа с разделами документа
- •Текстовые абзацы, их функции и свойства
- •Свойства шрифта абзаца
- •Выравнивание и переносы
- •Отступы и интервалы
- •Оформление списков, записей и таблиц
- •Оформление списков
- •Оформление записей
- •Параметры табуляции
- •Способ заполнения полей
- •Оформление таблиц
- •Взаимодействие изображений с текстом
- •Способы вставки изображений в документ
- •Режимы взаимодействия изображений и текста
- •Представление нетекстовых объектов в документе
- •Управление представлением изображений
- •Представление невизуальных объектов
- •Визуализация гиперссылкой
- •Визуализация изображением
- •Визуализация значком
- •Числовые диаграммы
- •Структура диаграммы
- •Основные элементы диаграммы
- •Типы диаграмм
- •Автоматизация документооборота
- •Стадии документооборота
- •Принципы стилевого оформления документов
- •Стиль как информационный объект
- •Принцип единства функционального оформления
- •Принцип наследования свойств стилей
- •Применение шаблонов документов
- •Автоматизация настройки программ с помощью шаблонов
- •Принцип наследования шаблонов
- •Корневой шаблон
- •Технология подготовки документов слияния
- •Тема 9. Защита информации
- •Информационные угрозы. Цели и объекты защиты информации
- •Юридические меры защиты информации
- •Способы защиты информации
- •Защита информации от несанкционированного доступа
- •Средства безопасности операционных систем семейства Windows
- •Способы защиты документов Microsoft Office
- •Защита от потерь информации
- •Действия при сбоях в работе программ
- •Вредоносные программы
- •Источники и основные признаки заражения. Способы защиты
- •Средства защиты от вредоносных программ
- •Принцип достаточности защиты
тельность и техническую наглядность записи. Пользуются шестнадцатеричной системой системные программисты — люди, отвечающие за взаимодействие программ с устройствами.
В прошлом в вычислительной технике использовалась также восьмеричная система. Как и в шестнадцатеричной системе, её основание является целой степенью двойки ( ), а один разряд позволяет выразить три двоичных бита. В те годы, когда на компьютерах ещё встречались шестиразрядные байты, три двоичных бита составляли полубайт, и восьмеричная система была актуальной. Сегодня, когда байты повсеместно стали восьмиразрядными, восьмеричная система утратила своё значение и в практических задачах не применяется.
Самый универсальный способ обозначения чисел, позволяющий записать число в любой системе счисления, состоит в использовании подстрочных индексов. Значение индекса указывает на основание использованной системы счисления.
В то же время, для наиболее распространённых систем счисления существуют и другие соглашения:
если по контексту ясно, что запись сделана в десятичной системе, никаких специальных обозначений не требуется. При желании классы разрядов можно разделять пробелами;
если по контексту не ясно, в какой системе сделана запись, можно использовать обозначение или (от слова decimal — десятичный);
ведущие нули в записи чисел не используются. В десятичной системе число всегда начинается со значащей цифры;
если по контексту ясно, что запись сделана в двоичной системе счисления, специальных обозначений не требуется. В длинных двоичных словах байты обычно разделяют пробелами. Для наглядности часто пробелами разделяют и полубайты;
ведущие нули в записи байта проставляются всегда;
ведущие нули можно не ставить, если речь идет не о байте, а просто о битовой последовательности, например: 101. Читается такая последовательность: один — ноль — один (не сто один). Если по контексту не ясно, в какой системе счисления сделана запись, используют обо-
значение |
или (от слова binary — двоичный); |
шестнадцатеричный разряд способен иметь до 16 различимых значений. Соответственно, для представления его значения необходимы 16 цифр. Первые десять цифр (от 0 до 9) заимствуются из десятичной системы, а остальные шесть обозначаются буквами латинского алфавита. Независимо от контекста, шестнадцатеричные числа всегда должны иметь специальное обо-
значение, например: |
или (от слова hexadecimal — шестнадцатеричный; |
в технической документации шестнадцатеричные числа иногда обозначают знаком #;
ещё один способ обозначения шестнадцатеричных чисел — начинать их с префикса 0x. Известен также приём записи восьмеричных чисел, начиная с нуля.
Ранние системы кодирования текстов
В первые двадцать лет своего развития компьютеры служили только для работы с числами.
Не случайно в те годы их называли электронными вычислительными машинами.
Разумеется, даже самые ранние образцы компьютеров умели печатать данные на бумаге. Однако умение печатать буквы и умение работать с текстами — это далеко не одно и то же. Вплоть до 1963 г. вычислительная техника не имела своих стандартов кодирования текстов. Для ввода и вы-
73
вода текстовых данных использовалось оборудование, заимствованное в телеграфной связи: телетайпы и электрические пишущие машинки. Вместе с оборудованием из телеграфии заимствовались и стандарты кодирования символов.
Двоичное кодирование текста. Система Бэкона
До появления телеграфии существовал лишь один стимул к кодированию текстов — преобразование записи в тайнопись. Сегодня этой цели служит не кодирование, а шифрование, но различать эти понятия стали сравнительно недавно. Так что первые приёмы дискретного кодирования текстов имеют свои корни в криптографии.
В 1605 г. английский ученый, философ и политический деятель Фрэнсис Бэкон (1561—1626) опубликовал труд под названием «О приумножении наук», в котором впервые предложил двузначную схему шифрования текста. В этой схеме каждая буква английского алфавита обозначалась пятисимвольной группой, составленной из двух знаков. Бэкон демонстрировал работу своей системы на знаках и . Разумеется, можно использовать и любые иные приёмы дискретизации знаков — суть системы от этого не зависит.
Всего кодом Бэкона можно представить 32 (25) различимых письменных знака. Поскольку русский алфавит содержит 33 буквы, то, пожертвовав одной буквой (часто жертвуют буквой Ё), код Бэкона можно продемонстрировать и на русскоязычном тексте.
Схема Бэкона не выглядит эффективной, потому что количество знаков исходного сообщения увеличивается в пять раз. Однако цель Бэкона состояла не в том, чтобы сделать текст нечитаемым, а в том, чтобы скрыть сам факт наличия тайнописи.
Схема Бэкона не использует цифры, но её вполне можно считать цифровой. Прежде всего, это дискретная система, а в дискретных системах совершенно всё равно, какими знаками пользоваться. Заменив буквы и цифрами 0 и 1, мы получим таблично-цифровую систему пятиразрядного кодирования.
В соответствии с духом своего времени, Бэкон предполагал использовать изобретение для тайнописи. Однако он не упустил из виду возможности применения своей схемы для передачи сообщений с помощью колокольного звона, боевых труб, мушкетных выстрелов и вспышек света. Отмети также, что Бэкон обосновал использование пары различимых сигналов для передачи сообщений задолго до того, как Г. Лейбниц (1646—1716) впервые применил двоичную систему для представления числовых данных.
Двоичный код переменной длины. Система Морзе
В1844 г., когда американский изобретатель Сэмюэл Морзе (1791—1872) готовил к запуску первую экспериментальную линию телеграфной связи между Вашингтоном и Балтимором, ему потребовалась удобная и эффективная система кодирования символов. Альфред Вейл, помогавший Морзе, предложил кодировать передаваемые символы с помощью двух электрических сигналов: длинного (тире) и короткого (точка).
Вотличие от системы Бэкона, система Морзе несимметрична. В ней разные знаки алфавита кодируются разным количеством элементов (от одного до шести). Чем реже знак встречается в текстах, тем большее количество символов необходимо для его кодирования. Наиболее часто встре-
74
чающиеся буквы E и T в системе Морзе кодируются одним элементом, а такие буквы, как Q и L — четырьмя.
Система Бодо. Введение управляющих кодов
Третья четверть девятнадцатого века — это эпоха пара и телеграфа. Энергия пара позволила людям быстро перемещаться ни большие расстояния. А телеграф позволил им при этом не разрывать социальные, экономические и культурные связи со своим сообществом. Механизация производственных процессов стала основным содержанием эпохи промышленной революции.
Потребовали механизации и телеграфные сети, охватившие к 1870 г. целые континенты. В то время с азбукой Морзе могли работать только подготовленные люди, способные воспринимать точки и тире «на глаз» или «на слух», а бурно развивающаяся экономика настойчиво требовала более простых телеграфных аппаратов.
Переменная длина кода, эффективная при передаче сообщений вручную, к середине 70-х годов XIX века стала препятствием для механизации телеграфа. Чтобы приёмный аппарат мог без участия оператора различить, где заканчивается один знак и начинается другой, надо либо ввести дополнительный разделительный элемент, либо кодировать все знаки одинаковым количеством элементов, как предлагал ещё Фрэнсис Бэкон. Технический прогресс избрал второй путь.
В 1874 г. Эмиль Бодо во Франции разработал систему, которую назвали «печатающим телеграфом». Передающее устройство имело клавиатуру с пятью клавишами, похожими на фортепианные. Две левые клавиши (IV и V) приводились в действие левой рукой, а три правые (I, II и III) — правой.
Приёмное устройство распечатывало на бумажной ленте не точки и тире, как в аппаратах Морзе, а обычный текст. Внедрение системы Бодо имело огромный эффект. Отныне политики, банкиры и военачальники могли сами читать приходящие сообщения, не посвящая телеграфиста в конфиденциальное содержание.
Сочетаниями из пяти элементов можно выразить до 32 различных кодов ( |
). Бодо раз- |
|
местил их в таблице размером |
. Номер строки определяла одна из четырёх возможных комби- |
наций клавиш для левой руки (0, IV, V, IV+V), а номер столбца — одна из восьми комбинаций клавиш для право руки (0, I, II, I+II, III, I+III, II+III, I+II+III).
В телеграфии необходимо передавать не только буквы, но также цифры и знаки препинания Поэтому 32-символьной таблицы для Бодо было явно не достаточно. В принципе, он мог просто ввести шестую клавишу ( ), но это усложнило бы обучение телеграфистов. Бодо решил действовать иначе — он ввёл вторую таблицу из 32 кодов. В первой таблице он разместил буквы, а во второй
— цифры и знаки препинания. Для переключения между основной и дополнительной таблицами Бодо ввёл так называемые управляющие коды. Они не имеют символьного содержания, а сообщают приёмнику о том, что следующие поступающие символы он должен декодировать по другой таблице.
В XX в. роль управляющих кодов значительно усилилась. В современных таблицах кодирования текстов выделены целые области, в которых размещаются коды, не имеющие текстового содержания. Они предназначены исключительно для того, чтобы передатчик мог в какой-то степени управлять приёмником.
75
Система Мюррея. Введение кодов форматирования
Аппаратура Бодо заметно упростила получение телеграфных сообщений. Для чтения текстов, принятых аппаратом Бодо, специалист не требовался, однако она мало помогла отправителю. Телеграфный ключ Морзе сменили клавиши, похожие на фортепианные, а потребность в квалифицированном операторе по-прежнему осталась. Для решения этой проблемы в 1901 г. новозеландский журналист Дональд Мюррей предложил использовать в передающем устройстве клавиатуру, заимствованную у пишущей машинки.
Вместе с клавиатурой у пишущей машинки были позаимствованы две операции: прокрутка листа бумаги на новую строку и возврат каретки. Была также добавлена новая операция — удаление предыдущего символа как ошибочного. Для исполнения этих операций в таблицу кодирования были введены три новых управляющих кода, которых не было в системе Бодо. Эти коды сохранились до наших дней и выполняют функции форматирования текста:
код LF (Line Feeding) — код подачи строки;
код CR (Carriage Return) — код возврата каретки;
код DEL (Delete) — код отмены символа.
Система Мюррея была создана ради упрощения ввода текстов, но она повлияла и на их вывод. Новые коды форматирования дали возможность печатать принятые сообщения не на длинной ленте, а на листах обычного формата. В 1908 г. эта возможность была реализована в аппаратах нового поколения, получивших название телетайпов.
Система FIELDDATA. Введение кодов-разделителей.
Недостатки системы кодирования Мюррея стали заметны лишь тогда, когда появились первые компьютеры и пришла пора автоматизировать информационный обмен.
Первые компьютерные сети были созданы Министерством обороны США в 50-х годах XX в. Они соединяли посты наблюдения за воздушной обстановкой, службы управления воздушным движением, метеорологические службы. Обмен данными между компьютерами должен был проходить автоматически, но кодов телеграфной связи для этого оказалось мало. Так появилась группа военных стандартов под общим названием FIELDDATA, имевших следующие особенности:
семиразрядное кодирование с возможностью представления до 128 различимых кодов
( );
наличие кодов не только для прописных, но и для строчных букв английского алфавита;
наличие специальных кодов-разделителей данных.
Введение в действие кодов-разделителей имело огромное значение для автоматизации информационного обмена. Фактически, с введением специальных кодов-разделителей появилась возможность доступа к удалённым базам данных и автоматизации их информационного обмена. Одним из самых ярких проявлений новых возможностей информационного обмена стала электронная почта.
Примеры простейших кодов-разделителей, реализованных в системе FIELDDATA:
SBK (Start of Block) — начало блока данных. Сегодня этот код назвали бы «началом записи».
ЕВК (End of Block) — конец блока данных («конец записи»).
76