
- •Предисловие
- •Лекция 1. Информация. Начальные понятия и определения
- •1. Информация и данные
- •2. Адекватность и формы адекватности информации
- •3. Качество информации
- •4. Понятие об информационном процессе
- •5. Формы представления информации
- •6. Преобразование сообщений
- •Лекция 2. Необходимые сведения из теории вероятностей
- •1. Понятие вероятности
- •2. Сложение вероятностей независимых несовместных событий
- •3. Умножение вероятностей независимых совместных событий
- •4. Нахождение среднего для значений случайных независимых величин
- •5. Понятие условной вероятности
- •6. Общая формула для вероятности произведения событий
- •7. Общая формула для вероятности суммы событий
- •Лекция 3. Понятие энтропии
- •1. Энтропия как мера неопределенности
- •2. Свойства энтропии
- •3. Условная энтропия
- •Лекция 4. Энтропия и информация
- •1. Объемный подход к измерению количества информации
- •2. Энтропийный подход к измерению количества информации
- •Лекция 5. Информация и алфавит
- •Лекция 6. Постановка задачи кодирования. Первая теорема Шеннона.
- •Лекция 7. Способы построения двоичных кодов. Алфавитное неравномерное двоичное кодирование сигналами равной длительности. Префиксные коды.
- •1. Постановка задачи оптимизации неравномерного кодирования
- •00100010000111010101110000110
- •2. Неравномерный код с разделителем
- •3. Коды без разделителя. Условие Фано
- •00100010000111010101110000110
- •00100010000111010101110000110
- •4. Префиксный код Шеннона–Фано
- •5. Префиксный код Хаффмана
- •Лекция 8. Способы построения двоичных кодов. Другие варианты
- •1. Равномерное алфавитное двоичное кодирование. Байтовый код
- •2. Международные системы байтового кодирования текстовых данных. Универсальная система кодирования текстовых данных
- •3. Алфавитное кодирование с неравной длительностью элементарных сигналов. Код Морзе
- •4. Блочное двоичное кодирование
- •101010111001100010000000001000000000000001
- •5. Кодирование графических данных
- •6. Кодирование звуковой информации
- •Лекция 9. Системы счисления. Представление чисел в различных системах счисления. Часть 1
- •1. Системы счисления
- •2. Десятичная система счисления
- •3. Двоичная система счисления
- •4. 8- И 16-ричная системы счисления
- •5. Смешанные системы счисления
- •6. Понятие экономичности системы счисления
- •Лекция 10. Системы счисления. Представление чисел в различных системах счисления. Часть 2.
- •1. Задача перевода числа из одной системы счисления в другую
- •2. Перевод q p целых чисел
- •3. Перевод p q целых чисел
- •4. Перевод p q дробных чисел
- •6. Перевод чисел между 2-ичной, 8-ричной и 16-ричной системами счисления
- •Лекция 11. Кодирование чисел в компьютере и действия над ними
- •1. Нормализованные числа
- •2. Преобразование числа из естественной формы в нормализованную
- •3. Преобразование нормализованных чисел
- •4. Кодирование и обработка целых чисел без знака
- •5. Кодирование и обработка целых чисел со знаком
- •6. Кодирование и обработка вещественных чисел
- •Лекция 12. Передача информации в линии связи
- •1. Общая схема передачи информации в линии связи
- •2. Характеристики канала связи
- •3. Влияние шумов на пропускную способность канала
- •Лекция 13. Обеспечение надежности передачи информации.
- •1. Постановка задачи обеспечения надежности передачи
- •2. Коды, обнаруживающие одиночную ошибку
- •3. Коды, исправляющие одиночную ошибку
- •Лекция 14. Способы передачи информации в компьютерных линиях связи
- •1. Параллельная передача данных
- •2. Последовательная передача данных
- •3. Связь компьютеров по телефонным линиям
- •Лекция 15. Классификация данных. Представление данных в памяти компьютера
- •1. Классификация данных
- •2. Представление элементарных данных в озу
- •Лекция 16. Классификация структур данных
- •1. Классификация и примеры структур данных
- •2. Понятие логической записи
- •Лекция 17. Организация структур данных в оперативной памяти и на внешних носителях
- •1. Организация структур данных в озу
- •2. Иерархия структур данных на внешних носителях
- •3. Особенности устройств хранения информации
- •Контрольные вопросы
- •Список литературы
2. Международные системы байтового кодирования текстовых данных. Универсальная система кодирования текстовых данных
Для успешной работы с информацией недостаточно только условиться о длине кода. Ясно, что способов кодирования, то есть вариантов сопоставления знакам первичного алфавита восьмибитных цепочек очень много. По этой причине для совместимости технических устройств и обеспечения возможности обмена информацией между многими потребителями требуется согласование кодов. Подобное согласование осуществляется в форме стандартизации кодовых таблиц.
Первым таким международным стандартом, который применялся на больших вычислительных машинах, был EBCDIC(ExtendedBinaryCodedDecimalInterchangeCode) – «расширенная двоичная кодировка десятичного кода обмена». Эта система кодирования исторически тяготеет к «большим» машинам.
В персональных компьютерах и телекоммуникационных системах применяется международный байтовый код ASCII(AmericanStandardCodeforInformationInterchange) – «американский стандартный код обмена информацией», разработанный в 1963 году. В своей первоначальной версии это – система семибитного кодирования. Она ограничивалась одним естественным алфавитом (английским), цифрами и набором различных символов, включая «символы пишущей машинки» (привычные знаки препинания, знаки математических действий и др.). В следующей версии фирмаIBMперешла на расширенную 8-битную кодировку.
В первой половине кодовой таблицы ASCII(номера кодов от 0 до 127) первый бит всех кодов 0. В эту часть кодовой таблицыASCIIвходят коды прописных и строчных английских букв, цифры, знаки препинания и знаки математических операций, а также некоторые управляющие коды (номера этих кодов от 0 до 31), вырабатываемые при использовании клавиатуры.
В табл. 15приведены некоторыеASCII-коды:
Табл. 15. Примеры ASCII-кодов
Знак, Клавиша |
Код двоичный |
Код десятичный |
Знак, клавиша |
Код двоичный |
Код десятичный |
A (лат) |
01000001 |
65 |
1 |
00110001 |
49 |
B (лат) |
01000010 |
66 |
9 |
00111001 |
57 |
Z |
01011010 |
90 |
[Esc] |
00011011 |
27 |
0 |
00110000 |
48 |
[Enter] |
00001101 |
13 |
Вторая часть кодовой таблицы ASCII– она считается расширением основной – охватывает коды в интервале от 128 до 255 (первый бит этих кодов 1). Вторая часть кодовой таблицыASCIIиспользуется для представления символов национальных алфавитов (например, русского), а также символов псевдографики. С помощью символов псевдографики можно создавать таблицы, несложные схемы и др.
Для второй части кодовой таблицы ASCIIтакже имеются стандарты, например, для символов русского языка. Для представления букв русского языка (кириллицы) в рамках кодаASCIIбыло предложено несколько версий. Первоначально был разработан ГОСТ под названиемКОИ-7(код обмена информацией, семизначный), оказавшийся по ряду причин неудачным; ныне он практически не используется.
Как в основной части кодовой таблицы, так и в ее расширении коды букв и цифр соответствуют их лексикографическому порядку (то есть порядку следования в алфавите) – это обеспечивает возможность автоматизации обработки текстов и ускоряет ее.
Для кодирования символов русского языка также существует код Windows-1251. Эта кодировка была введена компаниейMicrosoft. Учитывая распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформеWindows.
Другая распространенная кодировка русских символов носит название КОИ-8(код обмена информацией, восьмизначный). Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в Российском секторе глобальной сетиInternet.
Существует международный стандарт, в котором предусмотрена кодировка символов русского алфавита. Этот стандарт кодировки называется ISO(InternationalStandardOrganization– Международный институт стандартизации). На практике данная кодировка используется редко.
На компьютерах, работающих в операционных системах MS-DOS, могут действовать еще две кодировки (кодировкаГОСТи кодировкаГОСТ-альтернативная). Первая из них считалась устаревшей даже в годы появления персональной вычислительной техники, но вторая используется и по сей день.
В настоящее время появился и находит все более широкое применение еще один международный стандарт кодировки – Unicode. Его особенность в том, что в нем использовано 16-битное кодирование, то есть для представления каждого символа отводится 2 байта. Такая длина кода обеспечивает включение в первичный (здесь – компьютерный) алфавит 65536 знаков. Это, в свою очередь, позволяет создать и использовать единую для всех распространенных алфавитов кодовую таблицу.
Переход на данную систему кодирования долгое время сдерживался из-за недостаточности ресурсов средств вычислительной техники (в системе кодирования Unicodeвсе текстовые документы автоматически становятся вдвое длиннее). Во второй половине 90-х годов технические средства достигли необходимого уровня обеспеченности ресурсами, и сегодня мы наблюдаем перевод документов и программных средств на универсальную систему кодирования (Unicode).