
- •Введение
- •1. Математика и современная информатика
- •2. Алгоритмы перевода высказываний с естественного языка на язык математики
- •3. Алгоритм, его свойства, типы и способы записи
- •4. Информация. Формы ее представления, виды и свойства
- •5. Информационные процессы
- •Классификация информационных процессов
- •Когнитивные информационные процессы
- •6. Аналоговая информация
- •7. Дискретная информация
- •8. Количество информации, единицы измерения информации
- •9. Высказывательные логические связки
- •Алгебраические и функциональные языки
- •Классификация функциональных языков
- •Определение атд
- •Синтаксически-ориентированное конструирование
- •Примеры описания атд
- •Атд в языке программирования Haskell
- •Общий вид определения атд в языке Haskell
- •Сопоставление с образцом
- •Классификация атд
- •Атд в других языках программирования
- •11. Системы счисления, используемые в вычислительной технике
- •12. Семантические категории. Логические структуры
- •13. Двоичное кодирование информации
- •Двоичное кодирование символьной (текстовой) информации
- •18. Теория информации и кодирования
- •19. Система кодирования
- •20. Импликация - логическая константа
- •25. Правило де Моргана
- •26. Двоичная система счисления. Операции в двоичной системе счисления
- •27. Восьмеричная система счисления. Операции в восьмеричной системе счисления
- •28. Кванторы общности и существования
- •29. Составные формулы
- •30. Порядок выполнения логических операций
- •Порядок выполнения логических операций в сложном логическом выражении:
- •31. Свойства логических операций
- •6. Законы поглощения:
- •7. Другие (1):
- •35. Закон исключения третьего
- •36. Кодирование изображений
- •37. Кодирование звуков
- •38. Классификационное кодирование
- •39. Кодирование текста
- •Способы кодирования информации.
- •Кодирование символьной (текстовой) информации.
- •Кодирование числовой информации.
- •Кодирование графической информации.
- •Кодирование звуковой информации.
18. Теория информации и кодирования
(Бушковская)
19. Система кодирования
Кодирование ─ это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Система кодирования ─ это совокупность правил обозначения объектов и группировок с использованием кодов. Код ─ это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой.
Особенностью регистрационных систем кодирования является их независимость от применяемых систем классификации. Регистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объекта и его кода в течение длительного периода времени и защищённости кода от помех и ошибок.
К регистрационным системам относятся порядковая и серийная системы кодирования .Регистрационные коды состоят из двух частей: информационной и контрольной, предназначенной для защиты передаваемой информации от ошибок. Контрольная часть может рассчитываться по различным алгоритмам, в частности наиболее употребляемыми являются следующие формулы их расчета:
Порядковая система ─ это наиболее простая по своему построению система кодирования, суть использования которой заключается в последовательном присвоении каждому объекту кодируемого множества Мо номера его порядка, т.е. в присвоении цифр натурального ряда в порядке расположения объектов. Этот порядок может быть случайным или определяться после предварительной группировки объектов, например, по алфавиту. Как правило, порядковую систему применяют для кодирования малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.
Серийная (серийно -порядковая ) система кодирования отличается от порядковой тем, что номенклатура кодируемых объектов Мо предварительно должна быть разбита на группировки по одному признаку и каждой группировке должна быть отведена серия кодовых обозначений, в пределах которой каждому элементу присваивается свой код по порядку. Серия обозначений для каждой группировки определяются таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.
Классификационные коды используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации на ЭВМ, отсюда вытекают требования: однозначности отображения классификационных взаимосвязей объектов и их группировок и обеспечение максимальной простоты программирования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.
Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе классификации, в результате использования которой коды нижестоящих группировок образуются путём добавления кодов к кодам вышестоящих группировок .
Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы классификации, и коды группировок по фасетам формируются независимо друг от друга.Общие понятия
Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Система кодирования - совокупность правил кодового обозначения объектов.
Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:
длиной - число позиций в коде;
структурой - порядок расположения в коде символов, используемых для обозначения классификационного признака.
Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования которые образуют:
классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;
регистрационную систему кодирования, не требующую предварительной классификации объектов
Последовательные и параллельные системы кодирования строятся на базе разрядной или комбинированной систем кодирования .
Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, используемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе кодирования имеет место так называемое "зависимое " кодирование. Это значит, что классификационные группировки по младшим признакам кодируются в зависимости от кода группировки, образованной по старшему признаку. Запас свободных позиций определяется структурой кода.
Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой. Конкретное значение признака, характеризующего объект, определяется позицией и значением определенного числа в структуре кода. Длина кода зависит от числа ступеней классификации, от числа классификационных группировок на каждой ступени и от основания кодирования.
Комбинированная система кодирования, обладая всеми преимуществами разрядного кода, применяется для кодирования больших номенклатур (перечней ) объектов, которые характеризуются многими соподчиненными или независимыми признаками. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.
Код повторения (мнемокод) ─ это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.
Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки информации при использовании какой-либо системы.Существует такая система кодирова:ASCII (англ. American Standard Code for Information Interchange — американский стандартный код для обмена информацией; по-английски произносится [́эски], по-русски произносится [́аски], и слово ASCII чаще употребляется в женском роде) — 7-битная компьютерная кодировка для представления латинского алфавита, десятичных цифр, некоторых знаков препинания, арифметических операций и управляющих символов. В честь кода ASCII даже был назван небольшой астероид — «3568 ASCII» (открыт в 1936 году, название получил позже).
Возможно, просмотр некоторых символов у Вас будут отображаться не правильно. Зависит это от используемого шрифта, лучше установить шрифт Arial Unicode MS.Первый вариант ASCII предназначался в основном для передачи сообщений по телетайпу. Он был разработан 1963 году в фирме Bell Laboratories на смену созданной в 1874 году 5-битной кодировке Baudot. (Предшественницей Baudot была азбука Морзе.) В этом варианте ещё не было строчных букв. Они были добавлены в 1967 году, наряду с заменой стрелочки влево на подчеркПример 2.15. Проведем кодирование информации, классифицированной с помощью иерархической схемы. Количество кодовых группировок будет определяться глубиной классификации и равно 4, Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления -10 арабских цифр. Анализ схемы показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где Х - значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для классификационного признака "название факультета" и имеет следующие значения: 1 - коммерческий; 2 - информационные системы; 3 - для следующего названия факультета и т.д.;
2-й разряд выделен для классификационного признака "возраст" и имеет следующие значения: 1 - до 20 лет; 2 - от 20 до 30 лет; 3 - свыше 30 лет;
3-й разряд выделен для классификационного признака "пол" и имеет следующие значения: 1 - мужчины; 2 - женщины;
4-й разряд выделен для классификационного признака "наличие детей у женщин" и имеет следующие значения; 1 - есть дети; 2 - нет детей, 0 - для мужчин, так как подобной информации не требуется.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
1310 - студенты коммерческого факультета, свыше 30 лет мужчины;
2221 - студенты факультета информационных систем, от 20 до 30 лет, женщины имеющие детей.
Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации., а стрелочки вверх — на символ ^. Так возник вариант ASCII, используемый и поныне.
По сравнению с Baudot, кодировка ASCII представляла широкий набор обычных и управляющих символов, кроме того, буквы шли подряд и по алфавиту, что позволяло легко сортировать тексты.
7-битный код оказался удобным для использования и в компьютерах, поскольку компьютеры оперировали 8-битными байтами, а 8-й бит можно было использовать для контроля чётности. (Системы, не использовавшие контроль чётности, делали старший бит нулевым или изредка единичным.) Семибитность позволяла также добавить лишние 128 символов для, например, поддержки национальных алфавитов.
Конкурентом ASCII была кодировка EBCDIC, разработанная в 1964 году фирмой IBM для своей операционной системы System/360. Кодировка EBCDIC, однако, была сделана под тогдашние перфораторы и обладала рядом недостатков: была 8-битной (следовательно, не позволяла ни осуществлять контроль чётности, ни добавлять новые символы); буквы шли хотя и по алфавиту, но не подряд (например, после I следует не J, а символ переноса (soft hyphen)). В результате почти везде использовалась ASCII, а EBCDIC — только в системе System/360 и совместимых с ней (например, ОС ЕС). Сейчас даже компьютеры IBM Mainframe используют EBCDIC только для обратной совместимости.
Для кодирования национальных символов использовалось переключение режима с помощью символов SO (Shift Out) и SI (Shift In) — например, в КОИ-7. Впоследствии оказалось удобнее использовать 8-битные кодировки, где нижнюю половину кодовой таблицы (0—127) занимают символы ASCII, а верхнюю (128—255) — разные другие нужные символы.Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит, чтобы выразить различными комбинациями восьми битов все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы, например символ «§».
Технически это выглядит очень просто, однако всегда существовали достаточно веские организационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот, изобилием одновременно действующих и противоречивых стандартов. Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, а это пока невозможно из-за противоречий между символами национальных алфавитов, а также противоречий корпоративного характера.Так, например, кодировка символов русского языка, известная как кодировка Windows 1251, была введена «извне» — компанией Microsoft , но, учитывая широкое распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows .Другая распространенная кодировка носит название КОИ8 (код обмена информацией, восьмизначный) — ее происхождение относится ко временам действия Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета.В связи с изобилием систем кодирования текстовых данных, действующих в России, возникает задача межсистемного преобразования данных — это одна из распространенных задач информатики.