Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Весна 16 курс 3 ОрТОР / Метрология / Что такое классификация.docx
Скачиваний:
110
Добавлен:
30.09.2018
Размер:
54.4 Кб
Скачать

Кодирование

Кодирование представляет собой образование по определенным правилам и присвоение кодов объекту или группе объектов, позволяющее заменить несколькими знаками (символами) наименования этих объектов. С помощью кодов обеспечивается идентификация объектов максимально коротким способом, т.е. с помощью минимального числа знаков. Минимизация количества знаков, идентифицирующих объекты, способствует повышению эффективности сбора, учета, хранения, обработки информации.

Наиболее широкое применение в отечественной, зарубежной и международной практике кодирования информации находят цифровые коды. При этом, в основном, используются десятичные цифровые коды.

Структура кода представляет собой, как правило, графическое изображение последовательности расположения знаков кода и соответствующие этим знакам наименования уровней деления.

Например, структура кода для Общероссийского классификатора продукции ОК 005-93 (ОКП) представлена в следующем виде [ 3 ]:

 

 

Число знаков в коде определяется его структурой и зависит от количества объектов, входящих в подмножества, образуемые на каждом уровне деления.

Коды должны удовлетворять следующим основным требованиям:

-однозначно идентифицировать объекты и (или) группы объектов, т.е. быть идентификаторами;

-иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (признаков) заданного множества;

-иметь достаточный резерв для кодирования вновь возникающих объектов кодируемого множества;

-быть удобными для использования человеком, а также для компьютерной обработки закодированной информации;

-обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.

Методы кодирования в значительной степени связаны с методами разделения множества на подмножества.

Классификационные методы кодирования разделяются на два типа: последовательный и параллельный.

Последовательный метод – чаще всего используется при иерархическом методе классификации, когда множества разделяются на подмножества в нужной последовательности и когда кодовое обозначение строится по заданной структуре, определяющей последовательность и количественный состав признаков на каждом уровне деления. К его недостаткам следует отнести зависимость кода от установленных правил образования, необходимость иметь резервные коды на случай включения дополнительных объектов, невозможность изменения состава и количества признаков, через которые идентифицируется объект.

Параллельный (независимый) метод чаще всего используется при фасетной классификации объектов, когда коды присваиваются фасетам и признакам независимо друг от друга. В этом случае структура кодового обозначения определяется фасетной формулой. Данный метод хорошо приспособлен для машинной обработки и решения технико-экономических задач, характер которых часто меняется. Он обеспечивает возможность независимого изменения и дополнения характеристик объектов и их различных сочетаний, необходимых для решения конкретных задач. К недостаткам параллельного метода следует отнести некоторую громоздкость фасетных формул и избыточную емкость кодов.

При создании, например, кодов продукции для ОКП используют различные методы кодирования. Пример приведен для класса 88 (ОКП) – Обувь.

 

88 0000

Обувь

(Класс)

88 1000

Обувь юфтевая

(Подкласс)

88 1100

Обувь юфтевая мужская

(Группа)

88 1110

Обувь юфтевая мужская повседневная

(Подгруппа)

88 1111

Сапоги

(Вид)

88 1112

Полусапоги

(Вид)

88 1113

Сапожки

(Вид)

88 1114

Ботинки

(Вид)

Первый уровень деления (класс), в данном примере код 88, представляет собой порядковый номер, выделенный для обуви из 99 номеров классов множества однородных групп продукции согласно их отраслевой принадлежности.

На втором уровне деления (в подклассе) в качестве признака принят материал верха обуви и последовательно закодирован.

На третьем уровне деления (в группе) в качестве признака используют принадлежность обуви, в нашем примере: 1 – мужская. Код этого признака параллельно повторяется на уровне группы.

Также параллельным методом закодированы признаки на последующих уровнях классификации, что позволяет при компьютерной обработке получить нужную информацию, например о сапогах различной принадлежности, различного применения, сделанных из разных материалов.

Кодовое обозначение характеризуется:

  • алфавитом кода;

  • структурой кода;

  • числом знаков – длиной кода;

  • методом кодирования.

Алфавит кода представляет собой систему знаков (символов), составленных в определенном порядке, куда могут входить цифры, буквы и другие знаки, имеющиеся на клавиатуре печатного устройства. Коды бывают цифровые, буквенные и буквенно-цифровые.

Наиболее широкое применение в отечественной и зарубежной практике кодирования информации находят цифровые коды. При этом, как правило, используются десятичные коды, т.е. когда подмножество не превышает 10 объектов, код составляет знак – от0 до 9 включительно, а когда не превышает 100 объектов, код составляет два знака от 00 до 99 включительно и т.д.. Установлено, что наибольшая эффективность в процессе обработки информации обеспечивается при применении цифровых кодов из пяти и менее цифр.

Структура кода – это графическое изображение последовательности расположения знаков кода и соответствующие этим знакам наименования уровней деления.

Структура кода для общероссийского классификатора продукции следующая:

 

Число знаков в коде определяется его структурой и зависит от количества объектов, входящих в подмножества, образуемые на каждом уровне деления. При определении числа знаков на каждом уровне деления необходимо иметь в виду возможность появления новых объектов и предусмотреть резервные коды.

Методы кодирования в значительной степени связаны разделения множества на подмножества.

Метод присвоения объектам порядковых цифровых номеров, при котором кодовыми обозначениями служат числа натурального ряда, обеспечивает полную идентификацию объекта, но не является информативным, т.к. не отражает признаков присущих множеству. В отличии от него идентификационные методы кодирования обеспечивают идентификацию объектов через коды, составленные по определенным правилам и включающим определенный набор кодов отдельных признаков, характеризующих эти объекты.

Коды должны удовлетворять следующим основным требования:

  • однозначно идентифицировать объекты и (или) группы объектов, т.е. быть идентификаторами;

  • иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (признаков) заданного множества;

  • иметь достаточный резерв для кодирования вновь возникающих объектов кодируемого множества;

  • быть удобными для использования человеком, а также для компьютерной обработки закодированной информации;

  • обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.

Классификационные методы кодирования разделяются на два типа: последовательный и параллельный.

Последовательный метод – чаще всего используется при иерархическом методе классификации, когда множество разделяется на подмножества в нужной последовательности и когда кодовое обозначение строится на заданной структуре, определяющей последовательность и количественный состав признаков на каждом уровне деления. К его недостаткам следует отнести зависимость кода от установленных правил образования, необходимость иметь резервные коды на случай включения дополнительных объектов, невозможность изменения состава и количества признаков, через которые идентифицируется объект.

Параллельный (независимый) метод чаще используется при фасетной классификации объектов, когда коды присваиваются фасетам и признакам независимо друг от друга. В этом случае структура кода обозначается определенной фасетной формулой. Данный метод хорошо приспособлен для машинной обработки и решения технико-экономических задач, характер которых часто меняется, и для тех случаев, когда необходимо анализировать различные множества объектов. К недостаткам параллельного метода следует отнести некоторую громоздкость фасетных формул и избыточную емкость кодов.