Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1к 2 семестр / Lektsii_po_informatikei / ЛЕКЦИЯ_17_Информационное_обеспечение_ автоматизированных ИС.doc
Скачиваний:
85
Добавлен:
02.04.2015
Размер:
258.05 Кб
Скачать

Классификация и кодирование технико-экономической информации аис

Классификаторы и кодификаторы технико-экономической информации составляют основу автоматизированных информационных систем. От того, как успешно решены вопросы с классификацией и кодированием, зависит качество АИС.

Система классификации – совокупность правил и результат распределения заданного множества объектов на подмножества в соответствии с признаками сходства или различия. В качестве объектов классификации выступают различные номенклатуры - материалов, товаров, подразделений, и т.п. Эти номенклатуры требуют описания свойств, идентификации отдельных представителей.

Различают два метода классификации:

  • иерархический метод;

  • фасетный метод.

Иерархический метод устанавливает отношение подчинения между различными группировками. Последовательно детализируются качественные свойства объектов множеств: класс, подкласс, группа, подгруппа, вид и т.д. Классифицируемое множество объектов по некоторому основанию деления – отдельному признаку классификации или их совокупности делится на подмножества (рис. 6).

=

N11

Рисунок 6

Например, на основании признака классификации - s1 исходное множество М разбито на подмножества: {1}, {2}, … {N}.

Для {1} выбран классификационный признак - s2, подмножество {1} представляется как совокупность {11}, {1m}. Для {2} выбран классификационный признак - s3, подмножество {2} представляется как совокупность {21}, {22}, … {2k}и т.д.

При этом выполняются следующие условия:

  • объединение подмножеств классификационных группировок одного уровня иерархии дает исходное множество объектов;

  • пересечение классификационных группировок одного уровня иерархии дает нулевое подмножество, то есть:

Классификационные признаки применяются последовательно в каждой иерархической ветви, при этом они могут отличаться друг от друга в различных ветвях. Структура иерархической системы классификации жесткая и не подлежит изменению.

Основные достоинства иерархической системы классификации:

  • традиционность и естественность;

  • большая информационная емкость. Если число уровней иерархии – N, на каждом уровне отдельный признак классификации принимает Kn значений, то максимально возможное число классификационных группировок на последнем уровне составляет величину – H:

Например, число уровней иерархии – 3, для каждого уровня максимальное количество значений признаков классификации – 10, тогда, общее число классификационных группировок – 1000 (103).

  • возможность использования различных наборов классификационных признаков для каждой иерархической ветви классификации.

Недостатками иерархической системы классификации являются:

  1. Невозможность внесения изменений в классификатор (добавление или удаление классификационных признаков, изменение последовательности их применения) после его создания.

  2. Трудоемкий поиск информации по произвольному сочетанию признаков классификации.

Фасетный метод классификации предполагает, что исходное множество объектов разбивается на подмножества группировок по независимым между собой признакам классификации – фасетам (рис. 7). Фасет – набор значений отдельного признака классификации, все фасеты взаимно независимы.

Каждый объект одновременно имеет классификационные признаки из различных фасетов, а классификационные группировки создаются динамически путем задания фасетной формулы – последовательности фасет и значений классификационных признаков выбранных фасетов.

Рисунок 7

Например, 1 группировка создана на основании значений фасета Ф1, группировка 2 - на основании значений фасетов Ф3 и Фn и т.д. Если общее число фасетов N и для фасета имеется Kn значений признаков, то общая емкость фасетной системы классификации соответствует величине H:

Таким образом, имеет место информационная избыточность группировок, которые в ряде случаев не возможны по смыслу. Этот метод классификации наиболее эффективен для машинной обработки данных, при использовании технологии БД и языков запросов высокого уровня.

Кодирование предназначено для присвоения отдельным объектам или классификационным группировкам условных обозначений – кодов. Коды характеризуются:

  • Методом кодирования.

  • Алфавитом (цифры, буквы, штрихи, цвета, звуки)

  • Длиной и структурой обозначения кода

  • Помехозащищенностью.

Если выполнена предварительная классификация объектов, применяются классификационные методы кодирования; если классификация объектов не выполняется - идентификационные методы кодирования.

Среди классификационных методов выделяют:

  • последовательное кодирование, основанное на иерархической системе классификации, когда код объекта строится с учетом кода группировок старшего уровня иерархии;

  • параллельное кодирование, основанное на фасетной системе классификации, когда код объекта является объединением независимых между собой кодов отдельных фасетов.

Например, для иерархической классификации материалов разработана структура кода (знак + означает разделение на уровни иерархии):

ХХ + ХХ + ХХХХ + ХХ

0100000000 – код группы материалов 01

0101000000 – код первой подгруппы группы 0100000000

0101000100 – код первого вида материалов подгруппы 0101000000

0101000101 – код первого материала вида 01010000100

Таким образом, сначала кодируются старшие классификационные группировки, а затем младшие группировки. Длина кода должна быть достаточной для кодирования всех объектов в настоящее время и в ближайшей перспективе.

Для фасетной системы классификации разработана структура кода объектов недвижимости (знак : означает выделение фасетов):

ХХ : ХХ : ХХХХ

Для первого фасета используются коды: 01 – 33

Для второго фасета используются коды: 01 – 78

Для третьего фасета используются коды: 0001 – 1550

В результате возможно формирование кодов классификационных группировок вида:

21 45 0560

01 45 0000

00 32 0000 и др.

Для идентификации объектов используется порядковая или серийно-порядковая нумерация объектов, такие коды не несут смысловой нагрузки. Для некоторых номенклатур объектов применяются коды, содержащие как классификационную, так и идентификационную части или обеспечивающие идентификацию объектов внутри классификационных группировок.

Например, для станка используется классификационный код, в соответствии с которым начисляется амортизации, и идентификационный код – инвентарный номер, используемый для указания на определенный станок. Для табельных номеров Работающих наиболее часто строится код на основании кода структурного подразделения, для идентификации сотрудника к этому коду добавляется уникальный номер.

К кодам предъявляются следующие требования:

  • минимально необходимая длина;

  • помехозащищенность.

Помехозащищенность кода обеспечивается за счет включения в код контрольных разрядов, значение которых вычисляется по определенному алгоритму. Наиболее часто используется метод «остаток по модулю простого числа» с использованием весовых коэффициентов разрядов, например:

где k – значение контрольного разряда, а – весовой коэффициент и b – значение разряда кода, q – простое число.

Например, код 48005 превращается в код 48005 7 при использовании данного метода, простое число – 11, веса разрядов – 3, 5, 7, 11, 13:

4*3 + 5*8 + 5*13 = 117

117 mod 11 = 7

Для обнаружения ошибки выполняется повторное вычисление контрольного разряда, если новое значение контрольного разряда отличается от существующего значения, имеет место ошибка. Однократные ошибки являются массовыми, поэтому с помощью корректирующего кода они обнаруживаются.

Классификаторы и кодификаторы технико-экономической информации имеют различные сферы действия:

  1. Локальные классификаторы.– действительны в рамках АИС.

  2. Отраслевые классификаторы.– действительны в рамках отрасли народного хозяйства.

  3. Региональные классификаторы.– действительны для всех АИС одного региона (республики, города, области).

  4. Общероссийские классификаторы (ОК) – действительны для всех АИС Российской Федерации.

  5. Международные классификаторы.

Наиболее часто используемые ОК:

ОКАОТО – объектов административно-территориального деления;

ОКВ – валют;

ОКДП – видов экономической деятельности, продукции и услуг;

ОКДПТР – профессий рабочих, должностей служащих и тарифных разрядов;

ОКЕИ – единиц измерения;

ОКИН – информации о населении;

ОКОГУ – органов государственной власти и управления;

ОКОНХ – отраслей народного хозяйства;

ОКОПФ – организационно-правовых форм;

ОКОФ – основных фондов;

ОКП – продукции;

ОКУД – управленческой документации;

ОКФС – форм собственности и др.