Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконом. информация.doc
Скачиваний:
0
Добавлен:
20.09.2019
Размер:
81.92 Кб
Скачать

Классификация и кодирование экономической информации.

Для классификации информации используется ряд понятий, которые нам необходимо разобрать. Для начала определим само понятие классификации.

Классификация – система распределения объектов, процессов и т. д. по группам в соответствии с определенным признаком.

Под объектом понимается любой предмет, процесс, явление и т. п. как материального так и не материального свойства.

Группу объектов, которую можно охарактеризовать рядом общих свойств мы назовем классом.

Применительно к информации как объекту классификации выделенные классы называют информационными объектами.

Свойства информационного объекта описываются его реквизитами.

Реквизит – логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса.

Например, информационный объект автомобиль, его свойства могут характеризовать следующие реквизиты:

  • Марка, модель.

  • Дата выпуска.

  • Тип кузова.

  • Цвет кузова.

  • Тип, мощность, количество цилиндров, литраж, система питания двигателя.

  • Тип подвески.

  • Тип трансмиссии.

Или, например информационный объект «Студент» характеризуют перечисленные ниже реквизиты:

  • Ф. И. О.

  • Пол

  • Год рождения.

  • Место рождения.

  • Адрес проживания.

  • Факультет.

  • Группа.

При любой классификации необходимо соблюдать следующие требования:

  • Максимально возможная полнота охвата объектов рассматриваемой области.

  • Однозначность реквизитов не допускающая их двойственного толкования.

  • Возможность добавления новых объектов.

При проведении классификации широко используется понятие классификационного признака, который позволяет установить сходство или различие объектов. Например, в качестве признака классификации группы людей можно использовать возраст, укладывающийся в определенный диапазон значений: до 20 лет, от 20 до 30 лет, старше 30 лет.

Теперь давайте рассмотрим два метода классификации объектов. Которые лежат в основе различных систем классификации.

Иерархическая система (принцип пирамиды).

Исходное множество элементов составляет 0 – ой уровень и делится в зависимости от классификационного признака на классы, которые образуют 1 – вый уровень. Затем выделенные классы разбиваются, по определенным признакам, на подклассы составляющие 2 – ой уровень и т. д.

Количество уровней определяет глубину классификации. Данная система очень чувствительна к выбору классификационных признаков, которые очень сильно влияют на саму процедуру проведения классификации.

Достоинствами данной системы является:

  • простота построения.

  • использование не зависимых признаков в различных ветвях иерархической структуры.

Недостатки:

  • жесткая структура, не позволяющая свободно вносить изменения в систему, после внесения изменений приходиться перераспределять все классификационные группировки.

  • Невозможность группировать объекты по заранее не предусмотренным признакам.

Давайте в качестве примера создадим иерархическую структуру Вуза, которая позволила бы нам сгруппировать информацию о студентах по следующим признакам: факультет, возраст, пол, семейное положение.

В данной системе на 0 уровне находится факультет, уровень 1 названия факультетов, которые выступаю в данном случае классификационным признаком, уровень 2 признак возраст, разделенный на три подгруппы, уровень 3 признак пол, распадающийся только на две группы, уровень 4 признак семейное положение, делящийся также на две подгруппы и т. д.

Глубина классификации в нашем примере 4.

Как видно из этого примера мы жестко распределили студентов согласно выбранным признакам и в случае, если у нас возникнет необходимость изменить или добавить новый признак в системе это приведет к тому, что нам понадобиться студентов перераспределять заново.

Фасетная система классификации.

Данная система позволяет выбирать признаки классификации независимо друг от друга. Признаки классификации здесь называются фасетами (от английского грань, рамка). Каждый фасет содержит совокупность однородных значений определенного классификационного признака. Например, фасет цвет содержит значения: белый, красный, голубой и т. д.

Данная система обычно отображается в виде таблицы, в которой названия столбцов соответствуют определенным фасетам, а в ячейках располагаются их конкретные значения.

Сама процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов, при этом не обязательно использование всех фасетов.

Группировка фасетов для конкретного объекта может, выражается структурной формулой KS=(Ф1,…,Фi,Фn), где KS – класс, Ф – фасет.

При построении данной системы необходимо, чтобы значения, используемые в различных фасетах, не повторялись.

Достоинствами данной системы является:

  • Возможность создания большой емкости классификации.

  • Возможность простой модификации всей системы без изменения структуры существующих групп.

Недостатки:

  • Сложность построения, из-за необходимости учитывать все многообразие классификационных признаков.

Давайте вернемся, к примеру, рассмотренному выше, и построим уже фа сетную систему классификации для нашего Вуза.

Сгруппируем и представим в виде таблицы классификационные признаки по фасетам. Получим:

  • Фасет название факультета.

  • Фасет возраст.

  • Фасет пол.

  • Фасет семейное положение

Структурная формула для класса примет вид KS =(Факультет, Возраст, Пол, Семейное Положение).

Таблица же будет иметь вид.

Название факультета.

Возраст.

Пол.

Семейное положение.

Правоведение

До 20 лет

М

Холост

Менеджмент

20 – 30 лет

Ж

Замужем

После рассмотрения систем классификации давайте, обратим свой взор на системы кодирования. Они предназначены для замены названий объектов на условные обозначения (код) для обеспечения удобной и более эффективной работы по обработке информации.

Системой кодирования – называют совокупность правил кодового обозначения объектов.

Присваиваемый код характеризуется:

  • Длинной – количеством позиций символов.

  • Структурой – порядком расположения в коде символов.

Процедуру присвоения объекту кода называют кодированием.

По методу кодирования различают две системы.

  1. Классификационная – ориентирована на проведение предварительной классификации объектов с последующим их кодированием. При этом различают:

    1. Последовательное кодирование – применяется для иерархической классификационной структуры. Код составляется следующим образом, сначала записывается код 1 уровня, затем 2 и т. д.

Для иерархической структуры Вуза, которую мы составляли, в предыдущем разделе код будет следующим. Выберем десятичную систему счисления. Длина кода определяется глубиной классификации, в нашем случае она равняется 4, то есть код у нас будет четырехзначным вида ХХХХ, где Х – значение десятичного разряда.

Первый разряд выделен для признака «название факультета» и будет принимать значения: 0 для правоведения,1 для менеджмента.

Второй разряд для признака «возраст» и его значения: 0 до 20 лет, 1 от20 до 30 лет, 2 свыше 30 лет.

Третий разряд признак «пол», его значения 0 мужской, 1 женский.

Четвертый разряд признак «семейное положение», 0 холост; не замужем, 1 женат, замужем.

При такой системе код 1200 будет означать – студент факультета менеджмента, возраст больше 30 лет, мужчина, холост.

    1. Параллельное - применяется для фасетной классификационной структуры. В этом случае все фасеты кодируются, не зависимо друг от друга. Для значений каждого фасета выделяется определенное количество разрядов кода. Длина кода определяется количеством фасетов. Например, для Вузовской фасетной системы классификации длина кода будет 4. Порядок кодировки фасетов значения не имеет, выберем десятичную систему счисления и назначим:

Первый разряд фасету «пол», со значениями 1 мужчины, 2 женщины. Второй разряд фасету «семейное положение» со значением 1 женат, 2 холост. Третий разряд фасету «возраст», со значениями 1 до 20 лет, 2 от 20 до 30 лет, 3 свыше 30 лет.

Четвертый разряд фасету «название факультета», со значениями 1 менеджмент, 2 правоведение.

Расшифруем код 2131 – женщина, замужем, возраст за 30, студентка факультета менеджмента.

  1. Регистрационная – применяется для однозначной идентификации объектов путем присвоения уникального кода, не требует предварительной классификации. Различают:

    1. Порядковое кодирование – когда объектам присваиваются последовательные номера из чисел натурального ряда. Например, простенький инвентарный список.

    2. Серийно-порядковое кодирование – когда предварительно выделяются группы объектов со сходными признаками, которые образуют серию, а затем уже внутри серии производится порядковая нумерация объектов. Примером этой системы кодирования может служить обычный лотерейный билет.

Еще в качестве примера кодирования рассмотрим налоговый регистрационный номер. Первые четыре цифры – начальные от количества дней прошедших от начала 1900 года. Следующие четыре – порядковый номер родившихся в один день, который исчисляется по мере поступления в Государственный реестр этой информации. Предпоследняя цифра означает пол: четная – женский, нечетная – мужской. Последняя цифра определяется при помощи специального алгоритма, который держится в секрете.