3 Тема. Классификация и кодирования информации
Система классификации
Система кодирования
Классификация информации по разным признакам
Важным понятием при работе с информацией является классификация объектов. Классификация – система распределения объектов ( предметов явлений, процессов, понятий) по классам в соответствии с определенным признаком. Под объектом понимается любой предмет процесс или явление материального или нематериального свойства. Система классификации позволяет сформировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов – процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами. Например, информацию об университете можно классифицировать по многочисленным информационным объектам. Свойства информационного объекта определяются информационными параметрами, которые называются РЕКВЕЗИТАМИ. Реквизит – логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п. Например, реквизиты могут представляться либо числовыми данными, либо признаками. При любой классификации желательно соблюдать следующие требования: 1. Полнота охвата объекта рассматриваемой области, 2. Однозначность реквизитов, 3. Возможность включения новых объектов. В любой стране разработаны и применяются государственные, отраслевые и региональные классификаторы. Например, классифицированы отрасли промышленности, ед.измерения и т.д. Классификатор – систематизированный свод наименований и кодов классификационных группировок. При классификации используются такие значен,как Классификационный признак и значение классификационного признака, которые позволяют установить сходства или различия объектов. Возможен подход к классификации с объединением этих 2-х понятий в одно и назван он как признак классификации. Он имеет синоним основания деление .Пример ,это возраст до 1, 1-7,7-14,14-18 и т.д. Разработаны 3 метода классификации объекта: 1 иерархический, 2.фаесетный, 3. Дескрипторный. Иерархическая система классификации –исходное множество будет составлять нулевой уровень, далее нулевой уровень делится на классы, который образует первый уровень. В иерархической системе классификаций из-за жесткой структуры особое внимание следует уделять выбору классификационных признаков из –за жесткой структуры. Количество уровней классификации соответствует числу признаком, которые выбраны в качестве основания деления. Достоинства иерархической системы классификации: простота построения, использование независимых классификационных признаков в различных ветвях иерархической структуры. Недостатки: жесткая структура, которая приводит к сложности внесения изменений, невозможности группировать объекты по заранее непредусмотренным сочетаниям признаков.
3 лекция. Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицированного. Признаки классификации называются фасетнымы. Фасет - означает рамка. Каждый фасет содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочивание. Фасет – это цвет.
Достоинства:
Возможность создания большой емкости классификации
Возможность простой модификации всей систем классификации без изменения структуры следующих группировок
Недостатки
Сложность ее построения,т.к. необходимо учитывать все многообразие классификационных признаков.
Дескрипторная система классификации используется для организации поиска информации, для ведения словарей. Особенно широка она используется в библиотечной системе поиске
Суть дескрипторного метода классификации заключается в следующем: 1- отбирается совокупность ключевых слов или словосочетаний ,описывающих определенную предметную область или совокупность однородных объектов, 2- выбираемые ключевые слова или словосочетания подвергаются нормализации, т.и. из совокупности синонимов выбирается один или несколько наиболее употребимых, 3-создается словарь дескрипторов, т.е. словарь ключевых слов или словосочетаний ,отобранных в результате процедуры нормализации.
Система кодирования применяется для замены названия объектов на условное обозначение(код) в цели обеспечениях удобной и более эффективной обработки информации.
Система кодирования – это совокупность правил кодового обозначения. Код создан на базе алфавита. Характеризуется длиной (число позиций в коде), структурой (порядок расположения в коде символов, используемых для обозначения классификационного признака). Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, которые используются в системе кодирования и образуют классификационную систему кодирования. Можно выделить две группы методов, которые используются в системе кодирования.
Различают последовательное и параллельное кодирование
Последовательное кодирование используется для иерархической классификации
суть метода в следующем : сначала записывается код старшей группировки первого уровня, затем код группировки второго уровня и т.д,в результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфики выделенной группы на каждом уровне иерархиической структуры.
Классификационное кодирование используется для фасетной классификации
Суть метода : все фасеты кодируются независимо друг от друга, для значения каждого фасета выделяется определенное количество разрядов кода
Регистрационное кодирование используется для однозначной идентификации объекта и не требует предварительной классификации объекта. Различают порядковую и серийно порядковую систему в регистрационном кодировании. Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяется после предварительного упорядочивания объектов (например, по алфавиту). Этот метод применяется в том случае, если количество объектов не велико. Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию, по своей сути серийно-порядковая система является смешанной, т.е классифицирующей и идентифицирующей ,применяется тогда, когда количество групп невелико.
_____________________________________________________________________________________
Классификация информации по разным признакам
Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам и критериям. В основу классификации положены пять общих признаков.
По месту возникновения (входная, выходная, внутренняя, внешняя)
По стабильности (переменная, постоянная)
По стадии обработки (первичная, вторичная, промежуточная, результатная
По способу отображения(текстовая,графическая)
По функции управления(плановая,нормативно-справочная,учетная,оперативная)
Входная информация, которая поступает в фирму и ее подразделения,
выходная информация- это и-ция ,поступающая из одной фирмы в другую фирму или организации и может являться как входной информацией для одной фирмы и выходной для другой. Внутренняя информация возникает внутри объекта, а внешняя - за пределами объекта
Информация может быть переменной(текущей),постоянная(условно-постоянная). Переменная информация Отражает фактические, количественные и качественные характеристики производственно-хозяйственной деятельности фирмы, может меняться для каждого случая по назначению и по количеству. Постоянная или условно-постоянная, неизменная и многократно используемая в течении длительного времени информации, она может быть справочной нормативной, плановой. Постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Постоянно-нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Постоянно-Плановая содержит многократно используемые в фирмы плановые показатели.
Первичная информация возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии. Вторичная информация- это информация ,которая получается в результате обработки первичной информации и может быть промежуточной и результатной. Промежуточная информация используется в качестве исходных данных для последующих расчетов. Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.
Текстовая информация – совокупность алфавитных сиволов, цифр спец-символов, с помощью которых представляется информация на физическом носителе, т. Е бумаги. Графическая информация различного рода графика, схемы, диаграммы, рисунки.
По функции управления обычно классифицирует экономическую информацию. Плановая информация - это информация о параметрах объекта управления на будущий период , на эту информацию идет ориентация всей деятельности фирмы. Нормативно-справочная информация содержит различные нормативные и справочные данные, ее обновление происходит достаточно редко. Учетная Информация характеризует деятельность фирмы за определенный прошлый период времени. Оперативная или текущая информация , которая используется в оперативном управлении и характеризует производственные процессы в текущий или данный период времени.
