
Классификационное кодирование
Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.
Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.
Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.
Пример 2.16. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 2.6). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном методе не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для фасета "пол" и имеет следующие значения: 1 -мужчины; 2 – женщины;
2-й разряд выделен для фасета "наличие детей у женщин" и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется;
3-й разряд выделен для фасета "возраст" и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет;
4-й разряд выделен для фасета "название факультета" и имеет следующие значения: 1 – радиотехнический, 2 – машиностроительный, 3 – коммерческий; 4 – информационные системы; 5 – математический и т.д.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
2135 – женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;
1021 – мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.
Данные и знания
При изучении интеллектуальных систем традиционно возникает вопрос – что же такое знания и чем они отличаются от обычных данных, десятилетиями обрабатываемых ЭВМ. Можно предложить несколько рабочих определений, в рамках которых это становится очевидным.
Данные – это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства.
Знания – это выявленные закономерности предметной области (принципы, связи, законы), позволяющие решать задачи в этой области.
поле знаний - условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;
знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы – см. далее);
базы знаний.
Часто используются такие определения знаний:
знания – это хорошо структурированные данные, или данные о данных, или метаданные.
Интенсионал понятия – это определение через понятие более высокого уровня абстракции с указанием специфических свойств.
Другой способ определяет понятие через перечисление понятий более низкого уровня иерархии или фактов, относящихся к определяемому. экстенсионал.
Пример 16.1. Понятие "персональный компьютер". Его интенсионал: "Персональный компьютер – это дружественная ЭВМ, которую можно поставить на стол и купить менее чем за $2000 - 3000".
Экстенсионал этого понятия: "Персональный компьютер – это Mac , IBM PC , Sinkler ...".
Для хранения данных используются базы данных (для них характерны большой объем и относительно небольшая удельная стоимость информации), для хранения знаний – базы знаний (небольшого объема, но исключительно дорогие информационные массивы). База знаний – основа любой интеллектуальной системы.
поверхностные – знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области;
глубинные - абстракции, аналогии, схемы, отображающие структуру и процессы в предметной области.