Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по информационным системам маркетинга.doc
Скачиваний:
30
Добавлен:
27.04.2019
Размер:
1.55 Mб
Скачать

4.1.1. Иерархическая система классификации

Характерными особенностями иерархической системы явля­ются:

  1. наличие в системе неограниченного количества признаков классификации;

  2. соподчиненность признаков классификации, что выражается разбиением каждой классификационной группировки, обра­зованной по одному признаку, на множество классификаци­онных группировок по нижестоящему (подчиненному) при­знаку.

При построении иерархической системы классификации сна­чала выделяется некоторое множество объектов, подлежащее классифицированию Мо, для которого определяются полное мно­жество признаков классификации G и их соподчиненность друг другу, затем производится разбиение исходного множества объек­тов на классификационные группировки на каждой ступени клас­сификации.

При использовании иерархической системы классификации необходимо соблюдать следующие ограничения:

  1. получающиеся на каждом уровне классификационные груп­пировки должны составлять исходное множество объектов;

  2. классификационные группировки на каждой ступени не должны пересекаться;

  3. классификация на каждой ступени должна проводиться толь­ко по одному признаку.

Однако эта система характеризуется жесткой структурой классификации, не позволяющей вносить новые признаки или изменять их последовательность. Гибкость этой системы обес­печивается только за счет ввода большой избыточности в вет­вях, что приводит к слабой заполненности структуры класси­фикатора.

Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения.

Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Достоинства иерархической системы классификации:

  • простота построения;

  • использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации:

  • жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;

  • невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

4.1.2. Фасетная и дескрипторная системы классификации

Недостатки, отмеченные в иерархической системе, отсутству­ют в других системах, которые относятся к классу многоаспект­ных систем классификации. Аспект - точка зрения на объект клас­сификации, который характеризуется одним или несколькими признаками. Многоаспектная система - это система класси­фикации, которая использует параллельно несколько независимых признаков (аспектов) в качестве основания классификации. Существуют два типа многоаспектных систем: фасетная и дескрипторная.

Фасет - это аспект классификации, который исполь­зуется для образования независимых классификационных груп­пировок. Дескриптор - ключевое слово, определяющее неко­торое понятие, которое формирует описание объекта и дает при­надлежность этого объекта к классу, группе и т.д.

Фасетная система характеризуется следующими особеннос­тями построения:

  1. имеется некоторое множество классифицируемых объектов (Мо);

  2. это множество можно рассматривать в нескольких аспектах, каждый из которых может характеризоваться одним или не­сколькими признаками, образующими фасет Фr;

  3. устанавливается некоторый порядок следования фасетов с помощью фасетной формулы (при этом последовательность фасетов определяется по частоте обращения к этим фасетам на некотором множестве заданных задач):

F = (Ф1, Ф2, …, Фr,…, ФR)

  1. определяется количество подмножеств классификационных группировок, число которых определяется числом задач, обращающихся при своем решении к тем или иным фасетам.

Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet — рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

Схема построения фасетной системы классификации в виде таблицы отображена на рис. 4.1. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2, …, Фi…, Фn.. Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета, Например, фасет цвет, обозначенный Ф2, содержит значения, красный, белый, зеленый, черный, желтый.

Фасеты

Фi Ф2 Ф3 …..Фi ….Фn

1

2

k

Значения фасетов

Рис. 4.1. Фасетная система классификации

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты, Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:

КS = (Ф1, Ф2, …,Фi,…, Фn),

где Фi – i-й фасет; n - количество фасетов.

При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.

Достоинства фасетной системы классификации:

1) возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок;

2) возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее постро­ения, так как необходимо учитывать все многообразие классификационных признаков.

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов.

Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем:

  1. отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;

  2. выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребляемых;

  3. создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

1) синонимические, указывающие некоторую совокупность ключевых слов как синонимы;

2) родовидовые, отражающие включение некоторого класса объектов в более представительный класс;

3) ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.

Синонимическая связь: студент - учащийся - обучаемый. Родовидовая связь: университет – факультет - кафедра. Ассоциативная связь: студент - экзамен - профессор - аудитория.