Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы учебника по АОТ.doc
Скачиваний:
38
Добавлен:
04.11.2018
Размер:
1.66 Mб
Скачать

Перечислительные классификации.

Чаще всего к ним относят алфавитно-предметные классификации (они являются наиболее типичными представителями).

Характерным признаком такого ИПЯ является то, что словарь такого языка состоит из упорядоченных по определённому признаку слов, словосочетаний естественного языка. Наиболее расхожим признаком упорядочивания является алфавит, а слова и словосочетания естественного языка обозначают предметы какой-либо отрасли науки или области деятельности, то такие языки называются алфавитно-предметными классификациями. В словаре просто перечисляются лексические единицы.

Алфавитно-предметная классификация – система классов, каждый из которых соответствует одному виду предмета. Классы расположены в алфавитном порядке их имён и простейшим примеров является телефонный справочник.

Лексические единицы такого языка называются предметными заголовками. Совокупность предметных заголовков и образует собственно язык. Обычно, предметный заголовок сопровождается пояснениями (состав рубрик, синонимы и др.). Сам заголовок вместе с пояснениями называется предметной рубрикой.

Алфавитно-предметные классификации чрезвычайно разнообразны. Назначение – использование в качестве дополнительных входов к иерархическим классификациям. (Это – некие указатели).

Преимущества:

  1. простота: удобно работать, так как он имеет примитивную структуру, следовательно, поиск лексических единиц прост.

  2. удобство добавления новых рубрик.

Недостатки:

  1. невозможно (рационально) с помощью данного языка производить многоаспектный поиск по любому сочетанию признаков.

  2. в нём синонимия терминов устраняется только с помощью отсылок (единственный способ установления парадигматических связей) – необходимо очень большое количество отсылок.

  3. строгий лексикографический контроль.

  4. язык сложно использовать для специалистов, которые говорят на другом языке ( при переводе структура разрушается).

Разновидности:

  1. пермутационные указатели (permutation - перестановка), цепные указатели.

Часто бывает необходимо при поиске обеспечить доступ каждой составляющей словоформе. Для этого и существуют пермутационные указатели.

Каждая сложная лексическая единица повторяется столько раз, сколько в ней составляющих словоформ, при том каждый раз меняется порядок слов, чтобы при каждом повторе первая компонента (входная) не повторялась. Появляется возможность получить доступ к любой лексической единице. В зависимости от того как эта идея реализуется, есть 2 типа.

  1. КВИК (KWIK – keyword in context)

Есть лексическая единица «научная картина мира». Она будет повторятся в пермутационных указателях три раза: «научная картина мира», «картина мира научная», «мира научная картина». При повторе все компоненты сохраняются.

  1. КВОК (KWOK – keyword out context)

«научная картина мира», «картина мира», «мир».

Пермутационные указатели активно используются как входные указатели к иерархическим классификациям.

Фасетные классификации.

По своим свойствам эти языки правильнее было бы отнести к некоторому промежуточному классу (имеют свойства как пред-, так и посткоординационных языков).

Фасетная классификация – полииерархия ( корневых рубрик может быть много – множество деревьев, лес).

Автором этого типа классификаций является индийский учёный Рангнатан. При систематизации понятий в фасетной классификации используется обычный дедуктивный метод (от общих понятий к частным).

Фасетная классификация – такая система классификации, при которой классифицируемое множество образует ряд независимых группировок по различным аспектам классификации. Эти группировки называются фасетами. Они, как правило, соответствуют наиболее характерным аспектам тематической области, для которой создаётся язык, а внутри фасета термины могут упорядочиваться по разным правилам (иерархия, пересечение и т.д.). Каждый термин фасета называют фокусом.

Трафаретом для формирования запроса служит фасетная формула. Она фиксирует последовательность перечисления фасетов (аспектов классификации). Порядок следования фасетов строго регламентирован. Конкретный поисковый признак может быть разным.

Пр. предметная область «Карандаши».

A цвет грифеля

B твёрдость грифеля

C способ подачи грифеля

A1 цветные

A11 красный

A12 синий

A2 серые (простые)

B1 твердые

B2 твёрдо-мягкие

B3 мягкие

C1 автоматическая (с регулировкой)

C2 без регулировки

Фасетная формула ABC

Преимущества:

  1. гибкость

  2. возможность многоаспектного индексирования

  3. возможность агрегатировать объекты по любому сочетанию фасетов

  4. более глубокое деление понятий, чем в иерархической классификации

  5. возможность более просто вводить новые понятия, нежели в иерархических классификациях

  6. поисковый образ более простой, нежели в иерархических языках.

Недостатки:

  1. язык имеет сложный процесс формирования

  2. его сложно применять в ручных системах (если он имеет разветвлённую структуру).