Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2 курс_ИС_УМК_Попова.doc
Скачиваний:
8
Добавлен:
24.08.2019
Размер:
310.27 Кб
Скачать

Вопрос 3. Методика построения и грамматика ипя дескрипторного типа. Разработка ипт осуществляется на основе следующих этапов:

  1. Определение тематического профиля ИПТ. Тематический профиль определяется путем анализа информационных потребностей специалистов отрасли.

  2. Сбор лексики и формирование словника ключевых слов. Словник — исходный массив терминов, который потом подвергается семантической обработке в процессе дескрипторизации. Массив формируется путем извлечения первичных, а чаще вторичных документов и ключевых слов. Иногда используются справочная литература, опрос специалистов. Основная проблема на этом этапе формулировка ключевых слов. Служебные слова (предлоги, союзы, частицы) следует считать неключевыми; общие термины (метод, способ и т.п.) необходимо употреблять только в сочетании с другими словами, конкретизирующими их значение. Ключевыми словами могут быть словосочетания.

  3. Построение словарных статей и формирование лексико-семантического указателя. Осуществляется дескрипторизация ключевых слов (для составления дескрипторного словаря) и установление прадигматических отношений между дескрипторами (для увеличения семантической силы языка). Устраняется неоднозначность ключевых слов путем снабжения соответствующими пояснениями — реляторами (ЗАПИСЬ – процесс, ЗАПИСЬ – предмет) Все слова группируются в классы эквивалентности: Безусловноэквивалентные (ОПУБЛИКОВАННЫЕ ДОКУМЕНТЫ = ПЕЧАТНАЯ ПРОДУКЦИЯ) и условно-эквивалентные (ТЕХНИЧЕСКИЕ СРЕДСТВА=АППАРАТУРА)

После этого производится выбор одного из слов в качестве дескриптора. Таким образом, дескриптор — лексическая единица ИПТ, под которой принято понимать нормализованное слово или словосочетание, выбранное из множества условно-эквивалентных ключевых слов для его обозначения. Свойства дескриптора:

  • Полнота выражения смыслового значения данного класса.

  • Краткость и понятность.

  • Частота встречаемости термина в текстах документов и запросов.

Аскриптор — лексическая единица ИПТ, входящая в класс эквивалентности данного дескриптора, которая при индексировании документов и запросов подлежит замене на дескриптор. Результат дескрипторизации: дескрипторный словарь – алфавитный перечень дескрипторов и аскрипторов. Например:

АРХИВЫ

Архивные службы

Архивные учреждения

Архивные центры

Статьи аскрипторов снабжаются отсылками на заменяющие их дескрипторы. Стандарт предлагает три типа отсылок:

  1. Аскриптор – синоним дескриптора:

Первичные издания

см ПЕРВИЧНЫЕ ДОКУМЕНТЫ

2. Аскриптор, заменяемый комбинацией дескрипторов (используй комбинацию):

Русские тексты

исп к РУССКИЙ ЯЗЫК

ТЕКСТЫ

3. Аскрипторы, заменяемые несовместимыми дескрипторами (используй альтернативу):

Текущая информация

исп а СВЕДЕНИЯ

ТЕКУЩЕЕ ИНФОРМИРОВАНИЕ

Далее устанавливаются парадигматические отношения. Данный процесс включает:

  • Логический анализ.

  • Ассоциативный анализ.

  • Прагматический анализ.

Логический анализ – сопоставление объемов понятий, представленных дескрипторами:

ПРИКАЗЫ

вр ОРГАНИЗАЦИОННО_РАСПОРЯДИТЕЛЬНАЯ ДОКУМЕНТАЦИЯ (выше род)

ПРИКАЗЫ

нв ПРИКАЗЫ ПО ЛИЧНОМУ СОСТАВУ (ниже вид)

Ассоциативный анализ – сопоставление признаков предметов, входящих в определенные понятия, представленные дескрипторами.

КАТАЛОГ

вц НАУНО-СПРАВОЧНЫЙ АППАРАТ (выше целое)

АРХИВ

нч ОТДЕЛ (ниже часть)

Прагматический анализ – упорядочение структуры и состава словарной статьи дескриптора. Учитывает: область ИПТ, терминологические особенности отрасли знания

Структура дескрипторной статьи имеет вид:

Д {Мс; Мв; Мн; Ма}

где

Д – заглавный дескриптор;

Мс – множество аскрипторов, входящих в класс эквивалентности дескриптора;

Мв – множество вышестоящих дескрпиторов;

Мн – множество нижестоящих аскрипторов;

Ма – множество ассоциативных дескрпиторов.

Например для дескриптора:

АРХИВЫ

с АРХИВНЫЕ СЛУЖБЫ

АРХИВНЫЕ УЧРЕЖДЕНИЯ

в ИНФОРМАЦИОННЫЕ СЛУЖБЫ

н НАЦИОНАЛЬНЫЙ АРХИВ

РЕГИОНАЛЬНЫЙ АРХИВ

а СИСТЕМА АРХИВНОГО ОБСЛУЖИВАНИЯ

Для аскриптора:

АРХИВНЫЕ СЛУЖБЫ

см АРХИВЫ

  1. Разработка вспомогательных указателей. Наиболее распространены три типа указателей: систематический указатель дескрипторов тезауруса, указатель иерархических отношений и пермутационный указатель дескрипторов. Систематический указатель – алфавитный список дескрипторов (тематический, категориальный, смешанный). Указатель иерархических отношений — свод классификационных деревьев. Каждый дескриптор может входить при этом более чем в одно дерево. Пермутационный указатель — перечень списков, каждый их которых соответствует одному из знаменательных слов в составе лексической единицы. Предназначен для поиска лексической единицы по отдельным словам.

  2. Оформление ИПТ.

  3. Экспертиза и регистрация ИПТ.

Основным способом уменьшения информационного шума является введение в ИПЯ грамматических средств, которые позволяют точно и полно выражать синтагматические отношения. Грамматические средства делятся на:

  • фрагментирующие. Для разделения поискового образа на части. К ним относятся указатели связи (буквы, цифры, знаки);

  • смыслоразличительные. Для указания смысловой роли различительных слов внутри фрагмента поискового образа. К ним относятся указатели роли.

ЛЕКЦИЯ 5