Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тезаурус_1.doc
Скачиваний:
2
Добавлен:
12.07.2019
Размер:
76.29 Кб
Скачать

3. Обобщенная структурная схема тезауруса

По определению информационно поисковый тезаурус—это нормативный словарь – справочник, предназначенный для индексаторов и потребителей информации. Такой словарь – справочник состоит трех частей:

а) Словарная часть представляющая собой общий алфавитный список дескрипторов (вместе с их словарными статьями) и ключевых слов, которые в данной ИПС считаются синонимами этих дескрипторов.

б} «Семантическая картина словарного состава. ИПЯ, представляющая собой систему смысловых классов, в которые сгруппированы все дескрипторы этого ИПЯ. В этом разделе тезауруса должны быть возможно более наглядно выражены важнейшие парадигматические отношения между дескрипторами или, по крайней мере, отношения «вид — род» («род — вид).

Руководство по переводу ключевых слов и словосочетаний естественного языка на дескрипторный ИПЯ.

3.1. В словарной части тезауруса дескрипторы и синонимичные им. ключевые слова, приводятся в виде общего алфавитного списка, причем дескрипторы в этом списке соответствующим образом отмечены (например: даны прописными буквами). В этом списке дескрипторы и их, синонимы связаны перекрестными ссылками. Полисемия и омонимия дескрипторов и ключевых слов в ИПЯ устранены лексикографически, т.е. при помощи системы помет и специфических символов.

Для построение информационно – поискового тезауруса необходимо последовательно выполнить следующие операции:

1. Провести отбор (накопление) ключевых слов, необходимых для построения словаря дескрипторов.

2. Построить словарь дескрипторов, для чего необходимо:

— устранять синонимию, полисемию и омонимию ключевых слов;

— сгруппировать их в классы условной эквивалентности;

— выбрать из числа членов каждого класса условной эквивалентности такое ключевое слово, которое далее будет использоваться в качестве имени этого класса, т. е. дескриптора.

З. Для каждого дескриптора построить его словарную статью, в которой сгруппированы все другие дескрипторы данного ИПЯ, связанные с «заглавным» дескриптором соответствующими парадигматическими отношениями.

4. Построить классификационные таблицы дескрипторов или графические схемы, в которых эксплицитно выражены смысловые связи между дескрипторами.

5. Сформулировать правила перевода ключевых слов и словосочетаний естественного языка на дескрипторный ИПЯ, правила лексикографического редактирования поисковых образов и предписаний перед их вводом в ИПС, а также правила пополнения словарного состава ИПЯ новыми дескрипторами.

При построении тезауруса необходимо учитывать следующие факторы:

— среднюю скорость роста поискового массива документов;

— предлагаемый максимальный объем собрания (массива) документов, в котором будет производиться информационный поиск—предметно тематическую широту поискового массива документов;

— среднее число ежедневно поступающих информационных запросов;

  1. численность, уровень научной квалификации и характер практической деятельности лиц, которые будут пользоваться тезаурусом;

  2. требуемую точность, полноту и скорость информацией него пояска;

  3. материальные средства выделяемые для создания и эксплуатации ИПС.

В зависимости от числа документов в поисковом массиве должен изменяться и уровень необходимой специфичности дескрипторов предназначенных для координатного индексирования этих документов. Для индексирования большого поискового массива не следует применять дескрипторов, выражающих стишком широкие понятия. Если не соблюдать этого условия, то в ответ на каждый информационный запрос ИПС будет выдавать слишком много документов. В [1] было по казано, что увеличение абсолютного объема выдачи требует повышения приемлемого уровня ее точности. Необходимо отметить также следующую тенденцию, проявляющуюся при практической эксплуатации дескрипторных ИПС: чем больше специфических и абстрактных терминов содержится в словарном составе ИПЯ, тем выше надежность работы ИПС. Это обстоятельство следует учитывать при отборе ключевых слов для словарного состава ИПЯ.