Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник.doc
Скачиваний:
1228
Добавлен:
11.04.2015
Размер:
2.16 Mб
Скачать

7.2. Предметизационный ипя – средство предметизации

7.2.1. Характеристика предметизационного ипя

Качество любой ИПС, отражающей содержание документов, зависит от ИПЯ, с помощью которого система реализуется.

Предметные массивы библиографических записей или первичных документов создаются на основе предметизационного языка или языка предметных рубрик (ЯПР) – искусственного языка, предназначенного для индексирования документов и информационных запросов посредством ПР.

ЯПР предназначен для индексирования документов, частей документов и их совокупности.

Основная задача ЯПР – наиболее полно раскрыть содержание той или иной предметной области в целом и отдельных ее разделов, то есть дать по возможности исчерпывающий перечень предметов науки (проблемы, темы), выразить взаимоотношения между этими предметами. ЯПР получили различные названия: «Алфавитный указатель ПР и ссылок», «Рубрикатор», «Служебная картотека ПР», «Общий алфавитный ключ», «Словарь ПР», «Словарь предметного каталога» и др. Они помогают ориентироваться в каталогах (списках, указателях), придерживаться принятых ПР и ссылок, избегать дублирования, своевременно включать новые рубрики и обновлять устаревшие, отрабатывать единообразные методические приемы, развивать методику предметизации, способствовать большей оперативности и производительности работы. На выявленные «перспективные» предметы формулируются рубрики, использование которых планируется в будущем. Совмещенные с действующими рубриками, они составляют не что иное, как ЯПР.

ЯПР относится к вербальным ИПЯ, поскольку для представления своих ЛE в нем используются слова и выражения естественного языка в их орфографической форме.

Словарь русского языка и словарь ПР содержат перечень слов в алфавитном порядке, но на этом их сходство заканчивается. «Слова», представленные в ЯПР проходят жесткий отбор из лексики естественного языка и формулируются по собственным правилам. Именно поэтому ЯПР является искусственно созданным языком на основе естественного. Его лексические единицы следует называть не словами, а заголовками и подзаголовкам' предметных рубрик.

Предметные рубрики и слова естественного языка выполняют разные функции, и поэтому создаваемые с их помощью «тексты» строятся по-разному.

Многие достоинства естественного, например, русского языка делающие его «великим и могучим», оборачиваются недостатком для языка предметных рубрик.

Многозначность, синонимичность, свойственные естественному языку, являются непреодолимым препятствием при содержательном поиске документа. Поэтому, прежде чем использовать слова естественного языка в качестве рубрик, их всесторонне анализируют по ряду параметров и дорабатывают в соответствии с правилами, которые изложены ниже.

Формализация лексики при создании предметных рубрик вызвана необходимостью устранения как «избыточности», так и «недостаточности» естественного языка для целей информационного поиска.

Важнейшим принципом ЯПР является устранение синонимии, полисемии и омонимии, которыми так богат русский язык, для реализации «однозначности» информационного поиска.

  1. Синонимия естественного языка – совпадение или близость значения различных слов. Например: желтуха – гепатит.

  2. Полисемия – свойство какого-либо слова, имеющего одно или несколько этимологически близких значений, то есть перенос названия с одного предмета на другой на основе сходства по форме, свойствам, функциям предметов, например, звезда – геометрическая фигура; звезда – небесное тело, звезда морская.

  3. Омонимия – внешнее совпадение слов одинаковых по на писанию и звучанию, но выражающих различные понятия. Например: родниковый ключ и замочный ключ, лук оружие и лук – овощ.

В рубрике многозначные слова без уточнения их значения не используются.

Для разграничения терминов-омонимов используются реляторы, уточняющие термины, которые указываются в круглых скобках.

Например:

Гармония (иск.)

Гармония (лит.)

Гармония (муз.)

Гармония (филос.)

Гармония (эстет.)

В качестве реляторов могут использоваться понятия, характеризующие научные дисциплины, отрасль, этническую группу, язык, тип объекта, географическое название и т. д.

При формировании предметных рубрик используются следующие грамматические категории русского языка: существительные, прилагательные, порядковые числительные, наречия, предлоги, союзы.

Основной формой выражения понятий в предметных рубриках являются имена существительные и словосочетания на их базе.

Словосочетания могут состоять:

  • из существительного с прилагательными или причастиями: Муниципальная собственность;

  • существительного с существительными, первое из которых стоит в именительном падеже, а второе – в родительном: День печати;

  • существительного с предлогами (в, на, для, за, из, о, по, при, У), выражающими различные отношения предметов: Восстановление на работе;

  • двух существительных с союзом «и», который применяется Для соединения, сравнения, противопоставления двух понятий: Анонимы и псевдонимы;

  • существительного с порядковым числительным: Александр II (имп.;1818–1881).

Достаточно широко используются ПР с инверсией существительного, которое применяется в родительном падеже. Например:

Упругости теория

Существительные, используемые в формулировках предметных рубрик, применяются, как правило, во множественном числе. Например:

Университеты

Существительные, используемые в формулировках предметных рубрик в единственном числе, применяются:

1) если данный термин не используется во множественном числе.

Например:

Аудит;

2) в рубриках, отражающих названия отраслей, организаций, учреждений, индивидуальных предметов, собственных имен. Например:

Большой театр России.

Существительные, которые имеют как единственное, так и множественное число, могут употребляться в разных формах в зависимости от того, с точки зрения какой отрасли знания каждый предмет рассматривается. Например:

Книга История

но

Книги кириллической печати

В ЯПР не входят слова естественного языка, которые не несут серьезной смысловой нагрузки, с помощью которых нельзя сформулировать четкий запрос.