Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры к госам Комплексные АБИС.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.25 Mб
Скачать

33

Информатика

1. Языки отражения информации Информационно-поисковые языки дескрипторного типа.

Мыслительная деятельность человека осуществляется в форме понятий, представлений, которые неразрывно связаны друг с другом и являются формой отражения реальной действительности в мышлении. Представления – это чувственно-наглядные образы предметов и явлений объективного мира, в основе каждого представления лежит восприятие предмета в прошлом. представления, ощущения, восприятия, являются только базой, на основе которой складываются мыслительные образы вещей. Понятия образуются в результате логического осмысления представлений о предметах и явлениях, И представления, и понятия, формируясь в сфере мышления, имеют языковую природу, мышление с самого начала своего возникновения неразрывно связано с языком. Язык – это орудие реализации мысли, обмена мыслями, возникающее в процессе социальных коммуникаций. Естественные языки, представляют собой совокупность средств выражения человеческого сознания, способного передать в процессе коммуникации любую из его сторон.

ЕЯ имеют ряд функций: гностическую (познавательную), или аккумулятивную, - с помощью языка обеспечивается сохранение опыта и знаний человека; коммуникативную (передача информации); номинативную (с помощью слов называет вещи, явления, понятия); регулятивную – устанавливает отношения между участниками общения; эмотивную – состоит в выражении эмоций, чувств, настроений; побудительную – связана с выражением требований желаний; эстетическую – основана на способности слова не только воздействовать значением, но и оформленностью.

Искусственные языки создаются людьми для решения каких-либо задач. Виды: машинные языки (это искусственный или формальный язык, предназначенный для записи информации, хранящейся в запоминающем устройстве вычислительных программ для описания программ, алгоритмов), международные языки (эсперанто), информационные языки (языки для поиска информации – ИПЯ, это иск. яз., представляющий собой совокупность средств для описания формальной и содержательной структуры информации и ее поиска по запросу потребителя). Процесс представления информации на ИПЯ, в результате которого создаются поисковые образы документы (ПОД) и запросов (ПОЗ), называется индексированием. Структура ИПЯ: фонетический уровень (алфавит ИПЯ, это совокупность определенных знаков символов), лексический уровень (совокупность лексических единиц - ЛЕ), синтаксический уровень, текстовой уровень.

Для упорядочения ЛЕ при построении лексики ИПЯ, служат парадигматические отношения – это смысловые, объективно существующие отношения между ЛЕ, которое устанавливаются и фиксируются в словаре исходя из потребностей информационного языка. Кроме парадигматических отношений существуют синтагматические отношения (синтаксические, грамматические, текстуальные).

Виды ИПЯ: 1.ИПЯ не координируемые (используемые в ручном режиме):

1.1.С контролируемой лексикой: перечислительные классификации (сокращение яз. – англ, рус.), рубрикаторы информационно-библиографических изданий;

1.2.С неконтролируемой лексикой: вспомогательные указатели к изданиям.

2.Предкоординируемые ИПЯ:

2.1.С контролируемой лексикой: с грамматикой (иерархические классификации УДК, ББК, фасетные классификации) без грамматики (иерархические классификации, рубрикаторы (ГРНТИ), язык предметных рубрик);

2.2.С неконтролируемой лексикой: язык библиографического описания.

3. Посткоординируемые ИПЯ:

3.1.С контролируемой лексикой: дескрипторные ИПЯ с грамматикой (например, тезаурус MESH), дескрипторные ИПЯ без грамматики (большинство дескрипторных ИПЯ);

3.2.С неконтролируемой лексикой: ИПЯ ключевых слов с грамматикой (свободного индексирования), без грамматики.

Классификационные ИПЯ – ИПЯ построенные с помощью распределения понятий на взаимоисключающие классы (совокупность объектов, имеющих один или несколько общих содержательных признаков). При построении основной принцип деления от общего к частному, на учете подчинения и соподчинения. Классификационный ИПЯ – это язык предназначенный для индексирования документов и информационных запросов посредством понятий и кодов какой-либо классификационной системы. Языки фасетной структуры представляют собой фасетную классификацию – совокупность фасетов, следующих друг за другом в определенной последовательности. В основе построения таких классификаций лежит индуктивный метод, который предполагает исследование отдельных предметов классифицируемого множества, нахождение в них общих существенны признаков и группировку на основе последних терминов, обозначающих эти понятия. в фасетной классификации по существу производится параллельная классификация одних и тех же объектов по разным признакам. К ИПЯ классификационного типа относят ББК, УДК, классификация Дьюи и многие другие, но не в чистом виде, так, полуфасетные классификации используются в УДК и ББК.

Дескрипторные ИПЯ – это искусственные информационные языки нового типа, это ИПЯ предназначенные для координатного индексирования документов и запросов посредством дескрипторов и/или ключевых слов. Координатное индексирование – это индексирование, предусматривающее многоаспектное выражение основного смысла документа или смыслового содержания запроса множеством ключевых слов или дескрипторов. Элементы дескрипторных ИПЯ:

  • Ключевое слово – это информативное слово, приведенное к стандартной лексикографической форме и используемое для координатного индексирования.

  • Дескриптор – это ЛЕ, выраженная информативным словом (вербально), или кодом и являющаяся именем класса синонимичных или близких по смыслу ключевых слов.

  • Аскриптор, недескриптор, нондескриптор – ЛЕ в ИПТ, которая не может быть использована для координатного индексирования и подлежит замене одним или несколькими заменяющими дескрипторами.

  • Идентификатор – имя собственное используемое как дескриптор.

  • Вышестоящий дескриптор, широкий дескриптор – дескриптор, обозначающий либо родовое понятие, либо целое по отношению к данному дескриптору, обозначающему часть этого целого.

  • Нижестоящий дескриптор, узкий дескриптор – дескриптор, , обозначающий либо видовое понятие, либо часть по отношению к данному дескриптору, представленному вышестоящим дескриптором.

  • Ассоциативный дескриптор – дескриптор, связанный с другими семантической связью, характер которой не указывается.

  • Предпочтительный термин – термин, выбранный для использования в качестве дескриптора из множества эквивалентных по смыслу терминов.

  • Вспомогательный дескриптор, квалификатор – дескриптор, который используют только совместно с другими дескрипторами.

  • Тезаурусная статья – элемент лексико-семантического указателя ИПТ, состоящая из дескриптора и всей информации, относящейся к нему.

  • Лексическое примечание в тезаурусной статье – краткое объяснение, уточняющее значение дескриптора.

  • Код дескриптора – код, используемый в ИПТ для предоставления эквивалентных дескрипторов и синонимов.

Методика построения дескрипторных ИПЯ: на практике большое распространение получил эмпирический метод отбора лексики для построения ИПЯ. Этот метод получил название фасетно-блочного:

1 этап. Разработчикам задаются универсальная и типовая системы категорий, которые конкретизируются с учетом специфических особенностей тематической области. Результатом конкретизации является частная система категорий, подлежащая фасетному анализу, на основе которого разрабатывается фасетная структура ИПЯ. Уровень фасетного анализа дополняется внутрифасетным анализом, в результате которого образуются подфасеты. Подфасеты подразделяются на блоки. Совокупность фасетов, подфасетов и блоков образует фасетно-блочную структуру, априорным способом.

2 этап. Из документов, подлежащих к вводу в ИПС, эмпирическим путем выделяются ключевые слова; образуется словник ключевых слов, которые распределяются по фасетам, подфасетам и блокам, тем самым осуществляется терминологическое наполнение фасетно-блочной структуры. Поскольку априорно составленная структура не в состоянии предусмотреть все терминологические слои, осуществляется ее доработка.

3 этап. Ключевые слова, систематизируются по фасетам, подфасетам и блокам, подвергаются дескрипторизации. В результате дескрипторизации образуются дескрипторные блоки. Построением дескрипторных блоков реализуется эмпирический подход к построению ИПЯ.

4 этап. Текстографические элементы ИПЯ преобразуются в коды. Семантические сложные ключевые слова подвергаются семантическому развертыванию (представление содержания ключевого слова в виде логического произведения элементарных терминов – дескрипторов, набираемых из соответствующих дескрипторных блоков).

Для контроля лексики создается информационно-поисковый тезаурус (ИПТ), контролируемый словарь ЛЕ дескрипторного языка, отображающий семантические отношения между ЛЕ и предназначенный для организации поиска информации путем индексирования документов и (или) запросов. ИПТ служит:

  • Средством перевода с естественного языка на ИПЯ при индексировании информационных документов и запросов,

  • Источником сведений о полезных для поиска отношений между дескрипторами,

  • Терминологическим пособием при решении различных научно-информационных задач (в частности, предоставляет информацию о составе лексики, используемой при индексировании).

Структура ИПТ:

  • Лексико-семантический указатель – основная часть ИПТ, в которой в алфавитном порядке перечислены все дескрипторы и нондескрипторы с указанием их парадигматических отношений.

  • Систематический указатель ИПТ – вспомогательная часть ИПТ, в которой перечень ЛЕ построен согласно принятой классификацией понятий соответствующей отрасли знаний.

  • Иерархический указатель ИПТ – список дескрипторов высшего уровня иерархии, в котором для каждого из них даются подсиненные нижестоящие дескрипторы, расположенные в порядке убывающей общности.

  • Графический указатель ИПТ – совокупность семантических схем или карт, в графической форме представляющих парадигматические отношения между дескрипторами (с помощью диаграмм, стрелок и т.п.).

  • Пермутационный указатель ИПТ – указатель, в котором в алфавитном порядке перечислены все отдельные слова – компоненты словосочетаний, обозначающих дескрипторы, в состав которых входят эти слова.

Методика составления ИПТ:

1 этап. Определение тематического профиля ИПТ (он определяется путем анализа информационных потребностей специалистов той или иной отрасли).

2 этап. Сбор лексики и формирование словника ключевых слов (здесь словник – это исходный массив терминов, которых потом подвергается обработке в процессе дескрипторизации).

3 этап. Построение словарных статей и формирования лексико-семантического указателя (заключается в дескрипторизации ключевых слов и установлении парадигматических отношений между дескрипторами).

4 этап. Составление вспомогательных словарей (наиболее распространены три типа словарей: систематический, указатель иерархических отношений и Пермутационный указатель дескрипторов).

5 этап. Оформление ИПТ в соответствии с ГОСТом 7.25 -80.

6 этап. Экспертиза и регистрация ИПТ.