Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы_ГОС_магистр.doc
Скачиваний:
91
Добавлен:
09.09.2019
Размер:
4.03 Mб
Скачать
  1. Лингвистическое обеспечение автоматизированных систем. Идентификация объектов на основе классификации и кодирования.

Концептуальная модель поиска документов информации.

Лингвистическое обеспечение (ЛО) - совокупность языковых средств, обеспечивающая гибкость представления и обработки информации с помощью автоматизированной информационной системы (АИС).

В АИС язык выступает как средство, обеспечивающее человеко-машинное взаимодействие. ЛО включает языки запросов и отчетов, а так же специальные языки, определения и управления данными.

ЛО в значительной степени зависит от особенности предметной области:

  • от требований и полноте и точности передачи информации

  • к унифицировании языка и простоты его изучения и использования

Различают следующие уровни представления информации:

  • вещный уровень. Информация представляется в виде денотат. Денотат - класс предметов, обладающие некоторыми общими свойствами. В частном случае, денотат может состоять из 1го отдельного предмета или быть пустым

  • логический. Информация в виде концепта. Концепт - совокупность признаков, однозначно определяющая денотат. Обычно концепты выражаются в определениях соответственных понятиях.

  • языковой. Информация в виде имени. По существу имя - это средство доступа к денотату (его адрес). Документальный поиск заключается в отборе тех объектов (документов), состоящих из имен, возможные концепты которые включают концепт запроса.

Концепт - абстрактное понятие. Для осуществления операций над концептами, эти концепты должны получить материальное представление, должны быть обозначены определенным образом (иметь имена понятий).

Критерий смыслового соответствия. При эксплуатации документов и фактографической ИС важнейшим значением имеют вопросы, связанные с оценкой соответственно, содержание хранимых документов, информационной потребности.

Информационную потребность выражают на определенном языке. Именно поэтому не всегда удается точно, однозначно сформулировать эту информационную потребность.

Критерии:

1. оценка семантической близости потребности и документа - это критерий, определяющий % дискритеров, поискового образа документов, совпадающих с дискримптами поискового образа запросов. В тех случаях, когда выделить наиболее важный дискриптор, то способ становиться весомым, т.е. соответствия осуществляются в процессе ранжирования пользователем по дискрипторам с учетом их весовых...

2. способ с использованием обощенного расстояния Хэмминга. Поискового образа запроса и документа представляет n-мерными векторами в пространстве дескрипторов, их i-ые координаты принимают значения 0 или 1 в зависимости от того, входит i-ый дискриптор в поисковый образ или нет. Таким образом критерий смыслового соответствия (КСС) представляется в виде пары <β,k>, где β - мера формальной релевантным, мера близости поисковых образов, л - пороговое значение меры близости, при превышении которого документ признается формально релевантным.

Определение семантич. между запросом и документов сводится к определению семантич. связи между соответственными словами языка.

Основные понятия и состав лингвистического обеспечения информационных систем.

Язык - знаковая система, выполняющая познавательный и коммуникативные функции в процессе деятельности человека. Естественный язык обладает многозначностью, поэтому он становится препятствием хранению с ит.д., поэтому создан искусственный язык, который представляет собой специализированный язык основное назначение которого состоит в устранении многозначности слов. В искусственном языке отражается только объективная характеристика объектов и связи между ними. К ним относят и ИПЯ.

Поисковый язык - создан для реализации коммуникационный функции языка.

В информационном языке исключаются за счет однозначности знании:

  • синонимия, когда сходные слова, но значения имеют разное звучание

  • омонимия, когда слова одинаково звучат, но выражают разные смыслы

У всех языков обязательно есть внутренняя структура. Лексика - словарный запас. Грамматика - система способов построения слов и предложений. Морфология - совокупность действия в языке способов построения только слов. Морфена - наимен. неделимая единица выражения непосредственно соотносимая корню слова. Синтаксиз - это совокупность действий в языке способов построения предложений. Слова языка объединяются в лексикосемантические группы, которые называются парадигмами.

Типы отношений между словами:

1. парадигматические отношения -> аналитические, базисные отношения - это логические отношения между лексическими единицами языка, не зависимо от контекста конкретного употребления.

2. синтогматические, которые существуют между словами в пределах конкретного сообщения или фразы. Еще называются текстуальными. Это связи между лексическими единицами языка в тексте сообщения. При этом отражается конкретные ситуативные отношения между объектами.

Идентификация объектов на основе классификации и кодирования

При идентификации объектов различают следующие типологические задачи:

- уникальная идентификация

- идентификация группы объектов

Недостаток уникальности идентификации - это ее не информативность, т.е. объект, не характеризующийся атрибутами со смысловой стороны.

Уникальная идентификация объектов связывается с предметной областью, в которой рассматривают объект (пример, серия и номер паспорта). В основе идентификации групп объектов имеется содержательная информация и использование 1 из следующих методов:

  • метод классификации

  • описательный

  • смешанный

Классификационный метод основан на применении условных обозначений для объектов. При этом у объектов выделенные свойства имеют одинаковые значения. В основе такой идентификации лежит использование мнемонич. и классификации кодов, однозначно характеризующих объект.

Классификация

Под классификацией понимается выделение из ...., принимающих универс. классу всех подклассов на основе значений, выделенных в предметной области атрибутов и установление между выделенные подклассами отношения порядка.

Виды классификации:

  • иерархическая

  • фасетная

  • буйлевая.