Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
38
Добавлен:
10.05.2014
Размер:
87.04 Кб
Скачать

Лингвистическая модель входного подъязыка: компонент V (с примером)

Lm=<V (лексический компонент, определяющий лексику (словарь) подъязыка, обслуживающего конкр. ПрО), G (синтаксический компонент, определяющий способ порожд. прав. констр. языка), S (семантич. компонент, опред. способ записи логико-смысловой структуры вх. подъязыка, т.е. значений вх. текстов подъязыка), [P] (прагматич. комп. – опцион.)>

Программное ср-во реализации (поддержки) Lm – лингвистический процессор (ЕЯ-процессор), фактически это компонент понимания в арх. любой ИДС.

Пример компонента V. Сколько каменного угля перевезено железнодорожным транспортом в 2000 году?

<описание словаря>::=<имя словаря>{<тело словаря>}

<имя словаря>::=Словарь вопр. слов | С. предикатов | С. предлогов | С. характеристик | С. понятий | С. чисел

<тело словаря>::=<номер п/п><словоформа><сл.статья>

<сл. статья>::=<сл.ст. вопр. сл.>|<сл. ст. предиката>|…

<сл. статья понятий>::=<род>|<число> {<падеж>}

<род>::=М <число>::=Е <падеж>::=Р|Т в|Предл

<сл. статья предиката>::=<номер> <квазиоснова> <квазифлексия> <кодиф. части речи> <номер словоизменения> <модель управления>

<модель управления>::=({<актант>}) <актант>::=(<тип акт.> <синт. падежи> <сем. пад.>

<синтаксич. падежи>::=({[<предлог>] <синтаксич. падеж>})

<тип актанта>::=A | O | I | W <синт. пад.>::= ИП | РП | ДП | ВП | ТП | ПП

<кодиф. части речи>::= СУ | КП | ГЛ | ДЕ 44

Интерпретация семантическая и прагматическая.

Семиотика вкл. неск. разделов: синтактика: структурные аспекты сочетаний знаков данной сист., правила их образования и преобразования (безотносительно к их ф-циям и значениям); семантика: знаковые системы как ср-ва выражения смысла, т.е. занимается установлением завис. между структ. знакосочетаний и их выразительными возможностями, изуч. интерпретации знаков и знакосочетаний, образующих осмысл. тексты; прагматика: отнош. воспринимающего знаковую сист. к самой знаковой сист.

Семантическая интерпретация. Происходит сопоставление семантич. графа с самой семантич. сетью, в рез-тате происходит вычленение контекста (нек-рого подграфа), в к-ром работает запрос и получение содерж. инф-ции из конкретной сети. Происходит обращение к БД за числовой инф-цией и опред. способ обработки этой инф-ции (суммирование, оптимизация и т.д.). Сопоставление семантич. графа с семантич. сетью производится постепенным свертывание графа, начиная с вершины, наиболее удал. от вопросит. вершины и заканчивая вопросит. вершиной. Для этого предназн. спец. эвристики и программы сужения и отображения.

Прагматическая интерпретация. Рассматривается только в случае, если понимание текста идет по трем уровням отображения, т.е. системе требуется еще и реакция системы.

Произв. какие-то действия направленные на получение реакции.

В обычных экспертных системах мы работаем с анализом и семантической интерпретацией.

Прагматическая интерпретация используется при рассмотрении простых задач, где можно быстро получить решение (напр., язык общения агентов в многоагентных системах, где за счет выходной реакции реализуется партнерство). 42

Основные формы и языки взаимодействия СОЗ (ЭС), деловая проза.

Формы и языки взаимодействия: 1) ЕЯ; 2) ФЯ/искусств. яз.; 3) многооконная графика; 4) гипертекстовые ср-ва; 5) сист. меню.

Язык – наход. в распоряжении того/иного коллектива система элементов-единиц разных ярусов: слов, значимых частей слов и т.д. (инвентарь) + сист. правил функционирования этих единиц, т.е. генерации и понимания осмысленных высказываний (грамматика).

ЕЯ – такой язык, использование к-рого в рамках конкр. комп. приложений не заставляет пользователя предварительно обращаться к инструкциям и запоминать правила построения высказываний. Ограниченный ЕЯ: требует от польз. соблюдения явно выраженных ограничений. Подъязык – язык нек-рой гр. людей, общающихся в конкр. ПрО с конкр. целями. Деловая проза – языковой носитель отношений человека в сфере производства, особая лингвистическая и социальная категория, сохр. многие св-ва яз. в целом и в то же время самой своей сутью подготовленная для автоматизации. Экономичные и строгие средства выражения: отсутствие ораторских, эмоциональных и других приемов.

Свойства деловой прозы: 1) относительная полнота: подъязык, обслуживающий нек-рую ПрО, облад. дост. набором яз. средств для обозначения любого факта из этой ПрО; 2) замкнутость: при добавлении к обозримой выборке текстов подъязыка других текстов того же п. не происх. пополн. словаря и грамматики. 1 <-> 2 (наличие репрезент. выборки вх. текстов); 3) конечность: наличие конечного и огранич. словаря; 4) формальная ограниченность: ограничен набор грамматич. средств и конструкций из общеязыкового арсенала; 5) устойчивость: для понимания входных текстов несущественны поверхностно-синтаксич. различия текстов с тождественным смыслом. 48

Декларативные синтаксические знания: модель управления

Способы задания декларативных синтаксич знаний: 1. Синтаксич. отнош. (предикативные отнош. – между сказ. и подлеж.; копплетивные отнош – их 6 шт., отнош. между сказ. и его дополнением; обстоятельственные отношения – между сказ. и обстоятельством; определительные – подлеж.-опред.; количественные; отрицательные; вспомогательные).

2. Синт комп. модели упр (МУ): МУ – особая зона словарной статьи, в ко-рую помещена синт. и сем. инф-ция о конкр. лексеме. Число и содержание мест МУ завис. от: 1) числа и хар-ра актантов ситуации, обознач. данным словом (семантич валентность слова); 2) числа и хар-ра дополнений, завис. от данного слова и реально наблюд. в тексте (синтаксич валентность слова). МУ = сем. валентность + синт. валентность. МУ: индивидуальная, групповая, ядерная. Актанты ситуации – опред. лексико-графич. анализом ситуации. Примеры глубинных падежей (семантич вал): колотить – 4-х валентный предикат. A, B, C, D – актанты. "Иван колотит Петра кулаком по спине".

А(агент)

В(адресат/тема)

С(инструмент)

D(пораж. часть объекта)

синт.

комп.

1. Кто колотит? Sим

1. Sвин (кого колотят?). 2. по + Sдат. 3. в + Sвин

Sтв

По, Sдат

сем. комп

1. одуш

1. одуш. предм или физ. об. 2. Неоднор. предм. (часть или большой предмет) 3. преграда.

Физич объект

Часть тела объкта В.

3. Лексические ф-ции – инф. о лексич. сочетаемости отд. словоформ. Например синонимия: syn(красивый)=(симпатичный); конверсия: conv(пугать 1,2)=(бояться 2,1); дериваты:der(вышивать)=(вышивка). 46

Основные функции диалогового компонента, структура диалога

Функции диалогового компонента: 1) ведение диалога; 2) формирование (если текущая ситуация не предусмотрена структурой диалога) и обработка перехватов инициативы (пользователем). Общение (коммуникативное взаимодействие, диалог) – процесс достижения его участниками определ. согласов. целей путем обмена связанными высказ., выраженными в языке, о ПрО. Диалог между польз. и ЭВМ: общение направл. на удовлетв. информ. потребностей пользователя. Высказывания участников общения образуют связный текст (дискурс).

Структура диалога: 1.Глобальная структура.Действия ИДС задаются в виде посл-ти этапов, определяемых в зависимости от класса решаемых задач. Напр., в случае общения с ЭС: инструктаж; постановку задачи; решение зад., объяснения в ходе решения; объяснения после решения; определ. причин неудач и приобретение новых знаний.

2.Тематическая структура. Представляется в виде сценария, в рамках которого определяются: 1) структура задачи, т.е разбиение задачи на упорядоченное множество подзадач; 2) распределение подзадач по участникам общения; 3) языковые средства, используемые при обращениях к пользователю. 3. Локальная структура. Шаг диалога состоит из действия (высказывание акт. участника) и реакции (пассивного). Перехват инициативы возникает когда пассивный участник вместо преследования цели, предложенной активным уч., предлагает преследовать иные цели. Схемы диалога:

1. Д. ведет пользователь. Иниц. (кр. сообщ. об ошиб.) у польз., а с-ма реагирует на его требования. Ф-ции ДК практич. вырождены. 2. Ведет с-ма. Инициатива принадлежит с-ме. Она ведет диалог в соответствии с имеющимися у нее представлениями о структуре диалога (т.е. о разбиении задач на подзадачи и о том, кто из участников, когда и какую из них решает). 52

Семантический анализ текста (общий алгоритм)

Задача СЕА: преобразование синт. структуры предложения, полученной на этапе СИА, в форматы некоторого семантического языка, т.е. осуществление перехода от поверхностного «оформления» факта ПрО к его логико-смысловому значению.

На вход СЕА предложение поступает в виде списка пар слов исх.предложения, соединенных синт. отношениями.Результатом СЕА является семантический граф.Этап СЕА состоит из 2 фаз:

1.СЕА слов с МУ: для них всегда можно указать ссылку на эл-ты семантич. сети, обработка зависит от МУ. Слова с МУ делятся на группы: 1) предикаты действия (отраж ситуацию в реальном мире); 2) функциональные предик. (операторы над пред.);

3) пустые пред. (глаголы-связки («быть»), пустые глаголы («осуществить») и фазовые глаголы (начинать, заканчивать), модальные глаголы (мочь, должен, хотеть).

2.СЕА слов без МУ: семантика данных ИГ (слов без МУ) определяется в зависимости от контекста. ПОЭТ: в сем. сеть добавляются новые вершины, связываемые отношениями «быть элементом» и «быть значением».

Обобщенный алгоритм СЕА: 1. Классиф. вх. слов. на группы с учетом способа предст. инф. (декларативный/процедурный), организации словарн. инф. (предик, понятия, хар-ки и т.д.)

2. Перенос предик, комплетивных и обстоят. отнош. на слово, явл. предикатом действия. 3. Выбор канонич. формы сл. с МУ. 4. Замена синт.отношений (СИО), вх. в МУ на сем. отнош. и проверка замены по сем. сети на правильность. 5. Обработка обстоят. СИО как вспомогат. информ. к предикату действия. Инф-ция оформляется в виде спец. таблиц (напр., табл. времен). 6. Заполение всех актантов МУ соотв. словами вх. предложения, т.е. понятиями. 7. При наличии в запросе парам., треб. обр. к БД, форм. запросы к БД. 8. После обработки слов с МУ синт. стр. вх. предлож. разбивается на ряд поддеревьев, сост. именную группу, и далее обработка ИГ как слов без МУ.

50

Знания о языке, основные понятия.

Подходы к хранению словоформ: 1. Декларативный (хранятся все словоформы). 2. Процедурный (хранятся осн., нужно выделение осн. и мощные алгоритмы словообраз.).

Зн. о языке (лингвистич. зн.): 1. Лексические (слова, способы их измен. и образования); 2. Синтаксич. (правила постр. грамматич. правильных текстов). 3. Семантич. (соотн. слов и яз. констр. с объектами и понятиями ПрО).

Наиболее важные виды синт. и сем. знаний: 1. Синт. отношения (СИО). В русск. языке – 30-40: предикативные, комплетивные (между предик. и дополнением) – 5 шт., обстоятельств., определит., колич., вспомогат. и др. 2. Лексические ф-ции – инф. о лексич. сочетаемости отд. словоф. Напр. синонимия: syn(красивый) = (симпатичный); конверсия: conv(пугать 1,2) = (бояться 2,1); дериваты: der(вышивать) = (вышивка). 3. МУ – особ. зона словарной статьи, в ко-рую помещена синт. и сем. инф-ция о конкр. лексеме. Число и содерж. мест МУ завис. от: 1) числа и хар-ра акт. ситуации, обознач. данным словом (семантич валентность слова); 2) числа и хар-ра дополнений, завис. от данного слова и реально наблюд. в тексте (синтаксич валентность слова). МУ = сем. вал. + синт. вал.. МУ: индивид., групп., ядерная. Актанты ситуации – опред. лекс.-граф. анализом ситуации. Примеры глубинных падежей (семантич вал.): колотить – 4-х валентный предикат. A, B, C, D – актанты. "И. колотит П. кулаком по спине".

А(агент)

В(адресат/тема)

С(инструмент)

D(пораж. часть объекта)

синт.

комп.

1. Кто колотит? Sим

1. Sвин (кого колотят?). 2. по + Sдат. 3. в + Sвин

Sтв

По, Sдат

сем. комп

1. одуш

1. одуш. предм или физ. об. 2. Неоднор. предм. (часть или большой предмет) 3. преграда.

Физич объект

Часть тела объкта В.

62

Подходы к хранению словоформ: 1. Декларативный (хранятся все словоформы). 2. Процедурный (хранятся осн., нужно выделение осн. и мощные алгоритмы словообраз.).

Зн. о языке (лингвистич. зн.): 1. Лексические (слова, способы их измен. и образования); 2. Синтаксич. (правила постр. грамматич. правильных текстов). 3. Семантич. (соотн. слов и яз. констр. с объектами и понятиями ПрО).

Наиболее важные виды синт. и сем. знаний: 1. Синт. отношения (СИО). В русск. языке – 30-40: предикативные, комплетивные (между предик. и дополнением) – 5 шт., обстоятельств., определит., колич., вспомогат. и др. 2. Лексические ф-ции – инф. о лексич. сочетаемости отд. словоф. Напр. синонимия: syn(красивый) = (симпатичный); конверсия: conv(пугать 1,2) = (бояться 2,1); дериваты: der(вышивать) = (вышивка). 3. МУ – особ. зона словарной статьи, в ко-рую помещена синт. и сем. инф-ция о конкр. лексеме. Число и содерж. мест МУ завис. от: 1) числа и хар-ра акт. ситуации, обознач. данным словом (семантич валентность слова); 2) числа и хар-ра дополнений, завис. от данного слова и реально наблюд. в тексте (синтаксич валентность слова). МУ = сем. вал. + синт. вал.. МУ: индивид., групп., ядерная. Актанты ситуации – опред. лекс.-граф. анализом ситуации. Примеры глубинных падежей (семантич вал.): колотить – 4-х валентный предикат. A, B, C, D – актанты. "И. колотит П. кулаком по спине".

А(агент)

В(адресат/тема)

С(инструмент)

D(пораж. часть объекта)

синт.

комп.

1. Кто колотит? Sим

1. Sвин (кого колотят?). 2. по + Sдат. 3. в + Sвин

Sтв

По, Sдат

сем. комп

1. одуш

1. одуш. предм или физ. об. 2. Неоднор. предм. (часть или большой предмет) 3. преграда.

Физич объект

Часть тела объкта В.

54

Знания о языке (основные понятия)

Подходы к хранению словоформ: 1. Декларативный (хранятся все словоформы). 2. Процедурный (хранятся осн., нужно выделение осн. и мощные алгоритмы словообраз.).

Зн. о языке (лингвистич. зн.): 1. Лексические (слова, способы их измен. и образования); 2. Синтаксич. (правила постр. грамматич. правильных текстов). 3. Семантич. (соотн. слов и яз. констр. с объектами и понятиями ПрО).

Наиболее важные виды синт. и сем. знаний: 1. Синт. отношения (СИО). В русск. языке – 30-40: предикативные, комплетивные (между предик. и дополнением) – 5 шт., обстоятельств., определит., колич., вспомогат. и др. 2. Лексические ф-ции – инф. о лексич. сочетаемости отд. словоф. Напр. синонимия: syn(красивый) = (симпатичный); конверсия: conv(пугать 1,2) = (бояться 2,1); дериваты: der(вышивать) = (вышивка). 3. МУ – особ. зона словарной статьи, в ко-рую помещена синт. и сем. инф-ция о конкр. лексеме. Число и содерж. мест МУ завис. от: 1) числа и хар-ра акт. ситуации, обознач. данным словом (семантич валентность слова); 2) числа и хар-ра дополнений, завис. от данного слова и реально наблюд. в тексте (синтаксич валентность слова). МУ = сем. вал. + синт. вал.. МУ: индивид., групп., ядерная. Актанты ситуации – опред. лекс.-граф. анализом ситуации. Примеры глубинных падежей (семантич вал.): колотить – 4-х валентный предикат. A, B, C, D – актанты. "И. колотит П. кулаком по спине".

А(агент)

В(адресат/тема)

С(инструмент)

D(пораж. часть объекта)

синт.

комп.

1. Кто колотит? Sим

1. Sвин (кого колотят?). 2. по + Sдат. 3. в + Sвин

Sтв

По, Sдат

сем. комп

1. одуш

1. одуш. предм или физ. об. 2. Неоднор. предм. (часть или большой предмет) 3. преграда.

Физич объект

Часть тела объкта В.

66

Типовая структура ЕЯ-процессора

Текст1) морфологич. ан.  2) СИА  3) СЕА  4) сем. интерпр.  5) прагм. интерпр.

6) база лингв. зн.(словарь), 7) база пробл. (понятийных) зн. Рис.: 1, 2, 3 <->6; 3, 4, 5 <-> 7.

Анализ: *: *jj (знакденотат). Сем. интерпрет.: **: j**j (денотатконцепт). Прагм. интерпр.: **: **ji, где i – реакция (определяется целями ИДС).

Лингвистический процессор переводит ЕЯ-высказывания, вводимые пользователем, на язык внутреннего представления.

На примере системы АИСТ:

1. [Структурный анализ [Определение типа действия] [Выделение компонентов]].

2. [Формирование выражения на языке внутреннего представления].

3. [Обработка компонентов [Определение вида обработки] [Автоматическое индексирование: контролируемое (КЛ-режим), неконтролируемое (НЛ), смешанное (СМ)] [Редактирование] [Нормализация]]. Схема: 12; 1<-> 3.

Если инициатор – пользователь, то на входе – построенный по определенным правилам запрос на поиск, обработку и выдачу информации. Если система, на входе – анкета, поля которой заполнены текстом на ЕЯ.

64

Соседние файлы в папке Интеллектуальные диалоговые системы