
Интеллектуальные диалоговые системы / 41-66 изнанка
.doc
Лингвистическая модель входного подъязыка: компонент V (с примером) Lm=<V (лексический компонент, определяющий лексику (словарь) подъязыка, обслуживающего конкр. ПрО), G (синтаксический компонент, определяющий способ порожд. прав. констр. языка), S (семантич. компонент, опред. способ записи логико-смысловой структуры вх. подъязыка, т.е. значений вх. текстов подъязыка), [P] (прагматич. комп. – опцион.)> Программное ср-во реализации (поддержки) Lm – лингвистический процессор (ЕЯ-процессор), фактически это компонент понимания в арх. любой ИДС. Пример компонента V. Сколько каменного угля перевезено железнодорожным транспортом в 2000 году? <описание словаря>::=<имя словаря>{<тело словаря>} <имя словаря>::=Словарь вопр. слов | С. предикатов | С. предлогов | С. характеристик | С. понятий | С. чисел <тело словаря>::=<номер п/п><словоформа><сл.статья> <сл. статья>::=<сл.ст. вопр. сл.>|<сл. ст. предиката>|… <сл. статья понятий>::=<род>|<число> {<падеж>} <род>::=М <число>::=Е <падеж>::=Р|Т в|Предл <сл. статья предиката>::=<номер> <квазиоснова> <квазифлексия> <кодиф. части речи> <номер словоизменения> <модель управления> <модель управления>::=({<актант>}) <актант>::=(<тип акт.> <синт. падежи> <сем. пад.> <синтаксич. падежи>::=({[<предлог>] <синтаксич. падеж>}) <тип актанта>::=A | O | I | W <синт. пад.>::= ИП | РП | ДП | ВП | ТП | ПП <кодиф. части речи>::= СУ | КП | ГЛ | ДЕ 44
|
Интерпретация семантическая и прагматическая. Семиотика вкл. неск. разделов: синтактика: структурные аспекты сочетаний знаков данной сист., правила их образования и преобразования (безотносительно к их ф-циям и значениям); семантика: знаковые системы как ср-ва выражения смысла, т.е. занимается установлением завис. между структ. знакосочетаний и их выразительными возможностями, изуч. интерпретации знаков и знакосочетаний, образующих осмысл. тексты; прагматика: отнош. воспринимающего знаковую сист. к самой знаковой сист. Семантическая интерпретация. Происходит сопоставление семантич. графа с самой семантич. сетью, в рез-тате происходит вычленение контекста (нек-рого подграфа), в к-ром работает запрос и получение содерж. инф-ции из конкретной сети. Происходит обращение к БД за числовой инф-цией и опред. способ обработки этой инф-ции (суммирование, оптимизация и т.д.). Сопоставление семантич. графа с семантич. сетью производится постепенным свертывание графа, начиная с вершины, наиболее удал. от вопросит. вершины и заканчивая вопросит. вершиной. Для этого предназн. спец. эвристики и программы сужения и отображения. Прагматическая интерпретация. Рассматривается только в случае, если понимание текста идет по трем уровням отображения, т.е. системе требуется еще и реакция системы. Произв. какие-то действия направленные на получение реакции. В обычных экспертных системах мы работаем с анализом и семантической интерпретацией. Прагматическая интерпретация используется при рассмотрении простых задач, где можно быстро получить решение (напр., язык общения агентов в многоагентных системах, где за счет выходной реакции реализуется партнерство). 42 |
||||||||||||||||||||||||||||||
Основные формы и языки взаимодействия СОЗ (ЭС), деловая проза. Формы и языки взаимодействия: 1) ЕЯ; 2) ФЯ/искусств. яз.; 3) многооконная графика; 4) гипертекстовые ср-ва; 5) сист. меню. Язык – наход. в распоряжении того/иного коллектива система элементов-единиц разных ярусов: слов, значимых частей слов и т.д. (инвентарь) + сист. правил функционирования этих единиц, т.е. генерации и понимания осмысленных высказываний (грамматика). ЕЯ – такой язык, использование к-рого в рамках конкр. комп. приложений не заставляет пользователя предварительно обращаться к инструкциям и запоминать правила построения высказываний. Ограниченный ЕЯ: требует от польз. соблюдения явно выраженных ограничений. Подъязык – язык нек-рой гр. людей, общающихся в конкр. ПрО с конкр. целями. Деловая проза – языковой носитель отношений человека в сфере производства, особая лингвистическая и социальная категория, сохр. многие св-ва яз. в целом и в то же время самой своей сутью подготовленная для автоматизации. Экономичные и строгие средства выражения: отсутствие ораторских, эмоциональных и других приемов. Свойства деловой прозы: 1) относительная полнота: подъязык, обслуживающий нек-рую ПрО, облад. дост. набором яз. средств для обозначения любого факта из этой ПрО; 2) замкнутость: при добавлении к обозримой выборке текстов подъязыка других текстов того же п. не происх. пополн. словаря и грамматики. 1 <-> 2 (наличие репрезент. выборки вх. текстов); 3) конечность: наличие конечного и огранич. словаря; 4) формальная ограниченность: ограничен набор грамматич. средств и конструкций из общеязыкового арсенала; 5) устойчивость: для понимания входных текстов несущественны поверхностно-синтаксич. различия текстов с тождественным смыслом. 48 |
Декларативные синтаксические знания: модель управления Способы задания декларативных синтаксич знаний: 1. Синтаксич. отнош. (предикативные отнош. – между сказ. и подлеж.; копплетивные отнош – их 6 шт., отнош. между сказ. и его дополнением; обстоятельственные отношения – между сказ. и обстоятельством; определительные – подлеж.-опред.; количественные; отрицательные; вспомогательные). 2. Синт комп. модели упр (МУ): МУ – особая зона словарной статьи, в ко-рую помещена синт. и сем. инф-ция о конкр. лексеме. Число и содержание мест МУ завис. от: 1) числа и хар-ра актантов ситуации, обознач. данным словом (семантич валентность слова); 2) числа и хар-ра дополнений, завис. от данного слова и реально наблюд. в тексте (синтаксич валентность слова). МУ = сем. валентность + синт. валентность. МУ: индивидуальная, групповая, ядерная. Актанты ситуации – опред. лексико-графич. анализом ситуации. Примеры глубинных падежей (семантич вал): колотить – 4-х валентный предикат. A, B, C, D – актанты. "Иван колотит Петра кулаком по спине".
3. Лексические ф-ции – инф. о лексич. сочетаемости отд. словоформ. Например синонимия: syn(красивый)=(симпатичный); конверсия: conv(пугать 1,2)=(бояться 2,1); дериваты:der(вышивать)=(вышивка). 46 |
||||||||||||||||||||||||||||||
Основные функции диалогового компонента, структура диалога Функции диалогового компонента: 1) ведение диалога; 2) формирование (если текущая ситуация не предусмотрена структурой диалога) и обработка перехватов инициативы (пользователем). Общение (коммуникативное взаимодействие, диалог) – процесс достижения его участниками определ. согласов. целей путем обмена связанными высказ., выраженными в языке, о ПрО. Диалог между польз. и ЭВМ: общение направл. на удовлетв. информ. потребностей пользователя. Высказывания участников общения образуют связный текст (дискурс). Структура диалога: 1.Глобальная структура.Действия ИДС задаются в виде посл-ти этапов, определяемых в зависимости от класса решаемых задач. Напр., в случае общения с ЭС: инструктаж; постановку задачи; решение зад., объяснения в ходе решения; объяснения после решения; определ. причин неудач и приобретение новых знаний. 2.Тематическая структура. Представляется в виде сценария, в рамках которого определяются: 1) структура задачи, т.е разбиение задачи на упорядоченное множество подзадач; 2) распределение подзадач по участникам общения; 3) языковые средства, используемые при обращениях к пользователю. 3. Локальная структура. Шаг диалога состоит из действия (высказывание акт. участника) и реакции (пассивного). Перехват инициативы возникает когда пассивный участник вместо преследования цели, предложенной активным уч., предлагает преследовать иные цели. Схемы диалога: 1. Д. ведет пользователь. Иниц. (кр. сообщ. об ошиб.) у польз., а с-ма реагирует на его требования. Ф-ции ДК практич. вырождены. 2. Ведет с-ма. Инициатива принадлежит с-ме. Она ведет диалог в соответствии с имеющимися у нее представлениями о структуре диалога (т.е. о разбиении задач на подзадачи и о том, кто из участников, когда и какую из них решает). 52 |
Семантический анализ текста (общий алгоритм) Задача СЕА: преобразование синт. структуры предложения, полученной на этапе СИА, в форматы некоторого семантического языка, т.е. осуществление перехода от поверхностного «оформления» факта ПрО к его логико-смысловому значению. На вход СЕА предложение поступает в виде списка пар слов исх.предложения, соединенных синт. отношениями.Результатом СЕА является семантический граф.Этап СЕА состоит из 2 фаз: 1.СЕА слов с МУ: для них всегда можно указать ссылку на эл-ты семантич. сети, обработка зависит от МУ. Слова с МУ делятся на группы: 1) предикаты действия (отраж ситуацию в реальном мире); 2) функциональные предик. (операторы над пред.); 3) пустые пред. (глаголы-связки («быть»), пустые глаголы («осуществить») и фазовые глаголы (начинать, заканчивать), модальные глаголы (мочь, должен, хотеть). 2.СЕА слов без МУ: семантика данных ИГ (слов без МУ) определяется в зависимости от контекста. ПОЭТ: в сем. сеть добавляются новые вершины, связываемые отношениями «быть элементом» и «быть значением». Обобщенный алгоритм СЕА: 1. Классиф. вх. слов. на группы с учетом способа предст. инф. (декларативный/процедурный), организации словарн. инф. (предик, понятия, хар-ки и т.д.) 2. Перенос предик, комплетивных и обстоят. отнош. на слово, явл. предикатом действия. 3. Выбор канонич. формы сл. с МУ. 4. Замена синт.отношений (СИО), вх. в МУ на сем. отнош. и проверка замены по сем. сети на правильность. 5. Обработка обстоят. СИО как вспомогат. информ. к предикату действия. Инф-ция оформляется в виде спец. таблиц (напр., табл. времен). 6. Заполение всех актантов МУ соотв. словами вх. предложения, т.е. понятиями. 7. При наличии в запросе парам., треб. обр. к БД, форм. запросы к БД. 8. После обработки слов с МУ синт. стр. вх. предлож. разбивается на ряд поддеревьев, сост. именную группу, и далее обработка ИГ как слов без МУ.
50 |
||||||||||||||||||||||||||||||
Знания о языке, основные понятия. Подходы к хранению словоформ: 1. Декларативный (хранятся все словоформы). 2. Процедурный (хранятся осн., нужно выделение осн. и мощные алгоритмы словообраз.). Зн. о языке (лингвистич. зн.): 1. Лексические (слова, способы их измен. и образования); 2. Синтаксич. (правила постр. грамматич. правильных текстов). 3. Семантич. (соотн. слов и яз. констр. с объектами и понятиями ПрО). Наиболее важные виды синт. и сем. знаний: 1. Синт. отношения (СИО). В русск. языке – 30-40: предикативные, комплетивные (между предик. и дополнением) – 5 шт., обстоятельств., определит., колич., вспомогат. и др. 2. Лексические ф-ции – инф. о лексич. сочетаемости отд. словоф. Напр. синонимия: syn(красивый) = (симпатичный); конверсия: conv(пугать 1,2) = (бояться 2,1); дериваты: der(вышивать) = (вышивка). 3. МУ – особ. зона словарной статьи, в ко-рую помещена синт. и сем. инф-ция о конкр. лексеме. Число и содерж. мест МУ завис. от: 1) числа и хар-ра акт. ситуации, обознач. данным словом (семантич валентность слова); 2) числа и хар-ра дополнений, завис. от данного слова и реально наблюд. в тексте (синтаксич валентность слова). МУ = сем. вал. + синт. вал.. МУ: индивид., групп., ядерная. Актанты ситуации – опред. лекс.-граф. анализом ситуации. Примеры глубинных падежей (семантич вал.): колотить – 4-х валентный предикат. A, B, C, D – актанты. "И. колотит П. кулаком по спине".
62 |
Подходы к хранению словоформ: 1. Декларативный (хранятся все словоформы). 2. Процедурный (хранятся осн., нужно выделение осн. и мощные алгоритмы словообраз.). Зн. о языке (лингвистич. зн.): 1. Лексические (слова, способы их измен. и образования); 2. Синтаксич. (правила постр. грамматич. правильных текстов). 3. Семантич. (соотн. слов и яз. констр. с объектами и понятиями ПрО). Наиболее важные виды синт. и сем. знаний: 1. Синт. отношения (СИО). В русск. языке – 30-40: предикативные, комплетивные (между предик. и дополнением) – 5 шт., обстоятельств., определит., колич., вспомогат. и др. 2. Лексические ф-ции – инф. о лексич. сочетаемости отд. словоф. Напр. синонимия: syn(красивый) = (симпатичный); конверсия: conv(пугать 1,2) = (бояться 2,1); дериваты: der(вышивать) = (вышивка). 3. МУ – особ. зона словарной статьи, в ко-рую помещена синт. и сем. инф-ция о конкр. лексеме. Число и содерж. мест МУ завис. от: 1) числа и хар-ра акт. ситуации, обознач. данным словом (семантич валентность слова); 2) числа и хар-ра дополнений, завис. от данного слова и реально наблюд. в тексте (синтаксич валентность слова). МУ = сем. вал. + синт. вал.. МУ: индивид., групп., ядерная. Актанты ситуации – опред. лекс.-граф. анализом ситуации. Примеры глубинных падежей (семантич вал.): колотить – 4-х валентный предикат. A, B, C, D – актанты. "И. колотит П. кулаком по спине".
54 |
||||||||||||||||||||||||||||||
Знания о языке (основные понятия) Подходы к хранению словоформ: 1. Декларативный (хранятся все словоформы). 2. Процедурный (хранятся осн., нужно выделение осн. и мощные алгоритмы словообраз.). Зн. о языке (лингвистич. зн.): 1. Лексические (слова, способы их измен. и образования); 2. Синтаксич. (правила постр. грамматич. правильных текстов). 3. Семантич. (соотн. слов и яз. констр. с объектами и понятиями ПрО). Наиболее важные виды синт. и сем. знаний: 1. Синт. отношения (СИО). В русск. языке – 30-40: предикативные, комплетивные (между предик. и дополнением) – 5 шт., обстоятельств., определит., колич., вспомогат. и др. 2. Лексические ф-ции – инф. о лексич. сочетаемости отд. словоф. Напр. синонимия: syn(красивый) = (симпатичный); конверсия: conv(пугать 1,2) = (бояться 2,1); дериваты: der(вышивать) = (вышивка). 3. МУ – особ. зона словарной статьи, в ко-рую помещена синт. и сем. инф-ция о конкр. лексеме. Число и содерж. мест МУ завис. от: 1) числа и хар-ра акт. ситуации, обознач. данным словом (семантич валентность слова); 2) числа и хар-ра дополнений, завис. от данного слова и реально наблюд. в тексте (синтаксич валентность слова). МУ = сем. вал. + синт. вал.. МУ: индивид., групп., ядерная. Актанты ситуации – опред. лекс.-граф. анализом ситуации. Примеры глубинных падежей (семантич вал.): колотить – 4-х валентный предикат. A, B, C, D – актанты. "И. колотит П. кулаком по спине".
66 |
Типовая структура ЕЯ-процессора Текст1) морфологич. ан. 2) СИА 3) СЕА 4) сем. интерпр. 5) прагм. интерпр. 6) база лингв. зн.(словарь), 7) база пробл. (понятийных) зн. Рис.: 1, 2, 3 <->6; 3, 4, 5 <-> 7. Анализ: *: *jj (знакденотат). Сем. интерпрет.: **: j**j (денотатконцепт). Прагм. интерпр.: **: **ji, где i – реакция (определяется целями ИДС). Лингвистический процессор переводит ЕЯ-высказывания, вводимые пользователем, на язык внутреннего представления. На примере системы АИСТ: 1. [Структурный анализ [Определение типа действия] [Выделение компонентов]]. 2. [Формирование выражения на языке внутреннего представления]. 3. [Обработка компонентов [Определение вида обработки] [Автоматическое индексирование: контролируемое (КЛ-режим), неконтролируемое (НЛ), смешанное (СМ)] [Редактирование] [Нормализация]]. Схема: 12; 1<-> 3. Если инициатор – пользователь, то на входе – построенный по определенным правилам запрос на поиск, обработку и выдачу информации. Если система, на входе – анкета, поля которой заполнены текстом на ЕЯ.
64 |