- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
1.6. Табличный естественно-языковой интерфейс
В работе предлагается концепция «табличного» естественно-языкового интерфейса. Табличным интерфейсом будем называть естественно-языковой интерфейс, в котором должны содержаться по возможности любые осмысленные понятия, фразы, тексты языка, и при этом близкие по смыслу понятия фразы и тексты располагаются в этом интерфейсе рядом. Конкретной реализацией такого интерфейса является интерфейс следующего вида. Слова и понятия упорядочиваются в некой классификации, фрагменты этой классификации составляют столбцы подстановочных таблиц.
Подстановочная таблица – это таблица, при помощи которой можно генерировать предложения естественного языка, выбирая из каждой колонки этой таблицы по одному слову.
Сложные подстановочные таблицы представляют собой иерархию простых подстановочных таблиц с возможностью выбора одной подстановочной таблица из списка. При этом, образуется более длинная и сложная конструкция, чем может дать простая подстановочная таблица.
Smart таблицы - это подстановочные таблицы, в которые можно включать опции, запрещающие выбор тех или иных фраз из подстановочных таблиц. Это делается для того, чтобы отсечь не приемлемые по смыслу фразы естественного языка. При этом пользователь должен иметь возможность выбрать режим, разрешающий. или запрещающий те или иные несоответствия в речи.
По сравнению с грамматиками Хомского, табличный интерфейс содержит упорядоченное множество правил языка, что помогает с максимальной ясностью визуализировать структуру языка для пользователя и максимально ее упростить для алгоритмов порождения речи. Далее приведен пример сложной подстановочной таблицы.
Таблица 1.4
Последовательности подстановочных таблиц для генерации предложений и связных текстов
Я
|
Знать, что
|
|
Индустрия |
Развивается |
|
В Англии |
Он |
Помнить, что |
Сел. хозяйство |
Процветает |
В России |
||
Мы |
Видеть, что |
Экономика |
В упадке |
Во Франции |
В книге |
Написано, что |
|
Проходят |
Выборы |
|
В реги- онах |
Рос-сии |
В журнале |
Напеча-тано, что |
Заканчива-ются |
Страда |
В обла- стях |
Ка-нады |
||
В докуме-нте |
Сказано, что |
Начались |
Реформы |
В репу-бликах |
СССР |
В таблице 1.4 показан принцип моделирования осмысленных текстов, который позволяет визуализировать структуру естественного языка в рамках естественно-языковых интерфейсов.
Эти таблицы могут, например, генерировать фразу «Я вижу, что сельское хозяйство в России развивается. В журнале написано, что в регионах России заканчивается страда» Приведем еще один пример последовательности подстановочных таблиц.
Таблица 1.5
Генерация фраз при помощи подстановочных таблиц
Нет ли у вас |
Банку |
Молока |
Вы не угостите |
Бутылку |
Кефира |
Не дадите ли |
Стакан |
Сока |
Я |
Хотеть |
Пить |
Мы |
Желать |
Утолить жажду |
Мой сын |
Нужно |
|
Мы будем |
Очень признательны |
Мы были бы |
Весьма благодарны |
Мы заренее |
Обязаны |
В таблице 1.5 приводится пример таблицы, задающей последовательность осмысленных предложений вида «Я хочу пить, нет ли у вас банки сока, мы были бы очень обязаны». Подобные таблицы могут использоваться для построения «табличного» естественно-языкового интерфейса.
При выборе из каждой колонки сложной подстановочной таблицы простой подстановочной таблицы, а из каждой колонки последней по одному слову получается осмысленная фраза и текст языка.