- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
2.3.8. Высказывания
Рассмотрим классификацию высказываний P2.D3, то есть различные способы формального выражения информации фактов. Факты содержат информацию приведенного вида, а высказывания – не приведенного, содержащие эмоции, иносказания, иронию, метафоры, юмор, обратный порядок слов, метонимию и многие другие отклонения от информации приведенного вида. Выражение фактов характеризуется тем, что семы, составляющие эти факты, комбинируются в новые понятия. Например, предыдущий факт можно было бы выразить иначе : «Было бы неплохо угостить вас чаем». Факты языка – это информация, представленная в приведенном виде, а высказывания представляют собой различные формальные способы представления того или иного факта. Множество всех возможных выражений того или иного факта есть множество, анализ которого предстоит дать в последующих работах. Важным моментом в выражении фактов является контекстуальная избыточность, то-есть повторение одних и тех же компонентов для большей ясности и убедительности. «У меня есть чай. Вы не хотите чашечку. Я могу вас угостить. Я бы хотел, чтобы вы его попробовали».
Классификация фактов выражается в форме высказываний. Множество высказываний образует классификации с расположением предложений по тематическому принципу. Тема является множеством высказываний, связанных одним или несколькими тематическими центрами. Высказывания образуют друг с другом различные отношения и структуры: доказательства, примеры, аналогии, ассоциации, последовательности изложения и т. д. Все высказывания какого-либо текста представляют собой иерархию.
2.4. Понятийное пространство в целом
Понятийное пространство характеризуется тем, что только часть его ячеек соответствует реальным единицам языка, со своей грамматикой, фонетикой и написанием. Заданное полностью понятийное пространство дает нам базу, на которой располагается все знаковые системы.
Понятийное пространство можно использовать как базу для преобразования одних единиц в другие. При разработке систем естественно-языкового интерфейса можно нагрузить универсальную для разных языков понятийную ячейку грамматическим, фонетическим и прочим наполнением. Семантика вообще и понятийное пространство в частности является областью пересечения систем различных языков. Единицей самого высокого уровня естественного языка семантического аспекта является классификация фактов, то есть совокупность всех известных классов фактов во множестве всех возможных классов фактов. Таким образом, система языка представляет собой иерархию языковых семантических единиц (геносем, сем, понятий, и фактов). Понятия выражаются словами языка, а факты выражаются в форме высказываний. Понятийное пространство есть множество всех возможных единиц языка, часть которых имеет свое знаковое отображение в реальных языках. То есть множество знаков языка имеет свое отображение на упорядоченное множество понятий языка.
Выводы к главе 2
Любому понятию естественного языка может быть дано смысловое определение на основе общего для единиц одного уровня вектора признаков. Множество объектов, отношений и их отрицаний составляют формальную систему смыслового определения любого слова. При этом для всех слов языка можно получить единую формулу объектов и отношений, общую для всех слов языка, где каждое слово отличается от всех остальных уникальным набором отрицаний (или утверждений) объектов или отношений. Последовательность отрицаний задает вектор семантических признаков, полностью описывающий основное семантическое значение любого слова. Вектор семантических признаков однозначно задает классификацию любых языковых единиц, которая может быть представлена либо в виде многомерного куба, либо в форме симметричного дерева классификации. Изменение последовательности элементов вектора дает различные древообразные классификации, представленные в виде различных словарей: словаре гиперонимов (общих и частных значений слов), словаре ассоциаций, комбинаторном словаре и т. д.
Для каждого уровня языка (сем, слов, фактов) характерна своя семантическая классификация, свой семантический вектор и своя семантическая формула. Вместе они образуют последовательности классификаций, векторов и формул разного уровня.
Представление классификаций в форме упорядоченного множества открывает большие перспективы в создании простых и дружелюбных интерфейсов для задач построения фраз на незнакомом языке, поиска информации в базах данных и осуществления машинного перевода на основе сведения высказываний к приведенному виду и использования подстановочных таблиц как критерия осмысленности фраз.