![](/user_photo/2706_HbeT2.jpg)
- •Морфологический анализ
- •Синтаксический анализ текста
- •Предикатная структура – локальное семантическое представление предложения текста
- •Семантическая сеть – глобальное представление текста
- •Прагматика текста
- •3.5.1. Цепочка предикатных структур предложений текста как сценарий, описанный в тексте
- •3.5.2. Шаблоны ситуаций
- •3.5.3. Понимание текста как его интерпретация в терминах цепочек предикатных структур
- •Построение дерева зависимостей
- •1. Правило модиф_прил
- •2. Правило нар_прил
- •3. Правила для наречий сравнительной степени сравн_степень
- •3.3.3. Выявление предикатной структуры предложения
Прагматика текста
Описанным в разделе 3.4 способом строятся семантические сети целых предметных областей. В этом случае сети формируются на основе корпусов текстов, описывающих предметные области.
Последующий прагматический анализ входного текста заключается в выделении цепочки наиболее весомых ключевых предикатных структур, характерных для предметной области, к которой относится текст. Объем этой цепочки зависит от порога, примененного к смысловому весу предикатных структур (выделение главных предикатных структур), а порядок этих предикатных структур – от порядка их следования в предложениях текста. Такая цепочка полностью характеризует смысловое содержание текста в терминах выбранной предметной области.
Отнесение текста к одной из предметных областей осуществляется сравнением ассоциативной сети текста и ассоциативных сетей предметных областей (классификация) [29]. Степень пересечения ассоциативных сетей текста и предметной области характеризует смысловое пересечение текста и предметной области.
Последовательность главных предикатных структур, выбранных из текста, с использованием порогового преобразования, описывает основное содержание текста.
Текст по своей структуре делится на две части: тему и рему. Тема обычно находится в первой части текста. Рема – во второй. Состав ключевых предикатных структур текста можно сравнить с составом ключевых предикатных структур предметной области. Ключевые предикатные структуры текста, совпадающие с ключевыми предикатными структурами предметной области, обычно входят в тематическую часть текста. Ключевые предикатные структуры текста, отличающиеся от ключевых предикатных структур предметной области, входят, возможно, в рематическую часть текста. Выделив из цепочки ключевых понятий рематической части текста ключевые понятия, не относящиеся к предметной области, можно сформулировать основное новое содержание текста.
3.5.1. Цепочка предикатных структур предложений текста как сценарий, описанный в тексте
Рассмотрим
формализм взаимодействия семантической
сети с последовательностью предикатных
структур текста. В тех же терминах, что
и описанная в разделе 2 семантическая
сеть
,
предикат
можно представить себе как звездочку.
Субъект соответствует главному понятию
звездочки
,
он связан с актантами предиката, которые
являются его (субъекта) ближайшими
ассоциантами –
.
В отличие от подобного представления
в разделе 2, звездочки являются не парами,
а тройками.
Определение 10. Под предикатом будем
понимать тройку
,
где
- субъект, а
– актанты предиката,
- предикатное отношение:
|
(3.1) |
Последовательность
субъект-объектных пар предикатов
,
соответствующих последовательности
их содержащих предложений текста в
порядке их появления в тексте,
спроецированная на семантическую сеть,
высекает на семантической сети непрерывный
или разрывный путь
,
где I
– множество текстов, описывающих
предметную область. Они формируют
ассоциативную сеть предметной области
,
где
- множество предметных областей, а
объединение ассоциативных сетей разных
предметных областей
формирует модель мира
в
текстовой модальности (см. Раздел 2).
Удалением слабых связей ассоциативную
сеть предметной области
можно разбить на
подсетей
,
где
соответствует множеству различных
понятий
– подтем предметной области, вокруг
которых группируются подсети предметной
области.