6. Обзор ея-систем
В интеллектуальных вопрос-ответных системах основное внимание уделено приближению языка общения к литературному естественному языку. Данный класс систем развился с ориентацией не столько на использование в реальных задачах, сколько на развитие методов и моделей, позволяющих осуществлять перевод естественно-языковых высказываний, относящихся к узким и заранее фиксированным проблемным областям, в формальное представление, а также обратный перевод. Представителями данного класса являются системы ПОЭТ, ДИСПУТ, LUNAR, LIFER и др. (рис. 4).
Рис. 4 Схема вопрос-ответной системы ПОЭТ
ЕЯ-системы общения с базами данных возник в появлением баз данных с целью обеспечения доступа к информации широкого класса неподготовленных пользователей. К системам этого класса относят PARNAX, TEAM, IRUS, АИСТ и др. (рис. 5).
Рис. 5. Структурная схема системы с базой данных
Диалоговые системы решения задачи в отличие от систем общения с базами данных берут на себя не только функции доступа к базе данных, но и функции интеллектуального монитора, обеспечивающего решение заранее определенных классов задач. Основным направлением практического применения систем данного класса является реализация естественно-языкового общения с экспертными системами. В рамках данного подхода были созданы системы: XCALIBUR, ADVISOR, UC и др. (рис. 6).
Рис. 6. Структурная схема системы решения задач ADVISOR
Класс систем обработки текстов включает в себя множество различных направлений.
Это, прежде всего, системы обработки связных текстов, которые моделируют процесс понимания законченных описаний каких-то фрагментов действительности, выраженных в виде текста на естественном языке, т. е. последовательности связанных друг с другом предложений. Обычно такие системы используют для поиска текста с нужной пользователю информацией, его реферирования, поиска дополнительной информации, связанной с ним, и т. д. К этим системам относят ТАСС, KERNEL, RESEARCHER, TAILOR, FAUSTUS и др. (рис. 7).
Рис. 7. Схема взаимодействия систем обработки связных текстов RESEARCHER и TAILOR
Большой интерес представляют системы, работающие с множеством текстов:
TEXTANALYST;
МИНЕРВА;
ВААЛ 2000;
RELATUS и др.
TEXTANALYST позволяет работать с отдельными текстами и (корпусом текстов, автоматизирует процесс решения следующих задач:
структурный анализ содержания текста;
построение тематической структуры текста; реферирование;
формирование гипертекста; смысловой поиск.
В данной системе работа с текстом осуществляется на уровне слов, а для построения семантической сети используют методы контент-анализа. В связи с этим задачи реферирования и смыслового поиска решаются недостаточно эффективно. Реферирование является простой выборкой предложений с наибольшими весами, а поиск ограничен множеством терминов данного текста. Тем не менее в ряде случаев данная система справляется с решением указанных задач, особенно при анализе больших текстов.
МИНЕРВА предназначена для формирования семантического описания текста документа и помещения его в базу данных. Результатом работы системы является описание смысла текста на объектно-ориентированном языке МИНЕРВА, составляющее базу знаний юридической экспертной системы. В настоящее время проект находится в стадии разработки.
ВААЛ 2000 — психолингвистическая система, позволяющая прогнозировать эффект неосознаваемого эмоционального воздействия текстов на массовую аудиторию, анализировать тексты с точки зрения такого воздействия, составлять тексты с заданным вектором воздействия, выявлять личностно-психологические качества авторов текста. ВААЛ работает на уровне слов методами контент-анализа и использует оригинальную экспертную систему оценки психологического воздействия.
RELATUS была создана с целью анализа текстов, отражающих политические события. Система приобретает знания посредством отображения точных и явных текстов в динамическое представление знаний в виде структурированных ссылок. Работа с RELATUS рассчитана на специалистов, рядовой пользователь должен пройти серьезное обучение.
Таким образом, наиболее известные в настоящее время разработки в области анализа текста осуществляют семантический анализ на уровне предложения или слова.
Важным классом ЕЯ-систем являются системы проверки орфографии. К наиболее развитой системе этого типа относят систему построения гипертекстовых документов на русском языке КОМП-ТЕК. Система отличается от аналогов построением индексов не по словоформам, а по словам, что позволяет однозначно идентифицировать слова во всех формах в тексте. Система ориентирована на поиск статей по ключевым выражениям, заданным в запросе, и сейчас идет дальнейшее развитие системы, ориентированное на обработку текстов на русском языке.
Другим направлением обработки текстов на естественных языках являются системы автоматического перевода. В них также использованы индексация словаря по словам и принципы синтаксического анализа и дополнительную информацию о характерных оборотах. Обычно текст предварительно переводится на внутренний язык системы и затем, уже с этого промежуточного языка, строится текст на целевом языке. Такая конструкция позволяет использовать модульное построение системы и расширять область ее действия простым формированием дополнительных словарей. К таким системам относят STYLUS, СОКРАТ, TRANSLATION OFFICE и т. д. Более простые версии представляют собой обычные интерактивные словари, например «Контекст».
Для всех описанных выше систем характерны следующие недостатки: узкая область применения и высокие ресурсные требования. Ни одна из них не может предложить полноценный интерфейс на естественном языке, который позволял бы эффективно управлять компьютером.
