Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОФЛингв_Лекция 5_Естественно-языковые системы.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
34.98 Mб
Скачать

6. Обзор ея-систем

В интеллектуальных вопрос-ответных системах основное внимание уделено приближению языка общения к литературному естественному языку. Данный класс систем развился с ориентацией не столько на использование в реальных задачах, сколько на развитие методов и моделей, позволяющих осуществлять перевод естественно-языковых высказываний, относящихся к узким и заранее фиксированным проблемным областям, в формальное представление, а также обратный перевод. Представителями данного класса являются системы ПОЭТ, ДИСПУТ, LUNAR, LIFER и др. (рис. 4).

Рис. 4 Схема вопрос-ответной системы ПОЭТ

ЕЯ-системы общения с базами данных возник в появлением баз данных с целью обеспечения доступа к информации широкого класса неподготовленных пользователей. К системам этого класса относят PARNAX, TEAM, IRUS, АИСТ и др. (рис. 5).

Рис. 5. Структурная схема системы с базой данных

Диалоговые системы решения задачи в отличие от систем общения с базами данных берут на себя не только функции доступа к базе данных, но и функции интеллектуального монитора, обеспечивающего решение заранее определенных классов задач. Основным направлением практического применения систем данного класса является реализация естественно-языкового общения с экспертными системами. В рамках данного подхода были созданы системы: XCALIBUR, ADVISOR, UC и др. (рис. 6).

Рис. 6. Структурная схема системы решения задач ADVISOR

Класс систем обработки текстов включает в себя множество различных направлений.

Это, прежде всего, системы обработки связных текстов, которые моделируют процесс понимания законченных описаний каких-то фрагментов действительности, выраженных в виде текста на естественном языке, т. е. последовательности связанных друг с другом предложений. Обычно такие системы используют для поиска текста с нужной пользователю информацией, его реферирования, поиска дополнительной информации, связанной с ним, и т. д. К этим системам относят ТАСС, KERNEL, RESEARCHER, TAILOR, FAUSTUS и др. (рис. 7).

Рис. 7. Схема взаимодействия систем обработки связных текстов RESEARCHER и TAILOR

Большой интерес представляют системы, работающие с множеством текстов:

TEXTANALYST;

МИНЕРВА;

ВААЛ 2000;

RELATUS и др.

TEXTANALYST позволяет работать с отдельными текстами и (корпусом текстов, автоматизирует процесс решения следующих задач:

структурный анализ содержания текста;

построение тематической структуры текста; реферирование;

формирование гипертекста; смысловой поиск.

В данной системе работа с текстом осуществляется на уровне слов, а для построения семантической сети используют методы контент-анализа. В связи с этим задачи реферирования и смыслового поиска решаются недостаточно эффективно. Реферирование является простой выборкой предложений с наибольшими весами, а поиск ограничен множеством терминов данного текста. Тем не менее в ряде случаев данная система справляется с решением указанных задач, особенно при анализе больших текстов.

МИНЕРВА предназначена для формирования семантического описания текста документа и помещения его в базу данных. Результатом работы системы является описание смысла текста на объектно-ориентированном языке МИНЕРВА, составляющее базу знаний юридической экспертной системы. В настоящее время проект находится в стадии разработки.

ВААЛ 2000 — психолингвистическая система, позволяющая прогнозировать эффект неосознаваемого эмоционального воздействия текстов на массовую аудиторию, анализировать тексты с точки зрения такого воздействия, составлять тексты с заданным вектором воздействия, выявлять личностно-психологические качества авторов текста. ВААЛ работает на уровне слов методами контент-анализа и использует оригинальную экспертную систему оценки психологического воздействия.

RELATUS была создана с целью анализа текстов, отражающих политические события. Система приобретает знания посредством отображения точных и явных текстов в динамическое представление знаний в виде структурированных ссылок. Работа с RELATUS рассчитана на специалистов, рядовой пользователь должен пройти серьезное обучение.

Таким образом, наиболее известные в настоящее время разработки в области анализа текста осуществляют семантический анализ на уровне предложения или слова.

Важным классом ЕЯ-систем являются системы проверки орфографии. К наиболее развитой системе этого типа относят систему построения гипертекстовых документов на русском языке КОМП-ТЕК. Система отличается от аналогов построением индексов не по словоформам, а по словам, что позволяет однозначно идентифицировать слова во всех формах в тексте. Система ориентирована на поиск статей по ключевым выражениям, заданным в запросе, и сейчас идет дальнейшее развитие системы, ориентированное на обработку текстов на русском языке.

Другим направлением обработки текстов на естественных языках являются системы автоматического перевода. В них также использованы индексация словаря по словам и принципы синтаксического анализа и дополнительную информацию о характерных оборотах. Обычно текст предварительно переводится на внутренний язык системы и затем, уже с этого промежуточного языка, строится текст на целевом языке. Такая конструкция позволяет использовать модульное построение системы и расширять область ее действия простым формированием дополнительных словарей. К таким системам относят STYLUS, СОКРАТ, TRANSLATION OFFICE и т. д. Более простые версии представляют собой обычные интерактивные словари, например «Контекст».

Для всех описанных выше систем характерны следующие недостатки: узкая область применения и высокие ресурсные требования. Ни одна из них не может предложить полноценный интерфейс на естественном языке, который позволял бы эффективно управлять компьютером.