Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Хайретдинов_Лекции_СИТ-n.doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
13.84 Mб
Скачать

Поиск с обратной связью на естественном языке

Большинство подходов к поиску в Сети с использованием технологии NLP воплощены в виде систем, отвечающих на вопросы. Они используют лингвистическую обработку и дополнительные средства (такие как специальная разметка и устранение смысловой неоднозначности) для поиска документов, которые содержат абзацы с ответами на вопросы, сформулированные на естественном языке. Однако в них отсутствует диалог, а потому усилия сосредоточены на получении подходящих абзацев в пределах документа, а не на выявлении потребности пользователя. В некоторых случаях недостаточно совершенные лингвистические методы могут оказаться бесполезными, а поисковые запросы трудно сформулировать. Однако ориентация диалогов и запросов на определенные задачи и области применения поможет справиться с этими трудностями.

Наш подход к интеллектуальному поиску и фильтрации в Сети включает в себя технологию интеллектуальных агентов и методы NLP. Благодаря этому в адаптивном диалоге можно применять знание, как контекста, так и интересов, целей и поведения пользователя. Основу модели интерактивной системы поиска составляют зависящие от задачи средства построения беседы и анализа диалога. Вместо предоставления образцов или обследования Сети для выявления нужной информации поиск на основе диалога позволяет сосредоточиться на требованиях пользователя путем изучения его конкретных интересов. Благодаря этому поисковая система может получать неявные знания и задействовать их для уточнения и фильтрации результатов поиска в ходе диалога. Такая система должна быть способна быстро определять нужды пользователя на основе предоставленной им информации и обратной связи при взаимодействии на естественном языке.

На Рис.2 проиллюстрирован общий подход к поиску и фильтрации с использованием обратной связи на естественном языке.

Рис. 2 Поисковый агент с управлением на естественном языке. В процессе

диалога пользователь формулирует запросы, которые передаются для обработки

в процессор диалога. В ходе взаимодействия с пользователем процессор

диалога уточняет запросы и направляет их поисковому агенту

Действие начинается с запроса на естественном языке, который формулируется пользователем. Запросы проходят обработку, при которой осуществляются диалоговые взаимодействия в форме высказываний на естественном языке, направленные на доработку и уточнение поискового запроса. В ходе диалога система уточняет запрос, а затем направляет его поисковому агенту.

Для разработки и проверки моделей диалога была выбрана экспериментальная технология Wizard of Oz. Используя WoZ для сбора лингвистических данных, мы получили объемный свод диалогов. Мы записали его, проаннотировали и проанализировали, чтобы создать структурную модель, поддерживающую планирование и генерацию интерактивной объяснительной и описательной беседы. Система моделирует человеко-машинное взаимодействие на естественном языке, причем интерактивный процесс продолжается до тех пор, пока модель не достигнет ожидаемых результатов.

Группа из 22 испытуемых-неспециалистов использовала имитатор WoZ для поиска информации в Web-пространстве. Ее разделили на четыре подгруппы: три были укомплектованы случайным образом, а четвертая состояла из аспирантов. Чтобы определить, возникают ли различия при проведении бесед (объяснения, описания и т.д.) в зависимости от текущей коммуникативной ситуации, нескольких «продвинутых» студентов попросили выполнить разные задания в одном и том же сеансе. Взаимодействия пользователей с системой (точнее со скрытым экспертом, который играл ее роль) были записаны и послужили для лингвистического анализа. Процесс уточнения продолжался до полного удовлетворения потребностей пользователя (был установлен 20-минутный порог для проверки достижения пользователем коммуникативной цели). После поиска испытуемых просили описать, что именно они получили в результате поиска в Web. Это было сделано для создания компьютерной модели, которая применяет извлеченные из Сети документы для генерации описаний и объяснений на естественном языке.