Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Общие вопросы комп. лингвистика.doc
Скачиваний:
1
Добавлен:
26.08.2019
Размер:
87.04 Кб
Скачать

4. Возможно ли построение программ, понимающих естественный язык? Есть ли принципиальные трудности, делающие построение таких программ невозможным?

Из-за огромных объемов знаний, требуемых для понимания естественного языка, большая часть работы ведется в хорошо понимаемых, специализированных проблемных областях. Одной из первых программ, использовавших такую методику «микромира», была программа Винограда SHRDLU – система понимания естественного языка, которая могла «беседовать» о простом взаимном расположении блоков разных форм и цветов. Программа SHRDLU могла отвечать на вопросы типа: «Какого цвета блок на синем кубике?», а также планировать действия вроде «передвинь красную пирамидку на зеленый брусок». Задачи этого рода, включая управление размещением блоков и их описание, на удивление часто всплывали в исследованиях искусственного интеллекта и получили название проблем «мира блоков».

Несмотря на успехи программы SHRDLU в разговорах о расположении блоков, она была не способна абстрагироваться от мира блоков. Методики представления, использованные в программе, были слишком просты, чтобы передать семантическую организацию более богатых и сложных предметных областей. Основная часть текущих работ в области понимания естественных языков направлена на поиск формализмов представления, которые должны быть достаточно общими, чтобы применяться в широком круге приложении и уметь адаптироваться к специфичной структуре заданной области. Множество разнообразных методик (большинство из которых являются развитием или модификацией семитических сетей) исследуются c этой целью и используются при разработке программ, способных понимать естественный язык в ограниченных, но достаточно интересных предметных областях. Но полное понимание языка на вычислительной основе все же остается далеко за пределами современных возможностей.

***

В самых первых программах диалога на естественном языке (таких, как программа Грина BASEBALL, Линдсея - SAD-SAM, Боброу - STUDENT и Фейценбаума - ELIZA) факты, относящиеся к определенной узкой области, хранились в спе­циально приспособленных для этого структурах данных. При вводе простейших повествовательных и вопросительных предложений программа начинала искать в них заранее определенные ключевые слова и шаблонные конструкции. Эти программы были столь ограниченны по своим возможностям, что игнорировали многие сложные аспекты реального языка.

Другой подход к диалогу на естественном языке, также применявшийся на первых порах, состоял в том, что представ­ление некоторого определенного текста целиком помещалось в базу данных с использованием хитроумных схем индексации, позволявших извлекать фрагменты текста, содержащие выделенные слова или фразы. Подобных систем, основанных на хранении текстов, тоже были ограничены, поскольку ответы, которые они давали на вопросы пользователям, могли содержать лишь то, что было предварительно и явным образом записано в базу данных. В поисках средств формального выражения и использования смысла предложений были разработаны системы, основанные на узких логических исчислениях, подобные системам SIR и TLS. Для записи информации в базу данных в этих системах употреблялась особая формальная нотация, а также имелись механизмы семантического анализа и перевода исходных выражений во внутреннее представление. Разработчики стремились к тому, чтобы эти системы обладали способностью делать логические выводы по информации, хранящейся в базе данных, и давать ответы (не записанные в нее явным образом) на соответствующие вопросы. Недостатком этих систем являлось то, что их способность к дедукции была ограничена сведениями, которые явно или неявно представлены в базе данных.

В настоящее время разработка программ, понимающих естественный язык, тесно связана с представлением знаний в экспертных системах. Эти программы используют проблемно-ориентированную информацию из базы знаний, чтобы пони­мать смысл предложений и взаимодействовать с пользователем на ограниченном диалекте естественного языка. Напри­мер, способностью вести диалог с пользователем на естественном языке обладают системы EMYCIN, TEIRESIAS и KAS

***

Так как цели автоматизации накопления знаний и понимания естественного языка весьма неоднозначны, дать точное определение тому, что лежит в основе семантической сетевой модели данных, весьма трудно. Попытки создать модель, которая превосходила бы все другие в плане возможностей представления знаний, привели к появлению целого ряда таких моделей. [4]

Следующим очевидным недостатком техники, используемой для понимания естественного языка, является пословный анализ значения фразы. По мере роста базы знаний увеличивается количество атрибутов, обозначаемых с помощью одинаковых терминов, что в свою очередь увеличивает количество неправильных вариантов разбора. Кроме того, целесообразно генерировать до конца не все возможные варианты разбора, а только те, которые подтверждаются существующими моделями. [5]

Поскольку на тот момент не было создано достаточно полной модели всей системы понимания естественного языка, то и ответа на этот каверзный вопрос не могло быть, если только не делать полного перебора всех возможных корректных американских фраз, что, очевидно, невозможно. Виноград сказал мне в частном разговоре, что такие неудобные фразы действительно существуют, но как-то охарактеризовать их он пока не в состоянии. На наш взгляд, именно это обстоятельство объясняет то, что бесчисленные последующие попытки создания систем управления командами, отдаваемыми на естественном языке, с тех пор так и не прекратились, сопровождаясь каждый раз все более яркими машинными демонстрациями, следуя моде, установленной еще в 60 - х годах. [6]

***

Сложность понимания естественных языков при решении задач искусственного интеллекта объясняется многими причинами. В частности, для использования языка необходимы большой объем знаний, способностей и опыта. Успешное понимание языка требует осмысления естественного мира, знания человеческой психологии и социальных аспектов. Для этого нужна реализация логических рассуждений и интерпретация метафор. Из-за сложности и многогранности человеческого языка на первое место выходит проблема исследования представления знаний. Попытки таких исследований увенчались успехом лишь частично. На основе знаний были успешно разработаны программы, понимающие естественный язык в отдельных предметных областях. Возможность создания систем, решающих проблему понимания естественного языка, до сих пор является предметом споров.