Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
204
Добавлен:
02.06.2015
Размер:
4.77 Mб
Скачать

Глава 4

МЕТОДЫ ПРИОБРЕТЕНИЯ ЗНАНИЙ

Самое непостижимое в мире то,что он постижим.

Альберт Эйнштейн

Проблема приобретения знаний включает две основные зада­чи: получение информации и ее систематизацию. Процесс полу­чения знаний от экспертов является ключевым при разработке интеллектуальных информационных систем, которые постоянно нуждаются в новых знаниях, поэтому на стадии разработки необ­ходимо рассматривать проблемы их перманентного обучения. С развитием средств информатизации появились новые задачи, связанные с управлением знаниями в ИИС.

4.1. Стратегии получения знаний

Извлечением знаний называют процесс получения знаний от экспертов. Извлечение знаний — сложная и трудоемкая процеду­ра, в результате которой инженеру по знаниям (когнитологу, ана­литику) необходимо создать собственную модель предметной об­ласти на основе информации, полученной от экспертов. Попыт­ки получить знания, необходимые для разработки ИИС, непо­средственно от экспертов и обойтись без когнитологов обычно не приводят к успеху, так как в этом случае предъявляются очень вы­сокие требования к эксперту, который, являясь специалистом в предметной области, будет вынужден приобрести квалификацию инженера по знаниям. Кроме того, существует еще несколько причин, вызывающих необходимость участия аналитиков в про­цессах извлечения знаний, а именно:

  • лучшим способом для вербализации знаний эксперта явля­ ется диалог;

  • опытный аналитик, вооруженный современной методоло­ гией системного анализа, может помочь эксперту в структуриза­ ции знаний предметной области;

158

• инженер по знаниям помогает эксперту осознать «скрытые» знания, предлагая ему установить причинно-следственные связи (а также связи другой природы) на множестве выделенных понятий.

Успех на этапе извлечения знаний во многом зависит от ква­лификации аналитика, который должен иметь образование, включающее знания из разных областей, в том числе из когни­тивной психологии, системного анализа, математической логи­ки, искусственного интеллекта и т.д.

Как правило, каждый когнитолог сам изобретает язык для описания полученных от эксперта знаний путем пополнения сложившегося языка конкретной науки специальными термина­ми и знаками. Стандарта таких языков пока не существует. Тем не менее желательно, чтобы такие языки были понятными и содер­жали как можно меньше неточностей. Разработка языков инже­нерии знаний ведется в различных направлениях, в частности известны языки-классификации, логико-конструктивные язы­ки, структурно-логические и др. Перспективный подход к созда­нию подобных языков открывает семиотика — наука о знаковых системах. Классическая семиотика является чисто гуманитарной наукой, основные интересы которой сосредоточены в области культуры человеческого поведения, искусства и языка. Область исследований прикладной семиотики связана с применением зна­ковых систем для представления и обработки знаний в практиче­ских приложениях ИИ [36].

4.1.1. Аспекты извлечения знаний

Процессы извлечения знаний рассматривают в трех основных аспектах: психологическом, лингвистическом и гносеологичес­ком (рис. 4.1).

Психологический аспект. Это самый важный из всех аспектов, так как извлечение знаний происходит в процессе общения когни­тологов с экспертами, где психология играет доминирующую роль.

Процесс извлечения знаний для интеллектуальных систем необходимо организовать не как однонаправленный процесс пе­редачи сообщений от эксперта аналитику, а как совместный по­иск истины [11, 17].

В процессе разговорного общения много информации теря­ется [28], поэтому важной проблемой является увеличение ин-

159

Рис. 4.1. Аспекты извлечения знаний

формативное™ общения аналитика и эксперта за счет использо­вания методик, выработанных в психологии (рис. 4.2).

Модель общения включает участников общения, средства об­щения и предмет общения (знания). В соответствии с этими ком­понентами выделяются три слоя психологических проблем: кон­тактный, процедурный, когнитивный.



Степень информативности общения аналитика и эксперта на уровне контактного слоя зависит в основном от пола, возраста, темперамента личности и мотивации участников общения. Уста­новлено, что хорошие результаты дают гетерогенные пары (муж­чина/женщина) и соотношение возрастов:

Рис. 4.2. Потери информации при разговорном общении

Желательно, чтобы участники процесса общения обладали такими качествами, как доброжелательность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, собранность, настойчивость, общительность и находчивость [11].

В рамках контактного слоя наиболее предпочтительными из четырех классических типов темперамента являются сангвиники и холерики.

Параметры процедурного слоя обеспечивают эффективность извлечения знаний. К этим параметрам относятся: ситуация общения (место, время, продолжительность); оборудование (вспомогательные средства, освещенность, мебель); профессио­нальные приемы (темп, стиль, методы и др.). Для повышения эф­фективности процесса извлечения знаний инженер по знаниям должен подобрать значимые для эксперта стимулы, поскольку последний передает аналитику один из самых ценных ресурсов — знания.

Когнитивный слой связан с изучением семантического прост­ранства памяти эксперта и с воссозданием его понятийной струк­туры и модели рассуждений. Когнитивный слой характеризуется когнитивным стилем и семантической репрезентативностью.

Под когнитивным стилем человека понимается специфичес­кая совокупность критериев, используемых им в процессе позна­ния мира для решения различных задач. Когнитивный стиль —

160

161

это система средств и индивидуальных приемов, к которым при­бегает человек для организации своей деятельности, обеспечива­ющей достижение желаемых результатов. Для повышения эф­фективности извлечения знаний целесообразно подбирать экс­пертов и аналитиков, обладающих вполне определенными харак­теристиками когнитивного стиля. Наиболее важными из них яв­ляются следующие: поленезависимость (независимость от шумо­вого поля), импульсивность — рефлексивность, жесткость — гиб­кость, когнитивная эквивалентность.

Желательно, чтобы и аналитики, и эксперты обладали следу­ющими когнитивными характеристиками:

  • высокой поленезависимостью, которая подразумевает спо­ собность выделять главные аспекты рассматриваемой проблемы и отбрасывать все лишнее, что не относится к поставленной зада­ че. Это качество желательно иметь и аналитику, и эксперту, одна­ ко следует учитывать тот факт, что полезависимые люди более контактны и склонны к общению;

  • рефлексивностью, характеризующей склонность к рассуди­ тельности и самоанализу (в то время как импульсивность харак­ теризуется быстрым, зачастую недостаточно обоснованным при­ нятием решений);

  • когнитивной эквивалентностью, определяющей способность человека к различению понятий и разбиению их на классы и под­ классы;

  • эксперты — устойчивостью представлений, т. е. жесткостью сфуктуры восприятия, а аналитики — гибкостью, т. е. умением легко приспосабливаться к новой обстановке.

Для эффективного построения ИИС инженер по знаниям должен владеть специальными неформальными методами и ма­тематическим аппаратом, позволяющими ему воссоздавать полу­ченные от эксперта знания с помощью различных моделей, на­пример, таких, как продукционная или фреймовая. Не навязывая эксперту какой-либо модели, аналитик должен подобрать сред­ства представления знаний, имеющие максимально высокую се­мантическую репрезентативность.

Лингвистический аспект. Актуальность исследования этого ас­пекта определяется тем, что язык является основным средством общения в процессе извлечения знаний. В области лингвистиче­ских проблем наиболее важными являются понятия: общий код, понятийная структура, словарь пользователя.

Общим кодом называют специальный промежуточный язык общения между экспертом и инженером по знаниям. Этот язык включает совокупность общенаучных и специальных понятий из профессиональной литературы, элементов базового языка, неоло­гизмов и т.п. (рис. 4.3). Общий код позволяет преодолеть языко­вой барьер в процессе общения когнитологов с экспертами. Выра­ботка общего кода для партнеров осуществляется в соответствии с информационными потоками, представленными на рис. 4.3.

Рис 4.3. Структура формирования общего кода

В дальнейшем общий код преобразуется в понятийную струк­туру, или семантическую сеть, которая связывает понятия, хра­нящиеся в памяти человека. Выявление отношений между эле­ментами знаний, представленных понятиями, является одной из самых сложных проблем в процессах извлечения знаний. Хоро­шо известно, что естественные знания человека представляют со­бой связанные структуры, а не разрозненные фрагменты. Однако до настоящего времени при разработке БЗ учитывается весьма ограниченный набор связей между понятиями, в то время как в действительности существует большое разнообразие таких отно­шений. Д. А. Поспелов [35] выделяет более 200 базовых видов отношений между понятиями. Такое многообразие делает невоз­можным однозначное определение набора признаков, описыва­ющих конкретное понятие, и, как следствие, однозначную клас­сификацию понятий. Очевидно, сложность данной проблемы яв-

162

163

ляется главной причиной того, что на сегодняшний день отсутст­вуют надежные методики формирования понятийных структур.

Тем не менее построение той или иной иерархии понятий входит в задачи концептуального анализа структуры знаний лю­бой предметной области. В последнее время в ИИ стал широко употребляться термин онтология, имеющий многозначную ин­терпретацию [63], в частности в [11] приводятся следующие его определения.

  1. Онтология как философская дисциплина представляет со­ бой систему категорий, являющихся следствием определенного взгляда на мир.

  2. Онтология как неформальная система концептуализации знаний предполагает построение описания множества выделен­ ных объектов, понятий, связей и отношений в заданной области знаний. При этом могут использоваться формальные или нефор­ мальные средства. В простейшем случае онтология может описы­ вать только иерархию понятий, связанных отношениями «эле­ мент-класс». Помимо этого она может содержать набор аксиом и правил вывода, позволяющих выразить другие отношения между понятиями и ограничить область интерпретации понятий.

  3. Онтология как представление концептуальной системы в виде логической теории означает использование определенного синтаксиса для представления знаний.

Разработка словаря пользователя необходима в связи с тем, что конечный пользователь не обязан владеть профессиональ­ным языком предметной области, который использовался при построении БЗ. Интерфейс пользователя создается, как правило, путем доработки словаря общего кода.

Гносеологический аспект. Он объединяет методологические проблемы получения нового научного знания, так как процесс познания часто сопровождается появлением новых понятий и те­орий. В процессе разработки БЗ эксперты довольно часто впер­вые формулируют некоторые закономерности на основе накоп­ленного эмпирического опыта. Последовательность факт—> обоб-щенный факт—>эмпирический закон—>теоретический закон назы­вается гносеологической цепочкой. Теория — это не только сис­тема обобщения накопленных знаний, но и способ получения нового знания.

Основными критериями качества новых знаний являются внутренняя согласованность, системность, объективность, исто­ризм.

164

В процессе извлечения знаний аналитиков прежде всего ин­тересуют эмпирические знания экспертов, представляющие со­бой результаты наблюдений, которые могут оказаться несогласо­ванными. Внутренняя согласованность эмпирических знаний ха­рактеризуется понятиями модальности, противоречивости, не­полноты. Под модальностью знания понимается возможность его существования в различных категориях. Противоречивость является естественным свойством эмпирических знаний и не всегда может и должна быть устранена. Напротив, противоречи­вость может служить отправной точкой в рассуждениях экспер­тов. Неполнота знаний связана с невозможностью исчерпываю­щего описания любой предметной области.

Системность знаний основана на определении места новых знаний в многоуровневой иерархической организации. При этом необходимо найти ответы на вопросы: какие понятия детализи­руют или обобщают новые знания и в каких отношениях они со­стоят с известными фактами и закономерностями?

Объективность знаний определить практически невозможно. Процессы накопления, описания, представления, обработки, интерпретации и оценивания качества знаний выполняются кон­кретными людьми, поэтому их результаты имеют субъективный характер. Объективность некоторых закономерностей часто свя­зывают с широтой области их применимости. Границы этой об­ласти можно установить экспериментальным или теоретическим путем, но далеко не всегда. В качестве косвенных свидетельств объективности иногда допускают совпадение представлений раз­личных экспертов и подтверждение выдвинутых гипотез извест­ными фактами.

Историзм знаний связан с развитием и изменением представ­лений о предметной области с течением времени.

Процесс познания можно представить следующими этапами:

  • описание и обобщение фактов;

  • выявление связей между фактами, формулирование правил и закономерностей;

  • построение модели знаний предметной области;

  • объяснение и прогнозирование явлений на основе модели.

На начальных этапах инженер по знаниям, исследуя структу­ру умозаключений эксперта, может использовать разные теории и подходы для построения формальной модели знаний предмет­ной области. Наиболее известными и часто применяемыми при-

165

емами являются математическая логика, теория ассоциаций и ге­штальт-психология.

Математическая логика формирует критерии, которые гаран­тируют точность, значимость и непротиворечивость общих поня­тий, рассуждений и выводов. Применяя логический подход, ког-нитолог выполняет следующие операции: определение понятий, выявление сходства и различия, анализ, абстрагирование, обоб­щение, классификацию, образование суждений, составление силлогизмов и т.д. Проблема применения логического подхода к представлению знаний заключается в том, что человек не всегда мыслит категориями строгой классической логики, а естествен­ная система знаний не является полной, допускает противоречия и многозначные оценки истинности.

В теории ассоциаций мышление представляется в виде цепоч­ки идей, связанных общими понятиями. Здесь применяются сле­дующие приемы:

  • ассоциации, приобретенные на основе связей различной природы;

  • привлечение прошлого опыта;

  • метод проб и ошибок со случайным успехом;

  • привычные («автоматические») реакции и пр.

Гештальт-психология [8] ориентирует аналитика на выделе­ние целостного образа или структуры знаний {гештальта) как основы для понимания процессов и явлений окружающего мира. Понятие гештальта во многом согласуется с понятием фрейма. Применение данной теории ориентирует эксперта на формиро­вание модели знаний в соответствии с критериями простоты, связности и гармонии.

Идеализированная модель знаний предметной области стро­ится на основе установленных логических связей между поняти­ями. Модель формализуется с помощью категориального аппа­рата, формально-знаковых средств математики и логики. Для адекватного отображения в модели реальной картины мира ин­женеру по знаниям необходимо владеть такими приемами, как идеализация, абстрагирование, огрубление. Критерием качества построенной модели является способность ИИС делать прогно­зы и объяснять множество явлений из заданной предметной об­ласти. Инженер по знаниям должен стремиться, чтобы результи­рующая модель знаний была достаточно полной, связной и не­противоречивой.

166

Соседние файлы в папке Андрейчиковы