Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IIS / Лекции / ИИС - Лекции.doc
Скачиваний:
250
Добавлен:
31.03.2015
Размер:
1.6 Mб
Скачать

Контрольные вопросы по теме

  1. Приведите определение знаний и расскажите об отличиях знаний от данных применительно к построению ИИС.

  2. Приведите известные Вам классификации знаний.

  3. Сформулируйте необходимость в разработке и использовании моделей представления знаний, назовите известные Вам модели представления знаний.

  4. Дайте описание логической модели представления знаний.

  5. Сформулируйте определения основных понятий языка предикатов.

  6. Расскажите о функционировании механизмов вывода в логической модели представления знаний.

  7. Опишите применение нечеткой логики для расширения логической модели представления знаний и сформулируйте преимущества ее применения для решения практических задач.

  8. Расскажите об особенностях выполнения арифметических операций в системах нечеткой логики.

  9. Дайте описание продукционной модели представления знаний.

  10. Расскажите о механизме функционирования систем продукций.

  11. Дайте описание семантической сети для представления

  12. Приведите примеры использования семантической сети для моделирования структуры понятий предметной области.

  13. Расскажите об основных понятиях фреймовой модели представления знаний.

  14. Опишите особенности функционирования фреймовой модели представления знаний.

  15. Сформулируйте необходимость использования различных моделей представления знаний и особенности разных моделей.

Тема 1.3. Инженерия знаний и получение знаний

1.3.1. Инженерия знаний

Понятие инженерии знаний

Как ранее было сказано, знания хранятся в ИИС в виде базы знаний, организованной в соответствии с одной из моделей представления знаний. Напомним, что выбор модели представления знаний оказывает существенное влияние на характеристики и свойства интеллектуальной системы в целом.

Но после проектирования базы знаний и разработки соответствующего программного обеспечения либо выбора удовлетворяющего требования готового решения необходимо сформировать базу знаний, наполнив ее знаниями о предметной области, и возможно необходимыми фактами. Этап формирования базы знаний интеллектуальной системы является критическим для функционирования всей системы в целом, так как если реализация влияет на возможные границы способностей системы, то знания системы определяют ее возможности в решении задач предметной области.

Этот этап разработки ИИС называют этапом приобретения знаний. Область деятельности, изучающая проблемы формирования и наполнения баз знаний, получила название инженерия знаний.

Инженерия знания - достаточно молодое направление искусственного интел­лекта, появившееся тогда, когда практические разработчики столкнулись с весь­ма нетривиальными проблемами трудности «добычи» и формализации знаний. В первых книгах по ИИ эти факты обычно только постулировались, в дальней­шем начались серьезные исследования по выявлению оптимальных стратегий выявления знаний [1,с.59]. Исследования привели к возникновению дисциплины инженерии знаний, и появлению новой специальности - инженера по знаниям, или специалиста, владеющего теоретическими знаниями и практическими приемами построения интеллектуальных систем, а главное, обученного способам формирования баз знаний интеллектуальных систем.

Проблемы формирования баз знаний

При построении ИИС и формировании баз знаний возникает целый спектр трудностей и проблем. Для понимания приведем описание основных из них [18,с.159].

Предметные знания интеллектуальной системы могут быть взяты из многих источников, таких как учебники, отчеты, базы дан­ных, истории болезни, опытные данные и личный опыт. Однако главный источник знаний современных ИИС - это специалист-эксперт в предметной области. Инженер знаний обычно получает зна­ния, непосредственно взаимодействуя с экспертом. Этот процесс состоит из продолжительной серии напряжен­ных, систематических интервью, обычно продолжающихся в те­чение многих месяцев. Во время бесед инженер знаний дает эксперту для решения задачи, близкие к реальным и того же типа, на решение которых ориентируется создаваемая эксперт­ная система. Инженер знаний должен работать с экспертом, наблюдая, как он решает конкретные задачи. Редко оказывается эффек­тивным подход, при котором эксперту напрямую задаются вопросы о его правилах или методах решения конкретного класса задач в его области компетентности. Эксперты обычно испытывают большие трудности при формулировании таких правил.

Представляется, что «эксперты» имеют тенденцию формулировать свои заключения и то, как они пришли к ним, в общих выражениях, которые слишком широки и расплывчаты для эффективного анализа на ЭВМ. Предпочтительнее, чтобы ЭВМ работала на более конкретном уровне, имея дело с четко определенными порциями исходной инфор­мации, которые могут быть встроены в более сложные суждения. Но эксперт редко работает на таком конкретном уровне. Он быстро делает сложные выводы, не утруждая себя тщательным анализом и формули­рованием каждого шага своего процесса рассуждения. Порции исходных знаний являются неявными допущениями, и они компонуются друг с другом так быстро, что эксперту трудно описать этот процесс. Когда он анализирует проблему, он не может легко описать каждый шаг и он может даже не иметь представления о тех отдельных шагах, которые были сделаны для нахождения решения. Он может приписать интуиции или назвать предчувствием то, что оказывается результатом очень слож­ного логического процесса, основанного на огромном количестве удер­живаемых в его памяти данных и богатой практике. В последующем, объясняя свое заключение или предчувствие, он будет повторять только основные шаги, часто опуская большинство мелких шагов, которые могли показаться ему очевидными в то время. Знание о том, что счи­тать основным и относящимся к делу и не требующим дальнейшей переоценки — вот что делает специалиста «экспертом». Этот аспект природы эксперта несколько необычен. На прак­тике он называется парадоксом экспертизы. В контек­сте разработки интеллектуальных систем мы будем называть его па­радоксом инженерии знаний:

Чем более компетентными становятся эксперты, тем менее способны они описать те знания, которые они используют для решения задач!

Хуже того, исследования показали, что когда эксперты пы­таются объяснить, как они пришли к заключению, они часто выстраивают правдоподобные линии рассуждения, которые, од­нако, мало похожи на их действительное поведение при реше­нии задач. Эта особенность имеет два важных следствия. Вот первое из них:

эксперты нуждаются в посторонней помощи, направленной на то, чтобы прояснить и сделать явным их способ мышления и решения задач. Высказанное можно сформулировать в виде следующего эмпирического правила - не будьте своим собственным экспертом!

Второе эв­ристическое правило, обращенное к инженеру знаний:

Не верьте всему, что говорят эксперты!

Опытные инженеры знаний развивают рабочие гипотезы, ос­нованные на том, что говорят эксперты, и проверяют эти гипо­тезы на правильность и непротиворечивость, предлагая экс­пертам решать новые проблемы, требующие предполагаемых (согласно гипотезе) знаний. Инженер знаний считает, что он или она получили законное экспертное правило не потому, что эксперт ручается за точность правила, а потому, что эксперт демонстрирует применение этого правила при решении задачи.

Иногда поведение экспертов выглядит скорее интуитивным, чем рассудочным. Дело в том, что значительный объем знаний является важнейшей пред­посылкой мастерства эксперта. Однако знания эксперта — не просто не­упорядоченный свод фактов. Большое число образцов-шаблонов ситуаций служат указателями, помогающими эксперту в долю секунды обратиться к нуж­ным частям его запасов знаний. Эта способность использовать шаблоны для управления процессом интерпретации и решения, возможно, и со­ставляет значительную часть того, что мы называем физической ин­туицией.

Более того, эксперт может применять совершенно разные методы работы и методики в разных нестандартных ситуациях, и сознательно выделить критерии использования различных методик необычайно трудно.

Терминология инженерии знаний

Поле знаний — это условное неформальное описание основных понятий и взаимосвя­зей между понятиями предметной области, выявленных из системы знаний эксперта, в виде графа, диаграммы, таблицы или текста [1,с.59].

Поле знаний, как первый шаг к формализации, представляет модель знаний о предметной области, в том виде, в каком ее сумел выразить эксперт на некотором «своем» языке. Проблемы адекватного формирования языка для описания предметной области мы в данном курсе рассматривать не будем. Хорошим источником специальной информации по этой теме служит [1].

Поле знаний служит ключевым средством для последующего построения модели предметной области в базе знаний.

Для названия процесса по­лучения знаний (вида выбираемой при этом стратегии) в литературе получило распространение несколько терминов: приобретение, добыча, извлечение, полу­чение, выявление, формирование знаний. В англоязычной специальной литера­туре в основном используются два: acquisition (приобретение) и elicitation (вы­явление, извлечение, установление).

Термин «приобретение» трактуется либо очень широко — тогда он включает весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура поля знаний заранее закладывает­ся в программу). В обоих случаях термин «приобретение» не касается самого та­инства экстрагирования структуры знаний из потока информации о предметной области. Этот процесс описывается понятием «извлечение».

Извлечение знаний (knowledge elicitation) — это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений спе­циалистов при принятии решения и структура их представлений о предметной области.

Приобретение знаний (knowledge acquisition) — процесс наполнения базы знаний экс­пертом с использованием специализированных программных средств (прямое взаимодействие ИИС с экспертом).

Термин формирование знаний традиционно закрепился за чрезвычайно перспек­тивной и активно развивающейся областью инженерии знаний, которая занима­ется разработкой моделей, методов и алгоритмов обучения. Она включает индук­тивные модели формирования знаний и автоматического порождения гипотез на основе обучающих выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить причинно-следственные эмпирические зависимости в базах данных с неполной информацией, содержащих структурированные числовые и символьные объекты (часто в условиях неполноты информации).

Формирование знаний (machine learning) — процесс анализа данных и выявление скрытых закономерностей с использованием специального математического аппарата и программных средств.

Помимо отмеченных существуют также и другие стратегии получения знаний, например, в случае обучения на примерах (case-based reasoning), ког­да источник знаний — это множество примеров предметной области. Обучение на основе примеров (прецедентов) включает настройку алгоритма распознавания на задачу по­средством предъявления примеров, классификация которых известна.

Отметим также важность направления формирования знаний, тяготеющего в большей степени к области machine learning, то есть индуктивному обучению, основываясь на хорошо исследованном аппарате распознавания образови обнаружения сходства объектов. К сожалению даже общее обсуждение этих тем значительно увеличит объем учебного курса и поэтому оставлено за его рамками.

Также рамок курса остались теоретические вопросы форми­рования знаний из данных (data mining, knowledge discovery). Хорошим источником информации по Data Mining служит [5].

Соседние файлы в папке Лекции