Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
book.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
8.77 Mб
Скачать

Гл а ва 1. ОСНОВЫ ИНЖЕНЕРИИ ЗНАНИЙ

Что такое знания? Не что иное, как записанный опыт.

Т. Карлейль

1.1. Данные и знания

Инженерия знаний — молодая ветвь теории искусственного интел­лекта, изучающая процессы и методы получения, представления и формализации знаний для разработки экспертных систем (ЭС). Что такое “знание”, как его формализовать и представить в ЭВМ? Эти вопросы с середины 70-х годов становятся центральными в проблеме искусственного интеллекта (ИИ). Если проследить за сменой парадигм в этой области [163]: нейронные сети (50-е го­ды), эвристический поиск (б0-е годы), представление знаний плюс логическое рассуждение (70—80-е годы), то увидим, что послед­няя прочно удерживается уже почти 15 лет, и именно благодаря ей ИИ из академической науки превратился в одно из наиболее перспективных направлений коммерческой информатики.

За эти годы специалистами предложены десятки различных толкований понятия “знание”. Попытаемся обобщить различные представления и дать рабочее определение именно в контексте разработки ЭС. Определение знаний вне контекста ИИ звучит следующим образом: “Проверенный практикой результат позна­ния действительности, верное её отражение в мышлении челове­ка”. Это определение, однако, не проясняет особенностей знаний, отличающих компьютерные системы, основанные на знаниях, от традиционных прикладных программ.

Один из видных специалистов ИИ Ньюэлл [199] считает, что сейчас мы ступили на принципиально новый уровень общения с ЭВМ — уровень знаний. Исторически сложилась следующая пос­ледовательность уровней общения с ЭВМ. В 50-е годы для того чтобы решить задачу на ЭВМ, необходимо было написать про­грамму в цифровых машинных кодах, т. е. максимально прибли­зиться к машинному представлению о данных и операциях над ними. Затем, в 60-е годы, появились языки программирования или алгоритмические языки, которые позволяли вводить информацию о задаче и способе ее решения на некотором более “читаемом”, т.е. символьном, языке. И наконец, в конце 70-х годов, благода­ря успехам ИИ и программирования, появилась возможность вво­дить в машину непосредственно знания о предметной области и исходные условия задачи, а машина стала способна сама нахо­дить необходимые решения. Знания вводятся в этом случае на естественном языке (точнее, на его ограниченном подмножестве).

--7 --

Рис. 1.1. Формы знаний при разработке ЭС

Сложность понятия “знание” заключена в множественности и многообразии его материального носителя. Можно выделить пять форм знаний:

Z1 знания в памяти человека;

Z2—материализованные знания (монографии, статьи учебни­ки, и т. п.);

Z3 поле знаний (полуформализованное описание Zi и Za);

Z4—знания на языках представления знаний (формализация Z3);

Z5 — база знаний в ЭВМ (на машинных носителях информации).

Предлагаемую концепцию иллюстрирует рис. 1.1. Человек час­то решает трудные интересные проблемы, используя не четкие алгоритмы, а исключительно свой опыт в форме натопленных зна­нии (Zi); часть своего опыта человечество материально запечетлевает в форме книг, статей, заметок, таблиц (Zz). Совокупность Zi и Za образует знания о предметной области, не связанные с машинной обработкой. Существуют разные определения Zi и Za. Можно называть Zg канонизированными знаниями [30] поскольку это признанная специалистами часть Zi, можно — концептуаль­ными (как в [68]).

В целом в ЭС используется “экстракт” того, что удалось из­влечь из Zi и Za, Zi и Zz. При этом соотношение извлеченного эмпирического опыта Zi и его формализованной теоретической основы из книг Z'z .в разных областях различно.

-- 8 --

Принято считать, что чем больше вес Zi в 'процессе принятия решения, тем 'более •пригодна для внедрения ЭС предметная область. Для разработки Э'С принципиально важным оказывается разработка поля знаний 2з, когда создается 'некоторое полуформализованное описание ос­новных понятий предметной области и связей между ними. Это описание может иметь форму рисунка, таблицы, схемы, сети, диа­граммы и т. д. (см. гл. 5). В дальнейшем ноле знаний переписы­вается на некотором языке представления знаний — так полу­чают модель знаний Zi,.

Современные теории ИИ предоставляют разработчикам мно­го возможностей для описания базы знаний на стадии Zi. мате­матическая логика 1-го порядка [83, 116, 153]; продукционные языки типа OPS5 [71, 202]; семантические сети и волновые язы­ки [139, 152]; фреймы и языки типа FRL [8, 169]; объектно-ориен­тированные язьжи, 'например SMALLTALK [148] 'и др.

После того как разработчики ЭС создали модель 2.^ на некото­ром ЯПЗ, можно переходить к реализации базы знаний (БЗ) с помощью соответствующих программных средств. Так возникает форма Z5 — БЗ.

Следует сразу ограничить сферу предметных областей, где имеет смысл .выделять знания. Это области с преобладанием эм­пирического знания, где накопление фактов опережает развитие теории (медицина, геология, юриспруденция, финансы и т. д.). Такие хорошо 'структурированные области, как 'математика, фи­зика, теоретическая ^механика, имеют 'в осно.ве 'богатый матема­тический аппарат для описания своих закономерностей, .который позволяет проводить машинное 'моделирование с использованием традиционного алгоритмического программирования (без выделе­ния уровня знаний). Знания важны там, где определения 'размы­ты, понятия 'меняются, ситуации зависят от множества контекс­тов, где велика неопределенность, нечеткость информации.

В качестве рабочего примем 'следующее определение. Знания — это основные закономерности предметной области, позволяющие человеку решать конкретные производственные, научные и другие задачи, т. с. факты, понятия, взаимосвязи, оценки, правила, эврис­тики (иначе фактические знания}, а также стратегии принятия решения в этой области ('иначе стратегические знания).

Чем же знания отличаются от данных? По аналогии можно выделить ряд форм данных:

Di — результат наблюдений над объектами (например, взгляд на термометр и фиксация температуры воздуха) или данные в памяти (например, дата рождения);

Да — фиксация данных на материальном носителе — таблицы, графики и т. д. (например, данные о температуре воздуха в днев­нике наблюдений);

dsмодель данных—некоторая схема описания, связываю­щая несколько объектов (например, “t° воздуха—дата измере­ния”);

-- 9 --

Dt данные на языке описания данных;

Ds—база. данных на машинных 'носителях информации. Традиционно выделяют только три уровня, например, [138J:

“внешний — логический — физический”: DiDs—D^. Аналогичная триада для знаний: Zi—ZsZs.

Таким образом, у знаний и данных 'много общего, однако зна­ния обычно имеют 'более сложную 'структуру. Их иногда назы­вают хорошо структурированными данными или 'метаданными или данными о данных,

Можно отметить еще один аспект, отражающий различие дан­ных и знаний '[113]. Любое понятие, используемое человеком” имеет как 'бы две 'стороны — экстенсиоиал и ннтенсионал. Экстен-сионал — набор конкретных фактов, 'соответствующих данному понятию. Интенсионал — определение или описание некоторого понятия через его свойства. Например, для понятия “поликлини­ка” экстенсионал есть набор типа: “детская поликлиника, взрос­лая поликлиника, служебная поликлиника, поликлиника № 85 и т. я.”, а инсенсионал .'выглядит, например, так: “медицинское уч­реждение для оказания амбулаторной помощи по 'месту житель­ства или работы”.

Интенсионал отделяет знания от данных, которые всегда за­даются экстенсионально. Сила интенсионала в его точности, выра­зительности и правильно выделенных свойствах. Широко известно высказывание Платома, определившего человека как “животное на двух ногах, лишенное 'перьев”. И -его конфуз, когда в ответ Диоген 'принес ему ощипанного 'петуха...

В [113] выделены еще пять свойств, отличающих знания:

1) внутренняя интерпретируемость, 2) рекурсивная структурируе-мость, 3) взаимосвязь единиц, 4) наличие семантического прост­ранства с метрикой, 5) активность. Эти свойства касаются уров­ня 7.\ •И связаны со 'сложной природой знания, 'изучение которой происходит на стыке психологии, философии, лингвистики, кибер­нетики и физиологии ('см. гл. 3).

Для того чтобы знакомство читателя с терминологией инже­нерии з'нан”й было более 'полным, необходимо упомянуть о спо­собах классификации знаний (табл. 1.1).

Таблица 1.1

Знания

Модель представлений знаний

Классификация по “глу­бине”

Классфикзция по “жест­кости”

Глубинные

поверхностные

мягкие жесткие

Логика

Продукции Фреймы Семантические сети Объектно-ориентированнпые

+ +

+

+

;

+ +

+ + +

Языки

+

+

• +

-- 10 --

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]