Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КЛ_СИИ-Часть1.doc
Скачиваний:
4
Добавлен:
01.04.2025
Размер:
2.52 Mб
Скачать

3. Данные и знания. Классификация знаний

Инженерия знаний - молодая ветвь теории искусственного интеллекта, изучающая процессы и методы получения, представления и формализации знаний для разработки экспертных систем (ЭС). Что такое «знание», как его формализовать и представлять в ЭВМ? Эти вопросы с середины 70-х годов становятся центральными в проблеме искусственного интеллекта (ИИ). Если проследить за сменой парадигм в этой области на : нейронные сети (50-е годы), эвристический поиск (60-е годы), представление знаний плюс логическое рассуждение (70-80-е годы), то увидим, что последняя прочно удерживается уже почти 15 лет, и именно благодаря ей ИИ из академической науки превратился в одно из наиболее перспективных направлений коммерческой информатики.

За эти годы специалистами предложены десятки различных толкований понятия «знание». Попытаемся обобщить различные представления и дать рабочее определение именно в контексте разработки ЭС. Определение знаний вне контекста ИИ звучит следующим образом: «Проверенный практикой результат познания действительности, верное ее отражение в мышлении человека». Это определение, однако, не проясняет особенностей знаний, отличающих компьютерные системы, основанные на знаниях, от традиционных прикладных программ.

Сложность понятия «знание» заключена в множественности и многообразии его материального носителя. Можно выделить пять форм знаний:

Z1 - знания о памяти человека;

Z2 - материализованные знания (монографии, статьи, учебники, и т. п.);

Z3 - поле знаний (полуформализованное описание Z1 и Z2);

Z4 - знания на языках представления знаний (формализация Z3);

Z5 - база знаний в ЭВМ (на машинных носителях информации).

Следует сразу ограничить сферу предметных областей, где имеет смысл выделять знания. Это области с преобладанием эмпирического знания, где накопление фактов опережает развитие теории (медицина, геология, юриспруденция, финансы и т. д.). Такие хорошо структурированные области, как математика, физика, теоретическая механика, имеют в основе богатый математический аппарат для описания своих закономерностей, который позволяет проводить машинное моделирование с использованием традиционного алгоритмического программирования (без выделения уровня знаний). Знания важны там, где определения размыты, понятия меняются, ситуации зависят от множества контекстов, где велика неопределенность, нечеткость информации.

В большом словаре знания определяются как «результат, полученный познанием», или, более подробно, «система суждений с принципиальной и единой организацией, основанная на объективной закономерности». Исследователи, придающие особую важность научным подходам, предпочитают первое определение, а исследователи, для которых главное-это обязательная гарантия последовательности суждений (люди с логическим мышлением), предпочитают второе.

В то же время с точки зрения ИИ и инженерии знаний определение знаний необходимо увязать с логическим выводом. Другими словами, можно дать еще одно определение: «знания - это формализованная информация, на которую ссылаются или используют в процессе логического вывода». В данном случае знания -это информация, на которую ссылаются, когда делают различные заключения на основании имеющихся данных с помощью логических выводов. Если эта работа выполняется программным путем, то знания -это обязательно информация, представленная в определенной форме.

Если рассматривать знания с точки зрения решения задач в некоторой предметной области, то их удобно разделить на две большие категории-факты и эвристику. Первая категория указывает обычно на хорошо известные в данной предметной области обстоятельства, поэтому знания этой категории иногда называют текстовыми, имея в виду достаточную их освещенность в специальной литературе или учебниках. Вторая категория знаний основывается на собственном опыте специалиста в данной предметной области - эксперта, накопленном в результате многолетней практики. В так называемых экспертных системах именно эта категория знаний играет решающую роль в повышении эффективности систем. Иными словами, в эту категорию входят такие знания, как «способы сосредоточения», «способы удаления бесполезных идей», «способы использования нечеткой информации» и т. п., позволяющие с большей эффективностью решать задачи. Тем не менее из-за недостаточной научной обоснованности и отсутствия исчерпывающих сведений пользоваться такими знаниями нужно осмотрительно.

Знания, кроме того, можно разделить на факты (фактические знания) и правила (знания для принятия решения). Под фактами подразумеваются знания типа «А это А», они характерны для баз данных и сетевых моделей. Под правилами подразумеваются знания вида «ЕСЛИ - ТО». Кроме них существуют так называемые метазнания (знания о знаниях). Понятие «метазнания» указывает на знания, касающиеся способов использования знаний, и знания, касающиеся свойств знаний. Это понятие необходимо для управления базой знаний, логическим выводом, отождествления, обучения и т. п.

В качестве рабочего примем следующее определение. Знания - это основные закономерности предметной области, позволяющие человеку решать конкретные производственные, научные и другие задачи, т. е. факты, понятия, взаимосвязи, оценки, правила, эвристики (иначе фактические знания), а также стратегии принятия решения в этой области (иначе стратегические знания).

Чем же знания отличаются от данных? По аналогии можно выделить ряд форм данных:

D1 - результат наблюдений над объектами (например, взгляд на термометр и фиксация температуры воздуха) или данные в памяти (например, дата рождения);

D2 - фиксация данных на материальном носителе - таблицы, графики и т. д. (например, данные о температуре воздуха в дневнике наблюдений);

Dз - модель данных - некоторая схема описания, связывающая несколько объектов (например, t° воздуха -дата измерения);

D4 - данные на языке описания данных;

D5 - база данных на машинных носителях информации. Традиционно выделяют только три уровня, например,: «внешний - .логический - физический»: D1,-D3-D5. Аналогичная триада для знаний: Z1-Z3-Z5.

Таким образом, у знании и данных много общего, однако знания обычно имеют более сложную структуру. Их иногда называют хорошо структурированными данными или метаданными или данными о данных,

Можно отметить еще один аспект, отражающий различие данных и знаний. Любое понятие, используемое человеком», имеет как бы две стороны - экстенсионал и интенсионал. Экстенсионал - набор конкретных фактов, соответствующих данному понятию. Интенсионал - определение или «описание некоторого понятия через его свойства. Например, для понятия «поликлиника» - экстенсионал есть набор типа: «детская поликлиника, взрослая поликлиника, служебная поликлиника, поликлиника № 85 и т. д.», а интенсионал выглядит, например, так: «медицинское учреждение для оказания амбулаторной помощи по месту жительства или работы».

Интенсионал отделяет знания от данных, которые всегда задаются экстенсионально. Сила интенсионала в его точности, выразительности и правильно выделенных свойствах. Широко известно высказывание Платона, определившего человека как «животное на двух ногах, лишенное перьев». И его конфуз, когда в ответ Диоген принес ему ощипанного петуха... В [11З] выделены еще пять свойств, отличающих знания:

  1. внутренняя интерпретируемость, 2) рекурсивная структуризуемость, 3) взаимосвязь единиц, 4) наличие семантического пространства с метрикой, 5) активность. Эти свойства касаются уровня Z1 и связаны со сложной природой знания, изучение которой происходит на стыке психологии, философии, лингвистики, кибернетики и физиологии .

Для того чтобы знакомство читателя с терминологией инженерии знаний было более полным, необходимо упомянуть .о способах классификации знаний (табл. 3.1).

Таблица 3.1

Логика

-

+

-

+

Продукции

-

+

+

+

Фреймы

+

-

+

+

Семантические сети

+

-

+

+

Объектно- ориентированные языки

+

-

+

+

Классификация по глубине. К глубинным знаниям относят абстракции, образы, аналогии, в которых отражается понимание структуры предметной области, а также назначение и взаимосвязь отдельных понятий (в фундаментальных науках к глубинным знаниям относят законы и теоретические основания). Поверхностные знания обычно касаются лишь совокупности эмпирических ассоциаций и причинно-следственных отношений между понятиями предметной области. Например, мы пользуемся телефоном, используя поверхностные знания о том, что, сняв трубку и правильно набрав номер, мы можем соединиться с нужным абонентом. Подавляющее большинство владельцев телефонов не имеет и не нуждается в глубинных представлениях о структуре телефонной связи, схеме телефонного аппарата, которыми, безусловно, пользуются специалисты телефонной станции.

В большинстве ЭС сейчас используются поверхностные знания, которые часто позволяют получать вполне качественные результаты. Однако введение глубинных представлений позволит создать базы знаний большей мощности, так как глубинные знания более гибки и адаптивны, чем достаточно жесткие поверхностные. Классическим примером может служить медицина, где глубинные знания опытных врачей позволяют им порождать разнообразные способы лечения одной и той же болезни в зависимости от состояния больного, его возраста или от наличия лекарств в аптечной сети. Молодой или неквалифицированный врач часто действует по поверхностной модели: «Если кашель - то пить таблетки от кашля, если ангина - то эритромицин» и т. л.

Глубинные знания образуются как результат обобщения первичных понятий предметной области в некоторые более абстрактные структуры. Часто эти структуры не имеют вербального описания. Так, в медицине введено понятие синдрома (от греч. syndrome - скопление) - сочетания симптомов, которым пользуются ля обобщенного и углубленного описания болезни.

Степень глубины и уровень обобщенности знаний прямо связаны с опытом экспертов и могут служить показателем профессионального мастерства последних. Кроме того, глубина знания связана с типом мышления. Часто в психологии выделяют два типа мышления : эмпирическое, теоретическое (со склонностью к анализу, рефлексии и [внутреннему планированию действий). При эмпирическом мышлении поиск решения задачи ведется только на основе учета имеющихся связей в ситуации задачи, при теоретическом мышлении, поиск осуществляется путем конструирования новых связей между элементами задачи. Таким образом, эмпирическое мышление отражает объект со стороны его внешних проявлений и связей (т. е. на уровне поверхностных знаний), а теоретическое включает способность к обобщению и отражает внутренние связи объектов и законы их развития (т. с. глубинное знание).

Классификация по жесткости . Жесткие знания позволяют получать однозначные четкие рекомендации при заданных начальных условиях, в то время как мягкие знания допускают множественные, расплывчатые решения и различные варианты рекомендаций. Согласно этой классификации можно и сами предметные области относить к жестким или мягким.

Интересная графическая интерпретация этих классификаций, предложена в для знаний в области САПР. Если развить данный подход для других предметных областей, то можно предложить схему, отражающую тенденцию в инженерии знаний - от жестких и поверхностных знаний к мягким и более глубоким.