- •Часть 1
- •Оглавление
- •Часть 1
- •Лекция 1 введение
- •1. Цели и задачи дисциплины. Ее место в учебном процессе.
- •2. История развития систем ии
- •3. Философские аспекты систем ии
- •Лекция 2 искуственный интеллект как научное направление
- •1. Человеко-машинные системы с искусственным интеллектом
- •2. Проблема искусственного интеллекта
- •3. Основные направления исследований в системах с искусственным интеллектом
- •Лекция 3 знания и данные
- •1. Знания - необходимая компонента ии
- •2. Макрознания и макроидеи
- •3. Данные и знания. Классификация знаний
- •4. Проблемы представления знаний
- •Лекция 4 представление знаний и рассуждений
- •Лекция 5 логические модели представления знаний
- •1. Предварительные замечания
- •2. Логическая модель представления знаний
- •Лекция 6 псевдофизичесие логики
- •1.Нечеткость в представлении знаний
- •2.Нечеткие множества.
- •3. Нечеткие отношения
- •2.Нечеткие выводы
- •3.Построение Функций принадлежности.
- •Лекция 7 псевдофизические логики
- •Нечеткaя логика
- •1. Нечеткая и лингвистическая переменные.
- •2. Нечеткая и лингвистическая логика
- •Лекция 8 псевдофизические логики
- •Нечеткие высказывания. Нечеткие алгоритмы
- •1. Нечеткие высказывания
- •2. Свойства высказываний.
- •3. Правила преобразования высказываний.
- •4. Понятие нечеткого оператора и алгоритма
- •5. Выполнение нечетких алгоритмов.
- •Лекция 9 продукционные модели представления знаний
- •3. Классификация ядер продукции.
- •4. Методы поиска решений
- •5. Методы логического вывода. Дедуктивный вывод
- •3. Повышение эффективности поиска
- •Лекция 10 методы представления и обработки нечетких знаний в продукционных системах
- •1. Представление экспертной информации
- •2. Представление экспертной информации в виде
- •Лекция 11 методы представления и обработки нечетких знаний в продукционных системах
- •1. Нечеткий вывод на основе дедуктивного логического вывода
- •2. Нечеткий вывод на основе индуктивного логического вывода
- •Лекция 12 сетевые семантические модели представления знаний
- •1. Основные понятия семантических сетей
- •Лекция 13 сетевые семантические модели представления знаний
- •4. Модели семантических сетей. Активные семантические сети (м-сети).
- •Лекция 14 фреймы и объекты
- •Лекция 15 сценарии
- •1. Основные определения
- •3. Каузальные сценарии
- •Лекция 16 модели обучения
- •1. Неформальные модели
- •2. Формальные модели
- •3. Обучение по примерам
- •Лекции 17 обучение по примерам
- •1. Итеративные алгоритмы обучения
- •2. Спецификация задач обучения по примерам
- •Библиографический список
3. Данные и знания. Классификация знаний
Инженерия знаний - молодая ветвь теории искусственного интеллекта, изучающая процессы и методы получения, представления и формализации знаний для разработки экспертных систем (ЭС). Что такое «знание», как его формализовать и представлять в ЭВМ? Эти вопросы с середины 70-х годов становятся центральными в проблеме искусственного интеллекта (ИИ). Если проследить за сменой парадигм в этой области на : нейронные сети (50-е годы), эвристический поиск (60-е годы), представление знаний плюс логическое рассуждение (70-80-е годы), то увидим, что последняя прочно удерживается уже почти 15 лет, и именно благодаря ей ИИ из академической науки превратился в одно из наиболее перспективных направлений коммерческой информатики.
За эти годы специалистами предложены десятки различных толкований понятия «знание». Попытаемся обобщить различные представления и дать рабочее определение именно в контексте разработки ЭС. Определение знаний вне контекста ИИ звучит следующим образом: «Проверенный практикой результат познания действительности, верное ее отражение в мышлении человека». Это определение, однако, не проясняет особенностей знаний, отличающих компьютерные системы, основанные на знаниях, от традиционных прикладных программ.
Сложность понятия «знание» заключена в множественности и многообразии его материального носителя. Можно выделить пять форм знаний:
Z1 - знания о памяти человека;
Z2 - материализованные знания (монографии, статьи, учебники, и т. п.);
Z3 - поле знаний (полуформализованное описание Z1 и Z2);
Z4 - знания на языках представления знаний (формализация Z3);
Z5 - база знаний в ЭВМ (на машинных носителях информации).
Следует сразу ограничить сферу предметных областей, где имеет смысл выделять знания. Это области с преобладанием эмпирического знания, где накопление фактов опережает развитие теории (медицина, геология, юриспруденция, финансы и т. д.). Такие хорошо структурированные области, как математика, физика, теоретическая механика, имеют в основе богатый математический аппарат для описания своих закономерностей, который позволяет проводить машинное моделирование с использованием традиционного алгоритмического программирования (без выделения уровня знаний). Знания важны там, где определения размыты, понятия меняются, ситуации зависят от множества контекстов, где велика неопределенность, нечеткость информации.
В большом словаре знания определяются как «результат, полученный познанием», или, более подробно, «система суждений с принципиальной и единой организацией, основанная на объективной закономерности». Исследователи, придающие особую важность научным подходам, предпочитают первое определение, а исследователи, для которых главное-это обязательная гарантия последовательности суждений (люди с логическим мышлением), предпочитают второе.
В то же время с точки зрения ИИ и инженерии знаний определение знаний необходимо увязать с логическим выводом. Другими словами, можно дать еще одно определение: «знания - это формализованная информация, на которую ссылаются или используют в процессе логического вывода». В данном случае знания -это информация, на которую ссылаются, когда делают различные заключения на основании имеющихся данных с помощью логических выводов. Если эта работа выполняется программным путем, то знания -это обязательно информация, представленная в определенной форме.
Если рассматривать знания с точки зрения решения задач в некоторой предметной области, то их удобно разделить на две большие категории-факты и эвристику. Первая категория указывает обычно на хорошо известные в данной предметной области обстоятельства, поэтому знания этой категории иногда называют текстовыми, имея в виду достаточную их освещенность в специальной литературе или учебниках. Вторая категория знаний основывается на собственном опыте специалиста в данной предметной области - эксперта, накопленном в результате многолетней практики. В так называемых экспертных системах именно эта категория знаний играет решающую роль в повышении эффективности систем. Иными словами, в эту категорию входят такие знания, как «способы сосредоточения», «способы удаления бесполезных идей», «способы использования нечеткой информации» и т. п., позволяющие с большей эффективностью решать задачи. Тем не менее из-за недостаточной научной обоснованности и отсутствия исчерпывающих сведений пользоваться такими знаниями нужно осмотрительно.
Знания, кроме того, можно разделить на факты (фактические знания) и правила (знания для принятия решения). Под фактами подразумеваются знания типа «А это А», они характерны для баз данных и сетевых моделей. Под правилами подразумеваются знания вида «ЕСЛИ - ТО». Кроме них существуют так называемые метазнания (знания о знаниях). Понятие «метазнания» указывает на знания, касающиеся способов использования знаний, и знания, касающиеся свойств знаний. Это понятие необходимо для управления базой знаний, логическим выводом, отождествления, обучения и т. п.
В качестве рабочего примем следующее определение. Знания - это основные закономерности предметной области, позволяющие человеку решать конкретные производственные, научные и другие задачи, т. е. факты, понятия, взаимосвязи, оценки, правила, эвристики (иначе фактические знания), а также стратегии принятия решения в этой области (иначе стратегические знания).
Чем же знания отличаются от данных? По аналогии можно выделить ряд форм данных:
D1 - результат наблюдений над объектами (например, взгляд на термометр и фиксация температуры воздуха) или данные в памяти (например, дата рождения);
D2 - фиксация данных на материальном носителе - таблицы, графики и т. д. (например, данные о температуре воздуха в дневнике наблюдений);
Dз - модель данных - некоторая схема описания, связывающая несколько объектов (например, t° воздуха -дата измерения);
D4 - данные на языке описания данных;
D5 - база данных на машинных носителях информации. Традиционно выделяют только три уровня, например,: «внешний - .логический - физический»: D1,-D3-D5. Аналогичная триада для знаний: Z1-Z3-Z5.
Таким образом, у знании и данных много общего, однако знания обычно имеют более сложную структуру. Их иногда называют хорошо структурированными данными или метаданными или данными о данных,
Можно отметить еще один аспект, отражающий различие данных и знаний. Любое понятие, используемое человеком», имеет как бы две стороны - экстенсионал и интенсионал. Экстенсионал - набор конкретных фактов, соответствующих данному понятию. Интенсионал - определение или «описание некоторого понятия через его свойства. Например, для понятия «поликлиника» - экстенсионал есть набор типа: «детская поликлиника, взрослая поликлиника, служебная поликлиника, поликлиника № 85 и т. д.», а интенсионал выглядит, например, так: «медицинское учреждение для оказания амбулаторной помощи по месту жительства или работы».
Интенсионал отделяет знания от данных, которые всегда задаются экстенсионально. Сила интенсионала в его точности, выразительности и правильно выделенных свойствах. Широко известно высказывание Платона, определившего человека как «животное на двух ногах, лишенное перьев». И его конфуз, когда в ответ Диоген принес ему ощипанного петуха... В [11З] выделены еще пять свойств, отличающих знания:
внутренняя интерпретируемость, 2) рекурсивная структуризуемость, 3) взаимосвязь единиц, 4) наличие семантического пространства с метрикой, 5) активность. Эти свойства касаются уровня Z1 и связаны со сложной природой знания, изучение которой происходит на стыке психологии, философии, лингвистики, кибернетики и физиологии .
Для того чтобы знакомство читателя с терминологией инженерии знаний было более полным, необходимо упомянуть .о способах классификации знаний (табл. 3.1).
Таблица 3.1
|
|
|
|
|
Логика |
- |
+ |
- |
+ |
Продукции |
- |
+ |
+ |
+ |
Фреймы |
+ |
- |
+ |
+ |
Семантические сети |
+ |
- |
+ |
+ |
Объектно- ориентированные языки |
+ |
- |
+ |
+ |
Классификация по глубине. К глубинным знаниям относят абстракции, образы, аналогии, в которых отражается понимание структуры предметной области, а также назначение и взаимосвязь отдельных понятий (в фундаментальных науках к глубинным знаниям относят законы и теоретические основания). Поверхностные знания обычно касаются лишь совокупности эмпирических ассоциаций и причинно-следственных отношений между понятиями предметной области. Например, мы пользуемся телефоном, используя поверхностные знания о том, что, сняв трубку и правильно набрав номер, мы можем соединиться с нужным абонентом. Подавляющее большинство владельцев телефонов не имеет и не нуждается в глубинных представлениях о структуре телефонной связи, схеме телефонного аппарата, которыми, безусловно, пользуются специалисты телефонной станции.
В большинстве ЭС сейчас используются поверхностные знания, которые часто позволяют получать вполне качественные результаты. Однако введение глубинных представлений позволит создать базы знаний большей мощности, так как глубинные знания более гибки и адаптивны, чем достаточно жесткие поверхностные. Классическим примером может служить медицина, где глубинные знания опытных врачей позволяют им порождать разнообразные способы лечения одной и той же болезни в зависимости от состояния больного, его возраста или от наличия лекарств в аптечной сети. Молодой или неквалифицированный врач часто действует по поверхностной модели: «Если кашель - то пить таблетки от кашля, если ангина - то эритромицин» и т. л.
Глубинные знания образуются как результат обобщения первичных понятий предметной области в некоторые более абстрактные структуры. Часто эти структуры не имеют вербального описания. Так, в медицине введено понятие синдрома (от греч. syndrome - скопление) - сочетания симптомов, которым пользуются ля обобщенного и углубленного описания болезни.
Степень глубины и уровень обобщенности знаний прямо связаны с опытом экспертов и могут служить показателем профессионального мастерства последних. Кроме того, глубина знания связана с типом мышления. Часто в психологии выделяют два типа мышления : эмпирическое, теоретическое (со склонностью к анализу, рефлексии и [внутреннему планированию действий). При эмпирическом мышлении поиск решения задачи ведется только на основе учета имеющихся связей в ситуации задачи, при теоретическом мышлении, поиск осуществляется путем конструирования новых связей между элементами задачи. Таким образом, эмпирическое мышление отражает объект со стороны его внешних проявлений и связей (т. е. на уровне поверхностных знаний), а теоретическое включает способность к обобщению и отражает внутренние связи объектов и законы их развития (т. с. глубинное знание).
Классификация по жесткости . Жесткие знания позволяют получать однозначные четкие рекомендации при заданных начальных условиях, в то время как мягкие знания допускают множественные, расплывчатые решения и различные варианты рекомендаций. Согласно этой классификации можно и сами предметные области относить к жестким или мягким.
Интересная графическая интерпретация этих классификаций, предложена в для знаний в области САПР. Если развить данный подход для других предметных областей, то можно предложить схему, отражающую тенденцию в инженерии знаний - от жестких и поверхностных знаний к мягким и более глубоким.
