Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 3_на отправку.doc
Скачиваний:
14
Добавлен:
22.08.2019
Размер:
1.11 Mб
Скачать

Лекция №3-4 Тема №3: Знания

  • Организация базы знаний.

  • Предметное (фактуальное) и проблемное (операционное) знания.

  • Декларативная и процедурная формы представления знаний.

  • Методы представления знаний.

Отличия данных от знаний

Вначале уточним несколько понятий.

Характерным признаком ИИС является наличие знаний, необходимых для решения задач конкретной предметной области. При этом возникает естественный вопрос, что такое знания и чем они отличаются от обычных данных, обрабатываемых ЭВМ.

В теории ИИС данными принято считать отдельные факты, характеризующие свойства сущностей некой конкретной предметной области. Эти свойства должны быть представлены во всем их многообразии, необходимом и достаточном для решения определенного класса задач. Если известных фактов оказывается недостаточно, процедурная компонента должна автоматически обеспечить синтез новых фактов и решить конкретную задачу данного класса. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

  • исходная форма существования данных (результаты наблюдений и измерений, таблицы, справочники, диаграммы, графики и т.д.);

  • представление на специальных языках описания данных, предназначенных для ввода и обработки исходных данных в ЭВМ;

  • базы данных на машинных носителях информации.

Наряду с собственными свойствами каждая сущность предметной области может характеризоваться связями (отношениями) с другими объектами, процессами или ситуациями, отображенными в информационной модели предметной области.

В информационной модели предметной области не всегда удается отразить все возможные признаки объектов, иногда модель содержит только некоторые свойства объектов конкретного вида. Например, только фамилии, имена и отчества людей. При этом совершенно одинаковые по трем указанным признакам объекты одной ПО должны иметь разные указатели роли или состоять в разных отношениях к другим объектам. Для дифференциации объектов, у которых признаки совпадают, необходимо присвоить объектам уникальные идентификаторы в модели данной ПО.

Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания могут быть получены на основе обработки эмпирических данных. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

В большинстве изданий, посвященных проблематике ИИС, знания определяются как хорошо структурированные, рассмотренные в многообразии взаимосвязей данные о свойствах сущностей предметной области и об отношениях между ними. Часто знания трактуются как «данные о данных», которые могут порождать новые понятия, абстракции и даже приводить к открытию новых сущностей или как совокупность сведений (данных или программ), отражающих знания эксперта в определенной предметной области и предназначенных для хранения в базах знаний. Знания отражают множество возможных ситуаций, связанных с состоянием и конкретной реализацией объектов определенного типа, способы перехода от одного описания объекта к другому. Условно можно записать: знания = факты + убеждения + правила.

Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два способа наделения знаниями программных систем:

  • Знания помещаются в программу, написанную на обычном языке программирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. Минусы такого подхода заключаются в трудности модификаций и сопровождения этих программ, проблеме с пополнением знаний и оценкой их роли в процессе решения задач;

  • Создание баз данных и вынесение знаний в отдельную категорию в определенном формате, в котором они и помещаются в БЗ. База знаний легко пополняется и модифицируется, являясь автономной частью ИИС. На структуру БЗ и операции с нею накладывают определенные ограничения механизм логического вывода, реализованный в логическом блоке и также средства ведения диалога. Этот подход является оптимальным.

При разработке ИИС сначала с участием людей осуществляются накопление и представление знаний, а затем они представляются определенными удобными для хранения и обработки в ЭВМ структурами данных. Знания в ИИС существуют в следующих формах:

  • исходные знания (правила, выведенные на основе практического опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы);

  • описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или продукционных правил, семантическая сеть, иерархии фреймов);

  • представление знаний структурами данных, которые предназначены для хранения и обработки в ЭВМ;

  • базы знаний на машинных носителях информации.

Для знаний характерны следующие особенности.

Структурированность – это термин, по отношению к информации или данным означающий организованность в соответствии с определенной концепцией, отображающей возможные аспекты их прагматики. Видимо, поэтому знаниями иногда называют «хорошо структурированные данные». Знания должны быть размещены на физических носителях (печатных изданиях или компьютерных дисках) так, чтобы было удобно их найти и главное – понять, в каких смысловых отношениях находятся между собой отдельные элементы знаний. Внешне это означает удобство архитектуры и прозрачность хранилища знаний, т.е. наличие ясных названий и заголовков, удобного представления структуры (оглавлений, рубрикаторов) и т.п. Внутренний смысл процесса структуризации знаний предметной области раскрывается перечнем тех задач, которые предстоит решить для превращения совокупности разрозненных знаний в структуру.

Таких задач четыре:

  • составление словаря используемых в предметной области терминов;

  • идентификация понятий и свойственных им атрибутов;

  • выявление отношений между понятиями и определение типов этих отношений;

  • уточнение (детализация) понятий и их обобщение в концепты по признакам общности.

Самой трудной из этих задач является вторая. При ее решении используются традиционные методы классификации и нетрадиционные аналитические методы, входящие в арсенал «инженерии знаний» или когнитологии.

Доступность восприятия и усвоения. Для человека это означает возможность быстро понять и запомнить что-либо новое или возможность быстро вспомнить то, что узнал когда-то. Для компьютерных баз знаний это означает наличие средств, облегчающих доступ к знаниям и их усвоение (краткие аннотации к документам, индексы, классификационные признаки и пр.).

Непротиворечивость. Разные знания об одном и том же объекте не должны приводить к противоречивому или абсурдному пониманию сущности этого объекта. Однако для многих систем сбора знаний это изначально не так: на вход хранилища знаний может поступать разноречивая информация. Задача собирателя знаний  обнаружить противоречия и разрешить их на этапе сбора знаний либо присвоить разным элементам данных, составляющих знания, различную оценку достоверности.

Достоверность. Получая и используя знания, хочется иметь представление о том, насколько они достоверны. Хорошее хранилище знаний (учебник или база знаний) должно содержать достоверную, соответствующую истинному состоянию предметной области систему знаний о ее объектах и отношениях между ними. Это означает, что поддержание базы знаний в актуальном состоянии – важнейшая функция администраторов базы знаний.

Обрабатываемость. Для того, чтобы знания не оставались вещью в себе, база знаний, как информационная модель предметной области, должна быть построена с учетом возможности генерации достаточно сложных процедур обработки знаний. Эта возможность существенно зависит не только от мощности процедур логической и математической обработки знаний, имеющихся в составе системы, но и от выбранной структуры описания знаний.

Информация не является знаниями до тех пор, пока она не востребована и не решает никаких задач. Наглядный пример информации, не превратившейся в знание - чтение человеком текста, написанного на языке, которого он совершенно не знает. Информация в таком тексте есть, но если не знать языка, ее превратить в знание или невозможно, или очень трудоемко (если пользоваться словарём). Перевод такого текста с помощью компьютерной системы автоматического перевода - типичный пример более эффективной, хотя и не совершенной процедуры извлечения знаний. Если перевод будет сделан человеком, знающим в совершенстве язык и точно понимающим содержание текста, то есть надежда, что знания, в нем содержащиеся, будут извлечены полностью.