9. Классификация методов извлечения знаний.

В неявном виде предполагалось, что это некоторое взаимодействие инженера по знаниям и эксперта в форме непосредственного живого общения. Однако это не единственная форма извлечения знаний, хотя и довольно распространенная. В работах упоминается около 15 ручных (неавтоматизированных) методов извлечения и более 20 автоматизированных методов приобретения и формирования знаний.

Рисунок 4.1 иллюстрирует предлагаемую классификацию методов извлечения знаний, в которой используются наиболее употребительные термины, что позволит инженерам по знаниям в зависимости от конкретной задачи и ситуации выбрать подходящий метод.

Из предложенной схемы классификации видно, что основной принцип деления связан с источником знаний.

Кроме этого, предметные области можно разделить по критерию структурированности знаний. Под структурированностью будем понимать степень теоретического осмысления и выявление основных закономерностей и принципов, действующих в данной предметной области. И хотя ЭС традиционно применяются в слабо структурированных предметных областях, сейчас наблюдается тенденция расширения сферы внедрения экспертных систем.

По степени структурированности знаний предметные области могут быть:

хорошо структурированными — с четкой аксиоматизацией, широким применением математического аппарата, устоявшейся терминологией;
средне структурированными — с определившейся терминологией, развивающейся теорией, явными взаимосвязями между явлениями;
слабо структурированными — с размытыми определениями, богатой эмпирикой, скрытыми взаимосвязями, с большим количеством «белых пятен».

10. Структурирование знаний.

В настоящее время для структурирования знаний используются структурный и объектный подходы.

Структурный подход

Структурный подход основан на идее алгоритмической декомпозиции, где каждый модуль системы выполняет один из важных этапов общего процесса. В рамках структурного подхода разработано большое число выразительных средств: диаграммы потоков данных, структурированные словари (тезаурусы), языки спецификаций систем, таблицы решений, стрелочные диаграммы, диаграммы переходов, деревья целей, средства управления проектом (PERT-диаграммы) и др.

Объектный подход

Объектный (объектно-ориентированный) подход связан с объектной декомпозицией, при которой каждый объект рассматривается как экземпляр определенного класса. К базовым понятиям этого подхода относятся следующие:

Абстрагирование, которое М.Шоу определил как упрощенное описание системы, где выделяются наиболее существенные для рассмотрения свойства и детали, а незначительные аспекты опускаются. Абстрактное представление реальности отражено моделью сущности (объект) и моделью поведения (метод). Объекты соответствуют понятиям предметной области. Методы представляют собой операции, которые можно выполнять над объектами.
Класс — множество объектов, связанных общностью структуры и свойств.
Иерархия — упорядоченная система абстракций (классов).
Наследование — такое соотношение между классами, когда один класс использует структурную или функциональную часть другого класса (или нескольких других).
Типизация — ограничение, накладываемое на класс, которое препятствует взаимозаменяемости объектов, принадлежащих различным классам.
Модульность — свойство системы, связанное с возможностью ее декомпозиции на ряд взаимосвязанных частей (модулей).
Инкапсуляция — ограничение доступа к внутренней структуре и механизмам функционирования объекта.
Полиморфизм — возможность наделения объекта различными свойствами и стратегиями поведения. Иными словами, одно имя может соответствовать различным классам объектов, входящим в один суперкласс. Следовательно, объект, обозначенный этим именем, может по-разному реагировать на некоторое множество действий.

На стадии структурирования знаний предметной области необходимо решить следующие задачи: составление словаря используемых терминов; выявление понятий и их атрибутов; выявление связей и определение отношений между понятиями; детализация и обобщение понятий; построение обобщенной структуры знаний предметной области.

Первым шагом структурирования знаний является определение входных и выходных данных, которые в дальнейшем будут детализироваться и уточняться. На основании этих данных, а также по результатам анализа протоколов сеансов извлечения знаний составляется набор ключевых слов (терминов), в процессе обработки которого выявляются объекты, понятия и их атрибуты. Под понятием подразумевается обобщение предметов некоторого класса по специфическим признакам. Формирование понятий — серьезная проблема. Для выявления понятий используются традиционные методы распознавания образов и классификации, а также нетрадиционные методы, базирующиеся на методологии инженерии знаний. Наиболее распространенными методиками выявления объектов и понятий являются:

11. Модель представления знаний: семантические сети.

Одним из способов представления знаний является семантическая сеть. Изначально семантическая сеть была задумана как модель преставления структуры долговременной памяти в психологии, но в последствии стала одним из основных способов представления знаний в инженерии знаний. В основе сетевых моделей представления знаний лежит идея о том, что любые знания можно представить в виде совокупности объектов (понятий) и связей (отношений) между ними. В отличие от продукционных эти модели более наглядны, поскольку любой пример можно представить в виде ориентированного (направленного) графа, вершины которого - понятия, а дуги - отношения между ними. Понятиями обычно выступают абстрактные или конкретные объекты, а отношения - это связи типа: "это" ("is"), "имеет частью" ("has part"), "принадлежит", "любит" и т.п. Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:

класс - элемент класса;;
свойство – значение;
пример элемента класса.

В качестве примера на Рисунке 3 показана весьма простая семантическая сеть для представления объекта «чайник».

Рисунок 3.

Наиболее часто в семантических сетях используются следующие отношения:

связи типа "часть-целое" ("класс-подкласс", "элемент-множество" и т.п.);
функциональные связи (определяемые обычно глаголами "производит", "влияет"...);
количественные (больше, меньше, равно...);
пространственные (далеко от, близко от, за, под, над...);
временные (раньше, позже, в течение...);
aтрибутивные связи (иметь свойство, иметь значение...);
логические связи (и, или, не) и др.

Можно ввести несколько классификаций семантических сетей. Например, по количеству типов отношений:

однородные (с единственным типом отношений);
неоднородные (с различными типами отношений).

По типам отношений:

бинарные (в которых отношения связывают два объекта);
парные (в которых есть специальные отношения, связывающие более двух понятий).

Проблема поиска решения в базе знаний типа семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети, соответствующей поставленному вопросу. Подобного рода задачи решаются с помощью аппарата теории графов. Следует особо отметить роль фундаментальных признаков связей (рефлексивность, симметричность и транзитивность) в процессе вывода на сети. Так, например, связи вида "это есть" или "иметь частью" транзитивны, что позволяет говорить об установлении с помощью этой связи свойств иерархии наследования в сети. Это означает, что элементы более низкого уровня в сети могут наследовать свойства элементов более высокого уровня в сети. Примером простой семантической сети является описание объекта автомобиль и рядя связанных с ним понятий (см. Рисунок 4. Пример простейшей семантической сети.). На этой сети присутствует следующая цепочка понятий: «автомобиль имеет частью двигатель», «двигатель имеет частью стартер». В силу транзитивности отношения "иметь частью" можно вывести следующее утверждение «автомобиль имеет частью стартер». Аналогично можно сделать вполне очевидный вывод, что «Иванов обладает автомобилем» или, что «Mercedes имеет частью двигатель и потребляет топливо».

Рисунок 4. Пример простейшей семантической сети [11].

Основное преимущество этой модели - в соответствии современным представлениям об организации долговременной памяти человека. Недостаток модели - сложность поиска вывода на семантической сети.

<<< < Предыдущая 1 2 3 45 / 65 6 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.03.20251.08 Mб10ответы высшая геодезия (практика).docx
#
03.05.2019205.31 Кб26Ответы ИМ.doc
#
17.04.201953.49 Кб39ответы информатика.docx
#
18.04.2019268.8 Кб45Ответы Лапин младший.doc
#
01.07.20253.35 Mб6Ответы на билеты БВР.doc
#
01.07.2025200.05 Кб1Ответы на вопросы Осипова.docx
#
01.07.2025210.43 Кб0Ответы на вопросы по Геологии.doc
#
27.10.2018295.94 Кб22ответы на вопросы по философии.doc
#
01.07.202569.08 Кб0Ответы на вопросы, по философии часть 1..docx
#
01.07.202574.64 Кб0Ответы на вопросы, по философии часть 2.docx
#
23.09.20193.27 Mб33ответы на ГОС по геодезии.doc