- •Глава 1
- •Искусственный интеллект
- •Фактуальное и операционное знание
- •Признаки иис
- •Системы с интеллектуальным интерфейсом
- •Экспертные системы
- •Самообучающиеся системы
- •Адаптивные информационные системы
- •Языки программирования для ии и языки представления знаний
- •Глава 2
- •Данные и знания
- •Модели представления знаний
- •Глава 3
- •Системы продукций
- •Стратегии поиска в пространстве состояний
- •Рекурсивный поиск
- •Глава 4
- •Введение в экспертные системы. Определение и структура
- •Классификация экспертных систем
- •Коллектив разработчиков
- •Технология проектирования и разработки
- •Глава 5
- •Поле знаний
- •Стратегии получения знаний
- •Теоретические аспекты извлечения знаний
- •Теоретические аспекты структурирования знаний
- •Технологии инженерии знаний
- •Глава 6
- •Задача классификации
- •Деревья решений
- •Искусственные нейронные сети
- •Глава 7
- •Способы аналитической обработки данных
- •Некоторые бизнес-приложения Data Mining
- •Типы закономерностей
- •Процесс нахождения нового знания
- •Глава 1 2
- •Глава 2 15
- •Глава 3 23
- •Глава 4 45
- •Глава 5 54
- •Глава 6 62
- •Глава 7 88
Технологии инженерии знаний
Классификация методов практического извлечения знаний
Коммуникативные методы извлечения знаний охватывают методы и процедуры контактов инженера по знаниям с непосредственным источником знаний — экспертом.
Текстологические включают методы извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (статей, монографий, учебников).
На выбор метода влияют три фактора: личностные особенности инженера по знаниям, личностные особенности эксперта, характеристика предметной области.
По психологическим характеристикам людей можно разделить на три типа:
мыслитель (познавательный тип);
собеседник (эмоционально-коммуникативный тип);
практик (практический тип).
Предметные области могут быть хорошо документированные, средне документированные, слабо документированные.
Предметные области можно также разделить по критерию структурированности. Структурированность — это степень теоретического осмысления и выявленности основных закономерностей и принципов, действующих в данной предметной области. Предметные области могут быть
хорошо структурированные — с четкой аксиоматизацией, широким применением математического аппарата, устоявшейся терминологией;
средне структурированными — с определившейся терминологией, развивающейся теорией, явными взаимосвязями между явлениями;
слабо структурированными — с размытыми определениями, богатой эмпирикой, скрытыми взаимосвязями.
Коммуникативные методы
Пассивные методы извлечения знаний включают такие методы, где ведущая роль в процедуре извлечения фактически передается эксперту, а инженер по знаниям только фиксирует рассуждения эксперта во время работы по принятию решений. К пассивным методам относятся следующие.
Наблюдения. В процессе наблюдений инженер по знаниям находится непосредственно рядом с экспертом во время его профессиональной деятельности или имитации этой деятельности. Аналитик записывает все действия эксперта и не вмешивается в его работу.
Анализ протоколов «мыслей вслух». Этот метод отличается от наблюдений тем, что эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено.
Лекции. Это один из самых древних способов передачи знаний. От инженера по знаниям требуется грамотно законспектировать лекцию и задать
в конце необходимые вопросы.
Активные индивидуальные методы — наиболее распространенные. Они включают
анкетирование;
интервью;
свободный диалог;
игры с экспертом.
Активную функцию выполняет инженер по знаниям.
Анкетирование — наиболее стандартизированный и жесткий метод. Инженер по знаниям заранее составляет вопросник или анкету и использует для опроса нескольких экспертов.
Интервью — форма общения инженера по знаниям и эксперта, в которой инженер по знаниям задает эксперту серию заранее подготовленных вопросов с целью извлечения знаний о предметной области.
Свободный диалог — это метод извлечения знаний в форме беседы инженера по знаниям и эксперта, в котором нет жесткого регламентированного плана и вопросника.
Активные групповые методы включают
ролевые игры;
дискуссии за круглым столом;
«мозговой штурм».
Достоинство этих методов — участие нескольких экспертов.
Круглый стол — это обсуждение какой-либо проблемы из предметной области, в котором принимают участие с равными правами несколько экспертов.
«Мозговой штурм» — способ получения новых идей в условиях запрещения критики.
Деловая игра — эксперимент, в котором участникам предлагается производственная ситуация, а они на основе своего опыта, специальных знаний принимают решение.
Текстологические методы
Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении специальных текстов из учебников, монографий, статей, методик и других носителей профессиональных знаний.
Задача извлечения знаний из текстов — это задача понимания и выделения смысла текста. Текст — лишь проводник смысла. Смысл, который пытался заложить автор и смысл, который постиг инженер по знаниям, не совпадают. Смысл, который постиг инженер по знаниям, образуется из текста за счет привлечения всей совокупности научного и человеческого багажа читателя.
Приведем алгоритм извлечения знаний из текста.
Составление «базового» списка литературы для ознакомления с предметной областью и чтение по списку.
Выбор текста для извлечения знаний.
Первое знакомство с текстом. Определение значений незнакомых слов (консультации со специалистами или привлечение справочной литературы).
Формирование первой гипотезы о макроструктуре текста.
Внимательное прочтение текста с выписыванием ключевых слов и выражений, то есть компрессия текста.
Определение связей между ключевыми словами, разработка макроструктуры текста в форме графа или «сжатого» текста (реферата).
Формирование поля знаний на основании макроструктуры текста.
Обычно инженер по знаниям комбинирует различные из вышеперечисленных методов.
Простейший метод структурирования
Методы извлечения знаний — непосредственная подготовка к структурированию знаний. Простейший алгоритм формирования поля знаний включает следующие шаги.
Определение входных {X} и выходных {Y} данных.
Составление словаря терминов и наборов ключевых слов N. Проводится текстуальный анализ всех протоколов сеансов извлечения знаний и выписываются все значимые слова, обозначающие понятия, явления, процессы и т.п. Определяется смысл всех слов.
Выявление объектов и понятий {A}. Словарь N «просеивается» и выбираются значимые для принятия решения понятия и их признаки. Образуется полный систематический набор терминов из какой-либо области знаний.
Выявление связей между понятиями. Строится сеть ассоциаций, где связи намечены, но не проименованы.
Выявление метапонятий и детализация понятий. Связи, полученные на предыдущем шаге, позволяют структурировать понятия и выявить как понятия более высокого уровня обобщения (метапонятия), так и детализировать их на более низком уровне.
Построение пирамиды знаний, то есть иерархической матрицы понятий, подъем по которой — углубление понимания и повышение уровня абстракции.
Определение отношений {RA}. Отношения между понятиями выявляются как внутри каждого из уровней пирамиды, так и между уровнями. Даются имена всем связям.
Определение стратегии принятия решений {S}, то есть выявление цепочек рассуждений, которые связывают все выявленные ранее понятия и отношения в динамическую систему поля знаний.
