- •Часть 3. Методы инженерии знаний
- •3.1. Приобретение и формализация знаний
- •3.1.1. Основные определения
- •3.1.2. Моделирование поля знаний
- •Существует ряд языков представления знаний, не нашедших широкого применения: структурно-логический языка sll(Вольфенгаген), язык к-систем (Кузнецов), уск (Мартынов).
- •3.1.3. Семиотическая модель поля знаний
- •3.1.4. Иерархичность поля знаний («пирамида» знаний)
- •Пусть есть система
- •3.1.5. Теоретические аспекты приобретения знаний
- •3.1.6. Практические аспекты приобретения знаний
- •3.1.7. Текстологические методы приобретения знаний
- •3.1.8. Структурирование (формирование поля знаний)
- •3.1.9. Формализация качественных знаний
- •3.1.10. Автоматизированное приобретение знаний
- •3.2. Пополнение знаний
- •3.2.1. Общие сведения
- •3.2.2. Использование различных моделей знаний
- •3.2.3. Алгоритмы логического вывода в условиях определенности
- •3.2.4. Вывод в условиях неопределенности
- •3.3. Обобщение и классификация знаний
- •3.3.1. Общие понятия
- •3.3.2. Обобщение по признакам
- •3.3.3. Структурно-логические методы обобщения
Пусть есть система
E = <{oi: iI}, {rj: jJ}>,
где {oi: iI} – множество понятий предметной области;
{rj: jJ} – множество отношений предметной области.
Пусть предметная область на некотором уровне описания состоит из элементов ei. Тогда каждое понятие предметной области будет составляться из ее элементов и представляться как oi(e1, …, em), а каждое отношение будет определяться тем множеством элементов, которые в него вошли: {e1, …, em}rj.
Гомоморфизмом системы E в систему E’:
E’ = <{o’i: iI}, {r’j: jJ}>
называется отображение
: EE’
такое, что
(oi(e1, …, em)) = o’i((e1), …, (em))
{e1, …, em}rj{(e1), …, (em)}r’j
В соответствии с введенными обозначениями уровни пирамиды знаний есть гомоморфизмы моделей предметной области:
: MM’
M = <A, R, S>,
где A – множество понятий;
R – множество отношений;
S – множество стратегий.
По отношений к модели некоторого уровня модель более высокого уровня будет метамоделью, состоящей из системы метапонятий, метаотношений и метастратегий.
3.1.5. Теоретические аспекты приобретения знаний
3.1.5.1. Особенности приобретения знаний
Проблемы приобретения (извлечения) знаний:
организационные неувязки;
неудачный метод извлечения, не совпадающий со струткурой знаний в данной области;
неадекватная модель (язык) представления знаний.
Причины нежелательности выполнения функций аналитика (инженера по знаниям) экспертом:
Неполнота рассуждений эксперта в силу его склонности опираться не эмпирику, а не на теорию.
Возможность вербализировать в процессе диалога эксперта и аналитика невербальные знания эксперта.
Невладение экспертом методологией формирования моделей знаний.
Большинство инструментальных средств приобретения знаний ориентировано на конкретные ЭС с жестко обозначенной предметной областью и моделью представления знаний, т.е. не являются универсальными.
3.1.5.2. Психологический аспект приобретения знаний
Основные уровни общения:
Уровень манипулирования, когда один субъект рассматривает другого как средство или помеху по отношению к своей деятельности.
Уровень «рефлексивной игры», когда в процессе своей деятельности субъект учитывает «контрпроект» другого субъекта, но не рассматривает его самоценность и стремится к реализации своего проекта.
Уровень правового общения, когда субъекты пытаются согласовать проекты своей деятельности.
Уровень нравственного общения, когда субъекты принимают общий проект совместной деятельности.
В ходе общения велики потери информации:
Задумано 100%
Приобрело словесную форму 90%
Высказано 80%
Выслушано 70%
Понято 60%
Осталось в памяти 24%
Структурные компоненты модели общения в процессе извлечения знаний:
участники общения (партнеры);
средства общения (процедура);
предмет общения (знания).
Слои психологических проблем извлечения знаний:
контактный (S11);
процедурный (S12);
когнитивный (S13).
Контактный слой
В коллективе разработчиков должны складываться кооперативные, а не конкурентные отношения. Для кооперации характерна заинтересованность в успехах друг друга.
Значения параметров пола (S11_1) и возраста (S11_2) влияют на эффективность контакта но не являются критичными. Наилучшие результаты дают гетерогенные пары с разницей в возрасте 5-20 лет.
Личность (S11_3) – устойчивая система психологических черт, характеризующая индивидуальность человека. Рекомендуемые компоненты S11_3:
доброжелательность;
аналитичность;
хорошая память;
внимание;
наблюдательность;
воображение;
впечатлительность;
собранность;
настойчивость;
общительность;
находчивость.
Темперамент (S11_4) имеет 4 основных разновидности: холерик, сангвиник, меланхолик, флегматик. Наиболее контактными являются холерики и сангвиники.
Важен также учет мотивации (S11_5).
Процедурный слой
Ситуация общения (S12_1) определяется следующими компонентами:
место проведения сеансов (S12_1_1) – в небольшом помещении наедине, наиболее благоприятная дистанция общения – 1.2-3м (минимальнрое комфортное расстояние 0.7-0.8м);
продолжительность проведения сеансов (S12_1_2) – 1.5-2 часа, с паузами через каждые 20-30 мин;
время проведения сеансов (S12_1_3) – первая половина дня.
Оборудование (S12_2) включает:
вспомогательные средства (S12_2_1) для повышения эффективности процесса извлечения знаний (наглядный материал: рисунки, графики диаграммы для контактера художественного типа и формулы, текст для контактера мыслительного типа) и для протоколирования результатов (запись на бумагу, магнитофонная запись, запоминание);
освещенность (S12_2_2);
мебель (S12_2_3).
Профессиональные приемы аналитика (S12_3) включают:
темп (S12_3_1) – обязательно учитывается индивидуальный темп эксперта;
стиль (S12_3_2) – сокращение потерь информации за счет сокращения длительности фраз – оптимальная длительность 72 слова (число Ингве-Миллера), обязателен учет невербальных средств передачи информации – мимики, жестов, интонаций;
методы (S12_3_3).
Когнитивный слой
Когнитивный стиль (S13_1) – совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека.
Характеристики когнитивного стиля:
полезависимость – поленезависимость (S13_1_1);
импульсивность – рефлексивность (S13_1_2);
ригидность – гибкость (S13_1_3);
когнитивная эквивалентность (S13_1_4).
Поленезависимость – способность акцентировать внимание только на тех аспектах проблемы, которые необходимы для решения конкретной задачи и уметь отбрасывать все лишнее, т.е. не зависеть от окружающего задачу шумового поля. Поленезависимость важна и для эксперта, и для аналитика, т.к. сопровождается высокой способностью к пониманию, однако полезависимые люди более контактны.
Особенно полезны для общения гетерогенные пары.
Поленезависимость является характерной профессиональной чертой квалифицированных инженеров по знаниям. По некоторым данным, мужчины более поленезависимы, чем женщины.
Импульсивность – способность к быстрому принятию решений. Рефлексивность – склонность к рассудительности. Рефлексивность связана со способностью формирования понятий и продуктивностью решения логических задач. Рефлексивностью желательно обладать и эксперту, и аналитику.
Эксперт может себе позволить ригидность (что характерно для долго работающих над одной проблемой специалистов, особенно старшего возраста), инженеру по знаниям эта характеристика противопоказана.
Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен производить индивид, тем большее количество признаков понятий он может выделтиь. Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин.
Семантическая репрезентативность (S13_2) исключает навязывание эксперту некой модели представлений и заставляет аналитика последовательно воссоздавать модель мира эксперта, используя как неформальные методы, так и математический аппарат, например, многомерное шкалирование.
3.1.5.3. Лингвистический аспект приобретения знаний
Слои лингвистических проблем извлечения знаний:
«общий код» (S21);
понятийная структура (S22);
словарь пользователя (S23).
«Общий код»
«Общий код» решает проблему языковых «ножниц» между профессиональной терминологией эксперта и обыденной литературной речью аналитика. Грубо говоря, «общий код» – это тот язык, который должны получить эксперт и аналитик путем последовательного покомпонентного сближения их языков. Языки аналитика и эксперта состоят приблизительно из одних и тех же компонентов:
общенаучная терминология (S21_1) (для аналитика – из теоретической литературы);
специальная терминология предметной области (S21_2) (для аналитика – из специальной литературы, для эксперта – принятая ранее);
бытовой язык (S21_3);
неологизмы и профессиональный жаргон (S21_4) (у аналитика на момент начала общения отсутствует).
Выработка общего кода начинается с составления словаря предметной области. Затем следует группирование терминов и выбор синонимов. Разработка общего кода заканчивается группировкой терминов по понятийной близости.
Понятийная структура
Понятийная структура – это модель взаимосвязей понятий предметной области, которая рассматривается в рамках семиотического подхода (см. выше). Таким образом, при формировании понятийной структуры выстраиваются отношения функциональных зависимостей, структуризации, иерархии между понятиями предметной области.
Словарь пользователя
Имеется в виду отдельный словарь для создания дружественного интерфейса с пользователем ЭС. Необходимы специальные приемы, увеличивающие «прозрачность» и «доступность» системы. В качестве основы пользовательского словаря используется словарь общего кода.
3.1.5.4. Гносеологический аспект приобретения знаний
Процесс приобретения знаний аналитиком является познавательным процессом, и особенностями этого процесса являются:
Необходимость наиболее полного и точного познания знаний эксперта.
Возможность выявления новых закономерностей, не формулируемых экспертом в явном виде или вообще ему неизвестных.
Высокая точность, высокая полнота знаний, перемещение знаний от уровня эмпирик на уровень теорий повышают эффективность формируемой БЗ. В процессе приобретения знаний идеальным случаем является прохождение по т.наз. гносеологической цепочке: фактобобщенный фактэмпирический законтеоретический закон.
Знание имеет два уровня:
Эмпирический (наблюдения, явления).
Теоретический (законы, абстракции, обобщения).
«Научность» знания, сформированного аналитиком в процессе приобретения знаний, оценивается в соответствии со следующими критериями:
внутренняя согласованность (S31);
системность (S32);
объективность (S33);
историзм (S34).
Внутренняя согласованность заключается в минимизации отрицательных свойств экспертного знания: модальности, противоречивости, неполноты.
Модальность знания означает возможность его существования в различных конструкциях существования и долженствования: эксперт знает, что …; эксперт думает, что … и т.п.
Системность ориентирует аналитика на рассмотрение любой предметной области с позиций закономерностей системного целого и взаимодействия составляющих его частей.
Объективность основывается на глубине описания знания.
Требование историзма: структура поля знаний и БЗ должны допускать под стройку и коррекцию как в период разработки, так и во время эксплуатации ЭС.