Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IIS_konechnyy_variant.doc
Скачиваний:
5
Добавлен:
06.07.2019
Размер:
2.76 Mб
Скачать
  1. Лингвистический аспект извлечения знаний, общий код.

Лингвистический аспект - это исследование языковых проблем в процессе извлечения знаний.

Три слоя важных лингвистических проблем, возникающих при извлечении знаний: общий код, понятийная структура, словарь пользователя.

  1. Проблема общего кода

Языки, на которых говорят и размышляют аналитик и эксперт, могут существенно отличаться.

Бытовой и общенаучный языки у двух участников общения примерно совпадают, требуется некоторый общий язык, или код, для успешного взаимодействия партнёров.

После того как общий код более менее определен, возникает разговор.

Разработка общего кода заканчивается составлением словаря терминов предметной области с предварительной группировкой их по смыслу.

  1. Понятийная структура

Основная особенность естественного интеллекта и памяти - это связанность всех понятий в некоторую сеть.

Лингвистическая работа инженера по знаниям на данном слое проблем заключается в построении связанных фрагментов с помощью объединения терминов.

Работа по составлению словаря и понятийной структуры требует лингвистического "чутья", легкости манипулирования терминами и богатого словарного запаса инженера по знаниям, так как зачастую аналитик вынужден самостоятельно разрабатывать словарь признаков. Чем богаче и выразительнее общий код, тем полнее база знаний.

Аналитик (инженер по знаниям) вынужден все время помнить о трудности передачи образов и представлений в устной форме. Часто инженеру по знаниям приходится подсказывать слова и выражения эксперту.

  1. Словарь пользователя

Профессиональный уровень конечного пользователя может не позволить ему применить специальный язык предметной области в полном объеме. Для разработки пользовательского интерфейса необходима дополнительная доработка словаря общего кода.

Словарь пользователя - это доработанный словарь терминов, обеспечивающий пользователю доступность и прозрачность экспертной системы.

  1. Текстологические и пассивные методы извлечения знаний.

Классификация методов извлечения знаний. Основной принцип деления связан с источником знаний. Коммуникативные методы охватывают все виды контактов с живым источником знаний - экспертом, а текстологические касаются методов извлечения знаний из документов и специальной литературы.

Текстологические методы - это когда инженер по знаниям анализирует литературу по предметной области. Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении специальных текстов из учебников, монографий, статей, методик и других носителей профессиональных знаний.

Коммуникативные методы можно разделить на две группы: активные и пассивные. Пассивные и активные методы различаются по роли инженера по знаниям.

Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний передается эксперту, в активных методах, напротив, инициатива полностью в руках инженера по знаниям.

К группе пассивных методов относятся (рис.): наблюдения; анализ протоколов "мыслей вслух"; лекции.

Наблюдения. В процессе наблюдений инженер по знаниям находится непосредственно рядом с экспертом; При подготовке к сеансу извлечения эксперту необходимо объяснить цель наблюдений и попросить максимально комментировать свои действия.

Во время сеанса аналитик записывает все действия эксперта, его реплики и объяснения. Может быть сделана и видеозапись в реальном масштабе времени.

Анализ протоколов "мыслей вслух". Протоколирование "мыслей вслух" отличается от наблюдений тем, что эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, т.е. продемонстрировать всю цепочку своих рассуждений.

Лекции. Метод извлечения знаний в форме лекций, как и все пассивные методы, используют в начале разработки как эффективный способ быстрого погружения инженера по знаниям в предметную область.

От инженера по знаниям в этой ситуации требуется лишь грамотно законспектировать лекцию эксперта и в конце задать необходимые вопросы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]