Представление и использование не четких и ненадежных знаний
Некорректно поставленные задачи существует во всех предметных областях. Более того, можно сказать, что большинство реальных задач являются нечеткими. Корректно поставленные задачи решаются с использованием традиционных методов, которые, как правило, хорошо формализованы, для них существует описанные, математические методы и алгоритмы решений. Для решения некорректных задач используется специфические методы, позволяющие учитывать и оценивать некорректность в процессе логического вывода.
Надо отметить что сам термин «Нечеткие знания» является не совсем корректным, т.к. неясно каким образом структурированы знания в мозгу человека, и как они там представлены, поэтому не существует какой-то единой и общей теории нечеткости, но существует определенные классификации ненадежных знаний. И в зависимости от вида нечеткости применяются те или иные методы.
В инженерии знаний обычно выделяют следующие виды нечеткостей:
Недетерминированность выводов
Многозначность. Проблема состоит в том, что на определенных шагах поиска решения возникает множество вариантов дальнейшего хода действий, но при этом отсутствует критерий выбора наиболее предпочтительного пути.
Ненадежность фактов и правил, которые используются при построении вывода.
Неполнота. Ситуация возникает в том случае, когда для решения задачи просто недостает исходных данных.
Работа с нечеткими множествами, т.е. с множествами, для которых нельзя определить четких границ.
Ненадежные знания и выводы
Во многих практических задачах приходится работать с данными, достоверность которых нельзя считать полной, т.е. 100%. Такие знания могут быть достоверными с некоторой степенью доверия. Степень доверия обычно выражают коэффициентом доверия, который представляет собой число с плавающей запятой в диапазоне 0..1 В основе большинства методов работы с ненадежными знаниями лежат так называемые Байесовские методы, т.е. это методы работы с вероятностными величинами.
Пример:
Пусть имеется черный ящик в котором лежат шары. Эти шары помечены следующим образом. Одни имеют метку А, другие Б, третьи имеют метку АБ и часть шаров вообще без меток.
Проведем следующий эксперимент: Будем доставать из ящика по одному шару и будем подсчитывать общее число извлеченных шаров и число извлеченных шаров которые имели метку А не зависимо от Б. После подсчета шары возвращаем в ящик. После проведения некоторого числа экспериментов, мы можем вычислить вероятность извлечения шара с меткой А, для этого достаточно поделить число извлеченных шаров с меткой А на общее число шаров:
P(A) = (число шаров с меткой “A”)/(Общ. Число шаров)
Вероятность, определяемая таким образом называется априорной вероятностью некоторого события. Очевидно, что аналогично можно определить и вероятность извлечения шара с меткой Б.
Рассмотрим более сложную ситуацию. Попытаемся определить вероятность происхождения некоторого события при условии выполнения другого события. Для этого проведем следующий эксперимент: Также как и в предыдущем случае будем извлекать шары и вести подсчет. Но при этом будем учитывать общее число извлеченных шаров, число шаров которые имеют метку А, независимо от Б, число шаров имеющих метку Б, независимо от А, а также число шаров имеющих метку АБ. После проведения этих экспериментов можно вычислить вероятность извлечения шара имеющего метку АБ одновременно. Это может быть описано следующим образом:
P(A и Б)=(число шаров с меткой АБ)/(Общее число шаров) (*)
Чтобы вычислить вероятность извлечения шара имеющего метку А при условии что был извлечен шар имеющий метку Б необходимо произвести следующие вычисления:
P(A|Б)=(Число шаров с меткой АБ)/(число шаров с меткой Б) (**)
Эта вероятность называется опостореорной, т.е. вероятность выполнения одного события от другого.
В формуле (*) выразим числитель
(число шаров с меткой АБ) = P(А и Б) * (Общее число шаров)
и подставим в (**) получим
P(А|Б)=(Р(А и Б)* (Общее число шаров))/ (число шаров с меткой Б)= (Р(А и Б))/(Р(Б))
Аналогично предыдущему случаю можно вычислить вероятность появления шара с меткой Б при условии извлечения шара с меткой А.
P(Б|А)= (Р(А и Б))/(Р(А))
Если в обоих формулах выразить числитель и приравнять, то получится следующая зависимость:
Р(А|Б)*Р(Б)=Р(Б|А)*Р(А) – закон Байеса
Из четырех экспериментов, которые можно произвести над двумя объектами необходимыми являются только три, значение четвертого эксперимента всегда может быть выражено через три других. Замечание: Особенностью метода Байеса является то, что сам он в чистом виде не применяется, однако существует множество других методов построенных на принципах Байесовской вероятности, которые применяются для решения практических задач.
