Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Надежность и диагностика компонентов инфокоммуникационных и информационно-управляющих систем.-1

.pdf
Скачиваний:
3
Добавлен:
20.11.2023
Размер:
3.78 Mб
Скачать

ность y = f (x1, …, xn), установленная на обучающей выборке А, справедлива и для контрольной выборки С. Однако показатель m недостаточен для характеризации обучающей выборки А, поскольку важен не только ее объем, но и состав, т.е. информативность для установления закономерности той части генеральной совокупности U, которую она представляет.

В последующих разделах описана экспертная система, в которой реализована модель обучения на примерах. Для конкретных вариантов построения экспертной системы рассмотрены и вопросы представительности обучающей выборки.

4.4.2. Экспертные системы и принципы их построения

Под экспертной системой понимается система, объединяющая возможности компьютера со знаниями и опытом эксперта в такой форме, что система может предложить разумный совет или осуществить разумное решение поставленной задачи. Дополнительно желаемой характеристикой такой системы является способность системы пояснять, по требованию, ход своих рассуждений в понятной для спрашивающего форме. Методика достижения таких характеристик, основанная на наборе формальных решающих правил, называется построением экспертной системы [5, 8].

Существует два принципа построения экспертных систем.

В первом случае производятся интенсивные предварительные исследования и опросы экспертов для того, чтобы выяснить вероятности наступления того или иного исхода в зависимости от появления каждого возможного события. Такой экспертной системой можно пользоваться сразу после ее создания. При неправильной оценке событий такую систему можно видоизменять и дополнять, однако все видоизменения и дополнения вносятся в систему разработчиками. Будем называть такие экспертные системы обучаемыми.

Во втором случае системе задаются правила, по которым она рассчитывает вероятности того или иного исхода в зависимости от появления каждого возможного события. Поэтому после создания экспертную систему следует «обучить»: предъявить ей полный набор

361

возможных событий и сообщить в каждом случае, какой из исходов имел место. Такие экспертные системы будем называть самообучаемыми. Этот принцип самообучения относится к упомянутой выше модели обучения на примерах.

Существует множество вариантов построения экспертных систем. В данном разделе мы будем рассматривать экспертные системы, предназначенные для диагностики сложных технических устройств и систем. Принять решение об исправности узлов, на языке экспертной системы, значит разделить их по категориям исправностинеисправности.

4.4.3. Проблема разделения в самообучаемых экспертных системах

Допустим, мы имеем N категорий объектов, описанных замерами на определенном наборе переменных. Затем предъявляется еще один объект, заданный совокупностью М замеров на том же наборе переменных. Следует определить, к какой из N категорий принадлежит объект.

Если сформулировать эту проблему применительно к задаче технического диагностирования состояния АСУ ТП, то проблема будет выглядеть следующим образом. В системе АСУ ТП имеются датчики, исполнительные механизмы, управляющие узлы и т.д.

Для каждого отдельно взятого узла АСУ ТП определены: замеры параметров системы (напряжение, расход, давление, температура, влажность и т.д.), при которых этот узел находится в категории S1 (например, полностью исправен); замеры параметров системы, при которых этот узел находится в категории S2 (например, для датчика погрешность превышает оптимальную, но остается допустимой); ... ; замеры параметров системы, при которых этот узел находится в категории SN (полной неработоспособности).

Требуется по замеру параметров системы в произвольный момент времени определить, в какую из N категорий попадает данный узел системы.

362

Если N = 2, то требуется просто определить, исправен данный узел или неисправен.

Вообще говоря, поставленная проблема решается только в том случае, если указанные категории линейно сепарабельны. Это значит, что между каждой из категорий можно поместить разделяющую поверхность или ряд поверхностей. Поверхность определяется в терминах, которые легко измерить для данных объектов.

Если категории являются взаимоисключаемыми, т.е. объект в состоянии попасть только в одну из них (например, исправен – неисправен), то объект по результатам замеров помещают в наиболее вероятную категорию. Другими словами, помещают его в такую категорию, для которой значение вероятности р (Н: E) максимально. Здесь гипотеза Н соответствует одной из N категорий, а событие Е – все замеры, которые позволяют отнести объект к этой категории.

Заметим, что математически р (Н: E) является уравнением поверхности, которое в общем виде выглядит следующим образом:

M

 

y = bi xi ,

(4.7)

i=0

где bi – константы; xi – переменные. Это та поверхность, которая «указывает» в направлении конкретной гипотезы Н.

Проблему разделения можно решать двумя способами. Если xi – переменная, которая определяет текущее состояние системы – является дискретной и принимает значение 0 и 1 («да» или «нет»), то можно воспользоваться системой, принимающей решения по максимальной вероятности. Если xi является непрерывной величиной, то можно воспользоваться системой, принимающей решения по наименьшему расстоянию.

4.4.4. Алгоритмы обучения экспертных систем

Изложим теперь алгоритмы обучения экспертной системы в общем виде. Алгоритм обучения для системы, принимающей решения по максимальной вероятности, выглядит следующим образом:

363

1.Провести наблюдения на объекте, который должен быть классифицирован и получить {Х} .

2.Вычислить значение (4.7):

M

y = bi xi

i=0

для каждой категории. На первом шаге все bi для всех категорий и, следовательно, все y равны 0, однако следует сохранить этот этап

ина первом шаге для единообразия алгоритма.

3.Найти такую категорию k, для которой yk имеет наибольшее значение.

4.Если такая категория есть и объект действительно к ней принадлежит, то такая классификация корректна. Перейти к п. 6.

5.Если указанная попытка не удалась, то проводим следую-

щую модификацию: bik = bik + xi для той категории k, куда, согласно классификации, должен был попасть объект; bir = bir + xi для всех категорий r, в которые данный объект не должен был попасть, но для

которых yr yk.

6. Провести очередное наблюдение на объекте и перейти к п. 2. Система считается обученной, если процент правильных классификаций удовлетворяет пользователя либо если новые примеры

для обучения перестают влиять на точность классификации. Алгоритм обучения правил системы, принимающей решения

по наименьшему расстоянию, будет следующим:

1.Провести наблюдения на объекте, который должен быть классифицирован, и получить {Х} .

2.Вычислить значение

y j =

М

 

Midij xi

 

(4.8)

 

 

 

 

 

 

 

 

 

 

x

 

x

 

 

 

 

i=1 i max j

i min j

 

для каждой категории, где Midij – среднее значение для j гипотезы, а хi max j и хi min j – соответственно максимальное и минимальное значение. На первом шаге все средние, максимальные и минимальные

364

значения для всех категорий равны 0 (если не принимают какие-то отличные от 0 значения в соответствии с опытом разработчика) и, следовательно, все yj равны 0, однако этот этап сохраняется и на первом шаге для единообразия алгоритма.

3.Найти такую категорию (гипотезу) k, для которой yk имеет наименьшее значение.

4.Если такая категория есть и объект действительно к ней принадлежит, то такая классификация проведена успешно. Корректировка проводится одинаково как в случае успешной, так и в случае

неуспешной классификации. Нk категория, которая имела место на объекте в данном испытании. Пусть Nk – число корректировок категории Нk (начальное значение Nk равно 1). Тогда

Midik = (Midik Nk + xi )/ (Nk +1),

Nk = Nk +1.

(4.9)

5. Провести очередное наблюдение на объекте и перейти к п. 2. Система считается обученной, если процент правильных классификаций удовлетворяет пользователя либо если новые примеры

для обучения перестают влиять на точность классификации. Рассмотрим подробнее методику обучения экспертной систе-

мы. Для периода обучения можно выделить несколько этапов. На первом этапе определяется набор гипотез технического состояния системы и параметров, основываясь на которых система будет выносить заключение о вероятности той или иной гипотезы. Набору гипотез и параметров следует уделить особое внимание, поскольку в процессе обучения ни то ни другое нельзя изменять. В общем случае будем руководствоваться следующими соображениями. Поскольку мы создаем экспертную систему для диагностики, то в качестве предельного случая следует задать набор гипотез, совпадающих с полным набором всех возможных как однократных, так и кратных неисправностей. Как правило, такой полный перечень гипотез на практике неосуществим, поэтому в качестве оптимального варианта примем набор гипотез, совпадающий с полным набором всех возможных однократных неисправностей блоков системы.

365

При выборе списка параметров, по которым экспертная система будет выносить решение о наличии той или иной неисправности, следует учесть, что для сложной технической системы, особенно при наличии в ней аналоговых узлов, очень трудно заранее предсказать, какие именно параметры дадут экспертной системе возможность составить правильное заключение. Поэтому в список параметров следует вводить возможно большее их количество, при этом желательно в качестве параметров экспертной системы принимать не только значения физических характеристик диагностируемой системы, но и соотношения между ними. Процесс выбора параметров экспертной системы неформализуем, однако именно от него в первую очередь зависит успешный исход всего проекта.

После того как закончен этап выбора гипотез и параметров, следует этап обучения экспертной системы. На этапе обучения система устанавливает для себя правила, которыми она будет руководствоваться в рабочем режиме. Понятно, что при большом количестве гипотез количество наблюдений, которые необходимы системе для выведения правил, неограниченно растет. Для ускорения процесса обучения можно воспользоваться двумя способами.

Первый способ заключается в построении модели, математической или физической, что позволит вводить неисправности не в естественном темпе их появления в системе, а непосредственно одну за другой. Если модель построить не удается, но диагностируемая система позволяет временно выводить себя из рабочего режима и вносить требуемые неисправности, то время обучения также может быть сокращено.

Алгоритм обучения утверждает, что система считается обученной, если процент правильных классификаций удовлетворяет пользователя либо если новые примеры для обучения перестают влиять на точность классификации. Очевидно, что второй вариант является менее желательным, но в этом случае следует определить, какая же вероятность правильного ответа была достигнута.

Для определения момента конца обучения воспользуемся аппаратом математической статистики.

366

Пусть событие А – это правильный ответ экспертной системы. Будем оценивать вероятность p события А по его частоте p* в n независимых опытах. Величина Х будет принимать значение 1, если событие появилось (экспертная система дала правильный ответ), и 0 в противном случае.

Частота события находится по следующей формуле:

n

Xi

p* =

i=1

.

(4.10)

n

 

 

 

В качестве точечной оценки для неизвестной вероятности p разумно принимать частоту p*. При этом возникает вопрос о построении доверительного интервала для вероятности p.

Для вероятности p доверительный интервал Iβ = (p1, p2), где β – вероятность того, что истинная вероятность попадет в указанный интервал.

Выбор формулы для подсчета доверительного интервала зависит от n. Если число опытов не превосходит 100, то p1 и p2 находятся по следующим формулам:

 

 

 

1 t2

 

 

 

 

p* (1p* )

 

1 t2

 

 

 

 

 

 

p* +

 

β

 

t

 

 

 

 

 

 

+

 

 

β

 

 

 

 

 

 

 

 

 

 

 

 

4 n2

 

 

 

 

p1 =

 

 

2 n

 

β

 

 

 

 

n

 

 

;

(4.11)

 

 

 

 

 

 

 

 

 

t2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1+

β

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 t2

 

 

 

 

p* (1p* )

 

1 t2

 

 

 

 

 

 

p* +

 

β

 

+t

 

 

 

 

 

 

+

 

 

β

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4 n2

 

 

 

 

p2 =

 

2 n

 

β

 

 

 

 

n

 

 

,

(4.12)

 

 

 

 

 

 

 

 

t2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1+

β

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где tβ – коэффициент Стьюдента, взятый из таблицы для заданного β. Для больших n (порядка сотен) можно пользоваться следую-

щими формулами:

367

 

 

p

= p* t

 

 

p* (1p* )

,

 

(4.13)

 

 

 

 

 

 

 

 

 

 

1

 

β

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

= p* +t

 

p* (1p* )

 

.

 

(4.14)

 

 

2

 

 

 

 

 

 

 

 

 

β

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приведем значения коэффициентов Стьюдента в зависимости

от заданной вероятности (табл. 4.3).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4.3

 

 

 

 

 

 

 

 

 

 

 

 

 

β

tβ

β

 

 

tβ

 

β

 

 

tβ

β

tβ

0,80

1,282

0,86

 

 

1,475

 

 

 

0,91

1,694

0,97

2,169

0,81

1,310

0,87

 

 

1,513

 

 

 

0,92

1,750

0,98

2,325

0,82

1,340

0,88

 

 

1,554

 

 

 

0,93

1,810

0,99

2,576

0,83

1,371

0,89

 

 

1,597

 

 

 

0,94

1,880

0,9973

3,000

0,84

1,404

0,90

 

 

1,643

 

 

 

0,95

1,960

0,999

3,290

0,85

1,439

 

 

 

 

 

 

 

0,96

2,053

 

 

Из всего вышеприведенного следует общий алгоритм обучения экспертной системы:

1.В качестве исходных данных к проекту задаемся вероятностью правильного ответа экспертной системы и доверительной вероятностью.

2.Определяем набор гипотез и параметров экспертной системы. Если это возможно, строим модель диагностируемой системы.

3.Проводим очередное испытание экспертной системы: предъявляем текущий набор параметров и получаем выбранную экспертной системой гипотезу.

4.В соответствии с методом обучения экспертная система проводит модификацию правил.

5.Увеличивая количество испытаний n на единицу, с учетом общей частоты правильных ответов находим p1 и p2. Если p1 выше за-

368

данной вероятности правильного ответа, считаем, что процесс обучения закончен, если нет, переходим к п. 3. Однако возможно возникновение такой ситуации, когда новые примеры перестали влиять на точность классификации. Это значит, что принятый на этапе 2 набор параметров не является удачным. Следует его расширить, а возможно, и ввести в систему новые датчики, т.е. вернуться к п. 2.

Для улучшения набора параметров логично воспользоваться информацией, накопленной экспертной системой в процессе обучения. Фактически экспертная система формирует таблицу функций неисправностей (табл. 4.4).

 

 

 

 

Таблица 4.4

 

 

 

 

 

Параметр

Н1

Н2

НN

1

р11

р12

 

р1N

2

р21

р22

 

р2N

 

 

 

 

 

 

 

 

 

М

рМ1

рМ2

 

рМN

В этой таблице рij обозначает значение параметра i при наличии гипотезы Нj. Анализ этой таблицы позволит выявить гипотезы, которые экспертная система не в состоянии различить. Для таких гипотез значения столбцов таблицы функций неисправностей будут совпадать. Следовательно, разумно дополнить экспертную систему новыми параметрами, которые помогут снять это совпадение.

Предположим, что процесс обучения экспертной системы завершился успешно и вероятность правильного ответа превышает заданную. Однако мы уже видели, что вероятность правильного ответа все равно никогда не достигнет единицы. Следовательно, в большинстве случаев будет разумно выдавать не одну подозреваемую неисправность, для которой вероятность возникновения наиболее велика, а несколько подозреваемых неисправностей с наибольшими вероятностями.

Таким образом, мы приходим к нечеткому множеству неисправностей N, характеристическая функция А(х) для которых будет

369

представлять собой вероятность того, что на данный момент времени в системе имеется именно данная неисправность, т.е. в нечеткое множество будут входить принятые гипотезы со своими коэффициентами принадлежности к множеству всех возможных гипотез:

N={(H1, p1),(H2 , p2 ),...,(Hk , pk )} .

Всоответствии с математическим аппаратом значения рi должны находиться на интервале (0;1). Покажем, как преобразовать значения гипотез в вероятности для обоих методов построения правил экспертной системой:

1. Для экспертной системы, ориентированной на максималь-

ную вероятность, имеем набор значений yk. В случае если среди полученных значений имеются отрицательные, складываем получен-

ные значения с yk min. Затем делим эти коэффициенты на их общую сумму.

2. Для экспертной системы, принимающей решения на основании выбора по наименьшему расстоянию, методика определения коэффициентов характеристической функции будет иная, поскольку, чем меньше подсчитанное значение гипотезы, тем более она вероят-

на. В соответствии с алгоритмом здесь отрицательные значения yk не могут быть получены.

Далее делим значения для гипотез на сумму значений гипотез:

yk

 

yk = yk .

(4.15)

После этого преобразуем полученные значения по формуле

1yk

 

pi = (1yk ) .

(4.16)

Таким образом, нечеткое множество подозреваемых неисправностей может быть сформировано для обоих вариантов построения экспертной системы.

Поскольку имеется два способа построения решающих правил для экспертной системы, невозможно заранее предсказать, какой из

370