Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТПР. Всё в 1 файле / Прикладные Инст сист.pdf
Скачиваний:
299
Добавлен:
15.09.2014
Размер:
1.43 Mб
Скачать

m

 

 

 

 

 

 

 

 

 

где Р (х0) = P(Ωi )P(x0

 

Ωi ) .

 

 

 

i=1

 

 

 

 

 

 

 

 

 

Условные риски, связанные с решениями ω Ω1и ω Ω2 , равны соответственно

R ( Ω |х0) = s12Р ( Ω

2

|х0); R ( Ω

2

|х0) = s21Р ( Ω |х0).

(7.4)

1

 

 

 

 

 

1

 

Байесовская стратегия решает задачу с минимальным условным риском. Это значит,

что предпочтение решению ω Ω1 следует отдавать тогда и только тогда, когда

 

R ( Ω | х0) / R ( Ω

2

| х0) < 1.

 

 

(7.5)

1

 

 

 

 

 

 

 

 

Подставим в это выражение значения условных рисков, определенных в (7.4). Тогда неравенство

s21 Р ( Ω1| х0) > s12 Р ( Ω2 | х0) или Р ( Ω1| х0) / Р ( Ω2 | х0) > s12 / s21

определяет, в каких условиях необходимо принять решение о том, что ω Ω1.

При практическом применении правила (7.5) априорные вероятности P ( Ωi ) задаются на основании статистических сведений, архивных данных, литературных источников, а условные вероятности Р (х| Ωi ) оцениваются по результатам наблюдений:

P (x1,…, x p | Ωi ) = Р (x1| Ωi ) Р (x2| Ωi ,x1)· ··· ·Р ( x p | Ωi , x1,…, x p1 ).

При оценке Р (х| Ωi ) довольно часто используется предположение о том, что события, состоящие в появлении у объекта тех или иных значений рассматриваемых признаков, статистически независимы. Тогда Р (х| Ωi ) можно выразить через условные вероятности появления отдельных значений признаков в классе Ωi :

Р (х| Ωi ) = P(x j | Ωi ).

j

7.2. Принятие решения с помощью последовательной процедуры Вальда

В большинстве методов классификации предполагается, что решение о принадлежности классифицируемого объекта ω классу Ωi , i = 1, …, m, принимается после измерения всех признаков объекта x j , j = 1, …, р.

Однако возможен другой подход к решению этой задачи: после измерения каждого очередного признака х1; х1, х2; х1, х2, х3 и т.д. решается задача классификации на основании измеренных к текущему моменту признаков неизвестного объекта. При этом в зависимости от результатов сравнения полученного решения с некоторой установленной заранее границей либо измеряется очередной признак объекта, либо прекращается накопление информации об этом объекте. Такая процедура классификации называется

последовательной процедурой Вальда [1].

Пусть fik (x1, …, xk ) – известная функция плотности вероятностей k-мерной случайной переменной X = (x1, …, xk ), значения которой можно наблюдать на объектах,

принадлежащих классу Ωi , i = 1, 2,…, m, k = 1, 2, …, р. Определим λ(ijk) (х) как отношение

плотностей вероятностей:

λ(ijk) (х) = fik (х) / f jk (х), i, j = 1, 2,…, m, j i, k = 1, 2, …, р, λ(ij0) (х) = 1, i, j = 1, 2,…, m, j i.

40

Предположим, что требуется установить его принадлежность объекта к одному из двух возможных классов Ω1 и Ω2 . На основании последовательного теста Вальда сформулируем

решающее правило:

объект относится к классу Ω1, если

A <

λ(k) (х0) < В, для k = 0, 1, 2, …, n–1,

(7.6)

 

12

 

а для k = п

 

λ(n)

(х0) В, п р;

(7.7)

12

 

 

объект относится к классу Ω2 , если для k = 0, 1,…, n–1 выполняется соотношение

(7.6), а для k = п

λ(n)

(х0) A, п р.

(7.8)

12

 

 

 

 

Пусть

P(n)

– вероятность ошибочной классификации

(на основании первых п

 

 

ij

 

 

компонент вектора х) наблюдаемого объекта в класс Ωj , если он в действительности принадлежит классу Ωi ( i, j = 1, 2). Выбираем А и В таким образом, чтобы для данного п

P12(n) = α и P21(n) = β (α и β – соответственно вероятности ошибок 1- и 2-го рода). Тогда

пороговые значения А и В будут равны:

А = α / (1 – β ), В = (1 – α) / β. (7.9)

В практике анализа данных последовательная процедура организуется следующим образом. Необходимо классифицировать объект, характеризуемый р признаками. Рассмотрим случай двух классов (т = 2). По формуле Байеса (7.3) вычисляем апостериорные

вероятности

Р ( Ωi | x1,…, x p ) принадлежности объекта

классу

Ωi ,

i = 1, 2.

Найдем

отношение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(Ω1

| x1,…, xp )

 

P(Ω )

 

P(x | Ω )

 

P(x

2

| Ω , x )

 

 

P(xp | Ω1, x1,…, xp 1)

 

 

 

 

 

 

=

 

1

 

 

1

1

 

 

 

 

1

 

1

...

 

 

 

 

 

 

 

 

.

 

P(Ω

2

| x ,…, x

p

)

P(Ω

2

)

P(x | Ω

2

)

P(x

2

| Ω

2

, x )

 

P(x

p

| Ω

2

, x ,…, x

p 1

)

 

 

1

 

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

1

 

 

Сначала анализируется признак x1 (k = 1). Предположим, что для класса Ω1 признак x1 имеет частоту встречаемости Р (x1| Ω1 ), для класса Ω2 – соответственно Р (x1| Ω2 ). Если установлено, что признак x1 в классе Ω1 встречается значительно чаще, чем в классе Ω2 , то можно сделать вывод в пользу класса Ω1 .

Решающее правило:

объект принадлежит классу Ω1 , если

P(x1 | Ω1) В, P(x1 | Ω2 )

где В – верхняя граница, необходимая для принятия решения. Значение B определяется по формуле (7.9).

Впротивоположном случае, когда признак x1 значительно чаще встречается в классе

Ω2 , принимается следующее решение:

объект принадлежит классу Ω2 , если

P(x1 | Ω1) А, P(x1 | Ω2 )

41