Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Дискриминантный анализ / THEO_DIS.DOC

Скачиваний:

Добавлен:

01.05.2014

Размер:

389.12 Кб

Скачать

☆

1 / 31 2 3 > Следующая >>>

Краткий обзор дискриминантного анализа.

Задача классификации состоит в отнесении некоторого элемента выборки w к одной из k групп W1, W2, ... , Wk на основе измерения р параметров х1,..., хр.

Классификация в случае многомерных нормальных выборок с известными параметрами.

Стандартная процедура классификации для случая р непрерывных переменных предполагает, что наблюдения принадлежат одной из двух групп, имеющих многомерные нормальные распределения. Наблюдения х₁, х₂ ,..., x_p записываются в виде вектора

X = ( x₁, ... , x_p )^T

и предполагается, что W₁ имеет распределение:

W₂ - распределение:

Другое предположение состоит в том, что

i=1,..p ; j=1..p

Итак, вектор X имеет распределение:

или

Параметры m₁,m₂,e вначале будут считаться заданными. Найдем линейную комбинацию наблюдений, называемую дискриминантной функцией, имеющую вид:

z=a₁*x₁ + ... + a_p*x_p , (1)

где a₁ , ... , a_p- некоторые постоянные, и отнести X к W1, если z>=c и к W2 , если z<c ,

где с - постоянная.

Тогда задача будет сведена к определению значений a₁ , ... , a_p и с , минимизирующих вероятность ошибочной классификации.

Если наблюдение X поступило из W1 , то величина z имеет нормальное распределение со средним

и дисперсией

Аналогично для X из W2 величина z имеет нормальное распределение со средним

и с той же дисперсией. Имеет смысл выбрать такие a₁ , ... , a_p , при которых V1 , V2 были бы как можно больше удалены друг от друга относительно s_z² . Для этого введем расстояние Махаланобиса

Эта величина была предложена в работе Mahalanobis(1936) для измерения “расстояния” между двумя группами. Таким образом требуется найти коэффициенты a₁ , ... , a_p , максимизирующие D² . В работе Fisher(1936) показано, что такие a_i служат решением системы линейных уравнений

a₁*s₁₁ + a₂*s₁₂+ ... + a_p*s_1p = m_1
1- m₂₁

a₁*s₂₁ + a₂*s₂₂+ ... + a_p*s_2p= m_1
2- m₂₂

...

a₁*s_p1 + a₂*s_p2+ ... + a_p*s_pp= m_1
p- m_2p

После подстановки полученных a_i в (1) каждому объекту ставится в соответствие значение дискриминантной функции z.

Для определения постоянной с следует рассмотреть вероятности ошибок Pr(1|2) и Pr(2|1). Естественно искать такую постоянную с , чтобы сумма вероятностей Pr(1|2)+Pr(2|1) была минимальной. Это можно достигнуть выбором постоянной с , равноудаленой от средних,

т. е.

Приведем теперь более строгое решение задачи классификации, основанное на теореме Байеса. Определим вначале априорную вероятность q_iкак вероятность того, что элемент выборки принадлежит к группе Wi, i=1,2. Сумма априорных вероятностей q₁+q₂равна 1.

Определим далее условную вероятность Pr(x|Wi) получения некоторого вектора наблюдений X , если известно, что объект принадлежит группе Wi. Обозначим также через Pr(Wi|X) условную вероятность того, что объект принадлежит группе Wi при данном векторе наблюдений X. Эта величина называется апостериорной вероятностью.

Теорема Байеса. Равенство

справедливо для любого распределения величин X.

Если X имеет многомерное нормальное распределение

или

, то Pr(X|W1) и Pr(X|W2) можно заменить соответственно на плотности распределений f1(X) и f2(X). В результате получим

i=1,2. (2)

Байесовская процедура классификации состоит в отнесении вектора наблюдений X к W1,если Pr(W1|X) >= Pr(W2|X) , и к W2 , если Pr(W1|X) < Pr(W2|X).

Подставляя в эти неравенства значения апостериорных вероятностей из (2) получаем,

что X относится к группе W1 , если

и к W2 , если

Такая процедура минимизирует ожидаемую вероятность ошибочной классификации

q₁Pr(2|1)+q₂Pr(1|2).

Заметим , что эта величина является вероятностью того , что объект , принадлежащий группе W1 , ошибочно классифицируется , как принадлежащий W2 , или наоборот объект из W2 ошибочно относится к W1.

Алгебраическими преобразованиями неравенства (3) можно показать , что байесовская процедура эквивалентна отнесению X к W1 , если

и к W2 , если

Постоянные a_i являются решениями системы уравнений (1) , а V1 , V2 заданы выше.

Введем в байесовскую процедуру понятие стоимости ошибочной классификации . Для этого введем величину C(2|1) - стоимость потери из-за отнесения объекта из W1 к W2 . Аналогично, C(1|2) - стоимость потери из-за отнесения W2 к W1.

Обобщенная процедура классификации Байеса состоит в отнесении X к W1 , если

1 / 31 2 3 > Следующая >>>

Соседние файлы в папке Дискриминантный анализ

#
01.05.201410.28 Mб46DIALOG_D.DOC
#
01.05.201452.22 Кб46OVERVIEW.DOC
#
01.05.201437.89 Кб43STURTUP.DOC
#
01.05.2014389.12 Кб46THEO_DIS.DOC