Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Классификация / glava4 / FOKINA / 1 / 1.DOC

Скачиваний:

Добавлен:

01.05.2014

Размер:

1.52 Mб

Скачать

☆

<<< < Предыдущая 12 / 72 3 4 5 6 7 > Следующая >>>

1. Определение главных компонент

Будем предполагать, что исследуемые наблюдения X₁, Х₂, ..., ,... Х_n извлечены из некоторой р-мерной генеральной совокупности (т.е. совокупности всех мыслимых наблюдений), определяемой соответствующей вероятностной мерой. Однако для приводимых здесь понятий из всех характеристик исследуемой генеральной совокупности существенное значение имеет лишь ковариационная матрица , где

Здесь a⁽ⁱ⁾ компоненты вектора a средних значений признаков x⁽ⁱ⁾. Поскольку, как легко видеть, элементы , матрицы не изменятся при замене признаков x⁽ⁱ⁾ признаками (— произвольные постоянные числа), то будем в дальнейшем считать, что вектор средних значенийа = 0, чего всегда можно добиться, рассматривая в качестве исходных признаков x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾ не сами измерения (v = 1, 2, ..., п), а их отклонения от своих выборочных средних значений, т.е. полагая

где (4.1)

Назовем первой главной компонентой исследуемой генеральной совокупности наблюдений такую нормированную линейную комбинацию p исходных признаков x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾,

(4.2)

(здесь , причем ), которая среди всех прочих нормированных линейных комбинаций x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾ обладает наибольшей дисперсией.

И вообще, i-й главной компонентой исследуемой генеральной совокупности (i = 2,3, ..., р) будем называть такую нормированную линейную комбинацию р исходных признаков x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾,

(4.3)

которая среди всех прочих линейных нормированных комбинаций, некоррелированных со всеми предшествующими главными компонентами y⁽¹⁾, y⁽²⁾, …,y⁽^I^-1) (т.е. cov (y⁽ⁱ⁾, y⁽^j⁾) = M(y⁽ⁱ⁾y⁽^j⁾)) = 0 для j<i), обладает наибольшей дисперсией.

Из определения следует, что, во-первых, главные компоненты y⁽¹⁾, y⁽²⁾, …,y⁽^p⁾ занумерованы в порядке убывания их дисперсий, т.е. D y⁽¹⁾ D y⁽²⁾ … D y⁽^p⁾, причем легко подсчитать

(4.4)

и, во-вторых, вектор, определяющий преобразование перехода от x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾к y⁽ⁱ⁾ является так называемым i-м собственным вектором ковариационной матрицы , т.е. его компоненты l_i₁,l_i₂,…,l_i_pопределяются как нормированное решение системы уравнений

(4.5)

где — i-й по величине корень уравнения

(4.6)

Под подразумевается определитель матрицы М, под I—так называемая единичная матрица, а под  — неизвестное число. Из сопоставления (4.4), (4.5) и (4.6) вытекает, что

(4.7)

Таким образом, ковариационная матрица _Y главных компонент y⁽¹⁾, y⁽²⁾, …,y⁽^p⁾ будет иметь вид

(4.8)

Опираясь на то, что преобразование

с помощью которого осуществляется переход от исходных компонент Х к главным компонентам У (Y = LX), является ортогональным, нетрудно выразить исходные переменные x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾через главные компоненты

(4.9)

(в матричной записи Х = L'Y), а также показать, что обобщенная дисперсия и сумма дисперсий (Dy⁽¹⁾+ D y⁽²⁾ + … + D y⁽^p⁾) главных компонент равны обобщенной дисперсии и сумме дисперсий (Dx⁽¹⁾+ D x⁽²⁾ + … + D x⁽^p⁾) исходных признаков.

Это дает исследователю некоторую основу, опорную точку зрения, при вынесении решения о том, сколько последних главных компонент можно без особого ущерба изъять из рассмотрения, сократив тем самым размерность исследуемого пространства.

Действительно, анализируя изменение относительной доли дисперсии

(4.10)

, вносимой первыми р' главными компонентами, в зависимости от числа этих компонент, можно разумно определить число компонент, которое целесообразно оставить в рассмотрении- Так, при изменении q (р'"), изображенном на рис. 4.2, очевидно целесообразно было бы сократить размерность пространства с р = 10 до р' = 3, так как добавление всех остальных семи главных компонент может повысить суммарную характеристику рассеяния не более чем на 10%.

Рис. 4.2. Изменение относительной доли суммарной дисперсии исследуемых признаков, обусловленной первыми p’ главными компонентами, в зависимости отр’(случайр=10)

Замечание 1. В реальных задачах точное знание ковариационной матрицы  является скорее исключением, чем правилом. Поэтому в тех случаях, когда  неизвестна, данное выше определение следует использовать применительно к выборочной ковариационной матрице , элементы которой _ij подсчитываются на основании имеющихся у нас наблюдений по формуле

, (4.11)

в которой — значение i-й компоненты исследуемого вектора X, замеренное на v-м объекте, — соответствующее центрированное наблюдение, а — среднее значение i-ой компоненты по всем обследованным объектам, т.е. .

Главные компоненты, вычисленные на основании элементов _ij, выборочной матрицы , называют обычно выборочными главными компонентами, или главными компонентами выборки, в отличие от главных компонент генеральной совокупности. В тех случаях, когда нам важно будет отличать главные компоненты выборки от главных компонент генеральной совокупности, мы будем снабжать первые (и все их характеристики) «крышками» сверху, например, и т. д.

Замечание 2. Использование главных компонент оказывается наиболее естественным и плодотворным в ситуациях, в которых все компоненты x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾ исследуемого вектора Х имеют общую физическую природу и соответственно измерены в одних и тех же единицах. К таким примерам можно отнести исследование структуры бюджета времени индивидуумов (все x⁽ⁱ⁾ измеряются в единицах времени), исследование структуры потребления семей (все x⁽ⁱ⁾ измеряются в денежных единицах), исследование общего развития и умственных способностей индивидуумов с помощью специальных тестов (все x⁽ⁱ⁾измеряются в баллах), разного рода антропологические исследования индивидуумов (все x⁽ⁱ⁾ измеряются в единицах меры длины) и т.д. Если же различные признаки x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾ измеряются в различных единицах, то результаты исследования с помощью главных компонент будут существенно зависеть от выбора масштаба и природы единиц измерения. Поэтому в подобных ситуациях исследователь предварительно переходит к вспомогательным безразмерным признакам x^*(ⁱ⁾, например, с помощью нормирующего преобразования

, (4.12)

где _ii соответствует обозначениям формул (4.1) и (4.11), а затем строит главные компоненты относительно этих вспомогательных признаков X* и их ковариационной матрицы _X, которая, как легко видеть, является одновременно выборочной корреляционной матрицей R исходных наблюдений Х.

Замечание З. В некоторых задачах оказывается полезным понятие так называемых обобщенных главных компонент, при определении которых оговаривают более общие (чем ) ограничения на коэффициенты l_ij, т. е. требуют, чтобы

где _ij— некоторые дополнительно введенные веса. Очевидно, при _kj = 1 при k =j и _kj = 0 при мы имеем обычное условие нормировки коэффициентов l_ij и обычные главные компоненты. Можно показать[29], что при такой модификации условий нормировки коэффициенты , с помощью которых обобщенные главные компоненты у⁽ⁱ⁾ выражаются через исходные признаки x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾ (4.1 и 4.2), определяются как решения уравнений

(4.5')

где — i-й по величине корень уравнения

(4.6')

а матрица  = (_ij), i, j = 1,2, ..., р, — некоторая положительно определенная матрица весов. При этом, как и прежде, дисперсия обобщенной главной компоненты у⁽ⁱ⁾равна , a у⁽ⁱ⁾и у⁽^j⁾ при i j взаимно некоррелированы.

Заметим, кстати, что если в качестве матрицы весов выбрать матрицу

то как легко показать, обобщенные компоненты (в метрике ), построенные по исходным признакам x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾ совпадут с обычными компонентами, построенными по вспомогательным безразмерным (нормированным) признакам x⁽¹⁾, x⁽²⁾, …,x⁽^p⁾ (4.12),

Проиллюстрируем определение главных компонент на численном примере, заимствованном из [26].

Пример 1. По данным измерений (в мм) длины (), ширины () и высоты () панциря 24 особей (п = 24) одного из видов черепах по формуле (4.11) определена выборочная ковариационная матрица

Решая, в соответствии с (4.6), кубичное уравнение (относительно ) вида

находим

₁=680,40; ₂=6,50; ₃=2,86.

Подставляя последовательно численные значения ₁, ₂ и ₃ в систему (4.5) и решая эти системы относительно неизвестных l_i = (l_i₁, l_i₂, l_i₃)' (i = 1, 2, 3), получаем

В качестве главных компонент получаем

y⁽¹⁾=0,81x⁽¹⁾+0,50x⁽²⁾+0,31x⁽³⁾,

y⁽²⁾=0,55x⁽¹⁾+0,83x⁽²⁾+0,10x⁽³⁾,

y⁽²⁾=0,21x⁽¹⁾+0,25x⁽²⁾+0,95x⁽³⁾.

Здесь под x⁽¹⁾, x⁽²⁾ и x⁽³⁾подразумеваются в соответствии с (4.1) отклонения размеров длины (), ширины () и высоты () панциря от своих средних значений.

Вычисление относительной доли суммарной дисперсии, обусловленной одной, двумя и тремя главными компонентами, в соответствии с формулой (4.10) дает

Отсюда можно сделать вывод, что почти вся информация о специфике размеров панциря данного вида черепах содержится в одной лишь первой главной компоненте, которую и естественно использовать при соответствующей классификации исследуемых особей.

<<< < Предыдущая 12 / 72 3 4 5 6 7 > Следующая >>>