Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4ПМ_Б_Комп_Модел_Власова / Теоретический материал / Компютерное моделирование_Лекции.doc
Скачиваний:
93
Добавлен:
28.03.2016
Размер:
1.95 Mб
Скачать

7.2. Алгоритм метода главных компонент

Как было сказано в п.7.1., решение задачи методом главных компонент сводится к поэтапному преобразованию матрицы исходных данных X( см. рисунок 7.1.1, а),б), в)).

Пусть X– матрица исходных данных размерностьюn*m(n– число объектов наблюдения, m– число элементарных аналитических признаков);

Z– матрица центрированных и нормированных значений признаков, Элементы матрицы вычисляют по формуле:

; (7.2.1)

R– матрица парных корреляций:

R = (1/n)*Z’*Z. (7.2.2.)

Рис. 7.2.1 Схема математических преобразований

Если предварительная стандартизация данных не проводилась, то на данном шаге получают матрицу

S = (1/n)*X’*X, (7.2.3)

При этом элементы матрицы Xдля расчета будут центрированными величинами.

Опишем дальнейшие шаги вычислений для метода главных компонент и математический смысл полученных результатов.

Обозначим черезΛдиагональную матрицу собственных (характеристических) чисел.

(7.2.4.)

Множество решений λjнайдем из характеристического уравнения (7.2.5)

|R - λE| =0, (7.2.5)

здесь Λ - характеристики вариации, или показатели дисперсии каждой главной компоненты.

Суммарное значение Σλjравно сумме дисперсий элементарных признаковXj. При условии стандартизации исходных данных, эта сумма равна числу элементарных признаковm.

Решение характеристического уравнения относительно λ, когда число признаковmдостаточно велико и матрицаR большой размерности, вызывает трудности при расчете определителя|R|.Они успешно преодолеваются с применением различных методов матричной алгебры.

Наиболее эффективен и легко поддается алгоритмизации метод Фадеева, который базируется на рекуррентных соотношениях. Если А - некоторая симметрическая матрица размерностьюm x m, то её определитель находится по следу матриц, производных изА:

А1 = А | P1=trA1 | B1=A1- P1E

A2 = AB1 | P2=(1/)2trA2 | B2 =A2-P2E

……………… | ……………………... | ………………

| |

Am-1=ABm-1 | Pm-1= (1/(m-1)) trAm-1 | Bm-1 = Am-1 – Pm-1E

Am = ABm-1 | Pm = (1/m)trAm | Bm = Am- PmE, Bm=0

На заключительном этапе расчетов Pmесть определитель матрицыA(Pm= |A|). Для проверки вычислений используется условие:Bm = 0.

После вычислений рекуррентных соотношений записывается характеристический многочлен:

Pm (λ)= λmP1λm-1 P2λm-2 - …-Pm (7.2.6)

Приравняем характеристический многочлен к нулю и найдем корни λj этого уравнения.

Обозначим через Vматрицу нормированных собственных векторов. Число векторовVj первоначально равно m, т.е. j = 1, 2, 3, …, m.ПолучаютVj преобразованием ненормированных собственных векторовU:

Vj =Uj/|Uj| , (7.2.7)

где |Uj| - норма вектора U , т.е.|Uj| = (u1j2+u2j2+…+umj2)1/2

Необходимость повторного нормирования пространства обобщенных признаковRF объясняется механическим появлением в ходе расчетов результатов, искажающих нормированное пространство. В свою очередь собственные векторыUjнаходят из матричного уравнения:

(R- λE)U = 0 , (7.2.8.)

Реально это означает решение mсистем линейных уравнений для каждогоλjприj = 1..m. В общем виде система имеет вид:

(7.2.9)

Приведенная система объединяет однородные линейные уравнения, и так как число ее уравнений равно числу неизвестных, она имеет бесконечное множество решений. Конкретные значения собственных векторов при этом можно найти, задавая произвольно , по крайней мере, величину одной компоненты каждого вектора.

A– матрица факторного отображения, ее элементыarj– весовые коэффициенты. ВначалеAимеет размерностьm*m– по числу элементарных признаковXj, затем в анализе остаетсяr наиболее значимых компонент,rm. Вычисляют матрицуAпо известным данным матрицы собственных чиселΛи нормированных собственных векторовVпо формуле

A = 1/2. (7.1.6)

F– матрица значений главных компонент размерностьюr*n,F = A-1ZилиF=λ-1AZилиF= Λ-1/2 VZ.

Эта матрица в общем виде записывается:

(7.2.10)