Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Самарский национальный исследовательский университет им. ак. С.П. Королёва (бывш. СГАУ, СамГУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

4ПМ_Б_Комп_Модел_Власова / Теоретический материал / Компютерное моделирование_Лекции.doc

Скачиваний:

Добавлен:

28.03.2016

Размер:

1.95 Mб

Скачать

☆

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 2223 / 2823 24 25 26 27 28 > Следующая >>>

7.2. Алгоритм метода главных компонент

Как было сказано в п.7.1., решение задачи методом главных компонент сводится к поэтапному преобразованию матрицы исходных данных X( см. рисунок 7.1.1, а),б), в)).

Пусть X– матрица исходных данных размерностьюn*m(n– число объектов наблюдения, m– число элементарных аналитических признаков);

Z– матрица центрированных и нормированных значений признаков, Элементы матрицы вычисляют по формуле:

; (7.2.1)

R– матрица парных корреляций:

R = (1/n)*Z’*Z. (7.2.2.)

Рис. 7.2.1 Схема математических преобразований

Если предварительная стандартизация данных не проводилась, то на данном шаге получают матрицу

S = (1/n)*X’*X, (7.2.3)

При этом элементы матрицы Xдля расчета будут центрированными величинами.

Опишем дальнейшие шаги вычислений для метода главных компонент и математический смысл полученных результатов.

Обозначим черезΛдиагональную матрицу собственных (характеристических) чисел.

(7.2.4.)

Множество решений λ_jнайдем из характеристического уравнения (7.2.5)

|R - λE| =0, (7.2.5)

здесь Λ- характеристики вариации, или показатели дисперсии каждой главной компоненты.

Суммарное значение Σλ_jравно сумме дисперсий элементарных признаковX_j. При условии стандартизации исходных данных, эта сумма равна числу элементарных признаковm.

Решение характеристического уравнения относительно λ, когда число признаковmдостаточно велико и матрицаR большой размерности, вызывает трудности при расчете определителя|R|.Они успешно преодолеваются с применением различных методов матричной алгебры.

Наиболее эффективен и легко поддается алгоритмизации метод Фадеева, который базируется на рекуррентных соотношениях. Если А - некоторая симметрическая матрица размерностьюm x m, то её определитель находится по следу матриц, производных изА:

А₁ = А | P₁=trA₁ | B₁=A₁- P₁E

A₂ = AB₁ | P₂=(1/)2trA₂ | B₂ =A₂-P₂E

……………… | ……………………... | ………………

| |

A_m-1=AB_m-1| P_m-1= (1/(m-1)) trA_m-1| B_m-1= A_m-1– P_m-1E

A_m = AB_m-1 | P_m = (1/m)trA_m | B_m = A_m- P_mE, B_m=0

На заключительном этапе расчетов Pmесть определитель матрицыA(Pm= |A|). Для проверки вычислений используется условие:B_m = 0.

После вычислений рекуррентных соотношений записывается характеристический многочлен:

P_m (λ)= λ^m – P1λ^m^-1– P2λ^m^-2 - …-P_m (7.2.6)

Приравняем характеристический многочлен к нулю и найдем корни λ_j этого уравнения.

Обозначим через Vматрицу нормированных собственных векторов. Число векторовV_j первоначально равно m, т.е. j = 1, 2, 3, …, m.ПолучаютV_jпреобразованием ненормированных собственных векторовU:

V_j =U_j/|U_j| , (7.2.7)

где |U_j| - норма вектора U , т.е.|U_j| = (u₁_j²+u₂_j²+…+u_mj²)^1/2

Необходимость повторного нормирования пространства обобщенных признаковR^Fобъясняется механическим появлением в ходе расчетов результатов, искажающих нормированное пространство. В свою очередь собственные векторыU_jнаходят из матричного уравнения:

(R- λE)U = 0 , (7.2.8.)

Реально это означает решение mсистем линейных уравнений для каждогоλ_jприj = 1..m. В общем виде система имеет вид:

(7.2.9)

Приведенная система объединяет однородные линейные уравнения, и так как число ее уравнений равно числу неизвестных, она имеет бесконечное множество решений. Конкретные значения собственных векторов при этом можно найти, задавая произвольно , по крайней мере, величину одной компоненты каждого вектора.

A– матрица факторного отображения, ее элементыa_rj– весовые коэффициенты. ВначалеAимеет размерностьm*m– по числу элементарных признаковX_j, затем в анализе остаетсяr наиболее значимых компонент,r ≤ m. Вычисляют матрицуAпо известным данным матрицы собственных чиселΛи нормированных собственных векторовVпо формуле

A = VΛ^1/2. (7.1.6)

F– матрица значений главных компонент размерностьюr*n,F = A^-1Z’ илиF=λ^-1A’Z’ илиF= Λ^-1/2V’Z’.

Эта матрица в общем виде записывается:

(7.2.10)

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 2223 / 2823 24 25 26 27 28 > Следующая >>>