Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Анализ данных.doc
Скачиваний:
144
Добавлен:
10.05.2014
Размер:
2.77 Mб
Скачать

14. Анализ главных компонент. Вычислительная процедура.

Пусть имеется множество, состоящее из Nобъектов. Каждый объект описывается с помощьюnпеременных (признаков, факторов). Совокупность значений переменных сведена в матрицу:

, (10.1)

в которой наблюдения представлены в виде отклонений от выборочных средних, иначе говоря, центрированы, т.е. ,,

где ­– среднее значениеj-й переменной,– результат измеренияj-го признака наi-м объекте.

От исходного вектора признаков

перейдем к новому множеству переменных .

Каждую компоненту вектора zбудем представлять в виде некоторой линейной комбинации исходных признаков, т.е.,j=1,2,…,n, (10.2)

где – вектор искомых весовых коэффициентов.

На компоненты вектора zналожим следующее требование: первая переменнаядолжна быть ориентирована по направлению максимально возможной дисперсии, вторая − по направлению максимально возможной дисперсии в подпространстве, ортогональном первому направлению, и т.д. Компоненты вектораz, удовлетворяющие этому требованию, называютглавными компонентами.

Вычисление главных компонент Вычисление весовых коэффициентов будем проводить последовательно, начиная с первой главной компоненты. Значение первой главной компоненты дляi-го объекта (i=1,2,…,N) составит . (10.3)

Вводя векторное обозначение , выражение (10.3) можно записать в виде. (10.4)

Оценка дисперсии D(z1) центрированной переменнойесть по определению среднее квадрата ее значений. Таким образом,. (10.5)

есть не что иное, как оценка матрицы ковариаций исходных признаков . Эту оценку обозначим. Выражение (10.5) примет вид:. (10.5а)

Вектор параметров необходимо подобрать так, чтобы дисперсияD(z1) была максимальной. Если на параметры не накладывать никаких ограничений, то, очевидно, такая задача не имеет конечного решения. Потребуем, чтобы норма (длина) вектора, равнялась единице:. (10.6)

Для максимизации (10.5а) при ограничении (10.6) воспользуемся методом неопределенных множителей Лагранжа. Определим ,

где – множитель Лагранжа.

Дифференцирование по отдельным элементам векторакомпактно может быть записано так:

. Полагая , получаем. (10.7)

Из (10.7) видно, что – собственный вектор матрицы, соответствующий собственному значению λ1.

Из (10.6) и (10.7) следует, что .

Поскольку максимизируется, в качествевыбирается наибольшее собственное значение матрицы.

При поиске значений элементов вектора , кроме ограничения на норму вектора, аналогичного (10.6), требуется обеспечить ортогональность векторов значений первой и второй главных компоненти. Так как скалярное произведение ортогональных векторов равняется нулю, а матрицасимметричная и, следовательно,, то справедлива следующая цепочка равенств:

.

Поскольку ни (N-1), нинулю не равны, имеем:. (10.8)

Определим функцию Лагранжа следующим образом: ,

где λ2и– множители Лагранжа.

Приравняем нулю частную производную φ по :.

Умножая последнее равенство слева на и принимая во внимание условие нормировки (10.6), получаем:.

Учитывая, что , а также условие (10.8), имеем:.

Следовательно, соотношение (10.8) примет вид ,

где в качестве выбирается второе по величине собственное значение матрицы. Этот процесс продолжается до тех пор, пока не исчерпается список всехnсобственных значений матрицы. Полученные в результатеnсобственных векторов матрицы составят ортогональную матрицу:.

В итоге, значения главных компонент задаются матрицей: .

Ковариационная матрица главных компонент есть .

Введем диагональную матрицу собственных значений

Тогда , и окончательное выражение для ковариационной матрицы главных компонент приобретает вид, посколькув силу ортогональности собственных векторов.

Следовательно, главные компоненты попарно некоррелированы, а их дисперсии совпадают с собственными значениями ковариационной матрицы исходных переменных.

Если ранг матрицы Хменьшеn, то у матрицыбудетkнулевых собственных значений, и изменения в переменныхмогут быть полностью выражены с помощьюn-kнезависимых переменных. При отсутствии нулевых собственных значений некоторыемогут оказаться весьма близкими к нулю, так что существенный вклад в суммарную дисперсию будут вносить первые несколько главных компонент.

Суммарная дисперсия исходных переменных, равная следу матрицы , равняется суммарной дисперсии главных компонент. Действительно,.

Здесь мы воспользовались свойством неизменности следа произведения матриц при перестановке сомножителей, т.е. tr(AB)=tr(BA) (предполагается, что произведениеВАсуществует). Тогда отношения

,,…,,

характеризуют пропорциональный вклад каждого вектора, представляющего главные компоненты, в суммарную дисперсию исходных переменных.

Накопленные отношения

показывают относительную долю в суммарной дисперсии исходных переменных, которая приходится на первые kглавных компонент. Задавшись некоторым порогом, для дальнейшего анализа оставляют те первыеглавных компонент, для которых.

В заключение сделаем два замечания.

1. Переход к главным компонентам наиболее естественен и эффективен, когда исходные признаки имеют общую физическую природу и измерены в одних и тех же единицах. Если это условие не имеет место, то результаты иcследования с помощью главных компонент будут существенно завиcеть от выбора масштаба и природы единиц измерения. В качестве практического средства в таких ситуациях можно рекомендовать переход к вспомогательным безразмерным признакамнормированием исходных признаковпо формулегде– дисперсияi-го признака.

2. Аналитически доказано, что переход от исходного n-мерного пространства кm-мерному пространству главных компонент сопровождается наименьшими искажениями суммы квадратов расстояний между всевозможными парами точек наблюдений, расстояний от точек наблюдений до их общего центра тяжести, а также углов между прямыми, соединяющими всевозможные пары точек наблюдений с их общим центром тяжести