- •42 Двоенко с.Д. Методы анализа бмд
- •2. Основы анализа связей
- •Предположение о природе связи
- •2.2. Нормальное распределение
- •2.3. Корреляционная матрица и ее основные свойства
- •2.4. Собственные векторы и собственные числа корреляционной матрицы
- •2.5. Приведение корреляционной матрицы к диагональной форме
- •2.6. Геометрическая интерпретация главных компонент на плоскости
- •2.7. Модель главных компонент
- •2.8. Приближенное вычисление собственных чисел и векторов корреляционной матрицы
- •Понятие об измерении связи между качественными признаками. Статистический подход
- •2.10. Теоретико-информационный подход
- •2.11. Проблема интерпретации значений коэффициентов связи
2.5. Приведение корреляционной матрицы к диагональной форме
Преобразование корреляционной матрицы к диагональной форме основано на следующем свойстве вещественной (действительной) симметричной матрицы.
Пусть R- невырожденная корреляционная матрица и имеетnразличных собственных чисел. Пусть- соответствующие собственные векторы, выбранные из пар собственных векторов, соответствующих каждому собственному числу, составляющие ортонормированный базис вn-мерном пространстве. Пусть- матрица, столбцами которой являются собственные векторыai. Рассмотрим матрицу
где E- единичная матрица. Следовательно, матрицаAявляется ортогональной.
Напомним, что некоторая матрица Aортогональна, если. По уравнениюполучим, где столбцами матрицы в правой части являются векторы. Учитывая, что векторыaiортогональны, получим
.
Матрица ортогональна, и ее диагональные элементы являются собственными числами. Из условияследуети, так как.
Следовательно, невырожденная корреляционная матрица Rможет быть приведена к диагональной форме путем ортогонального преобразования.
Пусть - некоторый вектор, заданный своими проекциями на осях координат. Рассмотрим вектор, где, а строками матрицыявляются собственные векторыaiTлинейного преобразованияR. Тогда
Следовательно, компонента yi вектораy - это скалярное произведение собственного вектораai и вектораx. С другой стороны, скалярное произведение - это произведение модулей векторовai иx на косинус угла между ними. Так как, то это есть произведениена косинус угла междуai иx - проекция вектораxнаai. Поэтому векторxпредставлен своими проекциямиyiна ортонормированный базис собственных векторов корреляционной матрицыR. Можно считать, что новый базисобразует новоеn-мерное пространство признаков, принимающих свои значения наNобъектах.
Значения nпризнаковYi, как бы измеренных наNобъектах, образуют новую матрицу данных, полученную из матрицыXортогональным преобразованиемA:
.
Корреляционная матрица R, вычисленная по матрицеX, представляет собой матрицу
Вычислим среднее признака Yj
,
так как матрица Xстандартизована. Вычислим величину
Тогда матрица является ковариационной матрицей, вычисленной по матрицеY. Диагональная структура матрицыпоказывает, как и следовало ожидать, независимость признаков. Собственные числаiявляются дисперсиями этих признаков, то есть. Если разделить значения компонент каждого признакаYiна величину, то матрицаYбудет приведена к стандартизованному виду. Тогда преобразованиедаст стандартизованную матрицу данныхY с единичной корреляционной матрицей:
2.6. Геометрическая интерпретация главных компонент на плоскости
Пусть в соответствии со статистической гипотезой порождения матрицы данных X вn-мерном пространстве признаков существует многомерное нормальное распределение с плотностью вероятности. Для стандартизованной матрицыXмы полагаем, что
.
Проведем ортогональное преобразование матрицы данных Xв новую матрицу данных, гдеA- матрица, столбцами которой являются собственные векторы корреляционной матрицыR. Тем самым мы перешли в новое признаковое пространство, образованное ортонормированным базисом линейного преобразованияR. Очевидно, что в новом признаковом пространстве задано нормальное распределение с плотностью вероятности
.
Так как то
,
;.
Тогда .
Пусть n = 2, тогда двухмерное нормальное распределение имеет вид
.
Рассмотрим уравнение . Из курса аналитической геометрии известно, что это уравнение линии второго порядка. При заданномpи найденныхданная линия является линией постоянного значения плотности вероятности. Преобразуем данное уравнение линии второго порядка к каноническому виду. Так как, то данное уравнение является каноническим уравнением эллипса в системе координат, образованной собственными векторами, которые соответствуют собственным числам.
Если r>0, тои система главных компонентy10y2повернута на 450относительно исходной системы координатx10x2. Еслиr<0, тои система главных компонентy10y2повернута на 1350 относительноx10x2.
Если r=0, то. Тогда уравнение эллипса представляет собой уравнение окружностирадиуса. В этом случае система главных компонентy10y2может быть ориентирована в любом направлении, то есть любое направление является главным для такого линейного преобразованияR. Еслиr=1, то. Тогда уравнение эллипса для линии постоянного значения плотности вероятности вырождается в уравнение для двух точек, расположенных на оси 0y1, вида(рис. 2.1).
Рис.2.1. Главные компоненты
Определим уравнение максимального эллипса в соответствии с правилом “трех сигм”, согласно которому 99.73% всех наблюдений сосредоточено внутри него.
Согласно свойствам канонического уравнения эллипса его главная ось совпадает с направлением первой главной компоненты 0y1. Длина главной полуоси составляет величину. В то же время максимальное положительное случайное отклонение величиныy1на оси 0y1от центра координат с вероятностью 0.9973 не превышает величины. Следовательно,, откудаp=9.
Проведя те же рассуждения для второй оси максимального эллипса, получим, что уравнение имеет вид и описывает линию постоянного значения плотности вероятности на уровне
.
Так как длина главной полуоси равна , то при увеличении значенияrдлина главной полуоси увеличивется. В то же время длина второй полуоси эллипсауменьшается при увеличенииr. Следовательно, чем сильнее связаны признакиX1иX2корреляционной зависимостью, тем больше дисперсияпризнакаY1и меньше дисперсияпризнакаY2при неизменной суммарной дисперсии.