Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет им. М.В. Ломоносова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ЧастьII.doc

Скачиваний:

Добавлен:

27.09.2019

Размер:

1.01 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 75 6 7 > Следующая >>>

§2.5. Геометрическая интерпретация и оптимальные свойства главных компонент

Всякий переход к меньшему числу переменных осуществляется с помощью линейного преобразования и взятия p’ новых переменных.

Такой переход можно рассматривать как проекцию исходных наблюдений в пространство размерности , натянутое на координатные оси , где

, - аналитическая форма записи

, - матричная форма записи

Пример:

Рассмотрим двумерное нормальное распределение с параметрами ,

Тогда показатели экспоненты для плотности:

Здесь мы производим преобразование координат путем поворота осей координат:

( и распределены нормально, но независимо. Чем больше (ближе к 1), тем теснее группируются наблюдения возле оси ).

(если , то новая переменная , следовательно, мы перешли к некоррелируемым компонентам. После такого преобразования _, имеют двумерное нормальное распределение, но являются независимыми.

§2.5.1 Свойство наименьшей ошибки «автопрогноза» или наилучшей самовоспроизводимости

Можно показать, что с помощью первых главных компонент ,…, , исходных признаков ,…, достигается наилучший прогноз этих признаков среди всех прогнозов, которые можно построить с помощью линейных комбинаций исходных признаков.

В нашей ситуации мы хотим заменить исследуемый р-мерный вектор наблюдений на вектор меньшей размерности , в котором линейной комбинацией исходных признаков, теряя при этом не слишком много информации.

Информативность вектора Y зависит от того, в какой степени линейных комбинаций дают возможность «реконструировать» р исходных измеряемых на общих признаках .

Ошибку прогноза Х по Y будем обозначать и определять как некоторую функцию от так называемой остаточной дисперсионной матрицы вектора Х при вычитании из него наилучшего, в смысле наименьших квадратов, прогноза по Y: