- •§ 1. Meтод главных компонент
- •1. Определение главных компонент
- •2. Экстремальные свойства главных компонент. Их интерпретация
- •3. Статистические свойства выборочных главных компонент; статистическая проверка некоторых гипотез
- •4. Главные компоненты в задачах классификации
- •§ 2.Факторный анализ
- •1. Модель факторного анализа, ее интерпретация
§ 2.Факторный анализ
Предпосылкой для появления метода факторного анализа можно, по-видимому, считать естественное желание связать корреляцию между р наблюдаемыми признаками x(1), x(2), …, x(p) с тем фактом, что эти переменные зависят (линейно или нет) от меньшего числа других, непосредственно неизмеряемых («скрытых») переменных y(1), y(2), …, y(p’) (p’< р), которые в дальнейшем стали называть общими5 факторами и которые чаще всего удобнее конструировать так, чтобы они оказались взаимно некоррелированными. Поскольку в общем случае нельзя считать, что каждый из наблюдаемых признаков зависит лишь от р' каких-то (одних тех же для всех признаков) общих факторов, то постулируется, что исходный (наблюдаемый) признак x(i) зависит также от некоторой «специфической» (для себя) остаточной (или «шумовой») случайной компоненты и(i).
В литературе но факторному анализ иногда не указывается конечная цель исследования, которая по существу заключается в максимальном уменьшении числа ненаблюдаемых общих факторов с одновременной минимизацией зависимости x(i) от своих специфических факторов-компонент u(i); эта цель может быть достигнута лишь приближенно. В некотором смысле общие факторы можно считать причинами, а наблюдаемые (измеряемые на объектах) признаки — следствиями. Принято считать научное исследование такого рода успешным, если большое число следствий удалось объяснить малым числом причин.
Другими словами, факторный анализ можно рассматривать как метод сжатия информации или, что то же, как метод снижения размерности исходного факторного пространства X, поскольку корреляция между исследуемыми признаками означает их избыточность, а сведение многих избыточных признаков к немногим вспомогательным признакам (общим факторам), свободным от избыточности, и является задачей сжатия информации (снижения размерности).
Следует признать, что в силу ряда исторических причин и, в частности, из-за субъективных пристрастий и специфических интересов многочисленных исследователей, работавших в этой области, собственно говоря вероятностно-статистические аспекты этого важного раздела многомерного статистического анализа, каковым, но нашему мнению, является факторный анализ, долгое время были преданы некоторому забвению, а интерпретации и анализу различных факторных моделей была присуща некоторая неопределенность. Однако в последнее двадцатилетие появился ряд интересных именно вероятностно-статистических исследований этого метода [16], [30], [18], среди которых работу Андерсона и Рубина [16] можно выделить как основополагающую.
Мы кратко остановимся здесь лишь на линейных моделях факторного анализа, причем, так же как и в предыдущем параграфе, посвященном главным компонентам, оставим в стороне вычислительные аспекты метода [9], [22].
При разработке моделей факторного анализа исследователю приходится последовательно решать следующие вопросы:
— существования модели, заключающийся в том, что далеко не для всякого набора признаков X'= (x(1), x(2), …, x(p)) можно (при заданном р' < р) построить модель факторного анализа, т.е. указать такие общие факторы (y(1), y(2), …, y(p’)) (или доказать их существование), которые полностью объяснили бы существующую корреляцию между различными парами x(i) и x(j). При каком характере связей между исходными признаками (x(1), x(2), …, x(p)), т.е. при каких корреляционных (ковариационных) матрицах R=(rij) (=(ij)), а также при каком соотношении между числом наблюдаемых признаков р и числом скрытых общих факторов р' ( < р) сделанное допущение о наличии определенных связей между x(i) (i = 1, 2,..., р), с одной стороны, и y(j) (j = 1, 2, …, p') — с другой, является обоснованным и содержательным? — в этом и заключается вопрос существования модели;
— единственности (идентификации) модели. Оказывается, что если p, и р' таковы, что допускают построение модели факторного анализа, то определение соответствующих факторов Y’= (y(1), y(2), …, y(p’)) и коэффициентов линейного преобразования Q = (qij), связывающего X иY, не единственно. Спрашивается, при каких дополнительных ограничениях на матрицу преобразования Q и на ковариационную матрицу V= (vij) остаточных специфических факторов u(1), u(2), …, u(p) определение параметров искомой модели факторного анализа будет единственным?
— алгоритмического определения структурных параметров модели:
при заданной ковариационной матрице исходных признаков и известном числе общих факторов p’ (и в предположении, что решение задачи определения структурных параметров Q и V существует) как конкретно вычислить неизвестные параметры модели?
—статического оценивания (по наблюдениям X1, X2 .... Хn и при заданном р') неизвестных структурных параметров модели;
— статистической проверки ряда гипотез, связанных с природой модели и значениями ее структурных параметров, таких, как гипотеза об истинном числе р' общих факторов, гипотеза адекватности принятой модели по отношению к имеющимся результатам наблюдения, гипотеза о значимом отличии от нуля интересующих нас коэффициентов qij линейного преобразования и т. п.;
— построения статистических оценок для ненаблюдаемых значений общих факторов y(1), y(2), …, y(p’).
Кроме сформулированных выше вопросов, которых мы в той или иной мере коснемся в нашем изложении, мы затронем здесь вопросы соотношения моделей факторного анализа с моделями главных компонент и регрессии, а также некоторых направлений их модификации и использования.