Скачиваний:
60
Добавлен:
01.05.2014
Размер:
1.52 Mб
Скачать

§ 2.Факторный анализ

Предпосылкой для появления метода факторного анализа можно, по-видимому, считать естественное желание связать корреляцию меж­ду р наблюдаемыми признаками x(1), x(2), …, x(p) с тем фактом, что эти переменные зависят (линейно или нет) от меньшего числа других, не­посредственно неизмеряемых («скрытых») переменных y(1), y(2), …, y(p’) (p’< р), которые в дальнейшем стали называть общими5 факторами и которые чаще всего удобнее конструировать так, чтобы они оказа­лись взаимно некоррелированными. Поскольку в общем случае нельзя считать, что каждый из наблюдаемых признаков зависит лишь от р' ка­ких-то (одних тех же для всех признаков) общих факторов, то посту­лируется, что исходный (наблюдаемый) признак x(i) зависит также от некоторой «специфической» (для себя) остаточной (или «шумовой») случайной компоненты и(i).

В литературе но факторному анализ иногда не указывается ко­нечная цель исследования, которая по существу заключается в макси­мальном уменьшении числа ненаблюдаемых общих факторов с одновре­менной минимизацией зависимости x(i) от своих специфических факто­ров-компонент u(i); эта цель может быть достигнута лишь приближен­но. В некотором смысле общие факторы можно считать причинами, а наблюдаемые (измеряемые на объектах) признаки — следствиями. Принято считать научное исследование такого рода успешным, если большое число следствий удалось объяснить малым числом причин.

Другими словами, факторный анализ можно рассматривать как метод сжатия информации или, что то же, как метод снижения размер­ности исходного факторного пространства X, поскольку корреляция между исследуемыми признаками означает их избыточность, а сведе­ние многих избыточных признаков к немногим вспомогательным приз­накам (общим факторам), свободным от избыточности, и является зада­чей сжатия информации (снижения размерности).

Следует признать, что в силу ряда исторических причин и, в част­ности, из-за субъективных пристрастий и специфических интересов многочисленных исследователей, работавших в этой области, собствен­но говоря вероятностно-статистические аспекты этого важного раздела много­мерного статистического анализа, каковым, но нашему мнению, яв­ляется факторный анализ, долгое время были преданы некоторому заб­вению, а интерпретации и анализу различных факторных моделей была присуща некоторая неопределенность. Однако в последнее двадцати­летие появился ряд интересных именно вероятностно-статистических исследований этого метода [16], [30], [18], среди которых работу Андерсона и Рубина [16] можно выделить как основополагающую.

Мы кратко остановимся здесь лишь на линейных моделях фактор­ного анализа, причем, так же как и в предыдущем параграфе, посвя­щенном главным компонентам, оставим в стороне вычислительные ас­пекты метода [9], [22].

При разработке моделей факторного анализа исследователю при­ходится последовательно решать следующие вопросы:

существования модели, заключающийся в том, что далеко не для всякого набора признаков X'= (x(1), x(2), …, x(p)) можно (при заданном р' < р) построить модель факторного анализа, т.е. указать такие общие факторы (y(1), y(2), …, y(p’)) (или доказать их существование), которые полностью объяснили бы существующую корреляцию между различны­ми парами x(i) и x(j). При каком характере связей между исходными признаками (x(1), x(2), …, x(p)), т.е. при каких корреляционных (ковариа­ционных) матрицах R=(rij) (=(ij)), а также при каком соотно­шении между числом наблюдаемых признаков р и числом скрытых об­щих факторов р' ( < р) сделанное допущение о наличии определенных связей между x(i) (i = 1, 2,..., р), с одной стороны, и y(j) (j = 1, 2, …, p') с другой, является обоснованным и содержательным? — в этом и заключается вопрос существования модели;

единственности (идентификации) модели. Оказывается, что если p,  и р' таковы, что допускают построение модели факторного анализа, то определение соответствующих факторов Y’= (y(1), y(2), …, y(p’)) и коэффициентов линейного преобразования Q = (qij), связывающего X иY, не единственно. Спрашивается, при каких дополнительных ограничениях на матрицу преобразования Q и на ковариационную матрицу V= (vij) остаточных специфических факторов u(1), u(2), …, u(p) определение параметров искомой модели факторного анализа будет единственным?

алгоритмического определения структурных параметров модели:

при заданной ковариационной матрице  исходных признаков и из­вестном числе общих факторов p (и в предположении, что решение за­дачи определения структурных параметров Q и V существует) как кон­кретно вычислить неизвестные параметры модели?

статического оценивания (по наблюдениям X1, X2 .... Хn и при заданном р') неизвестных структурных параметров модели;

статистической проверки ряда гипотез, связанных с природой модели и значениями ее структурных параметров, таких, как гипотеза об истинном числе р' общих факторов, гипотеза адекватности принятой модели по отношению к имеющимся результатам наблюдения, гипотеза о значимом отличии от нуля интересующих нас коэффициентов qij ли­нейного преобразования и т. п.;

— построения статистических оценок для ненаблюдаемых значений общих факторов y(1), y(2), …, y(p’).

Кроме сформулированных выше вопросов, которых мы в той или иной мере коснемся в нашем изложении, мы затронем здесь вопросы соотношения моделей факторного анализа с моделями главных ком­понент и регрессии, а также некоторых направлений их модифика­ции и использования.