Скачиваний:
115
Добавлен:
01.05.2014
Размер:
1.38 Mб
Скачать

3.6. Проблема оценки значений факторов и виды факторных моделей.

Рассматривая методы определения общих факторов, мы приближенно оцениваем их значения, то есть восстанавливаем матрицу F значений факторов на совокупности исследуемых объектов. Согласно факторному уравнению X=FAT+ZD=Y+ZD, предположение XY состоит в том, что исходные признаки можно выразить только через общие факторы. Отсюда следует, что и общие факторы можно выразить через линейные комбинации исходных признаков. Но такое предположение дает возможность, согласно факторному уравнению, также выразить и характерные факторы через линейные комбинации исходных признаков.

Заметим, что, рассматривая выше методы построения факторов, мы исходили из разложения R= AAT+D 2, которое возникает при условии некоррелированности общих и характерных факторов, как между собой, так и друг с другом. Следовательно, система общих и характерных факторов образует базис m+n – мерного пространства. Некорректность предположения XY состоит в том, что тогда n исходных признаков должны являться базисом m+n –мерного пространства, что невозможно.

Отметим, что приближенные оценки значений факторов, особенно центроидных, просты. Это имеет значение при большой размерности исходных данных и особенно было важно при отсутствии вычислительной техники. Очевидно, что такие оценки факторов тем точнее, чем меньше характерности признаков. При нулевых характерностях оценки являются точными и соответствуют исходной корреляционной матрице. В этом случае общие факторы являются линейными комбинациями сходных признаков, метод главных факторов переходит в метод главных компонент, а метод центроидных факторов переходит в метод центроидных компонент. Следовательно, n исходных признаков образуют базис n-мерного пространства. Тогда для сохранения непротиворечивости факторной модели следует предположить коррелированность характерных факторов и справедливость лишь общего разложения исходной матрицы корреляций

.

Пусть число факторов совпадет с размерностью пространства m=n, тогда вклады всех общих факторов (главных либо центроидных компонент) полностью объясняют дисперсии каждого признака. Тогда в разложении R матрица AAT имеет единичные диагональные элементы, а матрица является антидиагональной, то есть имеет нулевые диагональные элементы, при том, что матрицаявляется корреляционной матрицей общего вида.

Перепишем это разложение в виде R=AAT+D2+(DTZTZD-D2), где матрица D2 является диагональной матрицей характерностей. Так как характерности равны нулю, то trD2=tr(DTZTZD-D2)=0, а матрица D2 является нулевой. Можно показать, что метод главных компонент является решением следующей задачи: найти такие общие факторы, чтобы минимизировать суммарную дисперсию характерных факторов. Очевидно, что решением являются n общих факторов, при которых матрица характерностей D2 является нулевой.

Можно также показать, что такая задача эквивалентна следующей задаче: найти такие общие факторы, которые в совокупности наиболее близки к исходным признакам в том смысле, что совокупность их вкладов , то есть квадратов коэффициентов корреляций с признаками, максимальна.

В этом смысле метод центроидных компонент аналогичен методу главных компонент, за исключением того, что близость общих факторов к исходным признакам оценивается совокупностью вкладов вида . Очевидно, что решение также должно удовлетворять нулевой матрицеD2.

Но в данном случае нельзя сказать, что задача построения цетроидных факторов эквивалентна задаче минимизации суммарной дисперсии характерных факторов. Минимальность дисперсии характерных факторов приходится постулировать априори.

Остаётся заметить, что метод главных компонент даёт единственное решение, в то время как метод построения центроидных компонент обеспечивает лишь локальный экстремум функционала . Поэтому этот метод может давать, вообще говоря, различные результаты на одних и тех же данных.

С учётом всего изложенного выше, содержательный смысл метода главных компонент состоит в объяснении дисперсий исходных признаков. Данный метод плохо объясняет их корреляции. Действительно, в силу разложения R=AAT+DTZTZD, где DTZTZD является антидиагональной, коэффициенты корреляции rij при ij состоят из двух вкладов: ковариации вычисленных признаков и ковариации ненормированных характерных факторов. В свою очередь, содержательный смысл метода центроидных компонент близок к содержательному смыслу метода главных компонент. Именно поэтому для таких факторных моделей приняты специальные названия: модель главных компонент и модель центроидных компонент. Основное их отличие от исходной “классической” модели состоит в том, что предполагается коррелированность характерных факторов.

В отличие от этих моделей, содержательный смысл исходной факторной модели и решений по методу главных и центроидных факторов состоит в объяснении не дисперсий, а корреляций исходных признаков через общие факторы. Действительно, в силу разложения R=AAT+D2, где D2 является диагональной матрицей, коэффициенты корреляции rij при ij определяются только как ковариации вычислительных признаков. Данные методы плохо объясняют дисперсии исходных признаков, так как они включают в себя дисперсию соответствующего характерного фактора, которая может оказаться большой.

Мы выяснили, что за проблемой точного оценивания значений факторов стоят более глубокие проблемы, касающиеся самой сущности факторного анализа. Обеспечение такой возможности приводит к необходимости вместо исходной “классической” факторной модели рассмотреть другие модели, а именно, главных и центроидных компонент. Но введение таких моделей приводит к изменению содержательного смысла факторного решения.

В рамках исходной факторной модели при вычислении значений факторов ищут не их, а такие линейные комбинации исходных признаков, которые являются хорошими в некотором смысле оценками общих факторов. Предположив, что оценки факторов соответствуют истинным значениям, а отклонения являются случайными, найдём их по методу наименьших квадратов. Пусть даны матрицы X(Nn), A(nm), F(nm), B(nm), (Nm), где B – матрица коэффициентов линейных комбинаций признаков, -матрица оценок факторов. Тогда =XB. Требуется решить задачу . Заметим, что минимизация такой функции означает независимую минимизацию всех её m компонент., так как общие факторы являются некоррелированными. Но такая минимизация означает и одновременную минимизацию всех m2 элементов матрицы (F-XB)T(F-XB) размером mm, а не только её диагональных элементов. Следовательно, требуется решить задачу . Преобразуем

Отсюда .

Соседние файлы в папке Основы обработки данных