
- •9 Факторный анализ
- •9.1 Общие представления о факторном анализе
- •Сущность факторного анализа
- •Проверка целесообразности выполнения факторного анализа
- •Основные модели факторного анализа
- •Метод главных компонент (мгк): основные формулы и процедуры
- •Проблема числа факторов
- •Методы (алгоритмы) факторного анализа
- •Проблема вращения и интерпретации
- •Главные факторы в сравнении с главными компонентами.
- •Данные для проведения факторного анализа (учебный пример)
- •3. Примеры факторного анализа
- •Предварительно преобразуем исходные значения признаков выборочной совокупности к нормированному и центрированному виду (таблица 6).
- •Корреляционная матрица
- •Литература
Проверка целесообразности выполнения факторного анализа
Целесообразность выполнения факторного анализа определяется наличием корреляций между переменными. Для проверки целесообразности могут быть использованы:
критерий сферичности Бартлетта (Bartlett’s Test of Sphericity), который проверяет нулевую гипотезу об отсутствии корреляций между переменными в генеральной совокупности.
критерий адекватности выборки Кайзера-Мейера-Олкина (Kaiser-Meyer-Olkin Measure of Sampling Adequacy), который позволяет проверить, насколько корреляцию между парами переменных можно объяснить другими переменными (факторами).
Нулевую гипотезу о том, что корреляционная матрица является единичной, рассматривают в соответствии с критерием сферичности Бартлетта на выбранном уровне значимости. Значение р-уровня меньше выбранного уровня значимости указывает на статистическую значимость отличия коэффициента корреляции от 0 и соответственно, на приемлемость проведения факторного анализа.
Значение статистики КМО, превышающее 0.5 также подтверждает то, что факторный анализ является приемлемым методом для анализа корреляционной матрицы.
Мера выборочной адекватности Кайзера-Мейера-Олкина – степень применимости факторного анализа:
Больше 0,9 – отличная;
Больше 0,8 – хорошая;
Больше 0,7 – приемлемая;
Больше 0,6 – сомнительная;
Больше 0,5 – малопригодная;
Меньше 0,5 – недопустимая.
Основные модели факторного анализа
Результатом факторного анализа является выявление взаимосвязи наблюдаемых переменных и латентных факторов.
В общем случае каждая переменная выражается как линейная комбинация латентных факторов:
И наоборот, латентные факторы также можно выразить линейными комбинациями наблюдаемых переменных:
Этой цели можно достичь, используя одну из моделей факторного анализа:
1)
метод главных компонент (МГК), в котором
наблюдаемые значения каждого из признаков
представляются в виде линейных комбинаций
факторных нагрузок
и факторов
,
где
,
причем обычно
где
- число факторов.
2) модель собственно факторного анализа (ФА), когда наблюдаемые значения определяются не только факторами, но и действием локальных случайных причин
.
Существует несколько методов реализации собственно модели факторного анализа.
Метод главных компонент основан на попытке объяснить максимальную долю дисперсии в заданном наборе переменных.
Метод факторного анализа пытается объяснить корреляции между переменными.
Основной объект анализа в методе главных компонент – это дисперсии, а в факторном анализе – ковариации (общности). Метод главных компонент ориентирован на выделение малого набора ортогональных компонент таким образом, чтобы они объясняли максимум дисперсии для анализируемого набора данных. Цель факторного анализа – при помощи малого набора факторов воспроизвести матрицу взаимосвязей. С математической точки зрения метод главных компонент дает единственное решение, тогда как разные виды факторного анализа дают разные решения для одного и того же набора данных. Это объясняется тем, что теоретически в МГК количество выделенных компонент равно количеству наблюдаемых переменных и общая дисперсия учитывается полностью. Главные компоненты упорядочены. Причем, первая объясняет наибольшую долю дисперсии, а последняя – наименьшую. Решение является единственным и если сохранить все компоненты, то модно точно воспроизвести наблюдаемую матрицу взаимосвязей. Если необходимо в первую очередь сократить число уменьшить размерность, то МГК даст возможность определиться как с количеством, так и с природой факторов.
Оба метода направлены на аппроксимацию корреляционной матрицы определенным числом факторов — меньшим, чем количество переменных, но способами аппроксимации они отличаются. Разумеется, методы дают схожие результаты: если главные компоненты объясняют большую часть дисперсии в переменных, они объясняют и почти всю корреляцию; в том случае, если факторы объясняют корреляцию между переменными, они также должны объяснять их дисперсию (пусть и не полностью).