
- •Факторный анализ
- •Факторный анализ
- •1 История и назначение факторного анализа
- •2 Основные задачи факторного анализа
- •3 Факторный анализ и матрица корреляций.
- •4 Основные показатели факторного анализа
- •Пример 1
- •5. Метода факторного анализа
- •6. Последовательность факторного анализа
- •Этап 2. Решение проблемы числа факторов
- •Этап 3. Факторизация матрицы интеркорреляций
- •Этап 5. Принятие решения о качестве факторной структуры
- •Этап 6. Вычисление факторных коэффициентов и оценок
- •7. Пример из области психологии
- •Библиографический список
Пример 1
Выборка из 50 испытуемых была обследована с помощью психологического теста по пяти показателям интеллекта:
устный счет;
продолжение числовых рядов;
осведомленность;
словарный запас;
определения сходства.
Были вычислены коэффициенты корреляции для всех пар показателей. В результате анализа корреляций, все показатели оказались статистически взаимосвязанными на уровне значимости p<0,05, кроме показателя 1 и 4, где к=0,23 (коэффициент корреляции). Близких к 1 коэффициентов корреляции не получилось. По этим результатам была составлена исходная матрица корреляций.
Таблица 1
Матрица корреляций пяти показателей интеллекта.
№ |
Показатели |
1 |
2 |
3 |
4 |
5 |
1 |
Счет в уме |
1,00 |
0,88 |
0,33 |
0,23 |
0,42 |
2 |
Числовые ряды |
0,88 |
1,00 |
0,32 |
0,24 |
0,35 |
3 |
Осведомленность |
0,33 |
0,32 |
1,00 |
0,58 |
0,54 |
4 |
Словарный запас |
0,23 |
0,24 |
0,58 |
1,00 |
0,54 |
5 |
Сходство |
0,42 |
0,35 |
0,58 |
0,54 |
1,00 |
Таблица 2
Факторные нагрузки после варимакс-вращения
Исходные переменные |
Факторные нагрузки |
(общность) |
|
F1 |
F2 |
||
1 |
0,97 |
0,20 |
0,99 |
2 |
0,86 |
0,20 |
0,78 |
3 |
1,18 |
0,76 |
0,62 |
4 |
1,09 |
0,74 |
0,56 |
5 |
1,06 |
0,69 |
0,55 |
Собственное значение |
1,79 |
1,70 |
3,5 |
Доля дисперсии |
0,36 |
0,34 |
0,7 |
В результате
применения факторного анализа выделилось
два фактора (
и
).
По фактору
максимальные нагрузки (0,97 и 0,86) имеют 1
и 2 показатели. По фактору
максимальные нагрузки имеют показатели
3,4,5.
Перейдем к интерпретации двух полученных факторов. Переменные 1–устный счет и 2–продолжение числовых рядов можно называть словом «математические способности». Фактор идентифицируется как «математические способности».
Переменные 3,4,5(словарный запас, осведомленность, сходство понятий) – определяют словесные понимания испытуемого. Поэтому фактор идентифицируется как «вербальные способности». Таким образом мы сократили число переменных с 5 до 2 и выявили два скрытых за взаимосвязью пяти признаков фактора.
5. Метода факторного анализа
Методы факторного анализа — это различные способы получения факторной структуры при заданном числе факторов. Эти способы, как уже говорилось, отличаются решением проблемы общностей. Рассмотрим наиболее часто применяемые методы: анализ главных компонент, метод главных факторов, факторный анализ образов (общности равны квадрату КМК), метод, не взвешенных наименьших квадратов, обобщенный метод наименьших квадратов и метод максимального правдоподобия.
Анализ главных компонент (Principal Components) иногда используется в качестве факторного анализа, хотя это и не вполне корректно. При использовании этого метода общность каждой переменной получается автоматически, путем суммирования квадратов ее нагрузок по всем главным компонентам. Вопрос о приближении восстановленных коэффициентов корреляции к исходным корреляциям не решается. В результате факторная структура искажается в сторону преувеличения абсолютных величин факторных нагрузок.
Факторный анализ образов (общности равны квадрату КМК) (Image Factoring) — это метод главных компонент, применяемый к так называемой редуцированной корреляционной матрице, у которой вместо единиц на главной диагонали располагаются оценки общностей. Общность каждой переменной оценивается предварительно, как квадрат коэффициента множественной корреляции (КМК) этой переменной со всеми остальными. Такая оценка, с точки зрения теоретиков факторного анализа, приводит к более точным результатам, чем в анализе главных компонент. Но значения общностей недооцениваются, что также приводит к искажениям факторной структуры, хотя и меньшим, чем в предыдущем случае.
Метод главных осей (Principal Axis Factoring), позволяет получить более точное решение. На первом шаге общности вычисляются по методу главных компонент. На каждом последующем шаге собственные значения и факторные нагрузки вычисляются исходя из предыдущих значений общностей. Окончательное решение получается при выполнении заданного числа итераций или достижении минимальных различий между общностями на данном и предыдущем шагах.
Метод не взвешенных наименьших квадратов (Inveighed least squares) — минимизирует квадраты остатков (разностей) исходной и воспроизведенной корреляционных матриц (вне главной диагонали). На первом шаге оцениваются общности через квадрат КМК. Затем вычисляется факторная структура, и восстанавливаются коэффициенты корреляции. Проверяется разность квадратов исходных и вычисленных корреляций. За новые значения общностей принимаются вычисленные по полученной факторной структуре. На втором шаге вычисляется новая факторная структура, и снова проверяется соответствие исходных и восстановленных коэффициентов корреляции. Процесс повторяется многократно до тех пор, пока не достигается минимально возможная разница между исходными и вычисленными корреляциями при заданном числе факторов. Метод, по определению, дает минимальные ошибки факторной структуры при фиксированном числе факторов.
Обобщенный метод наименьших квадратов (Generalized least squares) — отличается от предыдущего тем, что для каждой переменной вводятся специальные весовые коэффициенты. Чем больше общность переменной, тем в большей степени она влияет на факторную структуру (имеет больший вес). Это соответствует основному принципу статистического оценивания, по которому менее точные наблюдения учитываются в меньшей степени. В этом — основное преимущество этого метода перед остальными.
Метод максимального правдоподобия (Maximum likelihood) также направлен на уменьшение разности исходных и вычисленных корреляций между признаками. Дополнительно этот метод позволяет получить важный показатель полноты факторизации — статистическую оценку «качества подгонки». Мерой качества является оценка различия исходных и вычисленных коэффициентов корреляции по х2-критерию, значимость которого определяется в зависимости от числа факторов и количества переменных.
Вряд ли возможно дать общие рекомендации о преимуществе или недостатке того или иного метода. Можно лишь отметить, что анализ главных компонент дает наиболее грубое решение, а метод максимального правдоподобия позволяет статистически оценить минимально возможное число факторов для данного набора переменных. По-видимому, в каждом конкретном случае стоит сравнивать результаты применения разных методов и выбирать тот, который позволяет получить наиболее простую и доступную интерпретации факторную структуру.