
Факторный анализ справочный материал. Факторный анализ и анализ главных компонент
Существует несколько статистических методов, которые позволяют исследовать отношения между переменными, не определяя, какие из них являются зависимыми, а какие – независимыми. Для этих методов все переменные оказываются в равном положении – ни одна из них не является более важной, чем другая. Первый метод, который мы рассмотрим, метод главных компонент, объясняет наибольшую вариативность в терминах наименьшего количества линейных комбинаций переменных. Второй метод, факторный анализ, объясняет отношения между переменными с помощью нескольких факторов, которые не могут быть прямо измерены. Оба метода основываются на корреляциях (или ковариациях) между исходными переменными и часто называются одним термином – факторный анализ.
Главными целями факторного анализа являются: (1) сокращение числа переменных и (2) определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации.
Метод главных компонент
Метод главных компонент – это метод, который переводит большое количество связанных между собой (зависимых, коррелирующих) переменных в меньшее количество независимых переменных, так как большое количество переменных часто затрудняет анализ и интерпретацию информации. Строго говоря, этот метод не относится к факторному анализу, хотя и имеет с ним много общего. Специфическим является, во-первых, то, что в ходе вычислительных процедур одновременно получают все главные компоненты и их число первоначально равно числу исходных переменных; во-вторых, постулируется возможность полного разложения дисперсии всех исходных переменных, т.е. ее полное объяснение через латентные факторы (обобщенные признаки).
Например, представим, что мы провели исследование, в котором измерили у студентов интеллект по тесту Векслера, тесту Айзенка, тесту Равена, а также успеваемость по социальной, когнитивной и общей психологии. Вполне возможно, что показатели различных тестов на интеллект будут коррелировать между собой, так как они, в конце концов, измеряют одну характеристику испытуемого – его интеллектуальные способности, хотя и по-разному. Если переменных в исследовании слишком много (x1, x2, …, xp), а некоторые из них взаимосвязаны, то у исследователя иногда возникает желание уменьшить сложность данных, сократив количество переменных. Для этого и служит метод главных компонент, который создает несколько новых переменных y1, y2, …, yp, каждая из которых является линейной комбинацией первоначальных переменных x1, x2, …, xp:
y1=a11x1+a12x2+…+a1pxp
y2=a21x1+a22x2+…+a2pxp
… (1)
yp=ap1x1+ap2x2+…+appxp
Переменные y1, y2, …, yp называются главными компонентами или факторами. Таким образом, фактор – это искусственный статистический показатель, возникающий в результате специальных преобразований корреляционной матрицы. Процедура извлечения факторов называется факторизацией матрицы. В результате факторизации из корреляционной матрицы может быть извлечено разное количество факторов вплоть до числа, равного количеству исходных переменных. Однако факторы, определяемые в результате факторизации, как правило, не равноценны по своему значению.
Коэффициенты aij, определяющие новую переменную, выбираются таким образом, чтобы новые переменные (главные компоненты, факторы) описывали максимальное количество вариативности данных и не коррелировали между собой. Часто полезно представить коэффициенты aij таким образом, чтобы они представляли собой коэффициент корреляции между исходной переменной и новой переменной (фактором). Это достигается умножением aij на стандартное отклонение фактора. В большинстве статистических пакетов так и делается (в программе STATISTICA тоже). Коэффициенты aij называются факторными нагрузками. Обычно они представляются в виде таблицы, где факторы располагаются в виде столбцов, а переменные в виде строк:
Переменные |
Фактор 1 |
Фактор2 |
Интеллект (по тесту Векслера) |
0,86 |
0,02 |
Интеллект (по тесту Айзенка) |
0,75 |
0,01 |
Интеллект (по тесту Равена) |
0,91 |
0,18 |
Оценка по социальной психологии |
0,04 |
0,79 |
Оценка по когнитивной психологии |
0,13 |
0,85 |
Оценка по общей психологии |
0,21 |
0,82 |
Такая таблица называется таблицей (матрицей) факторных нагрузок. Числа, приведенные в ней, являются коэффициентами aij.Число 0,86 означает, что корреляция между первым фактором и значением по тесту Векслера равна 0,86. Чем выше факторная нагрузка по абсолютной величине, тем сильнее связь переменной с фактором.