- •3. Обработка эмпирических данных
- •Понятие о выборке и шкалах измерения Генеральная и выборочная совокупности
- •3.2. Статистические таблицы
- •Распределение (2х2)
- •3.3. Средние величины
- •3. 4. Понятие корреляции
- •3.5. Т-критерий Вилкоксона
- •Результаты методики Филлипса до и после проведения коррекционной работы
- •3.6. Факторный анализ
- •Корреляционная матрица
Корреляционная матрица
STATISTICA ФАКТОРНЫЙ АНАЛИЗ |
Корреляции (factor.sta) Построчное удаление ПД n=100 | |||||
Переменная |
РАБОТА_1 |
РАБОТА_2 |
РАБОТА_3 |
ДОМ_1 |
ДОМ_2 |
ДОМ_3 |
РАБОТА_1 |
1.00 |
.65 |
.65 |
.14 |
.15 |
.14 |
РАБОТА_2 |
.65 |
1.00 |
.73 |
.14 |
.18 |
.24 |
РАБОТА_3 |
.65 |
.73 |
1.00 |
.16 |
.24 |
.25 |
ДОМ_1 |
.14 |
.14 |
.16 |
1.00 |
.66 |
.59 |
ДОМ_2 |
.15 |
.18 |
.24 |
.66 |
1.00 |
.73 |
ДОМ_3 |
.14 |
.24 |
.25 |
.59 |
.73 |
1.00 |
Как видно из корреляционной матрицы переменные, относящиеся к удовлетворенности на работе, более коррелированы между собой, и переменные, относящиеся к удовлетворенности домом, также более коррелированы между собой. Корреляции между этими двумя типами переменных (переменные, связанные с удовлетворенностью на работе, и переменные, связанные с удовлетворенностью домом) сравнительно малы. Поэтому кажется правдоподобным, что имеются два относительно независимых фактора (два типа факторов), отраженных в корреляционной матрице: один относится к удовлетворенности на работе, а другой к удовлетворенности домашней жизнью.
Факторные нагрузки
Второй этап факторного анализа — первоначальное выделение факторов либо методом главных компонент, либо методом главных факторов. Результатом для нашего примера является решение с двумя факторами. Рассмотрим корреляции между переменными и двумя факторами (или "новыми" переменными). Эти корреляции называются факторными нагрузками.
Таблица 3. 16
Таблица факторных нагрузок (метод главных компонент)
STATISTICA ФАКТОРНЫЙ АНАЛИЗ |
Факторные нагрузки (Нет вращения) Главные компоненты | |
Переменная |
Фактор 1 |
Фактор 2 |
РАБОТА_1 |
.654384 |
.564143 |
РАБОТА_2 |
.715256 |
.541444 |
РАБОТА_3 |
.741688 |
.508212 |
ДОМ_1 |
.634120 |
-.563123 |
ДОМ_2 |
.706267 |
-.572658 |
ДОМ_3 |
.707446 |
-.525602 |
Общая дисперсия |
2.891313 |
1.791000 |
Доля общей дисп. |
.481885 |
.298500 |
Как видно из таблицы 3.16 первый фактор более коррелирует с переменными, чем второй (поскольку значения весовых нагрузок по каждой переменной первого фактора больше, чем второго). Это очевидно, потому что, как было сказано выше, факторы выделяются последовательно и содержат все меньше и меньше общей дисперсии (см. раздел Собственные значения и число выделяемых факторов, стр. 61).
Методы вращения факторов
Третий этап факторного анализа – вращение факторных нагрузок, являющихся результатом предыдущего этапа. Типичными методами вращения являются стратегии варимакс, квартимакс, и эквимакс. Целью этих методов является получение понятной (интерпретируемой) матрицы нагрузок, то есть факторов, которые четко отмечены высокими нагрузками (например, больше 0.7) для некоторых переменных и низкими – для других. Эту общую модель иногда называют простой структурой.
Идея вращения по методу варимакс была описана выше (см. раздел Метод главных компонент, стр. 60). Этот метод можно также применить и к рассматриваемому примеру. Как и ранее, наша задача – найти вращение, максимизирующее дисперсию по новым осям; или, другими словами, – получить матрицу нагрузок на каждый фактор таким образом, чтобы они отличались максимально, и имелась возможность их простой интерпретации. Ниже приведена таблица нагрузок на повернутые факторы.
Таблица 3. 17
Таблица факторных нагрузок (вращение – варимакс)
STATISTICA ФАКТОРНЫЙ АНАЛИЗ |
Факторные нагрузки (Варимакс нормализ.) Выделение: Главные компоненты | |
Переменная |
Фактор 1 |
Фактор 2 |
РАБОТА_1 |
.862443 |
.051643 |
РАБОТА_2 |
.890267 |
.110351 |
РАБОТА_3 |
.886055 |
.152603 |
ДОМ_1 |
.062145 |
.845786 |
ДОМ_2 |
.107230 |
.902913 |
ДОМ_3 |
.140876 |
.869995 |
Общая дисперсия |
2.356684 |
2.325629 |
Доля общей дисп. |
.392781 |
.387605 |
Как видно из таблицы 3.17, первый фактор отмечен высокими нагрузками на переменные, связанные с удовлетворенностью на работе, а второй фактор – с удовлетворенностью домом. Из этого можно заключить, что удовлетворенность, измеренная с помощью опросника, составлена из двух частей: удовлетворенность домом и работой. Таким образом, произведена классификация изучаемых переменных. На основе полученной классификации первый фактор можно назвать фактором удовлетворенности работой (или фактором социальных ценностей) и, соответственно, второй — фактором удовлетворенности домом (или фактором личностных ценностей).
Интерпретация результатов факторного анализа
Заключительным этапом факторного анализа является содержательная интерпретация факторов, полученных в результате вращения. Здесь от исследователя требуется хорошая теоретическая подготовка и знание экспериментальных результатов, уже накопленных в данной области исследования.
Практически интерпретация факторов заключается в выделении значимых факторных весов (референтных переменных) по каждому из факторов. Точных критериев, позволяющих дифференцировать значимые факторные веса (нагрузки) и незначимые, не существует. Например, в случае больших выборок (несколько сот человек и более) значимыми иногда полагают нагрузки от 0.3 и выше. При уменьшении выборки до нескольких десятков человек в качестве значимых используются веса порядка 0.4–0.5.
Интерпретация факторов не всегда протекает гладко; в некоторых случаях она бывает только предположительной (например, в случае использования данных, отвечающих различным типам шкал), а иногда авторы вовсе отказываются от нее, поскольку фактор включает тесты, в которых трудно усмотреть что-либо общее.
В идеальном варианте (распределение переменных не отличается от нормального) интерпретацию результатов факторного анализа можно начать с анализа корреляционной матрицы, затем перейти к факторным нагрузкам (выделению референтных переменных). Следующий шаг – сопоставление результатов корреляционной матрицы и выделенных факторов, содержащих значимые веса. И, наконец, последний этап – анализ полученных общностей содержания и природы тех изучаемых переменных (признаков), которые имеют наиболее высокую корреляцию с данным фактором. Называние факторов осуществляется с учетом тех референтных переменных, которые получили максимальные значения весов и имеют наиболее высокую корреляцию с фактором. Например, если тесты, оценивающие способность запечатления несмыслового материала, обладают высокими весовыми нагрузками по данному фактору, то последний может быть назван как фактор «механического запоминания».