
- •Введение
- •Глава 1. Методы главных компонент и факторного анализа: теоретические и практические вопросы
- •Глава 2. Основные уравнения и процедуры факторного анализа
- •Глава 3. Некоторые важные проблемы факторного анализа
- •Глава 4. Примеры использования факторного анализа в психологических исследованиях
- •Введение
- •Глава 1
- •1.1. Общие положения
- •1.2. Особенности факторно-аналитического исследования
- •Глава 2 Основные уравнения и процедуры факторного анализа
- •2.1. Основные уравнения
- •Матрицы, наиболее часто используемые в факторном анализе
- •2.1.1. Факторизация
- •2.1.2. Ортогональное вращение
- •2.1.3. Общности, дисперсия и ковариация
- •2.1.4. Факторные значения
- •2.1.5. Косоугольное вращение
- •2.1.6. Компьютерный анализ простейшего примера
- •2.2. Процедуры факторизации и вращения
- •2.2.1. Методы факторизации
- •2.2.2. Типы вращения
- •Глава 3 некоторые важные проблемы факторного анализа
- •3.1. Оценка общностей
- •3.2. Критерии оценки соответствия количества факторов и факторной модели экспериментальным данным
- •3.3. Критерии оценки качества вращения и простоты полученной структуры
- •3.4. Значимость и внутренняя согласованность факторов
- •3.5. Интерпретация факторов
- •3.6. Факторные значения
- •3.7. Сравнение факторных решений и выборок
- •3.8. Сравнение различных пакетов программ факторного анализа
- •Глава 4 примеры использования факторного анализа в психологических исследованиях14
- •4.1. Психологическое строение пола как характеристика личности ребенка
- •4.2. Отношение к демократии и гражданской культуре у российских студентов
- •4.3. "Сказочный" семантический дифференциал
3.5. Интерпретация факторов
Чтобы интерпретировать фактор, исследователь пытается найти глубинное измерение, объединяющее группу переменных, имеющих по нему высокие нагрузки. Как при ортогональном, так и при косоугольном вращении нагрузки содержатся в матрице нагрузок А, однако значения нагрузок для каждого из вращений различны. После ортогонального вращения величины в нагрузочной матрице представляют корреляции между переменными и факторами. Исследователь выбирает какой-то критерий определения значимости корреляций, собирает вместе переменные с нагрузками, превышающими установленный критерий, и пытается определить некий базисный признак (характеристику, концепт), их объединяющий.
После косоугольного вращения процесс аналогичен, однако интерпретация значений в матрице факторного отображения более сложна. Нагрузка представляет собой уже не корреляцию, а меру специфичной (индивидуальной) взаимосвязи между переменной и фактором (именно этой переменной именно с этим фактором без учета наложений). Поскольку факторы считаются коррелирующими, корреляции между переменными и факторами, приведенные в структурной матрице S, подвержены влиянию наложений факторов. Переменная может коррелировать с одним фактором через корреляцию с другим фактором, а не непосредственно. В значениях, стоящих в матрице факторного отображения, та часть дисперсии, которая получается из-за наложения факторов, отсутствует, однако это искажает принятую модель.
Фактически интерпретация матрицы факторного отображения, а не структурной, проводится по чисто практической причине: матрица факторного отображения проще и разница между высокими и низкими нагрузками в ней более очевидна.
Чем больше нагрузка, тем с большей уверенностью можно считать, что переменная определяет фактор. Комри и Ли (Comrey, Lee, 1992) предполагают, что нагрузки, превышающие 0.71 (объясняет 50% дисперсии), — превосходные, 0.63 (40% дисперсии) — очень хорошие, 0.55 (30%) — хорошие, 0.45 (20%) — удовлетворительные и 0.32 (объясняет 10% дисперсии) — слабые. Однако нагрузки, получающиеся в результате факторно-аналитической обработки, существенным образом зависят от того, каким способом была получена исходная матрица данных. Если обрабатывается матрица, заполненная одним испытуемым, проводящим многомерное шкалирование каких-либо объектов по каким-либо шкалам, то факторные нагрузки по значимым для того или иного фактора шкалам получаются существенно более высокими, чем в случае обработки матрицы, составленной как совокупность ответов различных испытуемых на единый список вопросов, когда каждый испытуемый (респондент) представляется одной строкой в общей матрице данных. Так, по первому (наиболее значимому) фактору, имеющему шкалы с самыми высокими нагрузками, граница отсечения величины нагрузок для интерпретации (т.е. значение, начиная с которого переменные, имеющие большую факторную нагрузку, включаются в группу для интерпретации), как правило, не ниже 0.75, а по второму считается приемлемым значение 0.5.
Вообще право выбора этой границы предоставляется исследователю и сам выбор напрямую связан с имеющимся у него опытом. Иногда в нагрузках факторов наблюдается некоторый пробел и его можно использовать в качестве границы отсечения.
Следует обратить внимание на то, что однородность выборки (например, все испытуемые имеют по переменным примерно одинаковые показатели, тогда как в целом по популяции диапазон показателей по тем же переменным гораздо шире) существенно влияет на величины факторных нагрузок. Поэтому если у вас есть какие-то соображения об однородности имеющейся выборки, то стоит понизить границу отсечения (и интерпретировать более низкие нагрузки). Таким образом, если выборка дает сходные значения по наблюдаемым переменным, для интерпретации факторов используется нижняя граница отсечения.
Процедура наименования фактора (присвоения ему названия или какого-то ярлыка) — процесс, требующий одновременно и творчества я научной обоснованности. Так, Руммель (Rummel, 1970) приводит многочисленные полезные советы по интерпретации и наименованию факторов. Лучшей интерпретации факторов способствует распечатка матрицы отсортированных (упорядоченных по степени убывания по каждому фактору) факторных нагрузок, где переменные сгруппированы по признаку их корреляции с определенными факторами. Процедура сортировки нагрузок предусмотрена во всех упомянутых программах. (По умолчанию в BMDP4M, REODER в SAS; SORT в SPSS и SYSTAT; сортировка в STADIA).
При интерпретации следует также учитывать вычисляемость, практическую значимость и сложность факторов. Удалось ли получить значимо близкое факторное решение через какой-то промежуток времени и/или на другой выборке? Имеет ли оно научную значимость и новизну с точки зрения понимания проблемы исследования? Каково место факторов в иерархии «объяснений» природы явлений? Достаточно ли они сложны (не примитивны), чтобы вызвать интерес ученых, и не слишком ли они сложны (трудно понимаемы и объяснимы) для интерпретации?