Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IBM_SPSS_Statistics_Base.pdf
Скачиваний:
168
Добавлен:
19.05.2015
Размер:
5.37 Mб
Скачать

Глава

Факторный анализ

22

Целью факторного анализа является выявление скрытых переменных или факторов, объясняющих структуру корреляций внутри набора наблюденных переменных. Факторный анализ часто используется для снижения размерности данных, чтобы найти небольшое число факторов, которые объясняют большую часть дисперсии, наблюденной для значительно большего числа явных переменных. Факторный анализ может также использоваться для формирования гипотез относительно механизмов причинных связей или с целью проверки переменных перед дальнейшим анализом (например, чтобы выявить коллинеарность перед проведением линейного регрессионного анализа).

Рассматриваемая процедура факторного анализа обеспечивает большую гибкость:

Доступны семь методов выделения факторов.

Доступны пять методов вращения, в том числе прямой облимин и промакс для не ортогональных вращений.

Доступны три метода вычисления значений факторов, которые можно сохранить в виде переменных для дальнейшего анализа.

Пример. Какие внутренние побуждения определяют ответы людей на вопросы обследования, касающегося политики? Исследование корреляций между вопросами обследования обнаруживает значительные пересечения в подгруппах вопросов — вопросы о налогах имеют тенденцию коррелировать между собой, вопросы касающиеся обороны также коррелируют между собой и т.д. С помощью факторного анализа можно выявить некоторое число основополагающих факторов и определить, что эти факторы представляют собой концептуально. Помимо этого, для каждого респондента можно вычислить значения факторов, которые можно использовать в последующем анализе. Например, основываясь на значениях факторов, Вы можете построить модель логистической регрессии для прогнозирования поведения людей на выборах.

Статистики. Для каждой переменной: число наблюдений без пропущенных значений, среднее значение и стандартное отклонение. Для каждого случая применения факторного анализа: корреляционная матрица переменных, включая уровни значимости, определитель

иобратную матрицу; воспроизведенная корреляционная матрица, включая антиобраз; начальное решение (общности, собственные числа и процент объясненной дисперсии); показатель выборочной адекватности Кайзера-Мейера-Олкина и критерий сферичности Бартлетта; неповернутое решение, включая факторные нагрузки, общности и собственные числа; повернутое решение, включая матрицу факторного отображения после вращения

иматрицу преобразования факторов. Для косоугольных вращений: матрицы факторного отображения и факторной структуры после вращения; матрица коэффициентов значений факторов и матрица ковариаций факторов. Графики: график типа “осыпь” собственных чисел, диаграмма нагрузок первых двух или трех факторов.

Данные. Переменные должны быть количественными, измеренными в интервальной шкале или шкале отношений. Категориальные данные (такие как исповедуемая религия или место рождения) не подходят для факторного анализа. Данные, для которых

© Copyright IBM Corporation 1989, 2011.

171

172

Глава 22

вычисление коэффициента корреляции Пирсона представляется осмысленным, пригодны также и для факторного анализа.

Допущения. Для каждой пары переменных данные должны представлять собой выборку из двумерного нормального распределения, а наблюдения должны быть независимыми. Модель факторного анализа предполагает, что переменные определяются общими факторами (факторами, оцененными моделью) и характерными или специфическими факторами (не перекрывающимися между наблюденными переменными); вычисляемые оценки основаны на том, что все характерные факторы не коррелированны друг с другом и с общими факторами.

Как запустить процедуру Факторный анализ

E Выберите в меню:

Анализ > Снижение размерности > Факторный анализ...

E Выберите переменные для факторного анализа.

Рисунок 22-1

Диалоговое окно Факторный анализ

Отбор наблюдений для факторного анализа

Рисунок 22-2

Диалоговое окно Факторный анализ: Задать значение

Как отобрать наблюдения для анализа E Задайте переменную отбора.

E Щелкните по Значение, чтобы ввести целое число в качестве значения отбора.

173

Факторный анализ

Только наблюдения с этим значением переменной отбора будут использованы в факторном анализе.

Описательные статистики факторного анализа

Рисунок 22-3

Диалоговое окно Факторный анализ: Описательные

Статистики. Одномерные описательные статистики включают среднее значение, стандартное отклонение и количество наблюдений без пропущенных значений для каждой переменной. Начальное решение выводит начальные общности, собственные значения и доли объясненной дисперсии, выраженные в процентах.

Корреляционная матрица. Возможности для вывода: коэффициенты, уровни значимости, детерминант, КМО и критерий сферичности Бартлетта, обратная, воспроизведенная и антиобраз.

КМО и критерий сферичности Бартлетта. Мера выборочной адекватности Кайзера-Мейера-Олкина (КМО), используемая для проверки гипотезы о том, что частные корреляции между переменными малы. Критерий сферичности Бартлетта проверяет гипотезу о том, что корреляционная матрица является единичной матрицей. Если гипотеза верна, факторная модель непригодна.

Воспроизведенная. Корреляционная матрица, оцененная по факторному

решению. Выводятся также остатки (разность между оцененными и наблюденными корреляциями).

Антиобраз. Корреляционная матрица антиобразов содержит коэффициенты частных корреляций с обратными знаками, а ковариационная матрица антиобразов содержит частные ковариации с обратными знаками. В хорошей факторной модели большинство внедиагональных элементов будут малы. Мера выборочной адекватности некоторого фактора лежит на диагонали матрицы корреляций антиобразов.

174

Глава 22

Выделение факторов в процедуре Факторный анализ

Рисунок 22-4

Диалоговое окно Факторный анализ: Выделение факторов

Метод. Позволяет задать метод извлечения факторов. Доступные методы: главные компоненты, невзвешенный МНК, обобщенный МНК, максимальное правдоподобие, факторизация главной оси, альфа факторизация и анализ образов.

Анализ главных компонент. Метод выделения факторов, используемый для формирования некоррелированных линейных комбинаций наблюденных переменных. Первый компонент имеет максимальную дисперсию. Последовательно получаемые компоненты объясняют все меньшие доли дисперсии, и все они не коррелированы между собой. Анализ методом главных компонент применяется для получения начального факторного решения. Может использоваться для сингулярных (вырожденных) корреляционных матриц.

Невзвешенный метод наименьших квадратов. Метод выделения факторов,

минимизирующий сумму квадратов разностей между наблюдаемой и воспроизведенной корреляционной матрицами без учета диагоналей.

Метод обобщенных наименьших квадратов. Метод выделения факторов,

минимизирующий сумму квадратов разностей между наблюденной и воспроизведенной корреляционными матрицами. Корреляции взвешиваются величинами, обратными характерностям, так что переменные с высокой характерностью получают меньшие веса, чем переменные с низкой.

Метод максимального правдоподобия. Метод выделения факторов. В качестве оценок параметров выбираются те, для которых наблюденная корреляционная матрица наиболее правдоподобна, если выборка взята из многомерного нормального распределения. Корреляции взвешиваются значениями, обратными к характерностям переменных, и применяется итеративный алгоритм.

Факторизация главных осей. Метод выделения факторов из исходной корреляционной матрицы с квадратами коэффициентов множественных корреляций по диагонали в качестве начальных оценок общностей. Эти факторные нагрузки используют для

175

Факторный анализ

оценки новых общностей, замещающих старые оценки общностей на диагонали. Итерации будут продолжаться до тех пор, пока изменения общностей от одной итерации к другой не удовлетворят критерию сходимости.

Альфа. Метод выделения факторов, рассматривающий анализируемые переменные как выборку из пространства всех возможных переменных. Он максимизирует альфа пригодность факторов.

Анализ образов. Метод выделения факторов, разработанный Гуттманом и основанный на теории образов. Общая часть переменной, частный образ, определяется как ее линейная регрессия на остальные переменные, а не как функция гипотетических факторов.

Анализ. Позволяет задать для анализа либо корреляционную матрицу, либо ковариационную матрицу.

Матрица корреляций Этот выбор оправдан, если анализируемые переменные измерены в разном масштабе.

Ковариационная матрица Это полезно, когда необходимо применить факторный анализ к большому числу групп с различными дисперсиями для каждой переменной.

Выделить. Возможно сохранение либо всех тех факторов, собственные числа для которых превосходят заданное значение, либо сохранение заданного количества факторов.

Вывести. Позволяет запросить вывод неповернутого факторного решения, а также график типа “осыпь” для собственных значений.

Неповернутое факторное решение. Выводятся факторные нагрузки (матрица факторного отображения), общности и собственные значения факторного решения без вращения.

График собственных значений. График, на котором изображены дисперсии, связанные

скаждым фактором. Используется для определения того, сколько факторов следует сохранить. Обычно график показывает явный разрыв между крутым наклоном больших факторов и постепенным уменьшением остальных ("осыпь").

Максимум итераций до сходимости. Позволяет задать максимальное число шагов, которое может использовать алгоритм для получения решения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]