1. Выбор исходных данных.

А) Модель факторного анализа разрабатывалась для метрических данных. Поэтому первое требование к исходным данным – представление всех признаков в метрической шкале (не обязательно с одинаковыми средними и дисперсиями). Включение в анализ порядковых или бинарных данных ДОПУСТИМО, но исследователь должен отдавать себе отчет, что искажение факторной структуры при этом будет соответствовать искажениям коэффициентов корреляции, и характер этих искажений неизвестен.

Б) Количественное соотношение признаков и объектов зависит от целей исследования:

– если цель анализа – изучение структуры взаимосвязей признаков, уменьшение их исходного количества путем перехода к новым переменным – факторам, то строгих ограничений нет. Желательно лишь, чтобы количество признаков было не меньше количества объектов;

– если исследователь хочет обнаружить и обосновать наличие факторов за взаимосвязями переменных, то желательно иметь в 3 раза больше объектов, чем признаков.

– если же стоит задача обоснования выявленной факторной структуры для генеральной совокупности, то объектов должно быть еще больше, для проверки устойчивости этой структуры на параллельных выборках.

2. Решение проблемы числа факторов.

Это первая проблема при проведении факторного анализа. Обычно заранее не известно, сколько факторов необходимо и достаточно для представления данного набора переменных. Сама же процедура факторного анализа предполагает предварительное задание числа факторов. Поэтому исследователь должен заранее определить или оценить их возможное количество.

Для этого на первом этапе факторного анализа обычно применяют анализ главных компонент и используют график собственных значений (Scree plot).

Для определения числа факторов были предложены два критерия.

Первый – критерий Кайзера: число факторов равно числу компонент, собственные значения которых больше 1.

Второй – критерий отсеивания Р. Кеттелла (scree-test), требует построения графика собственных значений (компьютерные программы предлагают этот график при выборе метода главных компонент – scree plot. Количество факторов определяется приблизительно по точке перегиба на графике собственных значений до его выхода на пологую прямую после резкого спада. При этом проверяются три гипотезы: если К – точка перегиба, то возможное число факторов равно К-1, К и К+1.

По первому критерию (Кайзера) в нашем примере число факторов равно 2, так как первые два собственных значения больше 1. По второму критерию (Кеттелла) – от двух до четырех, так как точке перегиба соответствует третья компонента.

При определении числа факторов на практике следует помнить, что указанные критерии являются лишь примерным ориентиром. Окончательное решение о числе факторов принимается только после интерпретации факторов. Начинать при этом рекомендуется с максимально возможного числа факторов, с учетом обоих критериев, постепенно уменьшая их число.

3. Факторизация матрицы интеркорреляций.

На этом этапе выбирается метод факторного анализа. Методы факторного анализа – это различные способы получения факторной структуры при заданном количестве факторов.

Наиболее часто применяются: а) анализ главных компонент; б) факторный анализ образов; в) метод главных осей; г) метод не взвешенных наименьших квадратов; д) обобщенный метод наименьших квадратов; е) метод максимального правдоподобия.

Вряд ли возможно дать общие рекомендации о преимуществе и недостатке того или иного метода. Можно лишь отметить, что анализ главных компонент дает наиболее грубое решение, а метод максимального правдоподобия позволяет статистически оценить минимально возможное число факторов для данного набора переменных. По-видимому, в каждом конкретном случае стоит сравнивать результаты применения разных методов и выбирать тот, который позволяет получить наиболее простую и доступную интерпретации факторную структуру.

То есть, на этом этапе выбирается метод и задается число факторов. Результатом данного этапа является матрица факторных нагрузок (факторная структура) до вращения, которая не подлежит интерпретации.

Полезной информацией на этом этапе могут являться суммарная доля дисперсии (информативность) факторов и значения общностей переменных. Суммарная доля дисперсии – показатель ее «участия» в факторном анализе, насколько она влияет на факторную структуру. Переменные с наименьшими общностями – ближайшие кандидаты на исключение из анализа в дальнейшем.

Полная объясненная дисперсия

Компонента	Начальные собственные значения			Суммы квадратов нагрузок вращения
Компонента	Всего	% дисперсии	Кумулятивный %	Всего	% дисперсии	Кумулятивный %
1	6,568	38,638	38,638	3,828	22,516	22,516
2	1,656	9,740	48,378	3,395	19,969	42,484
3	1,010	5,941	54,318	2,012	11,834	54,318
4	,971	5,714	60,033
5	,876	5,153	65,186
6	,773	4,548	69,734
7	,688	4,048	73,782
8	,634	3,728	77,509
9	,579	3,405	80,914
10	,531	3,121	84,036
11	,489	2,875	86,911
12	,473	2,780	89,691
13	,438	2,575	92,266
14	,414	2,437	94,704
15	,324	1,906	96,610
16	,299	1,756	98,366
17	,278	1,634	100,000

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
25.04.2019430.08 Кб26_Протоколы физического уровеня.doc
#
05.05.201958.46 Кб127 Дискурс.docx
#
21.11.2019107.52 Кб347_Dop_serdtse.doc
#
15.12.2018402.43 Кб38 практическая.doc
#
05.05.201944.79 Кб108 типология.docx
#
16.09.201992.67 Кб98 ФАКТОРНЫЙ АНАЛИЗ.doc
#
17.09.201944.68 Кб68-14.docx
#
25.04.2019315.39 Кб18_Канальный уровень в локальных сетях.doc
#
09.06.201590.11 Кб89.образвание централиз госв.doc
#
09.06.201577.82 Кб309.Образование централизованных государств.doc
#
21.11.2019134.14 Кб39_Dopolnit_ZhKT.doc