Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
8 ФАКТОРНЫЙ АНАЛИЗ.doc
Скачиваний:
9
Добавлен:
16.09.2019
Размер:
92.67 Кб
Скачать

1. Выбор исходных данных.

А) Модель факторного анализа разрабатывалась для метрических данных. Поэтому первое требование к исходным данным – представление всех признаков в метрической шкале (не обязательно с одинаковыми средними и дисперсиями). Включение в анализ порядковых или бинарных данных ДОПУСТИМО, но исследователь должен отдавать себе отчет, что искажение факторной структуры при этом будет соответствовать искажениям коэффициентов корреляции, и характер этих искажений неизвестен.

Б) Количественное соотношение признаков и объектов зависит от целей исследования:

– если цель анализа – изучение структуры взаимосвязей признаков, уменьшение их исходного количества путем перехода к новым переменным – факторам, то строгих ограничений нет. Желательно лишь, чтобы количество признаков было не меньше количества объектов;

– если исследователь хочет обнаружить и обосновать наличие факторов за взаимосвязями переменных, то желательно иметь в 3 раза больше объектов, чем признаков.

– если же стоит задача обоснования выявленной факторной структуры для генеральной совокупности, то объектов должно быть еще больше, для проверки устойчивости этой структуры на параллельных выборках.

2. Решение проблемы числа факторов.

Это первая проблема при проведении факторного анализа. Обычно заранее не известно, сколько факторов необходимо и достаточно для представления данного набора переменных. Сама же процедура факторного анализа предполагает предварительное задание числа факторов. Поэтому исследователь должен заранее определить или оценить их возможное количество.

Для этого на первом этапе факторного анализа обычно применяют анализ главных компонент и используют график собственных значений (Scree plot).

Для определения числа факторов были предложены два критерия.

Первый – критерий Кайзера: число факторов равно числу компонент, собственные значения которых больше 1.

Второй – критерий отсеивания Р. Кеттелла (scree-test), требует построения графика собственных значений (компьютерные программы предлагают этот график при выборе метода главных компонент – scree plot. Количество факторов определяется приблизительно по точке перегиба на графике собственных значений до его выхода на пологую прямую после резкого спада. При этом проверяются три гипотезы: если К – точка перегиба, то возможное число факторов равно К-1, К и К+1.

По первому критерию (Кайзера) в нашем примере число факторов равно 2, так как первые два собственных значения больше 1. По второму критерию (Кеттелла) – от двух до четырех, так как точке перегиба соответствует третья компонента.

При определении числа факторов на практике следует помнить, что указанные критерии являются лишь примерным ориентиром. Окончательное решение о числе факторов принимается только после интерпретации факторов. Начинать при этом рекомендуется с максимально возможного числа факторов, с учетом обоих критериев, постепенно уменьшая их число.

3. Факторизация матрицы интеркорреляций.

На этом этапе выбирается метод факторного анализа. Методы факторного анализа – это различные способы получения факторной структуры при заданном количестве факторов.

Наиболее часто применяются: а) анализ главных компонент; б) факторный анализ образов; в) метод главных осей; г) метод не взвешенных наименьших квадратов; д) обобщенный метод наименьших квадратов; е) метод максимального правдоподобия.

Вряд ли возможно дать общие рекомендации о преимуществе и недостатке того или иного метода. Можно лишь отметить, что анализ главных компонент дает наиболее грубое решение, а метод максимального правдоподобия позволяет статистически оценить минимально возможное число факторов для данного набора переменных. По-видимому, в каждом конкретном случае стоит сравнивать результаты применения разных методов и выбирать тот, который позволяет получить наиболее простую и доступную интерпретации факторную структуру.

То есть, на этом этапе выбирается метод и задается число факторов. Результатом данного этапа является матрица факторных нагрузок (факторная структура) до вращения, которая не подлежит интерпретации.

Полезной информацией на этом этапе могут являться суммарная доля дисперсии (информативность) факторов и значения общностей переменных. Суммарная доля дисперсии – показатель ее «участия» в факторном анализе, насколько она влияет на факторную структуру. Переменные с наименьшими общностями – ближайшие кандидаты на исключение из анализа в дальнейшем.

Полная объясненная дисперсия

Компонента

Начальные собственные значения

Суммы квадратов нагрузок вращения

Всего

% дисперсии

Кумулятивный %

Всего

% дисперсии

Кумулятивный %

1

6,568

38,638

38,638

3,828

22,516

22,516

2

1,656

9,740

48,378

3,395

19,969

42,484

3

1,010

5,941

54,318

2,012

11,834

54,318

4

,971

5,714

60,033

5

,876

5,153

65,186

6

,773

4,548

69,734

7

,688

4,048

73,782

8

,634

3,728

77,509

9

,579

3,405

80,914

10

,531

3,121

84,036

11

,489

2,875

86,911

12

,473

2,780

89,691

13

,438

2,575

92,266

14

,414

2,437

94,704

15

,324

1,906

96,610

16

,299

1,756

98,366

17

,278

1,634

100,000