Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Факторный анализ.doc
Скачиваний:
11
Добавлен:
25.08.2019
Размер:
761.86 Кб
Скачать

Интерпретация факторов.

Как же можно понять смысл того, что скрыто в найденных факторах? Основной информацией, которую использует исследователь, являются факторные нагрузки. Для интерпретации необходимо приписать каждому фактору какой-то термин, понятие. Этот термин появляется на основе анализа корреляций фактора с исходными переменными. Например, при анализе успеваемости школьников фактор имеет высокую положительную корреляцию с оценкой по алгебре, геометрии и большую отрицательную корреляцию с оценками по рисованию, то можно предположить, что этот фактор характеризует точное мышление.

Не всегда такая интерпретация возможна. Для повышения интерпретируемости факторов добиваются большей контрастности матрицы факторных нагрузок. Метод такого улучшения результата называется методом вращения факторов. Его суть состоит в следующем. Если мы будем вращать координатные оси, образуемые факторами, мы не потеряем в точности представления данных через новые оси, и не беда, что при этом факторы не будут упорядочены по величине объясненной ими дисперсии, зато у нас появляется возможность получить более контрастные факторные нагрузки. Вращение состоит в получении новых факторов - в виде специального вида линейной комбинации имеющихся факторов:

Чтобы не вводить новые обозначения, факторы и факторные нагрузки, полученные вращением, будем обозначать теми же символами, что и до вращения. Для достижения цели интерпретируемости существует достаточно много методов, которые состоят в оптимизации подходящей функции от факторных нагрузок. Мы рассмотрим реализуемый пакетом метод VARIMAX. Этот метод состоит в максимизации "дисперсии" квадратов факторных нагрузок для переменных:

Чем сильнее разойдутся квадраты факторных нагрузок к концам отрезка [0,1], тем больше будет значение целевой функции вращения, тем четче интерпретация факторов.

В любом случае, следует иметь ввиду, что интерпретация полученных факторов в значительной степени связана с представлениями исследователя о характере изучаемого явления. По сути дела в процесс интерпретации включается большой объем информации, которая не связана с анализом собранных данных. В результате глубинное понимание смысла получаемых факторов может быть отнесено, скорее к методам качественного, а не количественного исследования.

Выполнение факторного анализа

Метод факторного анализа находится в разделе Data Reduction (рисунок 5.3). Главное меню команды факторного анализа показано на рисунке.

Главное меню команды факторного анализа

В представленном на рисунке 5.4 меню с помощью факторного анализа решается задача построения некоторой типологии условий жизни респондентов. Включенные в анализ переменные фиксируют наличие или отсутствие в жилье у респондентов различных предметов бытовой техники. Представленная модель предполагает, что существуют некоторые глубинные факторы, характеризующее жилье в целом, которые проявляются именно в указанных переменных

Таблица 5.1

Результаты выполнения метода факторного анализа (рисунок 5.4).

Communalities

Initial

Extraction

У Вас есть холодильник?

1,000

,591

У Вас есть отдельная морозильная камера?

1,000

,467

У Вас есть стиральная машина?

1,000

,584

У Вас есть черно-белый телевизор?

1,000

,748

У Вас есть цветной телевизор?

1,000

,754

У Вас есть видеомагнитофон или видеоплейер?

1,000

,547

У Вас есть фен?

1,000

,481

У Вас есть компьютер?

1,000

,374

У Вас есть легковой автомобиль?

1,000

,416

У Вас есть грузовой автомобиль?

1,000

,469

У Вас есть мотоцикл, мотороллер, моторная лодка?

1,000

,363

У Вас есть трактор или минитрактор?

1,000

,531

У Вас есть садовый домик?

1,000

,568

У Вас есть дача или другой дом?

1,000

,303

У Вас есть другая квартира или часть квартиры?

1,000

,186

Total Variance Explained

Initial Eigenvalues

Extraction Sums of Squared Loadings

Component

Total

% of Variance

Cumulative %

Total

% of Variance

Cumulative %

1

2,776

18,504

18,504

2,776

18,504

18,504

2

1,273

8,489

26,992

1,273

8,489

26,992

3

1,208

8,052

35,045

1,208

8,052

35,045

4

1,105

7,364

42,409

1,105

7,364

42,409

5

1,018

6,789

49,197

1,018

6,789

49,197

6

,988

6,584

55,782

7

,935

6,233

62,015

8

,913

6,089

68,103

9

,883

5,885

73,989

10

,820

5,468

79,457

11

,808

5,388

84,845

12

,739

4,926

89,771

13

,654

4,357

94,129

14

,507

3,383

97,511

15

,373

2,489

100,000

Component Matrix

Component

1

2

3

4

5

У Вас есть холодильник?

,464

-0,0076

-,410

,406

,206

У Вас есть отдельная морозильная камера?

,283

0,081

,229

,218

-,529

У Вас есть стиральная машина?

,540

0,069

-,305

,404

,177

У Вас есть черно-белый телевизор?

-,435

,301

,344

,566

,170

У Вас есть цветной телевизор?

,739

-,156

-,394

-,161

-0,043

У Вас есть видеомагнитофон или видеоплейер?

,684

-0,035

,205

-,177

0,071

У Вас есть фен?

,602

-0,081

,275

-,119

,149

У Вас есть компьютер?

,340

-,150

,475

-0,075

0,072

У Вас есть легковой автомобиль?

,545

,166

,272

0,049

-,121

У Вас есть грузовой автомобиль?

,123

,592

-0,056

-,309

-0,072

У Вас есть мотоцикл, мотороллер, моторная лодка?

0,088

,533

-,169

,115

,171

У Вас есть трактор или минитрактор?

,127

,671

-0,019

-,234

-0,099

У Вас есть садовый домик?

,243

-0,021

0,021

,351

-,620

У Вас есть дача или другой дом?

,298

0,06

,314

,206

,263

У Вас есть другая квартира или часть квартиры?

,155

0,030

,270

-0,009

,297

Как показывает таблица 5.1, результаты факторного анализа выводятся в виде 3-х таблиц. Первая из них – таблица общностей (communalities) демонстрирует, какую часть дисперсии каждой из включенных в анализ переменных объясняет предлагаемая факторная модель. Таблица показывает, что, скажем, переменная, фиксирующая наличие у респондента телевизора, объясняется моделью приблизительно на 75%. В то же время переменная, фиксирующая наличие другой квартиры объясняется лишь на 18,6%. По всей видимости, эту переменную следовало бы исключить из анализа, поскольку она плохо объясняется построенной моделью.

Следующая таблица содержит информацию о дисперсии, объясненной моделью. Из таблицы видно, что первая главная компонента объясняет 18,5% общей дисперсии, вторая – 8,5% и т.д. В представленной модели было отобрано 5 главных компонент (факторов), которые в совокупности объясняют 49,2% общей дисперсии.

Последняя из таблиц – component matrix – называется матрицей факторных нагрузок и служит для интерпретации полученных факторов. В рассматриваемом примере 1-й фактор имеет высокие корреляции с наличием у респондента следующих предметов: цветной телевизор, стиральная машина, видеомагнитофон, фен, легковой автомобиль. То есть, можно сказать, что это фактор – характеристика современной, городской, достаточно обеспеченной семьи. А вот второй фактор будет выражен скорее у сельской семьи, поскольку имеет высокие факторные нагрузки с переменными: наличие грузового автомобиля, мотоцикла, трактора.

Поскольку более удобную матрицу факторных нагрузок дают методы вращения факторов, рассмотрим ту же факторную матрицу, но уже после вращения (таблица 5.2). Само вращение факторной матрицы можно выполнить используя клавишу Rotation.., расположенную в главном меню команды факторного анализа (рисунок 5.4).

Таблица 5.2

Матрица факторных нагрузок после вращения

Rotated Component Matrix

Component

1

2

3

4

5

У Вас есть холодильник?

0,046

,102

,759

-0,035

0,032

У Вас есть отдельная морозильная камера?

,130

0,0012

-0,012

0,053

,668

У Вас есть стиральная машина?

,155

0,081

,735

0,040

,105

У Вас есть черно-белый телевизор?

0,0017

-,864

0,010

0,010

0,020

У Вас есть цветной телевизор?

,169

,706

,460

0,046

,111

У Вас есть видеомагнитофон или видеоплейер?

,596

,383

,144

0,096

,119

У Вас есть фен?

,622

,274

,121

0,014

0,061

У Вас есть компьютер?

,575

0,069

-,122

-,115

,101

У Вас есть легковой автомобиль?

,473

,112

,129

,199

,351

У Вас есть грузовой автомобиль?

0,010

,102

-0,068

,674

0,0041

У Вас есть мотоцикл, мотороллер, моторная лодка?

-0,023

-,176

,298

,485

-0,081

У Вас есть трактор или минитрактор?

0,023

0,020

-0,043

,723

0,067

У Вас есть садовый домик?

-0,077

0,031

,123

-0,065

,736

У Вас есть дача или другой дом?

,485

-,179

,188

-0,0028

0,0095

У Вас есть другая квартира или часть квартиры?

,391

-0,095

0,020

0,015

-,154

В отличие от матрицы факторных нагрузок до вращения, матрица после вращения заметно удобнее – в ней почти все факторные нагрузки либо большие, либо маленькие, и, следовательно, такая матрица гораздо удобнее для интерпретации.

Проблема определения числа факторов.

Как уже говорилось полное описание дисперсии исходных признаков возможно только в ситуации, когда число факторов равно числу исходных признаков. Основная направленность факторного анализа – это именно сокращение числа показателей, и, следовательно, мы идем на то, что полученные факторы не будут на 100% объяснять исходную информацию и то, сколько же именно процентов будет объяснено, зависит от того, какое число факторов будет получено. Матрица объясненной дисперсии в таблице 5.1 показывает, что если будет взято 3 фактора, то они объяснят около35% исходной информации, а если возьмем 8 факторов, то такая модель объяснит уже около 68% информации. Какой процент является приемлемым, на каком числе факторов остановиться? Точного ответа на этот вопрос нет, однако есть несколько подходов, дающих определенные основания для его решения.

Критерий Кайзера. Есть определенные математические основания говорящие, что целесообразно отбирать столько факторов, сколько существует собственных чисел корреляционной матрицы, больших единицы. Для нашего примера таких чисел 5 и потому в данной модели было отобрано именно 5 факторов. Отметим, что критерий Кайзера по отбору числа факторов в команде факторного анализа SPSS используется по умолчанию.

Второй подход. Мы сами будем отбирать число факторов, ориентируясь на то, что бы это число факторов объясняло требуемый процент общей исходной дисперсии. Например, если исследователь решает, что факторная модель должна объяснять не менее 75% общей дисперсии исходных переменных, то таблица общей дисперсии в таблице 5.1 показывает, что необходимо взять 10 факторов.

Определение числа факторов осуществляется в меню Extraction.., вызов которого осуществляется нажатием соответствующей клавиши в главном меню команды факторного анализа (рисунок 5.1). На рисунке 5.6 показано меню Extraction. В меню Extraction так же находится окно, выбрав которое можно получить график «каменной осыпи» (окно Scree plot).

В той части меню, которая названа Extrаct, мы определяем что выбор числа факторов будет осуществляться через значения собственных числе («Eigenvalues over» - собственные числа больше чем…), либо через непосредственное указание требуемого числа факторов («Number of factors»). В любом случае мы должны указать точное значение (либо собственных чисел, либо числа факторов), которые будут основанием для отбора числа факторов в модели.