Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Факторный анализ.doc
Скачиваний:
10
Добавлен:
25.08.2019
Размер:
761.86 Кб
Скачать

Факторный анализ

Главными целями факторного анализа являются: (1) сокращение числа переменных (редукция данных) и (2) определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации.

Факторный анализ как метод редукции данных

Предположим, что вы проводите (до некоторой степени "глупое") исследование, в котором измеряете рост ста людей в дюймах и сантиметрах. Таким образом, у вас имеются две переменные. Если далее вы захотите исследовать, например, влияние различных пищевых добавок на рост, будете ли вы продолжать использовать обе переменные? Вероятно, нет, т.к. рост является одной характеристикой человека, независимо от того, в каких единицах он измеряется.

Теперь предположим, вы хотите измерить удовлетворенность людей жизнью, для чего составляете вопросник с различными пунктами; среди других вопросов задаете следующие: удовлетворены ли люди своим хобби (пункт 1) и как интенсивно они им занимаются (пункт 2). Результаты преобразуются так, что средние ответы (например, для удовлетворенности) соответствуют значению 100, в то время как ниже и выше средних ответов расположены меньшие и большие значения, соответственно. Две переменные (ответы на два разных пункта) коррелированы между собой. Из высокой коррелированности двух этих переменных можно сделать вывод об избыточности двух пунктов опросника.

Пример 1.

Предположим, что в интересах науки вы планируете собрать следующие данные у случайно сформирован ной выборки, например, у 200 знакомых студентов в баре вашего университета или колледжа:

• VI — вес тела (в кг);

• V 2 — степень невнятности речи (ранжируется по шкале от 1 до 5);

• V 3 — длина ноги (в см);

• V 4 — разговорчивость (ранжируется по шкале от 1 до 5);

• V 5 — длина руки (в см);

• V 6 — степень шатания при попытках пройти по прямой линии (ранжируется по шкале от 1 до 5).

Кажется вероятным, что VI , V3 и V5 будут варьировать совместно, поскольку крупные люди будут склонны иметь длинные руки и ноги и больше весить. Все эти три пункта измеряют некоторое фундаментальное свойство индивидуумов вашей выборки: их размеры. Точно так же вероятно, что V2, V4 и V6 будут варьировать совместно, так как количество употребленного алкоголя, вероятно, будет связано с четкостью речи, разговорчивостью и с осложнениями при попытках пройти по прямой линии. Таким образом, хотя мы собрали шесть фрагментарных данных, эти переменные измеряют только 2 конструкта: размеры тела и степень опьянения. В факторном анализе вместо слова «конструкт» обычно используется слово «фактор», и далее мы будем следовать этой традиции.

Исследовательский факторный анализ, по существу, выполняет две функции.

  1. Он показывает, сколько отдельных психологических конструктов (факторов) измеряется данным набором переменных. В приведенном выше примере такими двумя факторами являются размеры тела и степень опьянения.

  2. Он показывает, какие именно конструкты измеряют использованные переменные. В приведенном выше примере было показано, что VI , V 3 и V 5 измеряют один фактор и V2, V4 и V6 измеряют другой, совершенно отличный фактор.

Пример 2.

Шестерых студентов попросили ответить на каждое утверждение, используя пятибалльную оценочную шкалу, как показано в таблице, и их ответы даны в нижней части таблицы. Они отражают степень согласия каждого участника с каждым утверждением.

Q 1

Я получаю удовольствие от общения

1

2

3

4

5

Q 2

Я часто действую импульсивно

1

2

3

4

5

Q 3

Я веселый человек

1

2

3

4

5

Q 4

Я часто ощущаю депрессию

1

2

3

4

5

Q 5

Мне трудно засыпать по ночам

1

2

3

4

5

Q 6

Большие толпы людей вызывают у меня чувство тревоги

1

2

3

4

5

Пожалуйста, обведите кружком одну цифру, которая соответствует вашей реакции на утверждение:

обводите «5», если вы полностью согласны с описывающим вас утверждением;

обводите «4», если оно характеризует вас достаточно хорошо;

обводите «3», если не имеете определенной точки зрения или не уверены в том, что это утверждение характеризует вас;

обводите «2», если чувствуете, что утверждение не вполне характери­зует вас;

обводите «1», если абсолютно уверены, что это утверждение вас не характеризует

Q1

Q2

Q3

Q4

Q5

Q6

Энн

1

2

1

1

1

2

Стефен

5

5

4

1

1

2

Пол

3

4

3

4

5

4

Джанетт

4

4

3

1

2

1

Майкл

3

3

4

1

2

2

Кристин

3

3

3

5

4

5

Статистическая характеристика, именуемая коэффициентом корреляции, дает возможность определить, действительно ли индивидуумы, имеющие низкие баллы по одной переменной, склонны иметь низкий (или высокий) балл по другим переменным.

Q1

Q2

Q3

Q4

Q5

Q6

Ql

1,000

Q2

0,933

1,000

Q3

0,824

0,696

1,000

Q4

-0,096

-0,052

0,000

1,000

Q5

-0,005

0,058

0,111

0,896

1,000

Q 6

-0,167

-0,127

0,000

0,965

0,808

1,000

Таким образом, корреляции позволяют сделать вывод, что утверждения с 1 по 3 формируют одну естественную группу, а утверждения с 4 по 6 — другую. Это значит, что опросник на самом деле измеряет два конструкта, или «фактора». Один фактор состоит из трех первых утверждений, а другой включает три последних утверждения.

Хотя сказанное довольно легко подтверждается корреляциями, которые мы видим в табл. , следует помнить, что они едва ли являются типичными. Для этого имеются конкретные причины:

  1. Данные были сконструированы таким образом, чтобы корреляции между переменными были либо очень большими, либо очень маленькими. В реальной жизни корреляции меж ду переменными редко будут больше 0,5, а многие из них окажутся в диапазоне 0,2—0,3. Из-за этого очень трудно «на глаз» определить, каковы паттерны корреляций.

  2. Вопросы были расположены в таком порядке, что большие по величине корреляции в табл. оказались рядом. Если бы вопросы предъявлялись в другом порядке, выделить кластеры больших корреляций было бы нелегко.

  3. Использовалось только шесть утверждений, поэтому рассматривалось лишь 15 корреляций. При 40 вопросах пришлось бы рассматривать 40x(40-1):2 = 780 корреляций, что сделало бы выделение групп взаимосвязанных утверждений намного более трудным.

Существует несколько других проблем, связанных с проведением факторного анализа «на глаз», одна из которых заключается в том, что разные люди могут приходить к различным заключениям по поводу числа и природы факторов, поэтому весь процесс является весьма ненаучным.

В настоящее время факторный анализ даже очень большого эмпирического материала можно выполнить на персональном компьютере. Для проведения факторного анализа могут быть использованы несколько статистических компьютерных программ, включая SPSS.

Объединение двух переменных в один фактор. Зависимость между переменными можно обнаружить с помощью диаграммы рассеяния. Полученная путем подгонки линия регрессии дает графическое представление зависимости. Если определить новую переменную на основе линии регрессии, изображенной на этой диаграмме, то такая переменная будет включить в себя наиболее существенные черты обеих переменных. Итак, фактически, вы сократили число переменных и заменили две одной. Отметим, что новый фактор (переменная) в действительности является линейной комбинацией двух исходных переменных.

Обычно под моделью факторного анализа понимают представление исходных переменных в виде линейной комбинации факторов. Схематично такой взгляд на формирование ответов респондентов на вопросы анкеты показан на рисунке 5.1.