Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Анализ данных 7.doc
Скачиваний:
15
Добавлен:
24.09.2019
Размер:
5.09 Mб
Скачать
  1. Факторный анализ

При анализе данных исследователи могут использовать факторный анализ для двух основных целей. Во-первых, метод факторного анализа позволяет выявлять группировки тесно связанных между собой переменных и таким образом в социологическом исследовании дает возможность увидеть более глубокие, зачастую бессознательные ориентации и ожидания людей, в общем – некоторые латентные, скрытые факторы.

Во-вторых, факторный анализ позволяет корректно уменьшить количество переменных. Это процедура полезна для использования новых, полученных с помощью факторного анализа переменных в кластерном, регрессионном, дискриминантном анализе и других видах анализа данных. При уменьшении числа переменных факторный анализ помогает сохранить как можно больше информации и сделать так, чтобы новые переменные имели смысл и с ними было легко работать.

Например, ранее мы установили сильную корреляционную связь между группой переменных «интерес к знанию техник творчества», «интерес к знанию психологических закономерностей творчества», «интерес к знанию философских, религиозных концепций творчества» (переменные V8_B9, V8_B10, V8_B11, соответственно). Эти три переменные можно заменить одной новой латентной переменной, которая и называется фактором. Идеология факторного анализа – свести изучаемые переменные к ограниченному количеству независимых друг от друга факторов.

Процедура факторного анализа состоит из четырех основных стадий:

  1. Вычисление корреляционной матрицы для всех переменных, участвующих в анализе.

  2. Извлечение факторов, определение количества факторов, адекватно описывающих поведение исходных переменных.

  3. Вращение факторов для создания упрощенной структуры их взаимосвязей с переменными.

  4. Интерпретация факторов.

Далее можно ввести в таблицу данных новые переменные, соответствующие вновь найденным факторам, и использовать их в других статистических методах.

Для того чтобы провести факторный анализ, необходимо в меню «Statistics» выбрать опцию «Multivariate Exploratory Technics» и среди других методов – «Factor Analysis» (рис. 5.1).

Рис. 5.1. Меню выбора метода анализа данных

После того как вы активировали среди других методов факторный анализ, появляется диалоговое окно Factor Analysis (рис. 5.2).

Рис. 5.2. Диалоговое окно Factor Analysis

Далее следует определить переменные для анализа, нажав кнопку «Variables». Для проведения факторного анализа предпочтительнее брать группы достаточно однородных, однопорядковых переменных. Например, мы можем выбрать группу переменных, характеризующих интерес студентов к составляющим творческой компетентности.

Итак, возьмем для факторного анализа переменные V11_1 – V11_26 (ассоциации с творчеством). Ранее мы установили общие для всех студентов ассоциации с творчеством: вдохновение; обилие энергии; удовольствие; импровизация и спонтанность; интересные люди; добро; душевность; свобода и независимость. Использование факторного анализа позволит нам из исходных двадцати шести переменных получить ограниченное количество независимых друг от друга факторов. Значение этих факторов может быть понято как некие скрытые для прямого измерения смыслы, ассоциирующиеся с творчеством.

Установленная по умолчанию опция «Raw Data» означает, что для факторного анализа будут использованы реальные данные. На их основе программа рассчитает корреляционную матрицу, которая и будет использована далее в факторном анализе. После этого нужно нажать «ОК».

В появившемся диалоговом окне прежде всего следует обратить внимание на количество проанализированных случаев. Если имеется большое количество удаленных строк, то необходимо проделать процедуру сначала, заменив установку «Casewize» (см. рис. 5.2) на «Pairwise» или «Mean substitution» (вместо пропущенных данных использовать средние по переменной значения).

Рис. 5.3. Диалоговое окно Define Method of Factor Analysis при нажатой кнопке «Advanced»

Далее исследователь определяется с выбором метода факторного анализа (рис. 5.3). Выделяют две большие группы подходов к проведению факторного анализа – анализ главных компонент и анализ общих факторов.

В анализе главных компонент (Principal components) основное внимание уделяется объясненной факторами дисперсии. Вариабельность всех исходных переменных составляет 100 % дисперсии. Замена переменных факторами позволяет объяснить только часть дисперсии. Анализ главных компонент рекомендуется, если основная задача исследователя – выделить минимальное число факторов, которые описывают максимальное количество всей дисперсии.

При анализе общих факторов (Principal factor analysis) решается другая задача – определение структуры данных. Основное различие двух моделей факторного анализа состоит в том, что при анализе главных компонент предполагается, что должна быть использована вся изменчивость переменных, тогда как при анализе главных факторов используется только изменчивость переменной, общая и для других переменных.

В большинстве случаев эти два метода приводят к весьма близким результатам.

В меню определения методов нужно оставить отметку «Principal components». Далее будет необходимо, используя параметры: максимальное количество выделяемых факторов «Max no. of factor» и минимальное собственное значение «Mini eigenvalue», задать количество факторов, которые выделятся в ходе факторного анализа.

В ходе процедуры факторного анализа будет выделено или указанное количество факторов, или меньшее количество – все факторы, собственное значение которых больше заданного вами минимального собственного значения.

Существует несколько способов ответить на вопрос «Сколько факторов будет в конечной модели?»

Критерий собственного значения. Собственное значение отражает объем дисперсии исходных переменных, который определяется этим фактором. Задать минимальное собственное значение факторов – это один из распространенных способов отобрать минимальное количество факторов.

Поскольку факторный анализ предназначен для того, чтобы уменьшить количество исходных переменных, то было бы бессмысленно доводить количество факторов до количества переменных. Практическое правило, на которое обычно полагаются при проведении факторного анализа, заключается в том, что все факторы, включенные в модель (до вращения), должны объяснять, по крайней мере, такую же часть дисперсии, как и «средняя переменная». Фактор, собственное значение которого меньше 1,0, не лучше одной переменной, поскольку нормированная дисперсия исходных переменных составляет 1,0. Следовательно, собственное значение фактора должно быть больше 1,0. В противном случае будет лучше оставить исходную переменную. Таким образом, следуя критерию собственного значения, мы задаем минимальное собственное значение «Mini eigenvalue» равным 1,0.

Другой, часто используемый критерий ограничения количества выделяемых факторов, – критерий «каменистой осыпи». График «каменистой осыпи» – это график зависимости собственных значений от числа факторов в порядке их выделения (рис. 5.4). Для определения числа факторов оценивается форма графика. Обычно на графике виден четкий перелом между крутой частью и пологим «хвостом». Этот «хвост» и называют «каменистой осыпью».

Для нашего случая на основании критерия собственного значения отберется шесть факторов, критерий «каменистой осыпи» указывает в большей степени на необходимость отобрать только пять факторов (рис. 5.4).

Рис. 5.4. График «каменистой осыпи»

Критерий «процент объясненной дисперсии». При данном подходе число отбираемых факторов определяется таким образом, чтобы суммарный процент объясненной отобранными факторами дисперсии достигал удовлетворительного уровня (чаще всего этот уровень принимается равным 70 %). На рис. 5.5 показана выведенная на экран монитора таблица собственных значений, в которой указаны номер фактора (в порядке выделения), его собственное значение (eigenvalue), процент общей дисперсии объясненной фактором (% Total variance), кумулятивное собственное число (сумма всех собственных значений, включая предыдущие факторы), кумулятивный процент объясненной факторами дисперсии (Cumulate %).

Рис. 5.5. Таблица собственных значений факторов

В таблице собственных значений факторов (рис. 5.5) хорошо видно, как уменьшается вклад в объясненную дисперсию по мере увеличения порядкового номера фактора. Кумулятивный процент объясненной дисперсии достигает 100 %, когда число факторов сравнивается с числом переменных.

Вернемся к анализу переменных, описывающих ассоциации студентов с творчеством. Установим максимальное количество выделяемых факторов «Max no. of factor» – 26 и минимальное собственное значение «Mini eigenvalue» – 0,00. Это позволит рассмотреть все факторы и выбрать оптимальное их количество. После этого зайдем обратно в диалоговое окно «Define Method of Factor Analysis» и зададим (в зависимости от нашего выбора) или определенное количество факторов, или минимальное собственное значение. Затем нажмем «ОК». В результате наших действий откроется диалоговое окно вывода результатов факторного анализа (рис. 5.6).

Нажатие кнопки «Scree plot» позволит вывести на экран график «каменистой осыпи» (рис. 5.4). Нажатие кнопки «Eigenvalue» даст возможность просмотреть таблицу собственных значений факторов (рис. 5.5).

Рис. 5.6. Окно вывода результатов факторного анализа

Если в качестве способа определения необходимого количества факторов мы выберем критерий «процент объясненной дисперсии», то десять факторов будут составлять оптимальное количество для описания исходных двадцати шести переменных. В этом случае все девять факторов объяснят 69 % всей вариации переменных.

В нашем случае мы воспользуемся критерием собственного значения и соответственно зададим количество факторов равным семи, поскольку седьмой фактор имеет собственное значение лишь немного меньше единицы. Процент описываемой всеми выбранными факторами дисперсии при этом составит 63 %.

Следующим шагом после выделения факторов является их вращение. Нужно войти в подменю «Quick» и в опции «Factor rotation» установить один из методов вращения факторов «Varimax normalized» (рис. 5.7).

Рис. 5.7. Окно выводов результатов факторного анализа

Вращение факторов – это математическая процедура, которая позволяет выбрать наиболее оптимальное сочетание факторных нагрузок для последующей интерпретации факторов. Существует много методов вращения. При вращении «Varimax» каждый фактор имеет тенденцию давать большие нагрузки (близкие к 1 или -1) на небольшое количество переменных, что упрощает интерпретацию полученных в результате факторов. Нагрузка отражает связь между переменной и фактором, являясь подобием коэффициента корреляции. Значение нагрузки лежит в пределах от -1 до 1 (рис. 5.8).

Войдите в подменю «Loadings» и нажмите кнопку «Factor loadings». На экран монитора будет выведена таблица факторных нагрузок.

Рис. 5.8. Повернутая модель факторов (таблица факторных нагрузок)

После того как произведено вращение факторов, необходимо интерпретировать смысл выделенных факторов. Интерпретация факторов осуществляется исходя из больших значений факторных нагрузок (в таблице они выделены красным цветом).

Первый выделенный фактор описывает 12 % общей дисперсии и тесно связан с переменными, характеризующими ассоциации с творчеством: «добро», «душевность» (факторные нагрузки составляют 0,81, 0,85 соответственно). Довольно сильно этот фактор связан с переменными «интересные люди», «свобода и независимость». Скорее всего факторные нагрузки указывают на группу ассоциаций с творчеством, общий смысл которых заключается в следующем. Творчество ассоциируется с отношениями между людьми, проникнутыми добрыми и душевными чувствами. При этом связь смыслов «свобода» и «добро» определяют своеобразные формы взаимоотношений, характерных для молодежных сообществ: позволить другому быть независимым и свободным, быть самим собой. Таким образом, первый фактор может быть кратко обозначен как творчество – душевное, доброе человеческое взаимодействие.

Второй фактор объясняет 8 % общей дисперсии. Наиболее тесно связан с переменными «муки творчества, душевный дискомфорт», «неуверенность, страх перед критикой», «риск, неопределенность» (факторные нагрузки – 0,82, 0,79, 0,54 соответственно). Интерпретация фактора не представляет сложности – он отражает негативные моменты творчества. Интересно, что тесная связь этих переменных характеризует отсутствие дифференцированного восприятия негативных моментов творчества на уровне массового сознания студентов. Соединяются вместе в одном факторе и страх перед критикой, и душевный дискомфорт, и неопределенность.

Третий фактор описывает 11 % суммарной дисперсии, определяется связью с такими переменными, характеризующими ассоциации студентов, как «престиж», «успешность», «элитарность» (факторные нагрузки составляют 0,77, 0, 79, 0,69 соответственно). В основе этих трех переменных лежит один общий для них фактор – внешняя сторона творческой деятельности, ее итог, который в представлении студентов и ассоциируется с престижностью, успешностью, принадлежностью к преуспевающей элите общества.

Четвертый фактор (8 % общей дисперсии) тесно связан с переменными, отражающими ассоциации: занятия наукой, предпринимательство (факторные нагрузки по этим переменным составляют 0,80, 0,80 соответственно). Соединение этих переменных в одном факторе показывает, что в массовом сознании студенческой молодежи научная деятельность во многом родственна бизнесу. Природа такого объединения ассоциаций может быть понята, например, исходя из теории инвестирования Р. Стернберга и Т. Лаберта. Согласно этой теории, креативным можно считать человека, который стремится «покупать идеи по низкой цене и продавать по высокой». «Покупать по низкой цене» означает уметь верно оценивать потенциал развития и возможный спрос неизвестных, непризнанных, малопривлекательных идей, сопротивляться давлению среды, непониманию и неприятию и доводить идеи до реализации, «продавая по высокой цене».

Пятый фактор описывает 9 % общей дисперсии. Наиболее сильно фактор связан с переменными «импровизация, спонтанность», «сотворчество» (факторные нагрузки составляют 0,61, 0,64 соответственно). Пятый фактор сопряжен с такими переменными, как «целостный взгляд на мир», «интересные люди», «саморегуляция», «уважение к себе/жизни». Интерпретация данного фактора достаточно сложна. В самом деле, что общего между импровизацией и сотворчеством? Почему фактор сопряжен с саморегуляцией и уважением к себе и миру? Скорее всего, пятый фактор описывает ассоциации студентов с творчеством на уровне мировоззрения. А именно, творчество – необходимый элемент новой, начавшей формироваться в конце двадцатого столетия картины мира. Для этого мировоззрения характерен холизм (то есть целостный взгляд на мир), внимание к внутреннему миру, бессознательному (отсюда связь с импровизацией и спонтанностью). Формирование уважения к себе, к миру становится значимым аспектом внутренней работы над собой. Развитие навыков саморегуляции психических и организмических процессов способствует появлению представлений о взаимодействии с другими людьми, миром в целом, как о «космическом танце», сотворчестве. Если вывести корреляционную матрицу, то анализ коэффициентов корреляции обнаруживает группу переменных, тесно связанных с переменной «целостный взгляд на мир»: «сотворчество» (коэффициент корреляции составляет 0,35), «импровизация, спонтанность» (0,36), «интересные люди» (0,39), «уважение к себе и миру» (0,40). Таким образом, можем интерпретировать пятый фактор как ассоциации творчества с холистическим мировоззрением.

Шестой выделенный фактор описывает 6 % общей дисперсии признаков. Обнаруживается сильная взаимосвязь с переменной, характеризующей ассоциирование творчества с «ощущением незримой поддержки мира, Бога» (факторная нагрузка для данной переменной составляет 0,84). Этот фактор сопряжен с переменными «сверхсознание» (0,45), «духовность» (0,49). По всей видимости, фактор отражает ассоциации творчества с «вертикальным направлением ввысь»: к сверхсознанию, к Духу, к Богу.

Седьмой фактор объясняет 10 % общей дисперсии и тесно связан с переменными, описывающими такие ассоциативные связи с творчеством, как «вдохновение», «обилие энергии», «экстатические переживания» (факторные нагрузки составляют 0,60, 0,60, 0,55 соответственно). Фактор достаточно тесно связан с переменной «сверхсознание» (факторная нагрузка – 0,55), переменной «интуиция» (факторная нагрузка – 0,50), переменной «удовольствие» (факторная нагрузка – 0,47). Седьмой фактор отражает восприятие студентами творчества как энергетийного, мифологического, насыщенного бытия, связывая воедино вдохновение, удовольствие, экстаз, обилие энергии.

Творчество сквозь эту призму ассоциаций здесь отождествлено с сакральным ритуалом, в значительной степени мифологизировано. Интерпретируя смысл этого фактора, можно назвать несколько актуальных тем. А.Ф. Лосев указывал на то, что миф есть наивысшая по своей конкретности, максимально интенсивная и в величайшей степени напряженная реальность. Это не выдумка, но наиболее яркая и самая подлинная реальность. Миф есть переживание чудесного. Согласно К. Армстронг, «самые глубокие и значимые мифы повествуют о предельных состояниях, вынуждая нас выйти за границы обыденного опыта»4. Связь мифа и творчества выявил в своей концепции священного и мирского Мирча Элиаде. Как писал этот интересный мыслитель, через исполнение космогонического мифа – первотворения, воспроизведение его через песнопения, танцы, символические рисунки происходит исцеление, восстановление изначальной гармонии. Став символически современником сотворения мифа, человек в ритуале погружается в состояние первоначального расцвета; в него проникают гигантские силы, которые in illo tempore сделали возможным сотворение мира5. Отождествление с творящими Космос силами дает омоложение, исцеление, возрождение. Подводя итог сказанному, мы можем интерпретировать смысл седьмого фактора (отражающего восприятие студентами творчества) как энергетийного, мифологического, насыщенного бытия.

Таким образом, в ходе факторного анализа нами было выявлено семь факторов.

Первый – творчество ассоциируется с отношениями между людьми, проникнутыми добрыми и душевными чувствами.

Второй – диффузно отражает все негативные моменты творчества.

Третий – творчество ассоциируется с престижностью, успешностью, принадлежностью к преуспевающей элите общества.

Четвертый – отражает ассоциирование с занятиями наукой, предпринимательством.

Пятый – творчество ассоциируется с холистическим мировоззрением.

Шестой – отражает ассоциации творчества с «вертикальным направлением ввысь»: к сверхсознанию, к Духу, к Богу.

Седьмой – отражает восприятие студентами творчества как энергетийного, мифологического, насыщенного бытия, связывая воедино вдохновение, обилие энергии, удовольствие, экстаз, сверхсознание, интуицию.

Как использовать выявленную нами факторную модель ассоциаций с творчеством?

В теоретико-познавательном плане модель показывает, что, с одной стороны, количество групп ассоциаций, с которыми студенты связывают творчество, ограничено. С другой – группы ассоциаций студентов с творчеством позволяют осмыслить значение творчества в мировоззрении современной студенческой молодежи как ключевое, «проникающее» практически во все сферы жизненной проблематики, актуальной для современных студентов. Ряд выявленных факторов открывает глубинное, мифологически бессознательное восприятие творчества, подтверждая актуальность смыслов, выявленных при анализе мифов Мирча Элиаде.

В практическом плане модель позволяет свести исходных двадцать шесть переменных до семи факторов, что делает более корректным применение кластерного, регрессионного и других видов анализа. Для многих видов анализа необходимо учитывать то, что несколько сильнокоррелирующих между собой переменных, практически являясь одной переменной, могут искажать результаты группового анализа.

Для того чтобы перейти к новым переменным – факторам (при этом по специальным формулам значения факторов будут рассчитаны для каждого респондента), необходимо в окне вывода результатов факторного анализа войти в подменю «Scores», далее нажать кнопку «Save factor scores» (рис. 5.9).

Рис. 5.9. Окно перехода от переменных к выделенным факторам

При этом откроется диалоговое окно, в котором следует задать все переменные, которые будут соединены с новыми переменными факторами. Нужно отметить все переменные, нажав кнопку «Select all», и затем нажать «ОК». В результате будет создана новая таблица данных, которую надо сохранить и использовать в дальнейшем анализе (рис. 5.10).

Иногда вместо вычисления значений факторов исследователь может выбрать переменные-заменители. Из матрицы факторных нагрузок выбирают для каждого фактора переменную с наивысшим значением нагрузки на данный фактор. Затем эту переменную используют в качестве переменной-заменителя для соответствующего фактора.

Рис. 5.10. Таблица данных с новыми переменными-факторами

Иногда нагрузки двух или более переменных одинаково высокие. В таком случае выбор осуществляют исходя из теоретических предпосылок. Например, первый фактор в нашем исследовании может быть с успехом заменен переменной «душевность», второй – «муки творчества, душевный дискомфорт». Пятый фактор выразим переменной «сотворчество».

Задания:

1) Проведите факторный анализ переменных, отражающих интерес студентов к развитию творческих способностей и компетентностей. Сделайте вывод о возможности создания факторной модели интереса студентов к данной тематике.

2) Проведите факторный анализ переменных, характеризующих смысложизненную направленность студентов (переменные V4_1 – V4_11).