Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 7-8.doc
Скачиваний:
9
Добавлен:
25.08.2019
Размер:
1.52 Mб
Скачать

Статистические гипотезы в факторном анализе

В SPSS предусмотрена проверка теста Барлетта о сферичности распределения данных. В предположении многомерной нормальности распределения здесь проверяется, не диагональна ли матрица корреляций. Если гипотеза не отвергается (наблюдаемый уровень значимости велик, скажем больше 5%) - нет смысла в факторном анализе, поскольку направления главных осей случайны. Этот тест предусмотрен в диалоговом окне факторного анализа, вместе с возможностью получения описательных статистик переменных и матрицы корреляций. На практике предположение о многомерной нормальности проверить весьма трудно, поэтому факторный анализ чаще применяется без такого анализа.

Проблема определения числа факторов.

Как уже говорилось полное описание дисперсии исходных признаков возможно только в ситуации, когда число факторов равно числу исходных признаков. Основная направленность факторного анализа – это именно сокращение числа показателей, и, следовательно, мы идем на то, что полученные факторы не будут на 100% объяснять исходную информацию и то, сколько же именно процентов будет объяснено, зависит от того, какое число факторов будет получено. Матрица объясненной дисперсии в таблице 5.1 показывает, что если будет взято 3 фактора, то они объяснят около35% исходной информации, а если возьмем 8 факторов, то такая модель объяснит уже около 68% информации. Какой процент является приемлемым, на каком числе факторов остановиться? Точного ответа на этот вопрос нет, однако есть несколько подходов, дающих определенные основания для его решения.

Первым подходом является формально-статистическим. Есть определенные математические основания говорящие, что целесообразно отбирать столько факторов, сколько существует собственных чисел корреляционной матрицы, больших единицы. Данный критерий называется критерием Кайзера. Таблица объясненной дисперсии в таблице 5.1 показывает, что для нашего примера таких чисел 5 и потому в данной модели было отобрано именно 5 факторов. Отметим, что критерий Кайзера по отбору числа факторов в команде факторного анализа SPSS используется по умолчанию.

Второй подход базируется на том, что мы сами будем отбирать число факторов, ориентируясь на то, чтобы это число факторов объясняло требуемый процент общей исходной дисперсии. Например, если исследователь решает, что факторная модель должна объяснять не менее 75% общей дисперсии исходных переменных, то таблица общей дисперсии в таблице 5.1 показывает, что необходимо взять 10 факторов.

На какой процент объясненной дисперсии необходимо ориентироваться? Не существует каких-то убедительных рекомендаций по определению этого процента, кроме одной, вполне очевидной: «Чем больше, тем лучше». В этой ситуации следует, видимо, ориентироваться на примеры предыдущих исследователей. В социологии, как правило, встречаются факторные модели, в которых объясняется 60-75% дисперсии, хотя можно примеры и с большими, и с меньшими процентами.

Существует еще один подход, который базируется на методе, так называемой, «каменной осыпи». Суть метода в следующем. Строится график, в котором по оси абсцисс откладываются номера факторов, а по оси ординат – значения собственных чисел, для каждого из факторов. Пример такого рода графика для модели таблицы 5.1 показан на рисунке 5.5. Как говорилось в начале, все собственные числа в методе главных компонент вычисляются в порядке убывания, поэтому график будет представлять собой понижающуюся кривую.

Далее на этом графике ищутся точки, в которых происходит более, или менее резкое понижение. В приведенном примере рисунка 5.5 можно сказать, что действительно резких понижений у нас нет. Хоть сколь-нибудь резкое понижение происходит от 9-го к 10-му фактору. Рекомендация метода «каменной осыпи» состоит в том, что надо отобрать число факторов, до момента такого рода резкого понижения. То есть в нашем примере лучше брать 9 факторов, а не 10.

Рисунок 5.5

График «каменной осыпи» для модели таблицы 5.1

Важно понимать, что ни один из изложенных подходов к определению числа факторов не дает нам доказательных оснований по отбору числа факторов. У исследователя остается большой произвол в решении этого вопроса. Основным критерием остается максимальное удобство для исследователя в построении наиболее правдоподобной модели, что, естественно, ни в каком смысле не может считаться строгим основанием.

Определение числа факторов осуществляется в меню Extraction.., вызов которого осуществляется нажатием соответствующей клавиши в главном меню команды факторного анализа (рисунок 5.1). На рисунке 5.6 показано меню Extraction. В меню Extraction так же находится окно, выбрав которое можно получить график «каменной осыпи» (окно Screen plot).

В той части меню, которая названа Extract, мы определяем, что выбор числа факторов будет осуществляться через значения собственных чисел («Eigenvalues over» - собственные числа больше чем…), либо через непосредственное указание требуемого числа факторов («Number of factors»). В любом случае мы должны указать точное значение (либо собственных чисел, либо числа факторов), которые будут основанием для отбора числа факторов в модели.