Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
наши шпоры к статистике.doc
Скачиваний:
4
Добавлен:
01.04.2025
Размер:
1.13 Mб
Скачать

23. Модель факторного анализа и ее отличие от модели главных компонент. Анализ факторных нагрузок.

В очень многих практических случаях информация об изучаемом явлении может быть представлена в форме таблицы (матрицы) данных “объект-признак”, в которых строки соответствуют множеству наблюдений за состоянием изучаемого явления, а столбцы множеству признаков – переменных характеристик, описывающих данное явление и являющихся результатами измерения.

Факторный анализ позволяет свести информацию о каждом объекте в пространство меньшей размерности. При использовании факторного анализа предполагается, что несколько измеряемых переменных сильно коррелируют между собой. Корреляция означает либо эти переменные определяют друг друга, либо связь между ними обусловлена величиной, которую непосредственно измерить нельзя.

Цель факторного анализа – это извлечение на поверхность фактора, который бы по возможности точно позволил воспроизвести наблюдаемые корреляции.

Математическая сторона метода. Допустим, что статистические свойства матрицы исходных данных х задаются матрицей:

L =

x12

x1 x2

x1 xn

x2 x1

x22

x2 xn

xk x1

xk x2

xk2

Диагональные элементы – дисперсии; внедиагональные – ковариации. Переход к новым переменным (факторам) можно осуществлять, ориентируясь на поведение либо дисперсий, либо корреляций. В первом случае мы будем иметь дело с методом главных компонент, во втором случае с факторным анализом. В первом случае новые переменные называются главными компонентами, а во втором – факторами.

В методе главных компонент новые переменные ищутся как линейные комбинации исходных признаков zj = aij xt

i,j = 1,2,…k дисперсии, которые расположены в убывающем порядке, т.е. 2(z1)  2(z2)  …  2(zk). Тем самым корреляционная (ковариационная) матрица оказывается распределенной на k компонент. В формуле zj – главная компонента; aij – вес j-той компоненты в i-той переменной. В данном уравнении нет остаточной величины, т.к. предполагается, что k главных компонент исчерпывают всю дисперсию всех k исходных переменных х. На практике следят за размером дисперсий выделяемых компонент. Если некоторые дисперсии мало отличаются от 0, то ими пренебрегают, что сокращает размерность факторного пространства. Обычно число выделяемых компонент не превышает 5-10 при числе исходных признаков в несколько раз больше.

Основная модель факторного анализа записывается следующим образом:

fij-тый фактор; m – заданное число факторов; aij – коэффициент факторной нагрузки i-той переменной на j-тый фактор; Ei – остаточная величина (часто его называют специфическим фактором).

Задача факторного анализа заключается в линейном преобразовании k-мерного пространства в пространство меньшей размерности m.

Коэффициент взаимосвязи между некоторым признаком и общим фактором, выражающий меру влияния фактора на признак, называется факторной нагрузкой данного признака по данному общему фактору

Модель факторного анализа выглядит так:

Z1=W11F1 + W12F2 + ….+W1mFm + W11U

Z2=W21F1 + W22F2 + ….+W2mFm + W22U

……………………………………

Zn=Wn1F1 + Wn2F2 + ….+WnmFm + WnnU

Причем m<n; Z-стандартизов. исходный признак; F-m-й общий фактор; U-характерный (специфич.) фактор; W1m – факторная нагрузка при m-м общем факторе и i-м признаке; W1-факторная нагрузка при 1-м характерном факторе; Таким образом, Z=WF+U

В основе фактор. ан. лежит предполож, о том, что исходные признаки облад-т некот. общими чертами. В кажд. признаке м. выделить 2 состовляющие: 1 – общую – её можно заменить общими факторами; 2- специф./характер. – её нельзя заменить синтетич. величинами.

Матрица факторных нагрузок имеет след. вид:

W11 W12 … W1m W1 0…...0

W= W21 W22 … W2m 0 W2 …0

………………………………

Wn1 Wn2 … Wnm ..0.……..Wn

Если хар-ки = 0, то м. фактор. ан. преобраз. в м.главных компонент. Чтобы решить 1-ю систему ур-й, нужно: 1-опр-ть факторные нагрузки; 2-вычислить значения векторов.

Гл. роль в фактор.ан. при расчете фактор.нагрузок играет матрица корреляций;

Осн. зависимость для нахождения факторных нагрузок: Rср.=W*Wt

Вычисление матрицы фактор. нагрузок предст. собой ряд повторяющихся операций: на каждом этапе опре-ся нагрузки одного фактора: 1 этап: опред-ся нагрузки на фактор F1 в суммарную дисперсию, что вклад фактора F1 в суммарную дисперсию максимален. После опр-ия нагрузок W=(W11, W21, … , Wn1) образуется матрица R1 ср.= R ср. – W1; R1 ср – матрица остатков корреляций после исключения 1-го фактора.

2 этап: опред-ся нагрузки на фактор F2 при R1 ср.= R ср. – W1, и из условия максимал. вклада F2 в суммарную дисперсию после исключения F1. После определения вектора нагрузок W2 образуется матрица остатков корреляций между переменными после исключения факторов F1 и F2: R2 ср.= R1 ср. – W2. Эти операции будут повторяться до тех пор, пока не будет достигнута желаемая степень объяснения суммарной дисперсии. Зная значения собственных чисел, мы можем перейти к расчету факторных нагрузок: Wm=кор. Лm * Am. , Л – собств. числа.

Wm=(W1m, W2m, … , Wnm) – вектор факторных нагрузок при m-м факторе.

• Матрица, состоящая из факторных нагрузок и имеющая число столбцов, равное числу общих факторов, и число строк, равное числу исходных признаков, называется факторной матрицей

• Величина факторной нагрузки не превышает по модулю единицы, а знак ее говорит о положительной или отрицательной связи признака с фактором.

• Чем больше абсолютная величина факторной нагрузки признака по некоторому фактору, тем в большей степени этот фактор определяет данный признак.

• Значение факторной нагрузки по некоторому фактору, близкое к нулю, говорит о том, что этот фактор практически на данный признак не влияет.